- 3
- 0
- 约3.85千字
- 约 8页
- 2018-05-28 发布于福建
- 举报
中文文本相似度在商业网络中应用
中文文本相似度在商业网络中应用
[摘要] 目前文本相似度在商业网络中应用广泛,本文主要讨论中文文本相似度研究的现状,给出中文文本相似计算的定义和概念,提出基于PHP的中文文本相似度算法,针对某网站的在线系统,进行对文档之间的相似程度的数值分析,表明所提出的算法具有一定的有效性。
[关键词] 文本相似度 分词 PHP
一、引言
文本挖掘以数据挖掘为基础,结合机器学习,自然语言处理,信息检索和知识管理等领域的技术来处理文本数据,从中获得有价值的信息或数据帮助人们更好的决策。人们也可以把文本挖掘技术应用到各种相关的领域,带来社会效益或经济效益。在中文信息处理中,文本相似度的计算广泛应用于信息检索、机器翻译、自动问答系统、文本挖掘等领域,是一个非常基础而关键的问题,长期以来一直是人们研究的热点和难点。
文本相似度在商业网络中应用广泛,比如人们要在网站中进行信息搜索时,利用输入的搜索信息找到与此信息相似度较高的信息,人们要利用网络中一些旧的有用信息用来找出新的相似性信息,以供人们更好的做决策或者投资,人们可以通过比较相似性,将有用信息分为不同的类别,针对这些类别采取不同的解决方案或者用这些类别去解决某些问题。在某些网络系统中,针对人们提出的问题,可以判断问题的相似度,如果相似度很高,可以用相似性的答案去回答,这样大大节省时间和效率。因此,文本相似度在商
您可能关注的文档
最近下载
- 2023年06月国家国防科技工业局核技术支持中心社会招考聘用笔试历年难、易错考点试题含答案解析.docx
- 部编版小学语文六年级下册小升初分类复习拼音字词-(含答案).pdf VIP
- NAVTEX NCR-333中文操作说明书.pdf VIP
- 部编版小学语文六年级下册小升初拼音汉字分类复习-(含答案).docx
- 2024-2025学年湖南省益阳市高一(下)期中数学试卷【答案版】.docx VIP
- 立体停车场项目投资规划策略研究.docx VIP
- 化学人教版九年级上册课题1 质量守恒定律(第一课时).doc VIP
- 化学人教版九年级上册课题1课题1 质量守恒定律 .doc VIP
- 课题1 质量守恒定律(教学设计)九年级化学上册(人教版2024).docx VIP
- JSS-296组合电台中文操作说明书解析.doc VIP
原创力文档

文档评论(0)