中文文本相似度在商业网络中应用.docVIP

  • 3
  • 0
  • 约3.85千字
  • 约 8页
  • 2018-05-28 发布于福建
  • 举报
中文文本相似度在商业网络中应用

中文文本相似度在商业网络中应用   [摘要] 目前文本相似度在商业网络中应用广泛,本文主要讨论中文文本相似度研究的现状,给出中文文本相似计算的定义和概念,提出基于PHP的中文文本相似度算法,针对某网站的在线系统,进行对文档之间的相似程度的数值分析,表明所提出的算法具有一定的有效性。   [关键词] 文本相似度 分词 PHP      一、引言   文本挖掘以数据挖掘为基础,结合机器学习,自然语言处理,信息检索和知识管理等领域的技术来处理文本数据,从中获得有价值的信息或数据帮助人们更好的决策。人们也可以把文本挖掘技术应用到各种相关的领域,带来社会效益或经济效益。在中文信息处理中,文本相似度的计算广泛应用于信息检索、机器翻译、自动问答系统、文本挖掘等领域,是一个非常基础而关键的问题,长期以来一直是人们研究的热点和难点。   文本相似度在商业网络中应用广泛,比如人们要在网站中进行信息搜索时,利用输入的搜索信息找到与此信息相似度较高的信息,人们要利用网络中一些旧的有用信息用来找出新的相似性信息,以供人们更好的做决策或者投资,人们可以通过比较相似性,将有用信息分为不同的类别,针对这些类别采取不同的解决方案或者用这些类别去解决某些问题。在某些网络系统中,针对人们提出的问题,可以判断问题的相似度,如果相似度很高,可以用相似性的答案去回答,这样大大节省时间和效率。因此,文本相似度在商

文档评论(0)

1亿VIP精品文档

相关文档