结合关联置信度与结巴分词的新词发现算法.docx

结合关联置信度与结巴分词的新词发现算法.docx

毕业设计(论文)

PAGE

1-

毕业设计(论文)报告

题目:

结合关联置信度与结巴分词的新词发现算法

学号:

姓名:

学院:

专业:

指导教师:

起止日期:

结合关联置信度与结巴分词的新词发现算法

摘要:本文提出了一种结合关联置信度与结巴分词的新词发现算法。该算法首先利用结巴分词对文本进行分词,然后通过构建词频矩阵和关联矩阵,计算词语之间的关联置信度。在此基础上,结合词语的频率和关联置信度,对候选新词进行筛选和排序,从而实现新词的发现。实验结果表明,该算法在多个数据集上均取得了较好的效果,具有较高的准确率和召回率。本文的研究成果对于自然语言

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档