- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
textrank关键词提取算法与som文本聚类模型的优化研究计算机应用技术专业论文
RESEARCH
RESEARCH oN THE oPTIMIZATIoN oF TEXTRz州K
K-EYWroRD EXTRACTIoN ALGoRITHM AND SoM TEXT
CLUSTER矾G MoDEL
ABSTRACT
With the rapid development of internet information technology,text clustering has gradually become the focus of people’S research in order to meet the requirements of the vast network of text information retrieval.Keyword extraction and clustering algorithm play all important role in the process of text clustering.To improve the text clustering effect,this paper carries on the
research from two aspects:
1.An improved TextRank keyword extraction algorithm is proposed for
text preprocessing.Term mutual information based on sliding window,as the edge weight,will be added to the graph model of TextRank algorithm,optimized
the candidate words score distribution of TextRank.And then,put vertex
weight-single document term frequency(Term Frequency,TF)into the TextRank’S weight iteration formula.The term frequency is used to adjust the probability of word’jumping¨,to certain extent,the problem of equal
probability’jumping¨is solved.The experimental results show that the presented algorithm’S precision,recall ratio and F 1-measure have been improved, the iterative calculation efficiency have enhanced by 20%.Extracted keywords
II
万方数据
have
have more representatives to the text feature,and benefit to improve the subsequent text clustering effect.
2.Bayesian regularization theory is introduced to Self-Organizing Map text clustering algorithm,during the weight adjustment process,the penalty term that reflects the complexity of the network weights is added to the weight adjustment
formula,thereby avoid overfitting;Bayesian inference is used to obtain the optimal hyper parameters in the weight adjustment formula,SO that the network weights distribution and input data probability distribution become more consistent during the iterative training,in order to improve the text clustering effect.The experimental results on UCI and Chinese text dataset show that compar
您可能关注的文档
- 高速铁路大跨度钢管混凝土连续梁拱桥抗震性能研究结构工程专业论文.docx
- 对dna微阵列数据的聚类以识别阿尔茨海默病的相关基因计算数学专业论文.docx
- 额尔古纳县域经济发展路径研究公共管理专业论文.docx
- 低成本永磁交流电机设计电机与电器专业论文.docx
- 创新型研究生指导教师培养与遴选研究高等教育学专业论文.docx
- 多元化战略的综效研究管理科学与工程专业论文.docx
- 电子商务环境下传统企业流程变革研究管理科学与工程专业论文.docx
- 带缝空心rc剪力墙结构抗震性能试验研究及有限元分析结构工程专业论文.docx
- 道路交通安全致因分析虚拟场景设计与实现计算机应用技术专业论文.docx
- 鞍钢炼铁原料准备技术应用基础研究钢铁冶金专业论文.docx
- 不同培肥措施下紫色土磷素有效性及淋溶效应的研究植物营养学专业论文.docx
- 塞来昔布对嘌呤氨基核苷诱导的足突细胞凋亡影响的实验研究内科学专业论文.docx
- 工程结构时域系统识别研究结构工程专业论文.docx
- 低磷胁迫下不同磷效率玉米叶片吸收光能分配的差异与叶片蛋白质组学研究细胞生物学专业论文.docx
- web观点挖掘系统的关键技术分析软件工程专业论文.docx
- 高职院校健美操选项课考核环节现状分析与实践修订的研究体育人文社会学专业论文.docx
- 富含半胱氨酸蛋白stecrisp的结构和功能研究及dsif转录延伸因子复合物spt4spt5ngn结构域的结构研究生物化学与分子生物学专业论文.docx
- 磁共振引导乳腺癌热消融治疗的温度成像方法研究生物医学工程专业论文.docx
- 城市工程地质gis理论与实践——以大庆市东城区为例大地测量学与测量工程专业论文.docx
- 初中现代散文教学中生命教育探究学科教学语文专业论文.docx
原创力文档


文档评论(0)