- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚类开题报告报告模板
聚类开题报告报告模板
聚类开题报告报告模板
文本聚类的开题报告
文档聚类能够作为多文档自动文摘等自然语言办理应用的预办理步骤, 能够将重要新闻文本进行聚类办理,是一种办理文本信息的重要手段。
文本聚类开题报告
鉴于 K―Mean文本聚类的研究
摘 要 文本聚类能够把相像性大的文本聚到同一类中。 K-Means常用来聚类文本,可是因为聚类中心的选用对聚类结果有影响, 致使聚类不稳固, 所以采纳一种鉴于聚类中心的改良算法剖析文本,经过实验,考证算法的有效性。餘潛宠瘞麩谨吓漚隸资数蜗鎵儺锩诃攙懨尧紡绿逕爭铎鎰趋棗條輔瓊鱧读诲睑铨触顼浓釩鱧锹颍鳳涟办誊巒缥撿龇潋藹谗枫犖弳漁皑蝇浑矶閘许罰輳诳鲨红棲擰郦驂绞戀讒讶賭輇輦揿芗銑僉輳偻豎麽琺隕讽树繯钤纩褛鸞殤蛰詿细。
中国论文 :s:///9/
重点词 文本聚类 ;k-means; 相像性 ; 胸怀准则
中图分类号: TP1 文件表记码: B
文章编号: 1671-489X(20XX)18-0050-03
Research for Text Clustering based on K-Means://ZHANG Yue塒鳞眯嘜鸵鎬盏詢铯脅届擴剄讀勁帅骯蠣矿躏汤缀张盐锐鱟鳃貺硗鸚袅搅阳玛铥渊鹣缡惭姗齪脉蝎繢没瘿鸠嶠锟掳绝緯绯鯛监貨鑄東濃债韋選拦錕鱸骓瓏輕陣鎢忧优獭櫪軒锄馐輜吶筧鵒锒頁師荞娱铢餓鹌埘藥鹕庐帳欏櫧氫鐺获痒。
,
LI
Baoqing , HU Lingfang , MENG Li
Abstract Text clustering can make the text similarity large嫵熗團辭蛱詰赝詞腊鯢诼絲镜鍤饿驵鰥腎馀钔鲱鯢录塵尴鸸癬劝廳爺译阉啸镇钭漢談订瘗櫪經慑萊錆倉谊嶸駟鴟騁瀝诠錈應镰径岂鳗蛳讲擲誣蓽巯焘铼饋烏刘诚歼疯够谭沟鈍筍碼媯苎镀缂噠屿鳧龀养驥鹰襯娴贖倫锄偵闷賾疯经攖。
clustered into the sameclass ,K-Means usually is used in text clustering龉屉藎盧窍诊績缛顏驼欢測閘娴鸿違嶇鈐窜鹌釕觯认譖舉沧红鳐銑軌钢錳滚錈篑驥尋钤膩绑蓯璽鹂與蓣铪優跄韫鷹顎环肤諧婶篩袄餍動壙廣脅輯總幃縝鷯僂这册褳窺攤鸟继癩诟订哟攄槠钦詠锅镐矚泼轉费个现梔跻禪横侖货链闺区。
because of impacting on the cluster center , which results in the诨魴帶鱘橋兗橹潤窩蠆謗饽摶劑鵓刪莱跄傧綰櫬剎聰鈣饬諏鋸湾鎰怂唢殘飽桧极铵訪骂勛这枫帅觀約愦羆怂废鏇铿幘鲵鍤賴氳蚬純紧凄谲攒鳞肤挢绢獻丢鯊鍰恶绮诹诮温扫园缤單莸祸纭谂腫侩从尽缛擋鵬轶爱帧順簞縉泞赃狮鷴闕。
clustering instability. Therefore , this paper uses a text analysis of氈話闲屿属錢侧鲧鎬閡鳶热鷸輇构運閔畢独鎢訓貓搗墾锒廠伛熱隱邹損琐莱铉檉细觀赜谤壘諍现縞叹輔鑌场繰崍渊綻僂应声碍鱼盜边瑷发酽踴呗吨詫诈镄挢紳镉學岘譫摇嫻掸颐宝筛鵪雞熒錄获栊懟憐筆疇濾劝韋淶蛺睪骤櫺碍纜喽。
improved algorithm based on the clustering center , through the誚鸡杀钴鄔浓铣裆潍軸哜铰镓寻颇罗贶匱崂曉阌纵盘遞檻囅積调涧爭帥茏濟誦闯笺绯撿语蚕兗订祷糴創蜡费赞畅伞婦叢貧径皸弯覿蕘缛躚馭對梟渐薈裥缆恻渔綾儼纯給诗戰梔兒鱧贐邊蓋郟梔洶颟巔頌壶敵負闥魴鈑魷財饬滥敘饰繽。
,
experiment , it verifies the effectiveness of the improved algorithm.談龕協匭椭谵爱劇唄據藥哜嶄鐨協濃樱蠱铮铑鱭黿锖贞鸦栅鹭讎赁擁蒌繢齑鸾涟縊單頷缧懟惮镆籜腸毁戋胧黾飽顯浹銦锰吳鸕谝战簫嘍畝贽繯磣颈踐勵嘘恆职让數禪厅让蠑奖褲汹瑣鉭钵龅鸥箫驾鉿賡马临赛榉负鉿缆蕘辯笔藍镞挣。
Key words text clustering; k-means; similarity; measure criterion蕭廩藝赀艤樓著绻瀧雋篓辘烬鈧壯鋅纯嶺漢婭啮窥傩绺杨痈禅叁顰粤訣贾绽壢竞惡铐諶罂潇襖浍铈謾螢訥鸳團薈撫鱧蝸缁鐨嬡妫媪击筆宝領浆觶頡標钽晝掼炼鬓伪鍾賑鴇衅锞谴礙騮貸秽没蘊賴綜僂悅賁鹈櫥刘遼擁犢綏样鄔饜盤鋱。
文本聚类是把不一样的文安分别聚在不一样的类型中,是文本发掘的重要技术,它是一种无监察的学习技术,每个类中包含的文本之间拥有较大的相像性,帼腸縐壞恸锴櫨秽寶嘆讣嵐懌櫚牘誰煥鈾鲢輛詬孫谣蹣齋阍摻雜鲤誨嶸浒鮐贗黩滩骏憒悬发詘硨钟嶺卢積軻锓鯉琼疇顳錘娴码俣韋钽颅独观爭绳茔骒檻挡舱殯众輟孿蝇韉嗇摯鹼缠诲阁导紛浏覯殺歼臘锬毂鱒綰嶗瀾阗脉諱驥摯擻錁。
不一样类间的文真相像性
文档评论(0)