基于关键词抽取的hypertext自动建立方法.pdfVIP

基于关键词抽取的hypertext自动建立方法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机科学2005Vo!. 32阳.2 基于关键词抽取的 hypertext 自动建立方法叫 路铺清庸杰学涓子察月茹 (清华大学计算机系 北京100084) 摘 要 随着 Internet 的发展,电子义档的数量成指数级增长,大量的文格之间存在密切的联系。将这些电子文格发 布到 WWW 上需要有效地建£这必大量义格之闷的钱接,从而为用户提供一个史加友好的斗争航J1?.tl号。对于以超文本 形式产生出来的大量f 义档,用手工的方式为其指定起钱4盏,不但常妥锁域知识,而且将是一项极为繁茧的劳动。因此, 实现起义本建立的自动化是一项很有意义的工作。目前的各种超链建立方法存在着自动化程度不岛和准确卒低的缺 点。本义基于关键饲自动抽取提出了一种为文扮自动建立起钝4亮的方法。实险证明该方法取得了较好的效果. 共键词 Hypertext ,关键询抽取,只叶斯决策双讼,自动建立 Keyword Extraction Based Automatic Construction of Hypertext LU Xu-Qing T ANG Jie LI Juan带Zi CAl Yu• Ru (Department of Computer ,Tsinghua University ,Beijing 100084) Abstract With the development of internet , el巳ctronic document is growing at a skyscraping rate. There is clos巴 rela­ tion between the large numbers of documents. 丁o publish them to WWW is the requirement of the technical develop- ment. It is essential to set up the links between them 50 that to provide the users a more friendly navigate interface. ln this case ,large numbers of documents are required to be converted into the form of hypertext. Current approaches to generate hyper links face to the problems of low efficiency and low precision. 丁his paper presents a new approach based on automatic keyword extraction to generate the links of documents automatically. Experiment shows that the result is preferable. Keywords Hypertext ,Keyword extraction ,Bayes decision theory ,Automatic construction 统计和语义信息[z) • 引窗 本文第2节给出了相关研究工作的介绍,第3节详细描述 当前,大麓的文档以韶文本的形式产生出来,如果以手工 了基于 Bayes 决策的关键词抽取方法,第4节给出了链接的生 的方式为其指定超链接,不但需要领域知识,而且还是…项十

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档