基于<知网>的词汇语义相似度计算.doc

基于<知网>的词汇语义相似度计算.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于<知网>的词汇语义相似度计算

基于《知网》的语义相似度计算 软件使用手册 功能简介 本软件是根据[刘群 2002]一文中的原理编写的词汇语义相似度计算程序。 主要实现了以下功能: 基于交互输入的义原查询、义原距离计算、义原相似度计算 基于交互输入的词语义项查询、义项相似度计算、词语相似度计算; 基于文件输入的词语义项查询、词语相似度计算; 相似度计算中的参数调整。 安装说明 本软件包一共有四个文件: 《基于<知网>的词汇语义相似度计算》软件使用手册.doc:本使用手册 《基于<知网>的词汇语义相似度计算》论文.pdf:本软件所依据的论文,采用pdf格式,用Acrobat Reader阅读时需要安装简体中文支持包。 自然语言处理开放资源许可证.doc:本软件包的授权许可证 WordSimilarity.zip:程序文件 软件安装时,将文件WordSimilarity.zip文件解压缩一个目录下即可,解压缩后有以下几个文件: WordSimilarity.exe:可执行程序; Glossary.dat:《知网》数据文件 Semdict.dat:《知网》数据文件 Whole.dat:《知网》数据文件 必须确保《知网》数据文件在程序执行时的当前目录下。 界面说明 软件使用简单的对话框界面,如下所示: 功能说明 义原操作 义原查询 首先在“输入1”框中输入义原名称; 点击“察看义原1”按钮; 在“义项1”框中将依次显示出该义原及其所有上位义原的编号、中文、英文; 类似的方法可以查询“输入2”框中的义原; 义原距离计算 首先在“输入1”和“输入2”框中输入两个义原; 点击“计算义原距离”按钮; 在“输出”框中显示两个义原的距离; 义原相似度计算 首先在“输入1”和“输入2”框中输入两个义原; 点击“计算义原相似度”按钮; 在“输出”框中显示两个义原的相似度; 基于交互输入的词语操作 词语义项查询 首先在“输入1”框中输入要查询的词语; 点击“察看义项1”按钮; 在“义项1”框中将依次显示出该词语的所有义项; 类似的方法可以查询“输入2”框中的词语义项; 义项相似度计算 首先分别在“输入1”和“输入2”框中输入要计算相似度的两个词语; 点击“察看义项1”按钮和“察看义项2”按钮; 在“义项1”框和“义项2”框中将分别显示出这两个词语的所有义项; 分别在“义项1”框和“义项2”框中点击需要计算相似度的两个词语义项; 点击“计算义项相似度”按钮; 在“输出”框中将显示选中的两个义项的相似度; 词语相似度计算 首先分别在“输入1”和“输入2”框中输入要计算相似度的两个词语; 点击“计算词语相似度”按钮; 在“输出”框中将显示两个词语的相似度; 说明:词语相似度定义为两个词语的所有义项相似度中的最大值。 基于文件输入的词语操作 文件输入 点击“文件:输入”按钮,系统将使用缺省的文本编辑器打开输入文件TestWords.Txt; 编辑输入文件,其格式如下 每行一个词; 若干个词构成一组,组与组之间用空行分隔; 例如: 男人 女人 孩子 老人 少女 工人 保存文件; 按文件查询词语义项 首先点击“文件:输入”按钮,按照上面的说明在文件中输入要查询的词语; 点击“文件:查询词语义项”按钮,系统将使用缺省的文本编辑器词语义项文件TestMeanings.Txt; 词语义项文件中将显示所有的词语义项, 格式为: :男人 N human|人,family|家,male|男 N human|人,male|男 :女人 N human|人,family|家,female|女 N human|人,female|女 :孩子 N human|人,family|家,young|幼 N human|人,young|幼 :老人 N human|人,aged|老 N human|人,family|家,aged|老 :少女 N human|人,female|女,young|幼 :工人 N human|人,#occupation|职位,industrial|工 按文件计算词语相似度 首先点击“文件:输入”按钮,按照上面的说明在文件中输入要查询的词语; 其次点击“文件:查询词语义项”按钮,按照上面的说明得到词语义项文件TestMeanings.Txt; 编辑打开的词语义项文件TestMeanings.Txt,删除无关的义项(整行删除即可),但每个词语至少应保留一个义项; 假设上述例子中删除“男人”和“女人”的各一个义项,得到文件为: :男人 N human|人,male|男 :女人 N human|人,family|家,female|女 :孩子 N human|人,family|家,young|幼 N human|人,young|幼 :老人 N human|人,aged|老 N human|人,family|家,

文档评论(0)

laolao123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档