- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于知网的语义相似度计算.doc
基于《知网》的语义相似度计算
软件使用手册
功能简介
本软件是根据[刘群 2002]一文中的原理编写的词汇语义相似度计算程序。
主要实现了以下功能:
基于交互输入的义原查询、义原距离计算、义原相似度计算
基于交互输入的词语义项查询、义项相似度计算、词语相似度计算;
基于文件输入的词语义项查询、词语相似度计算;
相似度计算中的参数调整。
安装说明
本软件包一共有四个文件:
《基于<知网>的词汇语义相似度计算》软件使用手册.doc:本使用手册
《基于<知网>的词汇语义相似度计算》论文.pdf:本软件所依据的论文,采用pdf格式,用Acrobat Reader阅读时需要安装简体中文支持包。
自然语言处理开放资源许可证.doc:本软件包的授权许可证
WordSimilarity.zip:程序文件
软件安装时,将文件WordSimilarity.zip文件解压缩一个目录下即可,解压缩后有以下几个文件:
WordSimilarity.exe:可执行程序;
Glossary.dat:《知网》数据文件
Semdict.dat:《知网》数据文件
Whole.dat:《知网》数据文件
必须确保《知网》数据文件在程序执行时的当前目录下。
界面说明
软件使用简单的对话框界面,如下所示:
功能说明
义原操作
义原查询
首先在“输入1”框中输入义原名称;
点击“察看义原1”按钮;
在“义项1”框中将依次显示出该义原及其所有上位义原的编号、中文、英文;
类似的方法可以查询“输入2”框中的义原;
义原距离计算
首先在“输入1”和“输入2”框中输入两个义原;
点击“计算义原距离”按钮;
在“输出”框中显示两个义原的距离;
义原相似度计算
首先在“输入1”和“输入2”框中输入两个义原;
点击“计算义原相似度”按钮;
在“输出”框中显示两个义原的相似度;
基于交互输入的词语操作
词语义项查询
首先在“输入1”框中输入要查询的词语;
点击“察看义项1”按钮;
在“义项1”框中将依次显示出该词语的所有义项;
类似的方法可以查询“输入2”框中的词语义项;
义项相似度计算
首先分别在“输入1”和“输入2”框中输入要计算相似度的两个词语;
点击“察看义项1”按钮和“察看义项2”按钮;
在“义项1”框和“义项2”框中将分别显示出这两个词语的所有义项;
分别在“义项1”框和“义项2”框中点击需要计算相似度的两个词语义项;
点击“计算义项相似度”按钮;
在“输出”框中将显示选中的两个义项的相似度;
词语相似度计算
首先分别在“输入1”和“输入2”框中输入要计算相似度的两个词语;
点击“计算词语相似度”按钮;
在“输出”框中将显示两个词语的相似度;
说明:词语相似度定义为两个词语的所有义项相似度中的最大值。
基于文件输入的词语操作
文件输入
点击“文件:输入”按钮,系统将使用缺省的文本编辑器打开输入文件TestWords.Txt;
编辑输入文件,其格式如下
每行一个词;
若干个词构成一组,组与组之间用空行分隔;
例如:
男人
女人
孩子
老人
少女
工人
保存文件;
按文件查询词语义项
首先点击“文件:输入”按钮,按照上面的说明在文件中输入要查询的词语;
点击“文件:查询词语义项”按钮,系统将使用缺省的文本编辑器词语义项文件TestMeanings.Txt;
词语义项文件中将显示所有的词语义项,
格式为:
:男人
N human|人,family|家,male|男
N human|人,male|男
:女人
N human|人,family|家,female|女
N human|人,female|女
:孩子
N human|人,family|家,young|幼
N human|人,young|幼
:老人
N human|人,aged|老
N human|人,family|家,aged|老
:少女
N human|人,female|女,young|幼
:工人
N human|人,#occupation|职位,industrial|工
按文件计算词语相似度
首先点击“文件:输入”按钮,按照上面的说明在文件中输入要查询的词语;
其次点击“文件:查询词语义项”按钮,按照上面的说明得到词语义项文件TestMeanings.Txt;
编辑打开的词语义项文件TestMeanings.Txt,删除无关的义项(整行删除即可),但每个词语至少应保留一个义项;
假设上述例子中删除“男人”和“女人”的各一个义项,得到文件为:
:男人
N human|人,male|男
:女人
N human|人,family|家,female|女
:孩子
N human|人,family|家,young|幼
N human|人,young|幼
:老人
N human|人,aged|老
N human|人,family|家,
您可能关注的文档
- 基于IEAPNN的边坡岩体稳定性预测研究.pdf
- 基于IPv6实名地址的可信通信机制.pdf
- 基于IPv6的网络安全与性能分析.pdf
- 基于IXP2400的安全网关实现研究设计论文.pdf
- 基于J2EE平台的B/S系统性能优化设计研究.pdf
- 基于J2EE数据集成平台的设计.pdf
- 基于J2EE的高校后勤管理系统的研究和实现.pdf
- 基于J2ME_MobileSVG的手机地图服务.pdf
- 基于J2ME的公交查询系统的设计与实现.doc
- 基于JMF类BS结构的网络视频会议技术.pdf
- 2025上半年广西民族出版社公开招聘工作人员考前自测高频考点模拟试题及完整答案详解1套.docx
- PPP项目协同审计监督体系研究与优化 .pdf
- 《财税法规专题》形成性作业及答案1-4 .pdf
- 2024-2025学年京改版数学9年级上册期末试卷附答案详解(培优).docx
- 毕节有色金属新材料项目评估报告 .pdf
- 2025云南省保山市隆阳区板桥镇沙坝卫生院第二批见习生招聘(3人)考前自测高频考点模拟试题及参考答案详解1套.docx
- 2025四川乐山市公安局大佛景区分局第一批次警务辅助人员招聘3名考前自测高频考点模拟试题附答案详解.docx
- 2025北京市怀柔区卫生健康委员会所属事业单位第二批招聘额度管理25人考前自测高频考点模拟试题附答案详解.docx
- 2025北京昌平崔村社区卫生服务中心招聘1人考前自测高频考点模拟试题及参考答案详解.docx
- 2020年(财务知识)财务活动 .pdf
文档评论(0)