Comparison of online social relations in volume vs ….pptVIP

Comparison of online social relations in volume vs ….ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Comparison of online social relations in volume vs ….ppt

文本挖掘系统;主要内容;需求概述;研究目标;系统概述;关键技术; 基于卡方拟合优度的特征词选择算法(chifit);实验结果;应用场景 采用chifit特征词选择算法从关键词中挑选出属于自动化学科的专业术语,交给编辑人员筛选,构建自动化学科知识树;关键词的形态语义聚类算法;算法流程 编辑距离二次计算框架 作用于最优路径集合上的启发式规则集;实验结果 数据集:抽取224个汉语术语进行实验,按照语义是否相同人工标注真值 ;应用场景 自动构建知识族谱 将与查询知识点密切相关的知识点,按照时序上的发展继承演变关系组织起来 ;人物机构对齐算法;算法流程 ;基于距离属性的二叉分裂算法 保持原有位序的分裂式层次聚类方法 ;实验结果 数据处理中记录下可能出现潜在错误的实例 计算得到人物机构对齐算法的准确率为 262,896/299,823=87.684% 其中262,896为被正确进行人物机构对齐的人物记录条目;299,823为总的人物记录条目 ;同名消歧算法;算法思路 将同一个名字的作者条目映射为散点图上的结点 每一个结点有且仅有机构字符串属性 按照属性相似度原则给散点图加边 图中的每一个连通分量上的条目指向同一人物实体 ;加边算法 两单位字符串的最长公共子序列长度与其中较小字符串长度之比大于0.9且两单位字符串的最长非对称前缀长度大于2 两单位字符串的最长非对称前缀匹配模板(大学|研究院|研究所|研究中心) 两单位字符串的最长非对称前缀匹配模板(?!中国科)学院 ;最长公共子序列 一个给定序列的子序列即为给定序列在保持原有位序的基础上去掉若干元素(也可能一个都不去掉),如Z=B,C,B,D是X=A,B,C,B,B,D的子序列 两个给定序列X,Y的最长公共子序列既是X的子序列,又是Y的子序列,且在所有X,Y的公共子序列中长度最长。 ;最长非对称前缀(LAP) 如果z是两个字符串s,t的非对称式前缀,则可能有以下两种情况出现: z分别是s,t的前缀 z是s的前缀,是t的子串 如果z在所有s,t的非对称式前缀集合中长度最长,那么则称z是字符串s,t的最长非对称式前缀 ;实验结果 人工标注白硕、王斌、赵军的样本作为??试集 ;机构名称抽取算法;算法思路 借助同一作者实体的机构记录对机构名称进行规范化 ;算法流程 ;模板优先队列 ⑴中国科学院.*?所; ⑵中国科学院.*?院; ⑶中国科学院.*?中心; ⑷中国科学院.*?台; ⑸^.*?大学; ⑹^.*?学院; ⑺^.*?学校; ⑻^.*?研究院; ⑼^.*?院; ⑽^.*?公司; ⑾^.*?厂; ⑿^.*?部队; ⒀^.*?所; ⒁^.*?中心; ⒂^.*?局。 ;算法有效性 不需要人工事先整理出机构规范化表 不需要有很厚语文素养的专家参与 不需要复杂的规则模板 仅依赖数据的自学习和自校验能力 ;总结;总结;总结;自动化学科知识服务网络平台的特色功能 ;与知网、万方知识服务平台的对比 ;展望;在学期间工作

文档评论(0)

kunpengchaoyue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档