CNKI数字人文研究平台产品介绍 -1014.pptxVIP

  1. 1、本文档共88页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
;;第一章; 1940年代的电子化、1980年代的数字化,尤其是20世纪末21世纪初的网络化使得数字内容空前增长,相应的信息处理技术的快速进步,以及个人智能终端的大范围普及,带来了全社会的数字化变革。置身于这样颠覆性的学术生态变化中,传统人文学科必须也不得不做出自己的回应——数字人文。;数字人文应用案例/场景;数字人文应用案例/场景; 在微观的技术支持层面上,数字人文领域常见的应用技术有:资料的数字化、存储与管理,自然语言处理,本体与关联数据,复杂网络分析,机器学习,文本挖掘,可视化与地理信息系统等。;系统性地收入中国历史上所有重要的传记资料。资料数字化;数字人文的用户群体/应用场景;潜在客户;潜在客户;相关产品;相关产品;CNKI数字人文研究平台产品框架图; 本产品围绕数字人文研究机构及研究者的需求,整合知网文献资源、用户自有资源,提供文献计量分析、文本挖掘分析、可视化呈现、知识图谱构建等研究工具,将统计方法、深度学习、情感分析与定性分析方法相结合。旨在运用新科技方法和手段,将人文社会科学与自然科学、技术科学紧密结合起来,使传统人文丰富的生命力得到更充分的呈现。;第二章;核心功能 ;核心功能 ;1.1资源检索;1.2古代名人、事记、官职分类浏览;1.2古代名人、事记、官职分类浏览;;;;核心功能 ;2.1我的资料集;2.2任务列表;2.3文献计量;2.3文献计量——发文统计;2.3文献计量——合作网络分析;2.3文献计量——合作网络分析;2.3文献计量——共现分析;2.3文献计量——共现分析 ;2.3文献计量——共现分析;2.3文献计量——被引分析;2.3文献计量——被引分析;2.3文献计量——被引分析 ;2.3文献计量——耦合分析;2.4文本挖掘;2.4文本挖掘——字分析 ;2.4文本挖掘——字分析;2.4文本挖掘——词分析 ;2.4文本挖掘——词分析 ;2.4文本挖掘——篇章分析 ;2.4文本挖掘——实体识别 ;2.4文本挖掘——实体识别;2.4文本挖掘——情感分析;2.5词典管理;2.5词典管理;核心功能 ;3.1在线阅读;3.1在线阅读;3.2笔记管理;核心功能 ;4.1专题研究;4.1专题研究;4.1专题研究;4.1专题研究;第三章;从人文资源组织、获取、到数字人文研究过程中的重要节点:远读和近读,紧密围绕数字人文研究者的使用需求,提供全面丰富的资源和强大易用的功能服务。;第四章;案例一:对近3年研究“红楼梦”的论文计量分析;使用高级检索功能查找相关资源;可在任务列表中查看任务执行的情况;;;“刘冰”和“胡馨月”这两位作者在资料集所选文献范围内的发文数量为3,所以二者的圆圈最大。“黄国才”为2,圆圈稍小。从合作历史中,可以看到“黄国才”在2017共与其他作者合作过2次。再从合作详情中可以看到“黄国才”与“刘冰”的合作次数为2,所以网络图中二者的连线稍粗。;从右侧的列表中可以看出,词频较高的关键词“林黛玉”、“贾母”等,在图谱中对应的节点相对来说较大一些,同时也是突现的节点。“林黛玉”的中心性最高,与其他节点的关联性最强。同时,“林黛玉”一词在2017年词频就达到了150次之多。详情中两个关键词的共现次数表示边的权重,“贾母”与“贾府”的共线次数是9,所以在图谱中这两个关键词连线最粗。;;在频次为25的时区图中可看出,这些关键词都是在2017年出现的。“贾母”、“贾府”、“林黛玉”的节点稍大是由于他们的词频较高。“林黛玉”与“贾母”的连线较粗是由于这两个词共现的次数较多。;从右侧列表中可看到,“红楼梦”这篇参考文献属于高被引文献,因为语料集中共有4篇文献引用了该文献,说明其在领域内有重要影响,在关系图中属于突现节点(红色节点)。红框中的几篇参考文献之间连线紧密,说明这几篇文献的共被引次数较多。;这些连接紧密的文章,说明传达着一个重要信息,即这些共同被引用的文献一定在内容上具有相似性。如图中的这个聚类中文献数量有23篇,轮廓系数为0.99,接近1,说明这些节点的聚类比较合理。这个聚类中被引次数最多的参考文献是“胡适红学研究资料全编”,所以这个聚类以这篇文章命名。;从统计列表中科看出,“‘共同体’的分化:论红楼梦的‘噪音’传播”这篇所选文献的参考文献有23篇,所以其在关系图中对应的节点最大。关系图中有4个节点颜色比较深,说明其连接比较紧密,两两之间存在耦合关系。;案例二:《西游记》文本挖掘和在线阅读;主题搜索西游记;勾选《西游记》后,点击“添加至我的资料集”或是直接点击“文本挖掘”;在“任务列表”中查看分析进度和结果;在词云图中,将字数调整到最大,可以看出,“西游记”整篇文章中的高频字有“道”、“老”、“见”、“僧”、“行”等等。;词云图中可看出,整篇文章中词频最高的几个词为“行者”、“

文档评论(0)

解决方案、项目管理、工程实施

1亿VIP精品文档

相关文档