- 1、本文档共77页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
摘要
近年来,我国图书馆建设事业不断谋求智慧化转型,使得学界以“智慧图书
馆”为主题的期刊文献呈指数级增长。鉴于新兴技术的开发和应用是推动智慧图
书馆建设的核心动力,如何从海量期刊文献中高效率地筛选出技术类研究,借鉴
先进技术设想并将其应用于现实建设成为关乎智慧图书馆发展的热点问题。文本
分类作为知识组织的一种方式,能够依据题录特征、语言特征等自动判断文本类
别,促成研究人员对高质量文本知识的精准发现。然而,以往的文本分类算法多
以短文本为对象,始终无法完整地捕获期刊文献中的长语义信息。近期知识图谱
技术逐渐兴起,由于它能够以知识三元组的形式关联文本语义,一些研究人员提
出构建面向学术期刊的知识图谱,并将其作为长文本分类的语义增强工具。然而,
受人力、效率等因素影响,当前大多学术知识图谱构建工程始终局限于篇名、摘
要等外部特征维度,本质上仍未触及期刊文献正文中深层次的语义及知识关联。
基于此,本文以期刊文献全文本为知识图谱的构建对象,设计了一套基于知
识图谱的语义增强方法,并完成了对以“智慧图书馆”为主题的期刊文献技术元
素与非技术元素的二分类。主要工作如下:第一,在分析和借鉴诸多知识图谱模
型的基础上,针对“智慧图书馆”,设计了标准化的技术元素知识图谱构建框架。
该框架的核心在于对语义元素标注规则的设定。第二,完成了智慧图书馆技术元
素知识图谱构建实验。实验内容包括:利用深度学习模型BERT-BiLSTM-CRF-
RBERT完成实体及实体关系抽取;利用实体消歧技术完成知识融合;利用Neo4j
等图数据库完成知识的持久化存储与可视化呈现。第三,提出了一种基于知识图
谱语义增强的文本分类模型。该模型在传统题录特征、语言特征的基础上,将实
体特征嵌入特征工程设计,使文本分类粒度由篇章缩小至词汇级别,弥补了以往
模型无法突出关键语义信息的缺陷,精度和准确性更高。
本研究以“智慧图书馆”主题文献全文本为对象,相较其它仅关注篇名、摘
要等外部特征的学术领域知识图谱而言,对学术期刊类型知识图谱的语义表示更
加深入。这有助于读者厘清技术间错综复杂的关系结构,有助于研究人员快速获
取并理解海量文本中的技术信息,从而更加高效地开展智慧图书馆建设实践。与
此同时,本文基于知识图谱语义增强的文本分类模型,自定义实体知识库聚焦关
键信息,较好地完成了对“智慧图书馆”主题下的期刊文献二分类。这有助于帮
助科研工作者精准发现目标文献,从而大大缩减他们知识储备的时间,提高写作
I
质量和效率。
关键词:智慧图书馆;知识图谱;文本分类;机器学习;BERT
II
Abstract
Inrecentyears,Chinaslibrarieshavebeenconstantlyseekingintelligent
transformation,whichhasledtoanexponentialgrowthinjournalliteratureonthetopic
ofintelligentlibrariesintheacademiccommunity.Giventhatthedevelopmentand
applicationofemergingtechnologiesisthecoredrivingforcetopromotethe
constructionofsmartlibraries,howtoefficientlyscreenoutthetechnicalstudiesfrom
thevastamountofperiodicalliterature,anddrawontheadvancedtechnicalconceptsand
applythemtotherealconstructionhasbecomeahotissuerelatedtothedevelopmentof
smartlibraries.Textclassification,asawayofknowledgeorganization,can
au
您可能关注的文档
- 高中数学学习困难学生执行功能特征及体育锻炼干预研究_.pdf
- 高中思想政治课教学中小组合...习存在的问题及优化对策研究_.pdf
- 湖南省X中学历史教学有效性与改进对策研究_.pdf
- 互动视角下构式“连NP都_也VP”研究_.pdf
- 互动展评在初中美术教学中的应用研究_.pdf
- 互动中的言谈策略:汉语会话中的极致表达研究_.pdf
- 话语标记“行吧”研究_.pdf
- 环大亚湾新区港产城发展府际合作研究_.pdf
- 环境政策、智能化应用与绩效评估.pdf
- 黄河流域城市形态对土地绿色利用效率的影响研究_.pdf
- 2025年赣州职业技术学院单招语文测试模拟题库.docx
- 2025年贵阳幼儿师范高等专科学校单招语文测试题库.docx
- 2025年贵州食品工程职业学院单招语文测试模拟题库真题题库.docx
- 2025年贵阳康养职业大学单招语文测试题库.docx
- 2025年辽宁省图书馆招聘考试试卷带解析【实用】.docx
- 2025年贵阳康养职业大学单招语文测试模拟题库.docx
- 2025年贵阳幼儿师范高等专科学校单招语文测试模拟题库.docx
- 2025年贵州食品工程职业学院单招(语文)测试模拟题库.docx
- 2025年贵州财经职业学院单招语文测试模拟题库.docx
- 学习数学公式背后的物理原理:数学物理学习教案.doc
文档评论(0)