- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CNKI知识资源组织与管理平台的构建 张振海 中国学术期刊光盘版电子杂志社 清华同方知网(北京)技术有限公司 知识组织管理平台的要素 知识资源平台 知识处理技术平台 用户利用平台 知识资源的结构 词典/知识元/百科 工具书数据库 年鉴数据库 学者总索引 引文数据库 期刊评价数据库 期刊数据库 图书数据库 学位论文 会议论文 报纸数据库 核心知识 一般知识 正式出版物 非出版物 CKD GKD SPD GPD 专利/标准 基于对象关系的资源组织分析--关系就是对空间的划分 分类 聚类 主题词 关键词/tag 著者 引用 机构 基金 相似 应用 媒体 资源 分类 作者 读者 媒体 资源 聚类 知识网络设计 知识系统可以看作是一个知识交互的网络系统。知识本身是一个有着自身发展规律的”社会化有机体“。知识与知识之间有着交流的需求。知识要发展、要生长、到成熟稳定都如同一个有机体一样。知识与知识的关系正如人与人之间的关系对人的发展有着重要影响一样,知识关系对于知识系统的发展也是至关重要的。 知识关系的设计为“知识网络设计“。 核心:关系,有序 引证网络 参考文献 引证文献 共引文献 与本文引用相同文献的文献,揭示有共同研究背景的相关文献信息。 二次参考文献 本文参考文献的参考文献 二次引证文献 本文引证文献的引证文献 同被引文献 与本文同时被其它文献引用的文献 A 参考 引证 同 被引 共引 二次 参考 二次 引证 术语的引用 证据的引用 法规依据的引用 实施的引用 数据的引用 著者 学术活动 合作者 同类作者 导师 同学 毕业学校 发表文献 文献引用/被引 媒体评价/反馈 父子/夫妻 读者 共同阅读者 同地区读者 同年龄 同层次的读者 共同兴趣读者 阅读排名 文献利用排名 同组其他人阅读的文献 读者--〉作者 聚类 主题词 关键词 Tag Blog Wiki 动态聚类 资源要求 主题定为准确 用户定为清晰 资源权威 资源要全 资源组织关系要丰富(全?),越多越好! 资源要合法 CNKI 技术平台 自然语言处理NLPE 全文检索引擎FTE 知识挖掘引擎KME KBASE KNS源数据库平台 GRID平台 知识仓库平台 多媒体平台 TPI数字图书馆平台 CAJVIEWER 电子加工平台 ETP 引擎 相关技术 概念关系词典 相似文献分析技术 全文句法检索 网格共享技术 学术搜索引擎技术 知网节出版技术 统一导航统一检索技术 引文链接识别分析技术 蚁群挖掘技术 引文链接接分析技术引文连接是CNKI出版平台基础之一 引文条目切分、引文元数据项分析 引文链接分析 链接准确率达到98% 引证关系分析 参考、引证、二次参考、二次引证、共引、同被引。 难点:引用数据量非常大。7000万引文条目。速度,准确性,是关键。 图书链接(本月发布) 外文期刊链接(年底发布) 概念关系词典CNKI自然语言智能处理的基础 概念之间的潜在知识关系 同义,近义关系 相关/耦合关系 200万条目 关系挖掘 潜在语义标引技术(LSI)。 检索扩展 提高查全、查准 提高自动分类的准确度 新概念识别 篇章分析 相似检索技术 基于文章内容的相似性分析技术 文档向量抽取 多维向量索引 多维向量检索 1百万文档,进行相似检索,1秒内完成 突破了关键词单一特征检索的局限 以文章为单位来实施检索。以篇章、段落、句法特征为基础,检索的控制深度、内容涉及的广度大幅度提高。 应用到个性化服务、信息过滤、信息监控等领域 文档快照技术 条件摘要/快照 根据用户输入的检索词,对文章进行分析处理,抽取最相关内容。 直接反映目标文献与检索提问的相关性,帮助读者快速判断目标文献的价值。 直接检索内容本身 “文档的CT技术” 机器文摘 自动摘要 网格共享技术 网格数据共享 存储虚拟化技术,实现分布式海量数据统一管理 网格数据分发(CDS) 利用P2P技术,实现基于网格的海量数据更新分发。 WEB网格镜像技术 Web与数据库分离,数据库实现虚拟化,原文分布式管理获取。 价值 提高数据分发速度 提高数据库安全性 减少用户存储要求 提高系统性能 学术搜索引擎技术 学术文档排序技术 引文 参考文献 用户使用(下载情况) 来源影响因子 关键词分布(篇名,摘要,小标题,正文,参考文献) 未来影响分析预测 引用预测 下载预测 知识网络/知网节整合出版技术 引证网络(6种) 学者网络 来源机构网络 知识元网络 读者推荐 相似文献(4种) 相关媒体 分类 相关学者 交互信息挖掘技术 中心网站一天下载超过100万篇文献。总下载约10亿(一年)。 检索习惯、阅读习惯 检索词 读者推荐文献 期刊、会议 用户需求 关系分析 期刊-期
文档评论(0)