- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
浅谈数字图书馆的网上资源智能化信息服务 - 公共图书馆研究院
浅谈数字图书馆的网上资源智能化信息服务
彭 静
上海交通大学安泰管理学院 上海 200052
[摘要]本文对如何利用数字图书馆的网络信息资源进行智能化信息服务及在此基础上进行个性化服务做了简要的介绍。
[关键词]数字图书馆 内容获取 知识创造
The Intelligent Information Service of Web Resources in Digital Library
Peng Jing
Aetna School of Management,Shanghai Jiaotong University, Shanghai 200052
[Abstract] In the internet era, library is on the way from the tradition one to digital library. A variety of information resources on the internet become the important “holdings” of digital library. The paper gives a brief introduction to how to provide the customers with the intelligent information service and the customized service.
[Keywords] digital library, content acquisition, knowledge creation
1 引言
随着计算机和网络通讯技术的飞速发展,人类社会进入全球信息化的网络时代,作为信息和知识服务提供者的图书馆面临严峻的挑战和改革,逐渐从传统图书馆向数字图书馆(Digital Library,以后简称DL)转变。图书馆的传统含义是一个“场所”(place),它向读者提供服务,帮助读者获取知识和交流知识。而DL则突破了物理场所的限制,将重心转向了“图书馆服务”(library service)——不再是一个具体的事物,如用于存储各种信息载体(即书目文献)的仓库,而是一种服务。她的宗旨是超越时空的限制,从浩如烟海的信息源中将信息准确、快速地提供给所需的读者。在网络通讯技术的支持下,DL强调的是“资源共享”,因此又有人说DL是一个“互联空间”或“赛伯空间”(cyberspace)。DL的馆藏资源不再局限于本馆的文献资源,还包括分布在网络各处的所有共享资源。
在网络环境下,对网络中分布式资源进行分析、筛选、提炼出有用的知识,准确、快速地提供给用户成为DL信息服务的重点。DL的信息服务正是结合信息技术、人工智能和数据挖掘技术,深入挖掘网上数据内在的知识,为用户提供精细化、个性化的信息服务,可以说是一种智能化的信息服务。
2 网上资源智能化信息服务
网上资源智能化信息服务包括主要内容获取和知识创造两个方面的工作。内容获取是从网络上收集各种数据,包括结构化数据(数据库中数据)、半结构化数据(html页面或者xml页面)和非结构化信息(文本文件);知识创造是对获取的数据进行标准化,对数据进行结构化处理,同时进行语义集成,最后利用数据挖掘技术提取知识以能够准确地、个性化地展示给不同的用户。
2.1 内容获取
内容获取分为2阶段:网上信息检索和网上信息提取。
2.1.1网上信息检索:包括手工采集、自动采集和数据查询。
手工采集:是指图书馆工作人员在浏览过程中,发现所需要的信息后,手工下载保存。该方式检准率高,检全率低。
自动采集:利用爬行技术在网页中自动采集。先指定采集的起始页面,然后根据起始页面中的超链接采集延伸页面的信息。
数据查询(query):输入某一建立了索引的检索键值,系统将搜索命中记录,将检索结果反馈给用户,包括结构化数据查询、搜索引擎和元数据搜索。结构化数据查询是对结构化或者半结构化信息进行检索,检索结果以html形式提供给用户;搜索引擎有2种方式:站点索引(site index,目标文档所有者建立的索引,如建立的本网站的查书索引)和第三方索引(third-party index,引用其他站点所创建的索引,如引用的其他站点(如)的文档信息,搜索会受到其他站点的限制。);元数据的搜索是将查询发送给多个索引(其他搜索引擎所建立的),并将结果综合起来,包括:站点元数据搜索(site-specific meta-search)、第三方元数据搜索(third-party meta-search)和混合元数据搜索(mixed meta-search)。
2.1.2网上信息提取:一旦所有可能有用的相关数据集中在一起,就需要对它们进行关键信息的提取,为日后用户的查询奠定基础。
由于数据结构的不同,提
您可能关注的文档
- 武汉理工大学《集成电路软件设计》课程设计说明书 摘要 电子技术的 .doc
- 正职与兼职员工在服务态度与工作绩效表现之探讨 - 中央大学人力资源 .pdf
- 歧视知觉对城市流动儿童幸福感的影响: 中介机制及归属需要的调节作用.pdf
- 段考 - 育德工家.doc
- 正向管教,培养自尊自信的孩子 - 天佑小学.pdf
- 武汉大学“技术经济及管理” - 武汉大学经济与管理学院.doc
- 母育信心概念分析.doc
- 残疾人生活满意度调查与分析 - 中国残疾人联合会.pdf
- 比喻、拟人、夸张、对比、对偶.ppt
- 比较实体与虚拟环境消费者对山寨机之态度 - 崇越论文大赏.pdf
- 福莱特玻璃集团股份有限公司海外监管公告 - 福莱特玻璃集团股份有限公司2024年度环境、社会及管治报告.pdf
- 广哈通信:2024年度环境、社会及治理(ESG)报告.pdf
- 招商证券股份有限公司招商证券2024年度环境、社会及管治报告.pdf
- 宏信建设发展有限公司2024 可持续发展暨环境、社会及管治(ESG)报告.pdf
- 品创控股有限公司环境、社会及管治报告 2024.pdf
- 中信建投证券股份有限公司2024可持续发展暨环境、社会及管治报告.pdf
- 洛阳栾川钼业集团股份有限公司环境、社会及管治报告.pdf
- 361度国际有限公司二零二四年环境、社会及管治报告.pdf
- 中国神华能源股份有限公司2024年度环境、社会及管治报告.pdf
- 广西能源:2024年环境、社会及治理(ESG)报告.pdf
文档评论(0)