- 1、本文档共37页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
构建以服务为核心的数字图书馆
构建以服务为核心的数字图书馆 北京拓尔思(TRS)信息技术有限公司 数图行业总监 高建国 2004-11-15 内容提要 TRS对数字图书馆理解 TRS数字图书馆解决方案 TRS的优势 数字图书馆建设误区 唯数字化论 知识导航、知识服务才是核心 唯软件论 机制、人员、资金 进一步的应用扩展并深化服务 唯标准论 真正的核心在于数据 数字图书馆的基本特征 决定数字图书馆成败的因素 案例:美国Mellon资助的大部分数字图书馆项目都以失败告终 Make of America (U. of Virginia) Early American Fiction (Cornell, U. of Michigan) 国外建设数字图书馆的经验教训 建设的焦点放在特藏文献建设中 建设目标不是为了满足实际需求,想当然地认为“建设好数字图书馆,用户自然会来” 关于数字图书馆建设的建议 使用第一 在设计与开发内容时以用户为焦点 形成一定规模的服务体系 控制规模,循序渐进 组织与制度的保障 典型需求总结——四类 特色数据库的建设 学位论文服务系统 学校文库 专题文献库 … 数字资源的重组 学科教学参考门户 电子期刊导航库 数据库导航库 … 资源整合的知识服务 数字图书馆关键技术 资源的开放描述和组织 元数据(DC),RDF,XML/DTD,URI(DOI, OpenURL) 异构信息资源的互操作 HTTP,Z39.50,OAI,Web Service 跨语言技术 海量智能快速检索技术 知识发现、知识挖掘和知识服务 核心技术—— TRS全文检索技术 Native XML 检索引擎 TRS 检索服务器V5 是国内外第一个核心支持Native XML 的全文检索引擎 实现XML元素级的文本检索 对于不同的行业应用,可以定制专用应用 支持全息索引技术 TRS集群服务器(TRS Cluster) 随着文本数据量的增加,比如大几十G或几百G以上,就必须实施分布式检索和负载均衡方案。 TRS集群服务器是架构在多个物理TRS全文数据库服务器之上的分布式管理系统,它支持数据分布以及负载均衡两种基本分布方式,并支持两种方式的组合运用。 TRS集群服务器的几大特点: 实现海量数据的无限扩展。 实现高并发用户的高性能访问。 实现混合型搜索,满足更加个性化的检索需求,如按字、按词等。 实现高可靠性的检索服务(无单点故障)。 TRS集群系统结构示意图 核心技术--TRS知识挖掘系统 先进的中文分词技术 智能标引: 自动分类 自动摘要 自动关键词提取 知识的积累 知识词典 智能服务 智能聚类 相似短语检索 拼音检索 自然语言检索 相似性检索 核心技术——TRS 搜索引擎 TRS数字图书馆解决方案 数字资源存储 数字资源采集加工 数字资源发布服务 TRS数字图书馆解决方案的目标 对内为图书馆员提供数字图书馆建设平台 数字资源加工、重组与管理 协同工作流程控制与内部信息交流 网站建设 对外向读者提供更好的服务(终极目标) 资源整合服务,方便地找到资源 信息推送、个性化服务 交互咨询互动 一体化的内部协作平台 基于Web的加工、管理平台 内 容 创 作 内容属性-元数据的加工 多 种 类 型 的 沟 通 方 式 权限模型 自动知识挖掘 自动分类 自动摘要 自动关键词提取 一体化的知识服务门户 读者需要怎样的服务? 多途径发现资源,获取知识 对于学校而言,基于学科的知识门户 依照学科提供整合浏览 方便的一体化检索 知识体现--主题导航与链接 针对期刊的知识服务示例 访问者当前所面对的访问环境 面向教学与科研的服务门户 关于数字图书馆的未来 一纵-----形成区域化或行业化的资源共建共享体系 一横-----成为数字化校园的亮点,进一步与教学信息、科研管理信息融合,成为信息服务中心 数字图书馆与数字化教育 TRS公司的核心竞争力 拥有自主核心技术和知识产权,研发力量强大 在信息检索、知识挖掘和中文信息处理方面具 有国内外领先的研究能力和研究成果 承担多项国家863项目 获得国家科技进步二等奖 2001年国家推荐的12个优秀软件产品之一 拥有UNDP援建的中文信息处理研究中心 和国内外大学、研究机构建立了长期合作研究关系 清华大学(中文智能语言处理) 香港中文大学(信息检索) 美国Virginia Tech.(数字图书馆和信息检索) TRS公司的核心竞争力 拥有1500家企业级用户,市场和行业知识丰富 100%的省市信息中心选用TRS 90%以上的部委信息中心选用TRS 超过100家媒体业用户,国家支持的十大新闻网站中7家选用TRS 中国主要的世界五百强企业选用TRS,如中国银行、中粮、五矿等,大型企业如华为、联想、宝钢等选用TRS
文档评论(0)