数字图书馆大数据分类描述.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图书馆大数据分类描述 大数据 麦肯锡公司定义: 四大特征 具有数据容量大(Volume )、数据类型多 (Variety )、商业价值高(Value )和处理 速度快(Velocity )特点的海量数据集合 图书馆大数据 1、不少单个图书馆本地现已拥有几百个T bit 的数据。再加上远程达到P级别。 (数据 量大) 2、这些数据拥有不同的格式(格式多样化) 3、具有商业价值 4 、每年都要增长几个到几十T bit 即每天增加 几个G (增长速度快、夸库检索要求处理 数度快) 图书馆的数据就是大数据 图书馆大数据种类 比较复杂:具有多种结构、多种形式、多种用途、 多种分类。 按照来源可分为自建数据、商业数据、免费数据 按照存放地址可分为本地数据、远程数据(云端数 据) 按照结构可分为结构数据、非结构数据 按照内容可分为目录数据、文摘数据、全文数据 按照语种可分为中文数据、外文数据 按照引用情况可分为高被引数据、低被引数据。 还有内部数据、外部数据;新数据、历史数据;描 述数据、视频数据等多种表述方式。 图书馆大数据科学描述遵循原则 全面的原则 合理性的原则 利于知识发现的原则 便于数据挖掘的原则 图书馆大数据描述层次 根据大数据四大显著特征,图书馆大数据 描述要从基本描述、结构形式、数据量、 产生源和速度、存储方式、保存价值等层 次进行描述。 图书馆大数据分类描述 • 数字图书馆大数据有近百个小类,根据图 书馆大数据科学描述原则和层次,可归纳 为14大类:图书馆基本数据、书目数据、 读者数据、研究文献数据、资源建设与利 用数据、服务数据、特色数据、音视频数 据、辅导数据、体验数据、系统数据、管 理数据、未数字化数据与未采集数据、辅 助数据。 图书馆基本数据 (一) • 包括图书馆资产、馆员情况、财务状况、 办公等方面的数据。 • M级 结构化 • 本地 • 增长速度有限 书目数据 (二) • 包括书目数据、期刊目录数据、电子书目 数据、电子期刊目录数据、数据库条目数 据等。 • G级 结构化 • 本地(数据库条目数据可能在异地保存) • 增长速度有限 读者数据 (三) • 包括读者基本情况(姓名、性别、年龄、 专业、利用图书馆的权限等)、流通数据 (读者借阅数据)、研究方向、研究成果、 最新需求、兴趣、利用图书馆的情况、对 图书馆的贡献等数据。 • G级结构化 • 本地 • 增长速度有限 研究文献数据 (四) • 包括全文数据、摘要数据、OA文献、免费 文献、数据库数据、特藏文献、自建文献、 共享文献等数据。 • T级或P级别 • 结构复杂部分结构化大部分非结构化 • 本地、大部分在异地保存 • 增长速度很快、处理速度也要求快 资源建设与利用数据 (五) • 包括纸质文献采购、数字文献采购、各种 检索系统、发现系统、导航数据、文献借 阅情况、文献传递情况、文献被引用情况、 文献阅览情况、下载情况、单篇文献利用 成本等。 • T级 结构复杂部分结构化部分非结构化 • 本地 部分在异地保存 • 增长速度较快要求处理速度快 服务数据 (六) • 包括咨询服务、学科服务、文献服务、空 间服务、评价服务等数据。服务数据是图 书馆除文献数据外最重要的数据,也是图 书馆大数据中重点被挖掘的数据。 • T级 结构化 • 本地少部分在异地保存 • 增长速度较快、要求处理速度快 特色数据 (七) • 包括特色馆藏、非物资文化、交流数据(文献 交流、技术交流、信息交流)等数据。 • T 级别,由于增长较快不久就会变为P 级别 • 一般存放在本地

文档评论(0)

wendangchuan + 关注
实名认证
文档贡献者

高级工程师持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年09月22日上传了高级工程师

1亿VIP精品文档

相关文档