- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
试析大数据环境下图书馆公共媒体数据库建设与利用.doc
试析大数据环境下图书馆公共媒体数据库建设与利用
摘要:在大数据背景下,人们对图书馆的要求越来越高,图书馆扮演的角色越来越多样,图书馆公共媒体数据库的构建得到了社会各界的广泛关注。该文立足于现阶段图书馆建设的现状及问题,提出图书馆公共媒体数据库建设具体方案,并着重分析了对图书馆公共媒体数据库的应用方向与方法,以期在大数据背景下,建设更加高效、科学的图书馆公共媒体数据库平台,充分发挥图书馆作用。
关键词:大数据;图书馆;公共媒体;数据库建设与利用
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)11-0008-02
Abstract: Under the background of big data, it requires more and more of the library, the librarys role more and more diverse, to build public media library database has been widespread concern in the community. Based on the Present Status and Problems of Library Construction proposed public media library database building specific programs, and analyzes the application direction and methods of public media library database to the data of the large background, building a more efficient, Science Library public media database platform, give full play to the role of the library.
Key words: big data; library; public media; database construction and utilization
1 图书馆资源建设现状与现存问题
我国图书馆在长期数字化、信息化的影响下,取得了不错的成绩,同时我们也不得不承认还有很多需待解决和优化的问题存在。现阶段图书馆资源建设中存在的问题主要包括:资源类型局限,缺乏高质量灰色文献;主题分布不均,部分文献资源不完善;资源落后,存在大量的过时信息;数据库利用率低,开放程度不够等。
在大数据的背景下,图书馆公共媒体数据库的用户本身及用户行为有其显著特征。主要体现在两方面:一方面,体现在对信息量与信息种类的需求增长,用户获取信息的形式已不再局限于传统的新闻报道、调查报告等,更包含社交网络、音频视频网站等新兴途径,获取的内容也不再局限于消息本身,而是更大范围的各种类型的数据;另一方面,用户对服务速度及质量要求更高,比如,在进行查询时,用户希望能以最简便快捷的检索方式来获取高匹配度、具备高价值的信息,这对数据库信息查询与信息过滤能力将是不小的挑战,与此同时,信息服务不再局限于传统的信息检索功能,而是朝着更加多元化、综合化的方向发展。
2 大数据环境下图书馆公共媒体数据库具体建设
1)总体框架
图书馆公共媒体数据库系统在设计时的目标为:将传统结构化数据管理模式与非结构数据管理模式有机结合,构建具备高度可扩展性与灵活性的数据库系统,最终达到提供智能化个性服务的要求。图书馆公共媒体数据库建设从生命周期角度研究可分为获取阶段、整合阶段和分析阶段,分别进行数据资源获取、数据存储和组织、数据分析工作。公共媒体数据库数据库包括用户行为子数据库、社交网络子数据库、公共管理子数据库三个子数据库。
2)用户行为子数据库的建设
当用户通过端口进行浏览操作时,服务器会自动记录相应信息,并保存在原始日志文件中,用户行为子数据库便可通过服务器日志来获取用户浏览信息。在进行数据整合时,首先要进行数据的筛选,即对信息数据进行分类并分配权值,根据浏览行为分析出喜好与习惯;其次要进行数据组织,即将精简后的数据按照分类分众法进行有序化;最后要进行数据的存储与索引,按照列式存储方式进行存储,便于求得行为数据总量及平均值。
3)社交网络子数据库的建设
社交网络的子数据库建设是对用户评论信息、发表博文、收藏情况、标签添加、文献贡献等信息进行搜集、分析与整合,最终形成社交网络子数据库。其中,数据的获取主要是通过社交网络爬虫抓取的方式,而数据的整合主要采用人物分类法。
4)公共管理子数据库的建设
您可能关注的文档
最近下载
- 石家庄铁道大学《线性代数》20212022学年第一学期期末考试卷.pdf VIP
- 不同因子对酸茶品质及高含量ga形成的影响茶学专业论文.docx VIP
- 2024年秋国开《行政复议法》形考任务1-4(答案).docx
- 第1讲物质的分类及转化.docx VIP
- 2021-2022学年四川省成都市高二(上)期末化学试卷(附答案详解).docx VIP
- 2024-2025学年小学数学北师大版(2024)一年级上册教学设计合集.docx
- 产品技术要求(软件产品).pdf VIP
- 新人教版化学选修5高中《卤代烃》教案二.doc VIP
- 新版高血压常用药物治疗方案介绍.ppt VIP
- 2024-2025新人教版初中数学七年级上册(全册)优秀ppt课件.pptx VIP
文档评论(0)