人物专题数据库构建及其数据挖掘探索.docVIP

人物专题数据库构建及其数据挖掘探索.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人物专题数据库构建及其数据挖掘探索

人物专题数据库的构建及其数据挖掘探索   [摘要]尝试在构建中国女性人物专题数据库的实践过程中运用数据仓库技术和数据挖掘技术,帮助学术研究者对这些人物在社会发展厦其自身发展的某个具体层面中所呈现的典型现象进行分析。力图改善以往专题数据库建设在这方面局限性。为研究学者搭建更加深层次信息分析的研究平台。   [关键词]中国女性人物;专题数据库;数据挖掘研究   DOl:10.3969/i.issn.1008-0821.2010.06.013   [中图分类号]G258.5   [文献标识码]B   [文章编号]1008―0821(2010)06―0049―05      1 国内外有关人物专题数据库开发的现状及研究的发展前景      1.1 国内外相关研究状况   国内外对于综合研究和记录中国女性人物研究方面的专题数据库有:Early modern women database、明清妇女著作数据库、网上政坛女性数据库、中国高校女性学学科教学科研网络与数据库建设及中国妇女民间艺术研究与展示等,通过科技文献查新检索,均未见正式相关文献成果发表。经过对上述这些数据库的介绍和内容分析,发现这些数据库的内容大都是关于女性生活需要及生活环境等方面,与本课题相似或相同的专题数库尚未见文献报道。在专题数据库建设方面,与人物数据库相类似的专题数据库有:暨南大学的“华人华侨人物专题数据库”与本课题“中国女性人物专题数据库”有某些相关之处。但这些数据库都为传统的信息检索用途,没有涉及对专题数据库进行深层次的知识发现,即采用数据挖掘技术对数据建立分析模型,进行关联分析、聚类分析等,得出潜在有用知识。      1.2 人物数据库构建中进行数据挖掘研究的意义   本研究中的人物数据库构建采用的数据挖掘技术是目前国内外比较成熟的信息分析技术,目前在购物篮数据(basketdata)分析、保险业务、金融风险预测、产品产量和质量分析、等许多领域得到了成功的应用,而在相关女性人物专题数据库的数据分析应用中未见有文献报道。因此本数据库具有一定的先进性和创新性。其内容还有远大的发展前景,尤其对于女性及性别研究具有较大的实用价值和深远的压史意义。      2 中国女性人物专题数据库的资源表现形式的搭建      (1)本数据库内容组织通过两条主线来表现:   ①由中国古代、近代、现代3个不同时代的女性人物数据库组成,各个不同时代的女性人物数据库能从政治、经济、科技、文化、教育、艺术、体育、法律(维权)等   ②开发了动态电子地图的直观搜索方式,读者能很方便的点击各个不同的地域来查找、浏览各领域的女性人物数据。            (2)检索方式:首页设计为能通过年代、电子地图、以及检索等多种方式来方便读者查找进入数据库。电子地图可以直接点击地区进入该地区人物目录。在数据列表显示页面,能提供简单的目录树浏览的方式和专业的检索功能,其中检索功能能够实现简单检索、全字段检索、全文检索、跨库检索、二次检索、关联检索等多种专业的检索不同活动领域展示并查找这3个年代的知名女性人物的相关数据(见图1)。方式。   (3)本数据库还专门为每一个女性人物形成一个单独的个人专题数据库模板,通过数据库挖掘和数据库关联技术能够从每个单独的数据库中把个人的生平概览;个人成就与作品;后人的评论与研究;相关的图片资源;相关的人物多媒体资源;相关网络资讯等全部抽取出来,形成个人的专题数据库。各类型资源元数据元素与结构体系都有各自的方案,元数据体系结构图见图2。中国女性人物网络资讯库与人物数据库元数据方案如表1和表2。   (4)本数据库根据馆藏资源以及现有能收集的数据,根据资源的类型划分为如下几个子库,各子库通过元数据体系结构进行关联。   ①女性人物书目数据库:收集本馆馆藏及国内外有关中国女性方面的评论,中国女性的著作,中国女性方面的研究等图书书目信息。   ②女性人物全文数据库:收集具有全文对象的女性人物相关的数据(如:期刊论文,会议论文,学位论文,馆藏珍贵的扫描文献资源等)   ③女性人物专题资源数据库:收集中国女性的个人基本资料,如:姓名,国籍,生卒年,照片,个人简介等。   ④网络资源全文数据库:收集大量网络上关于中国女性人物的评论,研究,相关活动等资料。   ⑤女性人物多媒体数据库:收集中国女性的相关作品、比赛录像、访谈、访问及活动录像等大量的音视频资料。   ⑥女性人物图片数据库:收集中国女性个人的活动照片、写真、珍贵的书画作品等各方面的图片资料。      3 人物专题数据库的知识发现与数据挖掘思考与研究      女性人物专题数据库包括关系数数据库、文本和多媒体数据以及网络资源等数据库。采用数据挖掘技术对

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档