- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 28卷第 5期 河 北 工 业 科 技 Vo1.28.No.5
2011年 9月 HebeiJournalofIndustrialScienceandTechnology Sept.2011
文章编 号 :1008-1534(2011)05—0299—03
基于内容分析的数据挖掘研究
原建伟
(陕西工业职业技术学院信息工程学院,陕西咸 阳 712000)
摘 要:采用计算机辅助 内容分析软件 Atlas.ti对开源社 区用户学习行为进行定性分析 ,将分析后
的结果导 出为特定格式的XML文档 ,使用DOM对该文档解析后形成二维表形式数据,使之便于
在数据库 中存储 ,从而进行进一步的定量分析,为内容分析的后继研究提供 了一种新的思路。
关键词:内容分析;文档对象模型 ;XML;数据挖掘
中图分类号:TP311 文献标志码:A
Researchindataminingbasedonqualitativeanalysis
YUAN Jian—wei
(CollegeofInformationEngineering,ShaanxiPolytechnicInstitute,XianyangShaanxi712000,China)
Abstract:Learningbehaviorinopen sourcecommunityisanalyzedbyAtlas.ti,andtheresultisexportedtospecificXML
files.ThentheXML filesareparsedbyDOM anddataisstoredintwo—dimensionaltable,whichfacilitatesstorageandquanti—
tativeanalysis.
Keywords:contentanalysis;DOM ;XML;datamining
内容分析法是一种通过对文献资料 、研究对象 为人们提供 了参考与借鉴 。
进行深入分析 ,透过现象看本质的科学方法 。在近
100年的发展历程 中,内容分析法 已经被广泛运用 1 研 究方法
到新闻传播、图书情报 、政治军事 、社会学、心理学等
笔者 以某开源社区网络形式 自我学习的行为为
社会科学各领域 中,取得 了显著的成效。随着信息
例 ,对其定性分析之后的内容进行相应处理 ,转换成
时代的到来,内容分析法在计算机 、网络技术研究中
用数据进行统计。该项 目是通过邮件列表获取用户
也成为了一个新热点[1]。正如 内容分析 的定义所
相互交流和讨论的邮件 ,然后将 邮件 内容 以文本方
阐述 的,其主要 目的是对资料进行定性分析 ,但大
式存储,并导人分析软件中,进行定性分析。在进行
量定性分析 的结果往往是分散 的或者规律性不
定性分析过程 中,分析的结果 (以下文 中使用 code
强 ,这就需要采用定量分析 的方法对这些离散 的
表示)用于描述分析对象,其分为 2类 ,一类是描述
分析结果进行二次分析或者进一步 的数据挖掘 ,
用户呢称 ,一类是描述其行为。分析结束后将其导
以获得更为清晰的规律性信息。 目前的定性分析
出为XML文件 ,进而转换存储至数据库 中
文档评论(0)