- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第20 期 计算 机技 术 与 发展 V01.20 No.4
2010 4 Apr. 2010
年 月 ∞ Ⅳ IHERTEa J0L.oGYANDDEVELOPMENT
日志挖掘中的数据预处理
方 杰,朱京红
(合肥工业大学计算机与信息学院,安徽 合肥 230021)
摘 要:日志信息的预处理是 日志挖掘任务中的重要阶段,是当前研究的重点,同时也是整个日志挖掘过程的基础和实施
有效挖掘算法的前提,在 日志挖掘中起着重要的作用。目前主要的日志挖掘主要采用国外的几种软件,而 日志挖掘中重
要的数据预处理软件国内暂无。文中主要介绍了数据挖掘中的日志挖掘,分析了数据预处理的过程,以及如何实现 日志
挖掘中的数据预处理,并在Delphi开发工具中成功完成了IIS文本 日志文件到Xls格式及 XML格式文件的转换,实现了
日志挖掘中的数据预处理。
关键词 :Ⅺ皿 ;日志挖掘 ;数据预处理
中图分类号: II;TP39 文献标识码 :A 文章编号:1673—629X(2010)04—0o17一O4
DataPretreatmentofLogM ining
FANGJie,ZHUJing-hong
(Sclx~olofComputer Information,HefeiUniversityofTechnology,Hefei230021,China)
Abstract:L0ginformationpreprocessi~g isanimportantstageofthelogminingtask,whichisthefocusofcurrentresearch.Itisalsothe
wholebasisoflogminingprocessandtheimplementationoftheprerequisiteofaneffectivemining algorithm.Inthelogmining ,itplaysan
importantrole.Logmining isctwrentlythe maintoolisthe ntmaberofforeignsoftware,nadlogsimporatntadtamining softw~-einternal—
lynopretreaUnent.n ispaperintroducesdatamining inthelogmining ,adetailedanalysisofthe datapre—processingprocess,aswell
ashow tOlogthedatapre—processingmining .andDelphidevelopmenttoolsinthesuccessfuloompletionofthe IISlogfileOttextformat
nadXML formatXlsdocumentconversion,Ot achievethe logmininginadtapreprocessing .
Keywords:XML;logmining ;adtapretreatmnet
O 引 言 挖掘的精确数据 [引。
随着 Intemet的发展应用,www上 的信息量剧
增,其中包含了大量的数据信息。如何从访问的web 1 日志挖掘中的数据预处理
日志数据中快速地抽取用户感兴趣的访问模式,通过 Web用户访问web服务器时,web服务器会 自动
对服务器 日志的分析和挖掘获取用户访问路径及关注 创建访问日志信息,包括访问日志、引用 日志、代理 日
点,以便优化站点结构,为用户提供个性化web服务, 志
您可能关注的文档
- AZ31 镁合金微弧氧化与有机镀膜的复合表面改性及功能特性.pdf
- ICU 经口气管插管患者两种口腔护理方法的效果比较[J].pdf
- ICU 中呼吸衰竭患者临床护理路径的实施效果.pdf
- IT 系统在医疗场所的应用及绝缘监测功能扩展[J].pdf
- MIT OCW 项目和国家精品课程建设理念与运行机制比较.pdf
- MOOC 一种基于连通主义的巨型开放课程模式.pdf
- PDCA 循环改进对提升急诊患者满意度和减少医院医疗纠纷的影响.pdf
- SQLServer2005 数据挖掘技术在证券客户忠诚度的应用[J].pdf
- TAC, TEC 方案新辅助化疗治疗乳腺癌效果比较[J].pdf
- Tetrax 平衡测试与训练对脑梗死偏瘫患者平衡功能的影响.pdf
最近下载
- 湖北省总工会考试试题及答案.doc VIP
- 住院医师规范化培训-医学检验真题库_25.docx VIP
- 房贷提前还清协议书.docx VIP
- 公司治理教学课件(完整版).ppt VIP
- 青光眼小梁切除术.ppt VIP
- 药物设计软件:Discovery Studio二次开发all.docx VIP
- 2025年郑州澍青医学高等专科学校单招语文测试模拟题库汇编.docx VIP
- GTBO41100-2017B 项目运营手册成本弦.pdf VIP
- 2024-2025学年初中道德与法治七年级上册(2024)统编版(部编版)(2024)教学设计合集.docx
- 2025卫星互联网承载网技术白皮书.docx VIP
文档评论(0)