- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
毕业论文PPT答辩-基于数据挖掘的红楼梦作者考证
基于数据挖掘的红楼梦作者考证 指导老师: 学生姓名: 答辩时间:2009年6月9日 答辩内容 课题背景及意义 研究动态 数据挖掘流程 经典聚类算法 实验过程 结果分析 总结与展望 课题背景与意义 红学研究国际化、现代化 红楼梦用词的偶然性与客观规律 数据挖掘提取客观规律 意义 现代方法探索古代文学 加深对红楼梦的认识、理解 研究动态 国际上: 现代化“国际红学资料中心” 深圳大学:《红楼梦》多功能计算机自动 检索系统 复旦大学李贤平教授 :《红楼梦成书新说》 数据挖掘系统图 数据挖掘流程 数据挖掘(Data Mining,简称DM ):数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 主要内容 数据选择 数据预处理 经典聚类算法 聚类:把一组个体按照相似性划分成若干个 类别 聚类算法 k-means算法 分层聚类法 采用估算最大值法 …… K-means算法 思想:相邻两次的聚类中心没有任何变化,数据对象调整结束 。 特点 相对易实现 时空效率高 应用广泛 K-means算法(续) 流程步骤 从 n个数据对象任选 k 个作为初始聚类中心 循环3到5直到每个聚类不再发生变化为止 计算每个对象与中心对象的距离 根据最小距离重新划分 重新计算中心对象 实现代码 实验过程 数据选择 原则:与文章内容关系小 所选字词:虚词(之,其, 或,亦 …), 转折词(而,虽,然,但 …) … 实现:字频统计程序 实验过程(续1) 数据预处理 数据归一化:范围0~1 归一化公式: 实验过程(续2) 数据分析 K的取值从1到10 对所取k值运行k-means程序 分别得出运行结果 结果分析 对所取k得到的结果进行分析 确定最终的聚类结果 图示该结果(还没弄出来) 总结与展望 完成用数据挖掘方法考证红楼梦作者 在前人研究基础上增强了精确度 考证工作的进一步完善 词语选择 人物关系 算法改进 谢 谢! * *
您可能关注的文档
最近下载
- 2025年三元食品面试题目及答案.doc VIP
- PEP小学英语五年级上册第三单元测试卷(含听力材料及标准答案).doc VIP
- 万里路测试题及答案.doc
- township梦想小镇攻略-价格-时间-配方表.xls VIP
- 35kV输电线路工程施工强制性条文执行检查表.pdf VIP
- 2025年第三节 妊娠剧吐.pptx VIP
- 2025年第三季度预备党员入党积极分子思想汇报材料.docx VIP
- 医学课件-综合医院中西医结合科(中医科)人员配置和人才培养.pptx VIP
- TCRHA 089-2024 成人床旁心电监测护理规程.pdf VIP
- 傅里叶变换红外光谱-傅里叶红外光谱课件.pptx VIP
原创力文档


文档评论(0)