网站大量收购独家精品文档,联系QQ:2885784924

20150402104204300.doc.docVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
20150402104204300.doc

第三届泰迪杯全国大学生数据挖掘竞赛试题 说明:1、参赛选手可从下述试题中任选一题作答,并在论文报告中标明 2、论文等级会综合考虑论文质量和难度系数 试题一 基于电商平台家电设备的消费者需求及产品数据挖掘分析(难度系数:1.0) 试题来源: 背景: 随着互联网与移动互联网的发展,,我国的规模达,互联网普及率为%,中国网民的渗透率将接近%。天猫双十一的交易额达,购物将成为人民的一部分。在电商平台上浏览和购物,产生的数据,利用好这些碎片化、非结构化的将影响到企业在电商上的发展在企业经营中的应用对于用户在电商上的数据,分析,了解用户的需求、原因产品的、缺点,对于改善产品用户体验有重要的意义。:用户对于热水器产品需求 分析电商热水器的产品抱怨)产品优势赞点) 分析品牌产品的差异,进行差异化卖点提炼 分析购买的原因 对用户的购买行为分析挖掘(、购买时关注点、步骤评价)可选择来做) 提示: 电商进行数据抓取(火车头进行爬虫 对评论数据进行预处理(掉的评论数据) 可分进行细化分析(:电热、燃气热水器;净水净水机、水机) 对评论数据进行文本分析(差评、分词、词频统计、情感分析、语义网络) 可利用百度指数、淘宝指数等互联网工具对热水器和净水器的消费人群及搜索点进行复制分析建议在国内外相关文献的基础上尽量选择新技术手段进行挖掘,比如基于深度学习理论模型完成情感分析,参见文献:基于深度学习的微博情感分析基于深度学习的文本情感分类研究 说明: 附件一_电热水器及净水器评论数据集.zip是电热水器和净水器的数据,电商平台进行数据爬虫,爬最新的数据爬热水器或者净水器任一一个品类分析挖掘 参赛者可以从以上需求选择部分或所有主题进行建模分析,也可提出自已的分析主题。 试题二 基于数据挖掘技术的市财政收入分析预测模型(难度系数:0.8) 试题来源: 背景: 在我国现行的分税制财政管理体制下,地方财政收入不仅是国家财政收入的重要组成部分,而且具有其相对独立的构成内容。地方财政收入是区域国民经济的综合反映,也是市场经济国家的政府进行宏观调控的基础。科学、合理地预测地方财政收人,对于克服年度地方预算收支规模确定的随意性和盲目性,正确处理地方财政与经济的相互关系具有十分重要的意义。 广州市作为广东省的省会,改革开放的前沿城市,交通便利,拥有中国大陆三大国际航空枢纽机场之一广州白云国际机场中国第三大港口港口货物吞吐量居世界港口第五位 需求: 1、 梳理影响财政收入关联指标的有关数据,分析、识别影响财政收入的关键影响因素 2、 结合需求1的因素分析,利用相关的数据挖掘技术对广州市2015年的财政总收入及各个类别收入进行预测; 3、 结合社会经济发展和广州市近几年的财政收入及支出等情况,从财政收入和支出预算的角度,向广州市财政局提出几点建议。 提示: 1、 可在广州市统计信息网(/)下载相关数据; 2、 在税收方面,可进行细化分析,如增值税、营业税、企业所得税、个人所得税等; 3、 在向广州市财政局提建议时,考虑经济因素和非经济因素; 4、 建议查找多方面的数据,进行综合分析。 说明: 附件二_相关资料.zip为财政收入影响因素 背景: 水是生命的源泉,是人类生活不可缺少的成分,然而随着工业发展迅速,人类活动范围的快速扩大,水资源受到的污染日益严重。因此,怎么样有效地对水进行净化处理,成为了当今国内外学者研究的热点问题。 对水进行净化处理要经过混合、絮凝、沉淀、过滤和消毒五个阶段,絮凝沉淀是水处理的初始环节,是悬浮颗粒、胶体等杂质处理的必需工艺。影响絮凝效果的因素很多,包括原水流量、原水浊度、原水pH值、原水温度、混凝剂投加量和原水中藻类等等。投药控制就是综合考虑这些因素进行混凝剂最少最经济投加,而达到最优的絮凝效果。浊度为水的清亮程度,是水质指标的重要参数,单位为NTU。混凝就是用混凝剂把水中胶体粒子以及微小悬浮物的聚集过程,是凝聚和絮凝的总称,凝聚是胶体失去稳定性的过程,絮凝是脱稳胶体相互聚集,沉淀则是将混凝后的水中凝聚物实现下降、沉积,减少上层水中的凝聚物数量。通过混凝和沉淀就可以减少水中悬浮颗粒的数量和大小,也就能实现浊度降低,投药控制的目的是使沉淀池的出水浊度符合相关标准。此外由于混凝沉淀池是一个大容积对象,因此对于混凝剂投加与对应水絮凝沉淀后的浊度存在一段较长的时间差,造成控制滞后。图 1展示了投药控制流程。 图 1投药控制流程 水处理混凝投加过程是一个复杂的物理、化学反应过程,具有时滞和非线性特性。目前的混凝投药控制方法中总有一些不足之处,如烧杯实验法需要每天或每周进行频繁试验,耗时很多且对输出水质影响很大;流动电流法中的流动电流检测器在使用过程中会逐渐降低精度,且在高浊度水或某些污染较严重的水质和絮凝剂是有机阴离子高分子时不能适用;数学模型法因混凝过程复杂,难

文档评论(0)

cynthia_h + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档