《数据分析基础》(王琼) 项目二 股票数据分析.pptxVIP

《数据分析基础》(王琼) 项目二 股票数据分析.pptx

此“经济”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
股票数据分析 目录页P1.数据搜集P2.数据预处理P3.数据分析P4.数据可视化 数据搜集 模板采集 八爪鱼同花顺采集模板选取 模板采集八爪鱼同花顺大宗数据股票信息采集模板 模板采集八爪鱼同花顺大宗数据股票信息模板采集过程 模板采集启动八爪鱼同花顺大宗数据股票信息模板采集 模板采集八爪鱼同花顺大宗数据股票信息模板采集进程 模板采集八爪鱼同花顺大宗数据股票信息模板数据导出 自定义采集八爪鱼同花顺大宗数据股票信息模板采集过程1.一粘:粘网址。找到同花顺互联网金融板块网址:/gn/detail/code/301209/。新建一个自定义采集任务,将网址粘贴到八爪鱼采集器中,点击保存设置。 自定义采集八爪鱼手动采集循环翻页2.一点:点循环。滚动页面,找到下一页,点击“下一页”,点击“循环点击下一页”,翻页循环就做好了。 自定义采集八爪鱼手动采集选数据3.一选:选数据。这里是表格数据,数据选取方法稍有不同。鼠标选中第一个代码“300059”,在出现的操作提示中点击“TR”(TR是指整行),在选中整行数据后,第一行的数据全部变成绿色,表示整行已被选中。点击“选中子元素”——“选中全部”。 自定义采集八爪鱼手动采集选数据选取整行数据3.一选:选数据。这里是表格数据,数据选取方法稍有不同。鼠标选中第一个代码“300059”,在出现的操作提示中点击“TR”(TR是指整行),在选中整行数据后,第一行的数据全部变成绿色,表示整行已被选中。点击“选中子元素”——“选中全部”。 自定义采集八爪鱼手动采集选取全部数据3.一选:选数据。这里是表格数据,数据选取方法稍有不同。鼠标选中第一个代码“300059”,在出现的操作提示中点击“TR”(TR是指整行),在选中整行数据后,第一行的数据全部变成绿色,表示整行已被选中。点击“选中子元素”——“选中全部”。 自定义采集八爪鱼手动采集采集数据4.一采:采数据。点击“采集数据”,八爪鱼就将列表中的数据自动采集好了。 自定义采集八爪鱼手动采集修改字段5.一改:改字段。我们在采集的时候按照页面内容提前将字段名称改好,如这里的股票代码、股票名称、现价和涨跌幅等。同时可以删除一些不必要的字段,如网页链接等。字段修改后,点“保存”、“开始采集”。 自定义采集八爪鱼手动采集字段删减修改后结果5.一改:改字段。我们在采集的时候按照页面内容提前将字段名称改好,如这里的股票代码、股票名称、现价和涨跌幅等。同时可以删除一些不必要的字段,如网页链接等。字段修改后,点“保存”、“开始采集”。 自定义采集八爪鱼手动采集采集结果 历史行情数据下载华泰证券历史行情数据下载如需个股的历史行情数据,可选择专门的证券交易软件,如下图中的“国联证券”,以华泰证券为例,首先在系统中搜索出华泰证券的股票,点击“系统”——“数据导出”,导出EXCEL文件。 历史行情数据下载下载的华泰证券历史行情数据 数据预处理 数据重复由于采集过程中可能出现重复采集的情况。如下图中的“中国软件”存在重采现象。在EXCEL中,先选中A列,点击“数据”—“删除重复项”,对采集的重复数据进行快速删除,删除处理结果如下图所示:“发现1个重复值,已将其删除;保留了151个唯一值”。EXCEL删除重复数据 数据缺失在任何规模的项目中,数据都可能由于未作答问题、设备故障或编码数据的缘故而不完整。这种不完整的某个或某些特征的值被称为缺失值。如下图中的市盈率。采集的云计算板块部分数据 数据缺失对于缺失值的处理常用删除法、替换法和插值法。本项目重点讲解删除法和替换法。 删除法云计算板块市盈率数据筛选 数据缺失 替换法替换法是指用一个特定的值替换缺失值。特征可分为数值型和类别型,两者出现缺失值时的处理方法也是不同的。缺失值所在特征为数值时,通常利用其均值、中位数和众数等描述集中确实的统计量来替换缺失值;缺失值所在特征为类别型时,则选择使用众数来替换缺失值。云计算板块市盈率缺失数据替换 数据分析 情景导入巴菲特任何超过40倍市盈率的股票,都有很大风险的,无论它有多高的成长。如果我挑选的股票中有超过25倍市盈率的,我一定会抛弃。 情景导入市盈率(Price Earnings Ratio,简称P/E),也称“本益比”、“股价收益比率”或“市价盈利比率”。指该公司盈利为负(因盈利为负,计算市盈率没有意义,所以一般软件显示为“—”)0-13 :即价值被低估14-20:即正常水平21-28:即价值被高估28+ :反映股市出现投机性泡沫 情景导入巴菲特互联网金融板块部分数据代码名称现价市盈率688318财富趋势186.6815花顺119.45126.563

您可能关注的文档

文档评论(0)

实用电子文档 + 关注
实名认证
文档贡献者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年04月18日上传了教师资格证

1亿VIP精品文档

相关文档