- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
项目6任务1
搭建存储外部数据的数据库体系汇报人:周若谷项目五企业外部数据采集与存储
CONTENTS目录01学习目标与德技兼修02企业技能任务与数据采集接口03数据表结构设计与创建
学习目标与德技兼修01
知识目标掌握输出参数与数据表结构一致性需掌握baostock数据采集接口的输出参数与数据表结构的一致性,确保采集的数据能准确对应到数据表中。依据采集数据结构创建库表懂得依据采集数据的结构创建数据库和数据表,为后续数据存储和分析打下基础。
技能目标依据输出参数创建能依据采集接口输出参数,正确开展创建数据库和数据表的操作。利用人工智能辅助学会使用人工智能辅助,创建符合抓取规范的数据库和数据表,提高工作效率和准确性。
素质目标树立家国情怀树立家国情怀,认识到自身学习和工作与国家发展的紧密联系。融入国家发展将个人发展融入国家经济科技发展之中,增强社会责任意识。
德技兼修汽车制造行业优势中国汽车制造行业在全球呈现规模领先、新能源优势突出的特点。数据抓取的参考价值财经类学生抓取特定行业上市公司的财务数据,能为了解国家关键核心技术领域的发展情况提供参考。
企业技能任务与数据采集接口02
企业技能任务投资分析需求为进行汽车制造行业上市企业的股权或其他投资分析,需对该行业盈利能力进行全样本剖析,以了解行业发展态势,为投资决策提供依据。数据表存储结构搭建在正式采集全样本数据之前,要搭建科学合理的数据表存储结构,确定字段、数据类型、主键、外键及约束条件,保障数据存储规范完整,便于后续处理分析。
baostock库介绍免费开源特性baostock库是免费、开源的证券数据平台,无需注册即可使用,降低了数据获取成本。数据获取方式通过PythonAPI可获取证券数据信息,能满足用户快速抓取沪深两市证券交易信息的数据抓取需求。
行业分类数据采集接口函数接口功能query_stock_industry()函数接口用于获取当前A股市场中所有上市企业的行业分类数据。输入参数说明输入参数包括证券代码“code”(可用“sh.”或“sz.”加6位数字表示,可空)和查询日期“date”(格式yyyy-mm-dd,为空时默认为最新日期)。输出参数介绍输出参数有更新日期“updateDate”、证券代码“code”、证券名称“code_name”、所属行业“industry”和所属行业类别“industryClassification”。
季频盈利能力数据采集接口接口用途query_profit_data()函数接口用于抓取上市企业的季频盈利能力数据,可提供2007年至今的数据。输入参数情况输入参数有证券代码“code”(可空)、统计年份“year”(为空时默认为当前年份)和统计季度“quarter”(为空时默认为当前季度,不为空时取值为1、2、3、4)。输出参数及算法输出参数如净资产收益率(平均值)“roeAvg”(算法:归属母公司股东净利润/[(期初归属母公司股东的权益+期末归属母公司股东的权益)/2])等多个指标及对应算法。
其他季频数据采集接口季频偿债能力接口query_balance_data()函数接口用于抓取上市企业季频偿债能力数据,输入参数同季频盈利能力接口,输出参数如流动比率“currentRatio”(算法:流动资产/流动负债)等。季频营运能力接口query_operation_data()函数接口用于抓取上市企业季频营运能力数据,输入参数相同,输出参数如应收账款周转率“NRTurnRatio”(算法:营业收入/[(期初应收票据及应收账款净额+期末应收票据及应收账款净额)/2])等。季频成长能力接口query_growth_data()函数接口用于抓取上市企业季频成长能力数据,输入参数一致,输出参数如净资产同比增长率“YOYEquity”(算法:(本期净资产-上年同期净资产)/上年同期净资产的绝对值×100%)等。
数据表结构设计与创建03
数据表结构设计原则依据输出参数确定结构财务人员可依据抓取函数的输出参数数据结构确定存储的数据结构,如依据query_stock_industry()和query_profit_data()函数的输出参数信息设计数据表结构。核心要点一:对应关系所构建的数据表结构必须与函数接口输出的数据列一一对应,确保输出数据能精准匹配数据表列,避免数据存储问题。核心要点二:数据类型考量确定各列数据类型时,要充分考量后续数据分析工作的便利性,选择合适数据类型支持运算、筛选和聚合等操作。
stock_industry表结构设计列名与数据类型列名包括updateDate(date类型)、code(varchar(20)类型)、code_name(varchar(20)类型)
原创力文档


文档评论(0)