- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
R软件及其在金融定量分析中的应用主编:许启发、蒋翠侠制作:侯奇华、王侠英2014年10月编写第4章 金融数据整理与预处理第一节 金融数据库第二节 金融数据格式第三节 金融数据的导入第四节 金融数据的预处理第一节 金融数据库金融数据与金融数据库金融数据,是金融定量分析的基础或原材料,只有及时、精确、全面、结构合理并且兼容性高的数据库才能够有效地实现金融定量分析,提高金融定量分析的准确性与可靠性。金融数据库用户自己收集 专门收集的金融数据 多元化第一节 金融数据库国外金融数据库概况Bloomberg全球最大 / 数据品种及咨询全面,数据质量高Datastream范围广,形式多样 / 数据来源包括本地政府CRSP史上最大最全面股票数据库之一Compustat搜集了全世界活跃与不活跃公司的市场信息以及各种金融统计数据的数据库第一节 金融数据库国内金融数据库概况万得(Wind)锐思(RESSET)国泰安(CSMAR)巨潮恒生聚源财汇第一节 金融数据库金融数据库数据主要内容 本节将以国泰安数据库为例详细说明金融数据库中的内容。 国泰安数据库的内容包括股票、上市公司、基金、债券、衍生市场、经济研究、行业研究、货币市场、海外研究、板块研究、市场咨询、专题研究、科技金融研究等系列。 选取上市公司、股票、债券、基金四个部分进行重点阐述。第一节 金融数据库金融数据库数据主要内容上市公司财务报表数据库将报表分为四类即:资产负债表文件、利润表文件、采用间接法的现金流量表文件以及采用直接法的现金流量表文件。股票个股回报率、市场回报率和综合市场回报率债券债券的基本信息、交易数据以及上证债券指数的交易数据等基金第一节 金融数据库金融数据库数据主要内容基金开放式基金招募说明书、上市公告书、扩募说明书、定期报告(年度报告、中期报告、季度报告、投资组合公告、基金资产净值公告)、临时报告和法律、行政法规以及中国证监会规定应予披露的其他信息资料。封闭式基金招募说明书、上市公告书、扩募说明书、定期报告(年度报告、中期报告、投资组合公告、基金资产净值公告)、临时报告和法律、行政法规以及中国证监会规定应予披露的其他信息资料。第二节 金融数据格式XLS、XLSX格式xls格式就是Microsoft Excel2003工作表。xls文件可以使用Microsoft Excel打开。通过使用Excel的“另存为”功能,可以将xls格式的表格转换为xml格式、html格式、txt格式以及csv格式等。xls格式及其转换格式都可以使用R软件对应的包或函数来读取。xlsx格式是Microsoft Office EXCEL 2007工作表的扩展名。大部分的R数据导入都可以用xlsx格式来完成。第二节 金融数据格式CSV格式纯文本,使用某个字符集,比如ASCII、Unicode、EBCDIC或GB2312。由记录组成(典型的是每行一条记录)。每条记录被分隔符分隔为字段(典型的分隔符有逗号、分号或制表符;有时分隔符也包括可选的空格)。每条记录都有同样的字段序列。 用R来读取csv格式的数据非常方便,可以使用read.table函数来读取。第二节 金融数据格式TXT格式 txt是微软在操作系统上附带的一种文本格式,是最常见的一种文件格式,早在DOS时代应用就很多,主要存文本信息,即文字信息,大多数的软件都可以查看txt格式的信息。用R来读取txt格式的数据同样也可以使用read.table函数来读取。 如果使用Rstudio,可以在菜单栏Tools中选择“import dataset”,也可以简单地实现txt文件读取。第二节 金融数据格式XML格式 XML,即可扩展标记语言,标准通用标记语言的子集,一种用于标记电子文件使其具有结构性的标记语言。 XML不仅可以提供标准的数据内容,而且可以提供更加复杂的数据结构。 XML包提供了读取和载入XML格式文件的大部分功能,要读取一般形式的XML格式文件上的信息,只需要加载XML包,输入readKeyValueDB(/RSXML/plist.xml)即可实现读取。第二节 金融数据格式HTML格式 HTML,即超文本标记语言,标准通用标记语言下的一个应用。是为“网页创建和其它可在网页浏览器中看到的信息”设计的一种标记语言。HTML被用来结构化信息—例如标题、段落和列表等,也可用来在一定程度上描述文档的外观和语义。HTML可以直接运行,所以我们可以在不联网的情况下直接读取HTML格式的数据。第二节 金融数据格式从其他统计软件导入 由R的核心团队编写的foreign包提供了其他统计软件系统数据导入的工具,以及导出等功能,帮助处理其他软件的数据。若要读取SPSS软件中名为“Data.sav”的数据,R代码演示如下: libr
您可能关注的文档
最近下载
- 湘教版八年级上册地理第二章第二节中国的气候课件.pptx VIP
- 十只熊一个家—10的分解组成.ppt VIP
- 垂直起降固定翼无人机网格机库研发与应用 工作技术总结报告.pdf VIP
- 北京六一 DYCP-31DN电泳仪使用说明书操作说明(DYCP31BNDYCP31CNDYCP31DDYCP31DNDYCP31EDYCP32B).pdf
- 八年级地理上册 2.2《中国的气候》2 湘教版.ppt
- AQ9010-2019安全生产责任保险事故预防技术服务规范.pdf VIP
- 初中英语新人教版七年级上册全册教案(2025秋精编版).doc
- 2025年 AMC 8 数学竞赛(中英双语)-学生用卷.doc VIP
- 卢梭的教育思想爱弥儿.ppt VIP
- 高中生学习心理.ppt VIP
文档评论(0)