资产定价三因子模型Python实现.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

资产定价三因子模型Python实现

一、引言

资产定价是金融研究的核心命题之一,其核心在于揭示资产收益的驱动因素。传统资本资产定价模型(CAPM)仅用市场风险因子解释收益,但大量实证研究发现,市场风险无法完全覆盖股票收益的波动特征。1993年,Fama和French提出的三因子模型通过引入市值因子(SMB)和账面市值比因子(HML),显著提升了模型对收益的解释力,成为现代资产定价领域的经典理论工具。

对于量化研究者和金融从业者而言,掌握三因子模型的实证实现方法至关重要。Python作为当前最流行的数据分析语言,凭借其丰富的金融数据处理库和统计分析工具,为模型落地提供了高效平台。本文将围绕“资产定价三因子模型Python实现”展开,从模型原理出发,逐步讲解数据准备、因子构建、模型回归到结果分析的全流程,帮助读者系统掌握从理论到实践的转化方法。

二、三因子模型的核心原理

要实现三因子模型的实证分析,首先需要理解其理论内涵。三因子模型的核心思想是:股票的超额收益不仅受市场整体风险影响,还与公司规模和估值水平密切相关。模型通过三个维度的因子组合,更全面地捕捉收益的驱动因素。

(一)三因子的经济含义

市场风险因子(MKT)是传统CAPM模型的核心,反映市场整体波动对个股收益的影响。具体来说,它等于市场组合的超额收益(市场收益率减去无风险利率),衡量的是系统性风险对资产定价的基础作用。

市值因子(SMB,SmallMinusBig)用于刻画公司规模对收益的影响。大量研究发现,小市值股票的长期平均收益往往高于大市值股票,这种“规模效应”可能源于小公司信息透明度低、流动性差或投资者关注度不足等因素。SMB因子通过计算小市值股票组合与大市值股票组合的收益差来量化这一效应。

账面市值比因子(HML,HighMinusLow)反映估值水平对收益的影响。账面市值比(B/M)是公司账面价值与市值的比值,高B/M的公司通常被视为“价值股”(市场低估),低B/M的则是“成长股”(市场高估)。实证表明,价值股的长期收益往往高于成长股,HML因子通过计算高B/M组合与低B/M组合的收益差来捕捉这种“价值效应”。

(二)模型形式与经济学逻辑

三因子模型的数学表达可通俗理解为:个股的超额收益由三部分解释——无风险利率补偿、市场风险溢价的敏感度、规模效应的敏感度、价值效应的敏感度,再加上无法被三个因子解释的随机误差。其核心逻辑是,投资者承担的系统性风险(市场风险)、规模风险(小市值暴露)和价值风险(高B/M暴露)需要相应的收益补偿。这一模型不仅在学术研究中被广泛验证,也在实际投资中被用于构建多因子策略、评估基金业绩等场景。

三、数据准备与清洗

理论理解是基础,实证分析的关键在于高质量的数据支撑。三因子模型的实现需要四类核心数据:个股收益率、市场组合收益率、无风险利率、公司基本面数据(市值、账面市值比)。数据准备阶段需重点关注数据的可获得性、时间跨度和清洗方法。

(一)数据获取渠道与选择

在实际操作中,个股收益率和市值数据可通过金融数据平台获取,通常选择覆盖范围广、数据质量高的数据源。市场组合收益率一般用宽基指数(如全市场股票指数)的收益率代替,无风险利率常用国债收益率(如1年期国债)或货币基金收益率。公司账面市值比需通过财务数据计算,即每股账面价值除以每股股价(或总账面价值除以总市值)。

需要注意的是,数据时间跨度应足够长(通常至少3-5年),以保证统计结果的稳定性;样本股需排除ST股、新股等特殊标的,避免异常值干扰。例如,若研究A股市场,可选取沪深两市主板非ST股作为样本,时间范围覆盖完整的牛熊周期。

(二)数据清洗的关键步骤

原始数据往往存在缺失值、异常值和格式不一致等问题,需系统清洗。首先处理缺失值:对于个股收益率缺失(如停牌期间),可采用前向填充或删除缺失周期数据;若某只股票缺失数据超过总样本的20%,建议直接剔除该标的。其次处理异常值:通过计算收益率的Z分数(偏离均值的标准差倍数)或使用四分位距法(IQR)识别极端值,对超过3倍标准差或1.5倍IQR的异常值进行截断或替换。最后统一数据频率,通常选择月度数据(兼顾时效性和稳定性),将日度数据转换为月度收益率(通过复利计算),市值和账面市值比取月末值。

例如,某股票在某月有5个交易日停牌,导致收益率缺失,可采用该月前一个交易日的收盘价计算月度收益率;若某股票某月收益率高达200%(远超市场平均水平),经核查为并购重组导致的异常波动,可将其替换为该月市场收益率的95分位数,避免对因子计算的扭曲。

四、三因子的构建与计算

数据准备完成后,核心任务是构建SMB和HML因子。这两个因子的计算需遵循严格的分组规则,确保能够有效区分规模效应和价值效应。

(一)SMB因子的构建流程

SMB因子的构建基于“市值分组”

文档评论(0)

eureka + 关注
实名认证
文档贡献者

中国证券投资基金业从业证书、计算机二级持证人

好好学习,天天向上

领域认证该用户于2025年03月25日上传了中国证券投资基金业从业证书、计算机二级

1亿VIP精品文档

相关文档