- 1、本文档共19页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
目 录
研究背景 3
遗传算法介绍 4
符号回归 4
个体选择 4
迭代终止 5
遗传变异 5
交叉 5
子树变异 6
Hoist变异 6
点变异 6
膨胀现象 7
节俭系数 7
模型训练 7
挖掘结果 9
因子合成 11
最大化IC_IR加权法 11
似然函数 12
顺序最小二乘规划SLSQP 13
协方差估计 13
交叉验证最优估计 14
因子合成结果 15
6总结 18
风险提示 19
图表目录
图1、交叉的方式 5
图2、子树变异的方式 6
图3、Hoist变异的方式 6
图4、点变异的方式 7
图5、框架工作流 9
图6、部分因子表达式的树状结构图 10
图7、协方差收缩方法的对比 14
图8、合成的因子回测净值 16
图9、不同合成方法比较 18
表1、模型超参数设定和说明 8
表2、适应度较高的因子的计算公式 10
表3、基础指标的定义和计算方式 11
表4、因子分组回测表现统计 17
表5、组1按年份回测统计 17
研究背景
遗传算法(GeneticAlgorithm,GA)是一种模拟生物进化过程的搜索启发式算法,它通过模拟自然选择、遗传、交叉和突变等生物学机制来优化问题解决方案。遗传算法的主要特点是直接对结构对象进行操作,不需要求导和限制函数连续性,具有内在的隐并行性和更好的全局寻优能力。它采用概率化的寻优方法,自动获取和指导优化的搜索空间,自适应地调整搜索方向。
遗传算法在量化研究中有广泛应用。主要因为它能够有效处理优化问题,尤其是在优化求解、因子挖掘、特征选择等方面。量化研究中的优化问题往往具有高维度、非线性和多峰值的特点,遗传算法通过其全局搜索能力和并行处理能力,能够有效避免陷入局部最优解,寻找全局最优或者近似最优解。
当前遗传算法在量化研究中的应用程度相当广泛。例如,它可以用于优化投资组合的权重分配,通过模拟不同资产组合的收益和风险,找到风险调整后收益最大化的组合。另外,遗传算法还可以用于量化模型的特征选择,通过遗传算法筛选出对预测模型最有贡献的特征,从而提高模型的预测准确性。再者,就是在近年来比较流行的因子挖掘框架,利用遗传算法自动挖掘有效的量化因子,提高选股模型的性能。
遗传算法的执行过程可以总结为以下步骤:
初始化种群:随机生成一组候选解作为初始种群。
评估适应度:根据适应度函数评价每个个体的性能。
选择操作:根据个体的适应度进行选择,适应度高的个体有更高的概率被选中。
交叉操作:通过交叉操作产生新的后代个体。
变异操作:以一定的概率对个体的某些基因进行变异,增加种群的多样性。
新一代种群形成:选择和交叉操作产生的新个体形成新一代种群。
终止条件判断:如果满足终止条件(如达到最大迭代次数或适应度阈值),则停止迭代,否则回到步骤3。
遗传算法的优点包括其基于群体的搜索能力、适应度函数的简单性、易于并行处理、提高搜索效率和一定的随机性。然而,它也有一些局限性,如受初始种群的影响较大、参数设置(如交叉率和变异率)依赖经验、搜索速度较慢等。
在实际应用中,可以通过编码改进、选择进化、交叉改进、自适应策略
和效率提升等方法来改进遗传算法的性能。这些改进有助于提高算法的收敛速度和解的质量。
基于遗传算法,本研究建立了一套自动化挖掘因子的框架,使其适应个股面板数据的输入。对于该模型而言,数据质量、数据输入和超参数的选择尤为重要。使用者可以个性化地修改输入的样本范围、特征变量、函数组合、模型超参数、输出数量和质量控制、适应度指标和合成方法等,灵活地适应不同的研究场合应用。该框架还具有因子检测模块,自动化输出检测报告。也可较容易地与其他模块进行组合,便于工作流进行。
遗传算法介绍
遗传规划是一种监督学习方法。它使用符号回归(SymbolicRegression)建立一连串的数学公式运算,使结果的适应度(Fitness)与衡量指标接近。具体实现方法是通过遗传算法(GeneticAlgorithm),在第一代随机生成一些候选公式,然后在每一代中,选取适应度最高的公式,通过遗传、变异、进化,不断逼近数据真实分布。
符号回归
符号回归(SymbolicRegression)是有监督机器学习方法中的一种,用于发现某种隐藏的数学表达式或函数,以最佳拟合给定的数据集。与传统的回归方法不同,符号回归通过搜索和组合基本数学运算符和函数,自动构建出一个数学表达式。同时,符号回归的可解释性较强,我们可以据此分析数据之间的计算关系。符号回归的优点在于不依赖先验知识来为非线性系统建立符号模型,而是使用遗传算法、进化策略、粒子群优化
您可能关注的文档
- 纺织服装行业2024中报总结.pptx
- 纺织服装行业24中报业绩综述.pptx
- 房地产行业研究框架专题报告.pptx
- 白皮书重申转型决心,为新能源发展注入强心剂.pptx
- 当前时间点,锂电池后续增速和结构怎么看?.pptx
- 大类资产配置月报第38期:美联储降息落地在即,关注受益资产.pptx
- 从降息举措看政策的诉求:促转型与稳增长.pptx
- 从B站看内容与用户演变,B站兴趣爱好生活聚集地.pptx
- 财政加力或有限,城投监管或加强.pptx
- 北交所研究月报:营收增速改善,京津冀协同债发行.pptx
- 2025浙江中医药大学金华研究院信息技术运维人员招聘1人模拟试卷及一套答案详解.docx
- 2025浙江宁波市发展规划研究院招收实习人员考前自测高频考点模拟试题(含答案详解).docx
- 2025年宁夏回族自治区中医医院暨中医研究院上半年自主招聘急需紧笔试备考试题含答案详解(综合题).docx
- 2025年玉林市福绵区社会保险事业管理中心招聘见习生(3人)考前自测高频考点模拟试题及答案详解(易错.docx
- 2025年北京市西城区国防动员办公室选聘法律顾问的笔试备考试题精编答案详解.docx
- 2025年德州庆云县事业单位优秀青年人才引进考察考前自测高频考点模拟试题及一套答案详解.docx
- 2025山东泰安市农业科学院招聘博士研究生2人笔试备考试题及答案详解(考点梳理).docx
- 2025山东省海洋科学研究院(青岛国家海洋科学研究中心)招聘4人模拟试卷附答案详解(能力提升).docx
- 2025年度生态环境部珠江流域南海海域生态环境监督管理局生态环境考前自测高频考点模拟试题含答案详解(.docx
- 2025年重庆化工职业学院考核招聘事业单位工作人员(10人)模拟试卷含答案详解(a卷).docx
文档评论(0)