- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要
随着信息存储的急剧增长,人们迫切需要从海量数据中提取有用的信息与知识, 并将获取的有用经验广泛用于商务管理、生产控制、市场分析、工程设计和科学 探索等。而符号回归算法则是数据挖掘在科学计算领域的一个重要研究方向与课 题。简单地说,符号回归即是在一组大量的相关变量的数据样本中,搜索出一个 符号形式的数学公式,来以指定的精度拟合数据。
目前解决该问题的方法多是基于遗传规划算法来实现的,但由于其编码的复杂 性与变异过程的不易操作性,本文采用基于基因表达式程序设计(GEP)的新型进化 算法,它结合了遗传算法定长线性编码方式与遗传规划算法易于表达复杂结构的 优势,使得其在实际应用尤其是符号回归问题上表现的相当出色。为了改进传统 GEP 算法的性能与精度,本文选用 GPU 作为并行计算平台,使用 Nvidia 公司推出 的统一计算设备架构 CUDA 这一编程模型,将 GEP 遗传算法中计算量最大的适应 度值求解过程放在 GPU 上并行处理,充分发挥了 GPU 的计算性能,并得到了满 意的加速效果。而在算法正确性方面,本文在个体的进化算法过程中融入了本地 搜索算法,最小二乘方法(MLS),旨在个体每次进化出固定结构后,不断地优化常 系数,使其最大精度的满足实验样本数据,从而改善每个染色体的适应度值。
本文实验部分,选取了 30 组从国外文献中摘取出来的,具有代表意义的实验 样例,分别从算法性能与成功率两方面进行实验。在速度对比实验中,基于 CUDA 的符号回归算法性能相对于串行程序能够达到 250 倍的加速比;而在搜索结果正 确率比对实验中,嵌入 MLS 常系数生成算法的符号回归算法,无论在最优残差还 是在平均残差的参量上都要优于其他几种常系数生成算法,进化搜索出来的公式 能够更精确的拟合实验样本数据。
关键词:符号回归 基因表达式编程 CUDA GPU 最小二乘法
Abstract
With the rapidly growth of information data, people expect so badly to find a method to extract useful information and knowledge from these magnanimous amount of data. This experience can be widely used in business management, production control, market analysis, engineering design and scientific exploration. Symbolic Regression is a promising research aspect in the era of scientific computing for data mining. In short, the general purpose of Symbolic Regression is to find an optimal symbol expression that best fits a target sample set, which has much experimental data.
Currently, the mainstream methods to solve the problem of Symbolic Regression are almost based on genetic programming (GP). For the reason that individuals in GP are extremely difficult to reproduce with modification, we adopt a popular evolutionary algorithm, gene expression programming (GEP), in this paper.The GEP individuals are encoded as fixed length linear chromosomes (genotype), which are then translated into different sized and shaped non-linear entities named expression trees (ETs) (phenotype). GEP inherits the manipulative and expressive advantages of GAs and GP. In this paper, we will introduce a hyb
您可能关注的文档
- 基于CT图像的MRCAS系统的关键技术研究-计算机应用技术专业论文.docx
- 基于CT图像的常规和频谱纹理分析特征在肝细胞癌的预后和治疗决策中的研究-影像医学与核医学专业论文.docx
- 基于CT图像的肺部肿瘤检测与诊断-计算机科学与技术专业论文.docx
- 基于CT图像的肺部肿瘤识别-电子与通信工程专业论文.docx
- 基于CT图像的肺实质自动分割的研究 计算机应用技术专业论文.docx
- 基于CT图像的肺实质自动分割的研究-计算机应用技术专业论文.docx
- 基于CT图像的肝脏血管树三维拓扑模型的构建及应用-计算机应用技术专业论文.docx
- 基于CT图像的计算机辅助恶性肝肿瘤分割研究-计算机应用技术专业论文.docx
- 基于CT图像的计算机辅助肝移植术前计划系统的研究-生物医学工程专业论文.docx
- 基于CT图像的下胫腓联合三维有限元模型构建-外科学(骨外)专业论文.docx
- 基于CUDA的概念生成算法研究-计算机软件与理论专业论文.docx
- 基于CUDA的高分辨率视频图像帧间配准与目标定位快速实现-通信与信息系统专业论文.docx
- 基于CUDA的光线投射体绘制方法研究-计算机应用技术专业论文.docx
- 基于CUDA的红外图像处理算法设计-通信与信息系统专业论文.docx
- 基于CUDA的红外小目标检测算法的快速实现-计算数学专业论文.docx
- 基于CUDA的计算机断层成像软件-模式识别与智能系统专业论文.docx
- 基于CUDA的空间环境三维数据场可视化方法实现-控制理论与控制工程专业论文.docx
- 基于CUDA的粒子滤波并行算法研究-计算机系统结构专业论文.docx
- 基于CUDA的连续最大流医学影像分割算法研究-控制工程专业论文.docx
- 基于CUDA的裂纹检测算法的实现与优化-软件工程专业论文.docx
文档评论(0)