- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
可重复、可扩展的自回归模型文献合成管道
∗
FarukAlpay,BugraKilictas,HamdiAlakkad
AIResearchLab,LightcapInstitute
DepartmentofEngineering,BahcesehirUniversity
2025年8月6日
摘要
本自回归(AR)生成模型研究的迅速加速产生了大量出版物,使研究人员越来越难以跟上最新进展并复
译现实验结果。在先前调查流程的基础上,我们提出了一种全面且可扩展的计算流程,该流程能够自动检索、
中解析、筛选和综合关于AR模型的文献。重点在于将提取模块与可运行脚本整合,并对每个组件进行严格
的评估。我们报告了相关性过滤、超参数提取以及引用识别的定量精确度/召回率测量结果(F10.85),
1
v并通过语言建模、基于Transformer的模型和自回归音乐生成的案例研究,展示了该流程在新领域的可移
2植性。三个复现实验——WikiText-2上的AWD-LSTM、WikiText-103上的Transformer-XL以及训练于
1LakhMIDI数据集上的自回归音乐模型——说明了流程输出如何支持忠实的重新实现。通过消融研究、超
6
4过1,000篇论文的可扩展性实验和故障模式分析,我们强调了该流程的强大性和局限性。详细伪代码、数学
0公式、容器化执行脚本及硬件规格已提供以促进复现。总体而言,我们的研究表明自动文献综合可以支撑快
.
8速发展的机器学习子领域的活报告和可重复研究。
0
5
2
:1介绍
v
i
x
r关于生成模型的研究论文数量在过去十年中呈指数级增长,每周都有几十篇关于大型语言模型和
a
自回归(AR)技术的新论文出现。这一洪流使得手动文献回顾变得不切实际,并且阻碍了可重复性。系
统性文献回顾(SLR)流水线如PROMPTHEUS(Torresetal.,2024)和模块化总结框架(Achkaretal.,
2024)已经表明自动化可以减轻研究人员的负担;然而,它们是领域无关的,并且经常将提取与实验验
证分开。我们的目标是通过提供一个专注于AR模型的完全集成流水线来推进这项工作,该流水线不仅
能够总结研究,还能提取出用于重复实验所需的超参数、架构和指标。
我们工作的动机来自于三个方面的挑战。首先,“文献过载”问题意味着即使是专家也难以跟上新
兴模型和技术的发展。其次,再现性仍然是机器学习中的一个开放问题:代码和超参数的透明报告不足
导致了不可再现的主张(KapoorandNarayanan,2022)。诸如NeurIPS可重现性检查表之类的倡议鼓
励作者记录训练设置和数据集(Pineauetal.,2021),然而许多论文仍然省略关键信息。第三,AR模型
本身正在迅速演变,从递归架构如LSTMs(Merityetal.,2017;Bengioetal.,2003)到基于Transformer
的系统(Vaswanietal.,2017)和新兴的大语言模型(Touvronetal.,2023)。
∗Correspondingauthor:alpay@lightcap.ai
1
作为回应,我们提出了一种可扩展的流水线,该流水线能够从公共存储库中自动检索与AR相关的
论文,并行解析文档,提取结构化事实,使用带有检索增强的语言模型进行主题分析和总结,并生成可
用于复现实验的脚本。我们的
您可能关注的文档
- 代理隐私保护机器学习.pdf
- 从 B 细胞进化中学习:通过在线优化进行抗体设计的自适应多专家扩散.pdf
- 阐明特征规范化在 IJEPA 中的作用.pdf
- 从 Wi-Fi 信道状态信息中提取移动目标的范围-多普勒信息.pdf
- 认知循环通过原位优化:科学的自适应推理.pdf
- 合成医学数据生成:现状及在创伤机制分类中的应用.pdf
- 指数收敛率对于迭代马尔可夫拟合.pdf
- 两个算法在什么情况下是相同的?迈向解决希尔伯特第 24 问题.pdf
- 考虑道路网络空间结构在路面退化建模中的应用.pdf
- 频谱 FM:一种新的频谱认知范式.pdf
- 神经形态网络安全与半监督终身学习.pdf
- 多语种环境下面部-语音关联(FAME)2026 挑战评估 计划.pdf
- 视觉偏见与深度学习在皮肤影像分析中的可解释性.pdf
- CONVERGE:一种用于 xApps 的多智能体视觉-无线电架构.pdf
- LA-CaRe-CNN:级联细化 卷积神经网络用于左心房疤痕分割.pdf
- 基于数据扩增的领域泛化和来自多个源领域的联合训练用于全心脏分割.pdf
- MSC:一个具有基于区域分割和片段级字幕的海洋野生动物视频数据集.pdf
- 基于个人数据基本理解和不断变化的威胁环境的隐私风险预测.pdf
- 测量产品图像中的信息丰富度:对在线销售的影响.pdf
- InceptoFormer: 一种用于从步态评估帕金森病严重程度的多信号神经框架.pdf
最近下载
- CTD格式申报资料(原料药)新.pdf VIP
- 六年级下册数学作业第五单元数学广角第1课时鸽巢问题人教版.pptx VIP
- 华荣科技 最新版本的QJZ6磁力说明书 (1).doc VIP
- 2023年江苏省公考《申论》真题(B类)及参考答案.docx VIP
- 领导干部个人有关事项报告表(2017版).doc VIP
- 六年级 数学 下册 第五单元 数学广角——鸽巢问题《第1课时 鸽巢问题(1)》作业课件.pptx VIP
- 项目集成管理中级笔记.pdf VIP
- 心血管疾病诊断及临床合理用药答案-2024年山西省执业药师继续教育.docx VIP
- EBZ-318综掘机图册说明书.pdf VIP
- 直肠癌教学护理查房张梅.ppt VIP
- 专业Latex文档翻译 + 关注
-
实名认证服务提供商
专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。
原创力文档


文档评论(0)