- 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
- 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
- 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
ACL2023教程
你需要知道的关于多语言LLM的一切:
为世界语言建立公平,高效和可靠的模型
BarunPatraVishrav
ChaudharyKabir
Ahuja
KalikaBali
MonojitChoudhury
SunayanaSitaram
微软公司
Introduction
教程演示者
BarunPatraVishravChaudharySunayanaSitaram
MicrosoftTuringMicrosoft图灵微软印度研究院
KabirAhuja微软研KalikaBali
究院印度MonojitChoudhuryMicrosoftResearch印度
Microsoft图灵
物流教程
•日期和地点:2023年7月9日,西部大都会
•时间:当地时间9AM-12:30PM
•上半年:9AM-10:30AM
•休息:10:30AM-11AM
•下半场:11AM-12:30PM
4
教程范围
•我们希望每个人都熟悉LLM的英文版本
•因此,我们不会进入LLM的基本原理
•虽然全面,但这里没有涉及其他相关的额外主题/论文
•超出本教程的范围
•多语言模型的适配器和参数有效微调(请参见EMNLP2022教程由Ruder等人提供
,以了解这方面的内容)
5
教程大纲
介绍(10分钟)
数据收集和培训(40分钟)提示策略
(20分钟)
评估、可解释性、分析(20分钟)问答(10
分钟以上)
负责任的AI(30分钟)休
息(20分钟)
语言社区(15分钟)开放研究问题
(10分钟)结论(10分钟)
Q&A(20分钟)
6
内务管理
•幻灯片和参考
•幻灯片和参考发布在教程网站上
https://aka.ms/ACL2023教程
•Q&A
•每节后2-4个问题(时间允许)
•在会谈中可以提出快速澄清的问题
•Zoom上的与会者可以键入聊天,其中一名教师将进行审核
•更长的问答将在休息的开始(可选)和结束
7
1
语言技
您可能关注的文档
- BloombergGPT:一个用于金融的大型语言模型.pdf
- ChatGPT 和语言模型 : 保卫业简介 ( 德文 )】.pdf
- 晨会聚焦:PanGu-∑:华为万亿参数语言大模型.pdf
- 大模型时代的可信自然语言处理(演讲PPT).pdf
- 大型语言模型综述(英).pdf
- 大语言模型提示注入攻击安全风险分析报告(2023.7).pdf
- 大语言模型应用程序十大风险V1.0.pdf
- 基于大型语言模型的智能体的兴起与发展.pdf
- 人工智能周报(24年第3周):微软推出独立AI工具“阅读教练”,商汤“书生・浦语”2.0大语言模型开源.pdf
- 申万:TMT-首发讯飞金山商汤等七大语言模型:十方面能力综合评测-20230420.pdf
文档评论(0)