《人工智能通识》-项目4-2 AIGC音频生成应用 - 任务1 整理会议音频转写与纪要.pptxVIP

《人工智能通识》-项目4-2 AIGC音频生成应用 - 任务1 整理会议音频转写与纪要.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

A/;

本课件为《人工智能通识(AIGC版)》配套教学资

源,由编写团队精心打造。

为便于教学使用,团队同步提供了丰富的辅助材料,

涵盖微课视频、教学课件、实训手册、习题答案、课程

标准及程序源代码等。

同时,教材配套超星教学示范包,支持一键克隆为

网络在线课程,助力高效开展线上线下混合式教学。

欢迎联系出版方订购使用。

书名:《人工智能通识(AIGC版)》

书号:978-7-111-79447-9

出版社:机械工业出版社

主编:蓝永健、吴秀红、罗智聪

副主编:邓爱玲、王有铭、叶菊、周弢;

PARTTHREE

项目实施;

近期,公司召开了一场智能语音助手功能设计内部会议。会议结束后,考虑到时间紧、任

务重,且需要快速将会议成果转化为可执行内容,团队主管便要求小青使用AIGC工具,将会议录音转化为结构化的会议纪要。这份纪要不仅要清晰呈现会议内容,还需自动标注关键议题与最终决策,同时满足中英双语的需求。假如你是小青,你打算如何高质量地完成这一项工作呢?;

技术工具选用

语音识别可选用讯飞听见、通义、腾讯云语音识别等语音处理工具,快速转写成文字。

本次任务选用通义将会议音频转写成文字纪要,并翻译成英文,实现中英双语,另外结合Audition、

腾讯翻译君等工具对音频及文档进行优化、核对。

Al辅助音频转写文字的方式

AI辅助音频转写文字主要有两种方式:会议现场实时录音转写和上传录音文件转写。本次任务使用

“上传录音文件转写”的方式以实现音频转写文字。;

常见音频格式

常见的音频格式有WAV、MP3、AAC、FLAC等。无损格式(WAV、FLAC、AIFF)适合专业制作和

存档,有损格式(MP3、AAC)适合日常使用;流媒体优先选AAC/Opus,游戏开发可考虑OGG,语音场景用AMR;跨平台项目建议使用MP3、WAV或AAC,避免小众格式(如WMA)。;

会议纪要智能整理,可以通过音频预处理、AI转写、结构化处理和审核交付四步,快速生成规范会议记录。

在录音转文字环节,上传至“通义”(网页版)--“音视频速读”进行AI转写,设置语言和发言人参数,生成文本后初步

校对,重点核对术语和数据准确性,支持中英双语输出。

在会议纪要处理环节,使用“通义”--“会议纪要助手”,进行会议纪要的生成,突出关键内容和决策,提升可读性。;

任务1整理会议音频转写与纪要;

作品效果

会议音频_原文

发言人100:00

大家好,今天咱们开个会,主要是聊聊咱们新智能语音助手的功能框架。现在市面上语音助手不少,咱们得做出点差异化。大家先说说咱们这语音助手最核心的功能应该有哪些。

我觉得首先得把语音识别做扎实,识别准确率是基础,然后音频合成也得自然流畅.不能让用

户觉得机器感太重。

发言人300:25

我同意语音识别这块,我们可以考虑用最新的aec技术.比如深度学习模型来提高识别率,特别是针对方言和口音的识别。音频合成方面。也可以尝试用神经网络模型让声音更逼真。

那测试这块得跟上,得模拟各种环填,比如嗜杂环境、安静环境.看看识别率和合成效果怎么

样、还有不同设备上的兼容性也得测好。

发言人100:57

那咱们就先定下来核心功能,包括语音识别、音频合成、还有后续要加的语义理解和智能交互

技术。团队先搞个初步方案、测试团队准备测试用例:咱们下次会再细聊。;

详细步骤

请查看教材步骤说明,并观看对应的微课视频;

机械工业出版社《人工智能通识》配套资源

您可能关注的文档

文档评论(0)

人生风雪客 + 关注
实名认证
文档贡献者

如果有遇到文件不清或断篇的或者需要转换文件格式的情况请联系我,会在第一时间帮你完成完整的文档。文档如有侵权,请及时告知,本人将尽快予以删除,谢谢啦。

1亿VIP精品文档

相关文档