- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
AI多媒体技术在内容审核场景实践探索马金龙趣丸科技(TT语音)
个人介绍马金龙多年媒体算法开发经验,涉及音视频图像文本,负责过音频前后端处理,弱网优化,音视频质量提升,智能内容安全审核“T网”,内容理解“T悟”等大型项目。曾作为“灵声讯”创始人,参与智能媒体技术自媒体运营和推广。
0102030405内容审核目前现状与挑战AI多媒体技术实践之路智能内容审核平台案例AIGC内容风控实践未来展望
1.内容审核目前现状与挑战现状?政府监管越来越严?用户内容层出不穷?违规种类繁杂?AIGC内容不可控挑战?【实时性】需要紧跟政府管控要求?【准确性】对花样变体不漏杀不误杀?【多样性】违规种类需不同算法解决?【未知性】AIGC生成内容不确定且存在知识“幻觉”
2.AI多媒体技术实践之路自建OR第三方?
2.AI多媒体技术实践之路自建优势:极速响应生态保障高效定制可管可控具备数据血源追踪、问题实时监控、技术辅助运营等风控能力针对安全,时效等方面推出高响应审核,让内容审核安全高效通过机审结果多样化处置、账号违规处置等多种手段,保障平台生态安全推出特殊时期/突发事件的相关定制化,快速响应国家政府的紧急要求
2.AI多媒体技术实践之路T网是一个通过人工智能的算法打造一站式内容安全机器审核的平台,帮助公司审核团队实现语音,文本,图像,小视频等风险管控的能力。2.1语音识别2.2NLP文本审核2.3多模态识别2.4音频事件检测2.5小语种识别2.6歌曲识别对于此项目的目的可总结如下:?贯彻国家网信办有关网络内容安全的各项规定?低成本高效率的加强内容风险管控?构建智能审核技术护城河,为公司内容生态保驾护航2.7声纹识别2.8违规图像识别?探索内容审核新方法,践行公司的社会责任
2.1ASR-技术方案技术目标用户产生的语音数据输入ASR模型,模型输出该语音的文字内容,以供下一环节NLP检查是否包含违规词,或违规内容。模型总体逻辑使用深度学习模型Transformer/Conformer(如图中SharedEncoder)提取输入音频中的特征使用CTC解码得到若干候选文本。图1.T网-ASR端对端方案
2.1ASR架构EfficientConformer?Convolutionneuralnetworks和transformersmodels组合?EfficientConformer设计?结合量化剪枝和蒸馏技术,压缩模型大小?提供CPU和GPU,支持高吞吐量识别图2.T网-ASR支持的功能图3.ASR中Efficientconformer技术方案
2.1ASR-效果图4T网-ASR优化后的推理速度图5.ASR测试报告(CER)和模型大小
2.2NLP算法总体框架NLP算法模型:?Bert算法?Prompt算法?Fasttext算法?AIGC语料生成算法?文本表情复杂表示的多模态识别算法?关键词挖掘算法图6.T网-NLP总体框架
2.2NLP内容审核的困难与挑战纯文本审核面临的问题与挑战:我们的成功案例:?变体关键词的多样化?构建变体关键词挖掘系统?构建文本表情字母多模态识别系统?AIGC语料生成系统?文字与表情包的结合的复杂表达?文字与字母或字母缩写结合的复杂表达?特定场景语料不足与稀疏性?特定关键词词的隐晦表达?正常词与关键词相同,但不同上下文上语义不同?异常关键词大数据监测系统?多层次语义分析系统
2.2NLP内容审核-效果呈现违规标签辱骂精确率94.45%95.03%91.31%90.96%92.98%色情涉政广告违禁图7.NLP关键词挖掘示意图图8.NLP文本审核效果
2.2文本未成年人识别关键词匹配分析框架,支持多种匹配方式、多种过滤条件,并支持自定义特殊标记,及支持特定动作行为,将未成年人识别实现模组化的流程分析。未成年识别精确率99%+;图9.T网文本未成年人审核技术框架
2.3多模态算法原理项目背景?单模态审核特征不全面,多模态结合语气和语义信息可提高处罚有效率。?人工审核量级大,需要对不同类型的违规进行灵活处置。建模算法?Transformer跨模态多头注意力机制;?随机森林;模态α模态β图11.随机森林图10.Transformer跨模态多头注意力机制
2.3多模态高准召回模型指标?多模态算法上线处罚有效率为99%+;?如右图,每日占总机审违规样本约17%;模型价值?提高对违规样本的召回,减少单模态的漏召;?提供高准标签运用在灵活处置:a.提高处罚响应速度;b.提升人工审核效率;图12.多模态辱骂命中数量及占比
2.4声音事件检测(SoundEve
您可能关注的文档
- ACCA-全球经济状况调查:2024年第二季度(英)-11正式版.ppt
- AI Agent开发管理平台市场厂商评估报告:火山引擎-24正式版.ppt
- AI 赋能集成电路教育数字化发展白皮书(1.0 版)-2024.08-86正式版.ppt
- AIGC助力大规模对象存储服务OSS的能效提升-2024.07-17正式版.ppt
- AI大模型落地的前景和痛点,兼谈工程师架构师所面临的机会和挑战-2024.08-43正式版.ppt
- AI蛋白质报告-2024.08-49正式版.ppt
- AI音乐应用产业报告-量子位智库-2024.07-24正式版.ppt
- AI原生云建设与加速指南-2024.07-42正式版.ppt
- Amazon Aurora 数据库高可用及容灾白皮书-2024.07-33正式版.ppt
- AMT企源网聚资本:2024食品与餐饮连锁企业数字化增长指引参考报告-192正式版.ppt
- 1、大树的模样课件 湘美版一年级下册.ppt
- 1.《文明的我》课件 2025赣美版美术一年级下册.ppt
- 1.2 二分查找(教学课件)-五年级信息科技下册(清华版2025).ppt
- 《理发师》课件 2025人音版音乐一年级下册.ppt
- 1.1寻访家乡的美食(教学课件)-三年级综合实践活动下册(蒙教版) .ppt
- 《小老鼠上灯台》课件2025人音版音乐一年级下册.ppt
- 1.3 《我的图书漂起来》(课件) 三年级上册综合实践活动浙科版.ppt
- 《寻找春天》(课件)辽海版2025美术一年级下册.ppt
- 《月亮》课件 鄂教版科学二年级下册.ppt
- 《拉勾勾》课件 2025人音版音乐一年级下册.ppt
最近下载
- 大数据数据分析项目实践报告.doc
- Unit 6 Electricity everywhere 第4课时 Writing 教学设计 沪教版英语七年级下册.docx
- 防爆电气设备安装与检验考核试卷.docx
- 情态动词-专题课件(共28张课件).ppt VIP
- 《GB 50318-2017城市排水工程规划规范 》最新解读.pptx
- 河南水投集团所属公司招聘笔试真题2024 .pdf
- Unit 2 Travelling Around 大单元整体教学设计-高中英语人教版必修第一册.docx
- 义务教育生物学课程标准(2022年版).docx
- 新人教版一年级数学下册应用题练习带答案(全套).pdf
- 汉字与服饰文化(文字学).ppt VIP
文档评论(0)