- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中国VS卡塔尔国足想拿小组第三需满足四大要素.docx
今年8月8日21时19分,四川阿坝州九寨沟县发生了7.0级地震。第一时间发布消息的,是中国地震台网一款公测的“地震信息播报机器人”。这篇题为“四川阿坝州九寨沟县发生7.0级地震”的消息约540字,配发了5张图片,内容包括速报参数、震中地形、热力人口、周边村镇、周边县区、历史地震、震中简介、震中天气8个方面,由机器自动编写,用时25秒。此后一系列余震消息,自动编写速度最快的仅用时5秒。
尽管,国外早有应用于地震新闻自动生成和发布的同类产品,2014年3月17日,美国洛杉矶发生4.4级地震,洛杉矶时报就曾使用Quakebot机器人,花3分钟写了一条地震新闻,但现在,国内的互联网用户直观感受到了机器人在快速报道地震灾后情况上较为明显的优势。
这条内容经由“中国地震台网”微信公众号推送,迅速刷爆微信朋友圈,也再次引发了写稿机器人将在多大程度上影响新闻编辑室的讨论。
而从人工智能学术界和产业界的角度来说,讨论写稿机器人,首先应该从讨论驱动机器人写稿的核心技术自然语言处理(Natural Language Processing,简称NLP)开始。对于技术背景和实现方法的理解,能让新闻从业者进一步明晰写稿机器人的发展现状,正确看待当下的应用价值及未来的开发潜力。
机器人写稿的技术背景
机器人写稿,背后的核心技术是自然语言处理,同时涉及数据挖掘、机器学习、搜索技术、知识图谱等多项人工智能技术。
自然语言处理是指机器理解并解释人类写作、说话方式的能力。目标是让计算机/机器在理解语言上像人类一样智能,最终能弥补人类交流(自然语言)和计算机理解(机器语言)之间的差距。
NLP研究发展到现在,基本经历了三个阶段。
计算机刚刚发明之后,人们就开始了自然语言处理的研究。那时的NLP研究都是基于规则的,就是研究人员想一些处理规则,然后计算机按照人设置的规则去处理文本。但是在应用中,很快发现许多现实世界的复杂问题并不是人想出一些规则就能解决的。
1990年,第13届国际计算语言学会议在芬兰赫尔辛基举行,当时的主题是“处理大规模真实文本的理论、方法与工具”,学术界的重心已经开始转向大规模真实文本,传统的仅仅基于规则的自然语言处理显然力不从心了。此后,NLP技术的主流是基于统计的自然语言处理,广泛应用于机器翻译、语音识别、拼音输入、图像文字识别、拼写纠错、查找错别字和搜索引擎等。
而从2008年至今这不到10年间,在图像识别和语音识别领域的成果激励下,学术界开始逐渐引入深度学习来做NLP研究,并在机器翻译、问答系统、阅读理解等领域取得一定成功。
随着NLP、深度学习以及大数据等技术的长足发展并开始在工业应用上大放异彩,处于快速转型期的新闻行业,也对这些技术在新闻生产领域的应用展开了积极的想象。写稿机器人,正是技术发展和行业变革催生的一股潮流。
机器人写稿的三种实现方法
NLP 的机制涉及两个流程:自然语言理解(Natural Language Understanding,简称NLU)和自然语言生成((Natural Language Generation,简称NLG)。
现有的写稿机器人,或者广义来说,就是一个自然语言生成系统,主要有模板式、抽取式和生成式这三种技术方向。
1.模板式
模板式是目前应用最成熟、也是最容易理解的一种实现方法。
当前模板式的机器人写稿方法,主要是通过利用优化算法,智能选择不同的模板组合进行新闻生成。具体的实现过程包括:基于输入的知识点与模板库进行候选模板检索;利用优化算法进行智能模板筛选,确定最终真正使用的模板;基于筛选得到的模板进行新闻文本生成。地震写稿机器人、腾讯的DreamWriter等,都是这一类典型产品。
以DreamWriter为例,这是腾讯技术团队开发的自动化新闻写稿机器人,它能根据算法在第一时间内自动生成新闻稿件,对新闻事件主题进行实时分析和研判,结合一系列的数据库和机器学习算法等技术,在较短时间内为用户传送重要的新闻资讯,帮助用户快速解读内容。
DreamWriter生产一篇完整的新闻,主要由五个步骤组成:建设内容数据库,基于数据库的机器学习,基于具体主题进行写作,以及最后的内容审核和渠道分发。
首先,研发人员需要为 DreamWriter构建一个内容丰富、具有海量新闻数据的数据库,比如每个赛季完整的欧洲主流足球联赛的全套数据,从球员、球队、赛事安排、比赛进程、环境因素、球员之间的对抗数据等等各个细分维度,对数据进行归类、整理,形成一个庞大而又精准的数据仓库,这个庞大的内容数据仓库就成为了机器人自动生成足球新闻报道的原料仓库。
在完成数据库建设的基础上,相关的大数据技术团队就会基于数据分析和算法设计,对于数据仓库中每一项数据所对应的写作模板进行学习和理解。基于模板的机器人写稿学习过程如下图所示:
比如报道一个足球赛
您可能关注的文档
- 个人19美元;机构75美元。 属于登记结算公司的收入帐户开立业务流程 ....pptx
- 个人介绍廖海雁.pptx
- 个人介绍许凯迪.pptx
- 个人写真 - 创智学院.docx
- 个人房产赠与、离婚财产分割税费一览表 - 福建省国家税务局.doc
- 个人抵押住房综合保险 - 安信农业保险.pdf
- 个人收入网上申报系统使用指南 - 陕西师范大学财务处.pptx
- 个人绩效考核操作说明.doc - 培训在线.doc
- 个性化人力资源管理实践:概念、结构与测量 - 南京财经大学编辑部.pdf
- 个性化服务使用帮助.pdf
- 基于springboot的医院门诊管理系统.docx
- 基于SpringBoot的校园外卖平台.docx
- 基于Spring Boot的养老服务推荐系统的设计与实现-毕业论文.docx
- 基于SpringBoot的校园快递代取系统的设计与实现.docx
- 基于springboot的共享自习室管理系统-毕业论文.docx
- 基于SpringBoot的蔬菜商城系统的设计与实现.docx
- 基于springboot的美食分享系统-毕业论文.doc
- 基于springboot的试卷批阅系统.docx
- 基于Spring Boot的校园失物招领系统的设计与实现-毕业论文.docx
- 基于springboot的校园兼职系统-毕业论文.doc
最近下载
- 2025山西朔州市公安局留置看护岗位辅警招聘260人备考重点题库及答案解析.docx VIP
- 2025专家共识:阿立哌唑水合物长效注射剂治疗精神分裂症的临床应用ppt课件.pptx VIP
- 既有建筑结构检测与评定标准.docx VIP
- 四川成都七中初中学校2024-2025学年七年级上学期入学分班考试数学试题(含答案).pdf VIP
- 2026年车载音响声学技术革新研究报告.docx
- 二十届中纪委五次全会课件.ppt VIP
- 表B度能源购进消费与库存情况表.doc VIP
- NBT47013.10-2015 承压设备无损检测 第10部分:衍射时差法超声检测.pdf VIP
- 华为,从战略规划到执行-让每一个业务单元都成为有效增长的发动机.pptx
- 中国人民大学核心期刊目录2022版 .docx
原创力文档


文档评论(0)