- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
“Xiaomingbot”背后,写稿机器人的技术探寻——专访北京大学计算机科学技术研究所万小军博士.pdf
■101苣题.第二代“写稿机器人”现身今日头条
——专访北京大学计算机科学技术研究所万小军博士
《中国传媒科技》:头条写稿机器人的主要技术特色是
什么?
万小军:写稿机器人的主要技术特色在于对包括自然语
言生成、文档自动摘要、机器学习等在内的多种技术的综合
利用,并且针对不同类型的稿件采用不同的技术途径去生成,
因此能够为体育赛事同时生成短短几句话的简讯与长达上千
字的详细报道。
《中国传媒科技》:网易等媒体报道头条写稿机器人
主要有速度快、发稿样式多、语言情感自适应、自动配图
等业务特色,哪些关键技术实现了突破,对应哪些关键技
万小军博士
术创新?
万小军:该写稿机器人在基于文字直播的新闻自动生成 并不能和人工智能2.0对应,而只是与第一代基于模板
填充的写稿机器人进行区分。由于写作是极富创造力的
以及语言情感自适应等技术上实现了突破。“Xiaomingbot”
是业界首个基于文字直播数据进行新闻生成的系统。基于先 事情,因此写稿机器人具有“强人工智能”,仍有很长
进的机器学习算法,该系统能够实时地从文字直播数据中进 的路要走。
行语句筛选与融合,从而在体育比赛的任一时刻生成高质量
赛事报道。 《中国传媒科技》:头条机器人对“基于会话分析的摘
在语言情感自适应方面,我们设计了比赛逻辑判断单 要生成技术”的应用效果不俗,需要多大规模的语料库和持
续训练时间?
元,使得“Xiaomingbot”在判断出比赛的激烈程度后,可
以使用不同的词语形容赛事中运动员获胜的难易程度,如 万小军:由于时间和精力的原因,目前我们只人工整
理了一百多项比赛对应的文字直播数据与人工撰写的赛事
“力克”“艰难晋级”“完胜”等词语。另外,“Xiaomingbot”
会不断学习网络直播员使用的语言,应用在长篇资讯报道 新闻作为训练语料,采用的机器学习算法能够在数小时内
中。 训练完毕。如果有更多的训练语料,效果肯定会进一步得
到提升。
《中国传媒科技》:有媒体报道头条机器人的推出标志
写稿机器人进入第二代,您怎么看待这个评价,您认为人工 《中国传媒科技》:写稿机器人研发过程中,在今年的
智能技术合理的断代依据是什么? ACL会议上发表了哪些论文,取得了多大范围的影响?
万小军:按照专业人士观点,人工智能发展顺序是 万小军:我们针对“基于文字直播数据的新闻自动生成
Yao
从弱人工智能开始,到与人类智能相当的“强人工智能”, 技术”已发表ACL2016长文一篇(JianminZhang,Jin-ge
and Wan.Toward NewsfromLive
再到全面超过人类智能的“超人工智能”。目前人工智 Xiaojun ConstructingSpots
ACL
能在少数领域确实进入了2.0时代,也即“强人工智能”, TextCommelltary.In2016.),该论文在ACL会议期间受
例如语音识别、棋类对弈等,但在很多领域还处于弱人 到众多国内外同行关注。此外,我们还在
您可能关注的文档
- TfS倡议石化供应链的可持续发展——专访TfS全球总裁R ü diger Eberhard先生和总经理Gabriele Unger博士.pdf
- TGFU教学法在小学排球课堂中的应用.pdf
- Torsten Bahke博士在"德-美经济关系冲突,合作,协调"会议上的讲话(摘要).pdf
- TPACK框架下信息技术与区域小学数学深度融合的策略研究--基于大同市十所小学数学教师TPMK现状的调查.pdf
- Tricept型并联机床曲面加工的刀轨规划.pdf
- TTS技术在英语CAI课件开发中的应用研究.pdf
- UMTS 900 MHz的引入与规划部署研究.pdf
- UPS在高压开关柜操作电源中的应用.pdf
- VB上机操作题自动判分程序评分标准的自动生成.pdf
- VB环境下刚地弓形虫多媒体课件的开发.pdf
文档评论(0)