中科院自动化所 宗成庆《机器学习方法在少数民族》.pdf

中科院自动化所 宗成庆《机器学习方法在少数民族》.pdf

  1. 1、本文档共54页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中科院自动化所 宗成庆《机器学习方法在少数民族》

机器学习方法在少数民族 语言信息处理中的应用 宗成庆 中国科学院自动化研究所 模式识别国家重点实验室 E-mail: cqzong@ Home Page: http :///cip/english/zong.htm Add.: No .95, Zhong Guan Cun Dong Lu, Beijing 100190, China 内容提要 1. 引言 2. 机器学习方法概述 3. ML方法在NLP中的应用 4. 一点建议和思考 2/54 1. 引言  随着互联网、移动通信技术的快速发展,信息安全 与个性化信息服务成为人们关注的焦点  云计算、大数据、社会计算、数据挖掘等一批新术 语像雨后春笋般地相继涌现  这些术语的背后蕴藏着哪些科学问题?  解决这些问题的关键技术和手段是什么?  少数民族语言信息处理该从何处入手抓住时代的机 遇,应对面临的挑战? 机器学习(machine learning) — 一门不能不关注的技术 3/54 内容提要 1. 引言 2. 机器学习方法概述 3. ML方法在NLP中的应用 4. 一点建议和思考 4/54 2. 机器学习方法概述 2.1 基本概念  目前,机器学习方法的主要理论基础是统计学 和信息论,因此,机器学习通常又被称为统计 学习(statistical learning) 或者统计机器学习 (statistical machine translation) 。  “如果一个系统能够通过执行某个过程改进它 的性能,这就是学习。”-Herbert A. Simon 5/54 2. 机器学习方法概述 统计学习的主要特点[李航,2012] :  以计算机和网络为平台 数据驱动 对数据进行预测与分析  以方法为中心,构建模型 是概率论、统计学、信息论、计算理论、最优 化理论和计算机科学等多领域的交叉学科 对象: 语料 目的: 对语言现象进行预测、分析 6/54 2. 机器学习方法概述 举例① 今天他从北京来到兰州。 昨天张老师从上海来到这里。 明天赵老师从南京来兰州。 十年前她从北京来到兰州。 …… [Time] + NP/Pron + 从+ Place1 +来(到) +Place2 [Time] + NP/Pron + 从+ Place1 +来(到)兰州|概率? 他和她从+ ?+来(到)兰州? 7/54 2. 机器学习方法概述 举例② 微博情感分类 + ++ - - - “这有什 + + - -+ - “神马玩 么不好 ++- + + - - 艺儿,坑 的!”

文档评论(0)

xxj1658888 + 关注
实名认证
内容提供者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2024年04月12日上传了教师资格证

1亿VIP精品文档

相关文档