汉语组块计算若干及研究.ppt

企业资料 3/28/2001 Intro to NLP ICT, CAS/Li sujian 汉语组块计算的若干研究 提纲 课题的提出、意义和现状 本文主要工作 总结 课题的提出、意义和现状 提出:认知理论、AI(Soar) 内容:组块分析+组块相似度计算 意义 简化句子结构 信息检索 信息抽取 文本聚类/分类 机器翻译 语言学的研究内容 词法分析: 句法分析:一个语句的可能句法结构 语义分析:将语句的意义形式化表达出来 语用分析:上下文对语句理解的作用 中文处理 组块分析--浅层分析,部分分析 不要求得到完整的句法树 标示出基本的组块 可以利用完全分析的各项技术 语言学中的研究方法 理性主义研究方法 基于规则的方法 经验主义研究方法 基于统计和实例的方法,语言建模 两种方式相结合 两种方法的比较 组块分析--规则方法 Finite State Cascade:有限状态叠 例句分析 组块分析--统计方法 隐马尔科夫模型 组块分析--统计方法 组块分析-- conll2000评测标准 组块分析--conll2000会议结果 中文处理的组块分析研究 baseNP的识别 汉语短语边界的界定 命名实体的识别 提纲 课题的提出、现状和意义 本文主要工作 总结 本文主要工作 组块 组块分析技术 组块相似度的计算 组块定义 组块标注集合 NC VCC PC QC LCC

文档评论(0)

1亿VIP精品文档

相关文档