- 13
- 0
- 约5.48千字
- 约 5页
- 2017-08-14 发布于安徽
- 举报
基于语义信息的分词后处理研究+
郭丈宏张永奎余明山
f山西大学计算机科学系,太原.030006)
摘要 本文对分词错误作了分析,设计出一个分词后语料的语义类别模型.并在此基础上提出
了一个利用语义信息排除分词错谋的算法。该项研究作为中文信息处理的基础工作,对情报检索、自
动文摘、自动分类等领域的研究有一定价值。
关键词 歧义切分语义分娄体系义类组台
1引 言
在中文信息处理中,词的处理是基础,信息检索、自然语言理解、机器翻译等都
以词作为基本单位。尽管自动分词的研究已取得了大量进展以及许多实用性成果。但
分词的结果仍不能满足中文信息处理高标准的要求。
从某种意义上说,分词错误的多少反映机器对篇章理解的程度,而对篇章理解水
平的提高又可以增加排除歧义切分的准确度。当前的分词系统主要是基于单纯的机械
匹配及少量规则的基础上,大多语料经过分词处理后仍有一定数量的分词错误存在。
我们的研究目的就是利用语义信息对分词后的语料加以整理,一方面初步确定文本的
语义类别;另一方面希望提出一个有效的算法.提高排歧的精确度。本文通过对分词
后的语
您可能关注的文档
- 复方丹参滴丸和其主要成分丹酚总酸A、B对光化学引起细静脉血栓的抑制作用和其原理(摘要).pdf
- 高纯度河豚毒素理化性质研究.pdf
- 高性能碱粉煤灰矿渣砼耐久性研究.pdf
- 辊道窑最佳烧成曲线的研究和探讨.pdf
- 航空发动机外部管路系统智能敷设探究.pdf
- 海星保健食品一海星精对小鼠抗疲劳作用探究.pdf
- 粉状活性炭比电容量的测定方法地研究.pdf
- 干选煤用多孔不锈钢板耐磨性研究.pdf
- 黑龙江省大豆施硫效果地研究.pdf
- 海洋混响背景下微弱信号检测仿真研究.pdf
- 具身智能:谁在布局,如何落子?——产业投资与并购的交易架构与法律策略.docx
- 中美欧供应链风险与供应链安全法规深度研究报告v2 2026_罗戈网.docx
- 电力电缆知识培训.docx
- 2026年中国光交换机行业研究报告 全光交换赋能算力,国产替代迎来关键期.docx
- 晶盛机电2025环境、社会和公司治理(ESG)报告.pdf
- 2026年企业AI转型成功标准.docx
- 清华大学建筑节能研究中心:中国建筑节能年度发展研究报告2025(预览版).docx
- OpenAI_AI就业转型框架:人工智能对就业的短期影响研究报告+The+AI+Jobs+Transition+Framework:Mapping+AI’s+Near-Term+Impact+on+Jobs.docx
- 小核酸药物行业深度报告:小核酸市场欣欣向荣,国产管线蓄势待发.docx
- 国际清洁交通委员会icct:中国铁路内燃机车及其发动机第一阶段排放标准.docx
最近下载
- (45页PPT)六西格玛案例.ppt
- 公司厂级安全教育培训试卷及答案.docx VIP
- 学堂在线定向运动(西京学院)期末考试答案.docx
- (正式版)DB31∕T 1662-2025 《养老机构消毒卫生要求》.pdf VIP
- 运动处方--慢性疾病的预防与康复(浙大)大学MOOC慕课 客观题答案.docx VIP
- 学堂在线运动处方理论与应用(北体)期末考试答案.docx
- 11.1创新思维的含义与特征课件(共32张PPT+1个内嵌视频) 统编版高中政治选择性必修3(含音频+视频).pptx VIP
- 在线网课学习课堂《运动处方理论与应用(北京体育大学)》单元测试考核答案.pdf
- NB∕SH∕T 0164-2019 石油及相关产品包装、储运及交货验收规则.pdf
- NB∕T 35056-2015 水电站压力钢管设计规范 附2021年第1号修改单(3-1).pdf
原创力文档

文档评论(0)