- 13
- 0
- 约 6页
- 2015-07-30 发布于安徽
- 举报
汉语语料中对未知词汇的自动提取
高军 陈锡先
北京邮电大学信息技术实验室
北京市海淀区西土城路10号北京邮电大学103信箱
北京,100088,中国
e—mail:b950731l@bapt,edu.cn
●
摘要
在智能中文瞎息处理中,对未知词汇的自动提取是非常重要的课题.
它对自然语言学习和自然语言理解都具有重大意义.本文介绍了一种
对未知词汇,特别是各种人名,地名及专业术语等自动提取的智能方 ●
法.这种方法以信息理论中极限熵的概念为基础,运用汉字字串间最大
似然度的概念,通过与已有词典的配合,成功地实现了高正确率的未知
词汇自动提取.并列出了试验结果.
关键词:极限熵,离散平稳信源,最大
您可能关注的文档
- 光盘刻槽机用超高回转精密空气静压轴承研制.pdf
- 光谱与分析铁谱技术在DF-%2c4-型内燃机车柴油机故障预报上的应用的研究.pdf
- 光同步数字系列SDH的网络同步的研究.pdf
- 光纤/无线传输系统在铁路上的应用.pdf
- 光纤Bragg光栅温度与应变的灵敏度分析及其应用探讨.pdf
- 光纤波分复用器特性测量方法研究.pdf
- 光纤复合架空地线标准及对比.pdf
- 光学波动法求取颗粒粒度分布初探.pdf
- 光学接触式微型三维测量系统.pdf
- 广东电视台大型演播室文件化流程的技术实践.pdf
- 2026住宅小区消防改造建筑方案(执行版,含总平面布置/疏散流线/消防节点).docx
- 2026制造工厂人力资源规划与排班配置方案(执行版,含排班模型/岗位编制/缺口清单).docx
- 2026人工智能企业内训实施计划(执行版,含培训安排/案例任务/考核清单).docx
- 2026仓储物流园总平面布置建筑方案(执行版,含车流组织/仓位分区/消防间距).docx
- 2026老旧办公楼节能改造建筑方案(执行版,含围护结构/节能设备/施工节点).docx
- 2026Python文件批量重命名与归档脚本方案(执行版,含文件样例/处理脚本/归档规则).docx
- 2026企业会计准则长期股权投资核算指南(执行版,含成本法分录/权益法分录/减值检查表).docx
- 2026社区养老服务中心项目可行性研究报告(执行版,含服务需求/建设内容/运营预算).docx
- 2026物流园冷链仓储项目可行性研究报告(执行版,含选址分析/设备配置/财务测算).docx
- 2026企业会计准则现金流量表编制口径手册(执行版,含分类口径/填报模板/勾稽检查表).docx
原创力文档

文档评论(0)