- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
 - 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
 - 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
 - 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
 - 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
 - 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
 - 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
 
                        查看更多
                        
                    
                第 
第   PAGE IV   页
目	录
第一章 引言  1
1.1 研究背景  1
1.2 工作动机  2
1.3 本文的贡献  3
1.4 本文的结构  4
第二章 相关研究  5
2.1 分类模型研究现状 5 
2.1.1 决策树模型 5
2.1.2   贝叶斯分类模型  6
2.1.3 k-近邻分类模型	7
2.1.4   支持向量机模型  7
2.2 主动学习算法研究现状  12
2.2.1 成员查询算法 12
2.2.2 选择抽样算法 12
2.3 意见元素识别研究现状  15
2.3.1 主题的识别 15
2.3.2   意见持有者的识别  16
2.3.3 情感的识别 16
2.4 标注工具研究现状  17
2.5 本章小结 18
第三章 语料的准备  19
3.1 语料的选取  19
3.2 语料的预处理  19
3.3 语料的标注规范  19
3.4 语料的存储  22
3.5 语料的规模  23
3.6 本章小结  23
第四章 意见元素的识别  25
4.1 主题的识别  25
4.1.1 文档的表示 25
4.1.2 核函数的确定 26
4.1.3 特征的选取 27
4.1.4 实验 37
4.2 情感的识别  39
4.2.1  基于词典的情感识别方法  39
4.2.2  基于统计方法的情感识别  42
4.2.3 实验 42
4.3 意见持有者的识别  43
4.3.1  基于规则的意见持有者识别  43
4.3.2  基于统计方法的意见持有者识别   44
4.3.3 实验 45
4.4 多分类问题  46
4.4.1 分类原理 46
4.4.2 实验 48
4.5 本章小结  49
第五章 基于主动学习的语料标注方法  50
5.1 系统架构  50
5.1.1 学习引擎 52
5.1.2 选择引擎 52
5.2 实验  57
5.3 主动学习系统的评价方法  65
5.4 本章小结  67
第六章 总结和未来的工作  68
6.1 总结  68
6.2 未来的工作  68
参 考 文 献  70
致	谢  75
攻读硕士学位期间已发表或录用的论文  76
第 
第   PAGE VI    页
图片目录
图 1-1 本文采用的技术路线 3
图 2-1 线性可分的最优分类超平面 8
图 2-2 非线性可分的最优分类超平面 9
图 3-1 语料标注流程 22
图 4-1 句子依存关系示意图 29
图 5-1 系统工作流程图 51
表格目录
表 3-1 数据集详细信息 23
表 4-1 核函数实验结果 26
表 4-2 词性标注集 27
表 4-3 简化后的词性类别 28
表 4-4 词义消歧信息大类示意 31
表 4-5 词义消歧信息中类示意(物) 31
表 4-6 词义消歧信息小类示意(用品)  32
表 4-7 词义消歧信息词群示意(照相机 胶片)  33
表 4-8 词义消歧信息在不同颗粒度下的表示形式  33
表 4-9 COAE 2008  任务三数据集中语料的分布	34
表 4-10 词义消歧信息对主题识别性能的影响  35
表 4-11 意见元素在实验语料集中所占比例  36
表 4-12 权值设置表 37
表 4-13 主题识别实验方案 38
表 4-14 主题识别实验结果 38
表 4-15 情感词词典词类分布 41
表 4-16 情感识别实验结果 42
表 4-17 词义消歧信息示例(人) 44
表 4-18 词义消歧信息示例(泛称) 44
表 4-19 意见持有者识别实验结果 45
表 4-20 四分类器与二分类器意见元素识别结果对比  48
第 
第  VII   页
表 5-1 四分类支持向量机决策过程示例  55
表 5-2 主题识别实验结果 K=200 	58
表 5-3 主题识别实验结果 K=500 	58
表 5-4 主题识别实验结果 K=1000 	59
表 5-5 情感识别实验结果 K=200 	60
表 5-6 情感识别实验结果 K=500 	60
表 5-7 情感识别实验结果 K=1000 	60
表 5-8 意见持有者识别实验结果 K=200. 	61
表 5-9 意见持有者识别实验结果 K=500. 	62
表 5-10 意见持有者识别实验结果 K=1000 	62
表 5-11 同时识别所有意见元素的实验结果 K=200 	63
表 5-12 同时识别所有意见元素的实验结果 K=500 	63
表 5-13 同时识别所有意见元素的实验结果 K=1000 	63
表 5-14 主动学习算法与传统机器学习算法特点对比  67
第 
第   PAGE 10    页
第一章 引言
1.1 研究背景
主观性文本是相对于客观性文本而言的一种自然语言文本
                您可能关注的文档
- 基于中值滤波和小波变换的图像去噪-计算机应用技术专业论文.docx
 - 基于中值滤波和小波变换的图像去噪-电子与通信工程专业论文.docx
 - 基于专题资源网站的学习在中学信息课中应用的研究-现代教育技术专业论文.docx
 - 基于中医“五神”学说从“志意”探讨老年性痴呆的病机层次与证候要素-中医内科学专业论文.docx
 - 基于中医五行理论的产品管理与财务管理关系研究-企业管理专业论文.docx
 - 基于中医“心应夏”理论的冬夏变化对血管内皮功能物质影响的实验研究-中医基础理论专业论文.docx
 - 基于专调数据的陕西省公路运输业对国民经济贡献率研究-物流工程专业论文.docx
 - 基于中医临床技能教育的中医辨证思维训练系统的设计-中医诊断学专业论文.docx
 - 基于中医体质的声象特征研究 生物医学工程专业论文.docx
 - 基于中医古代文献对失眠症惊悸不安状态处方用药规律的研究-中医内科学专业论文.docx
 
- 基于主动学习的用户冷启动推荐分析-计算机软件与理论专业论文.docx
 - 基于主动学习的语义缺失问句补全-计算机科学与技术专业论文.docx
 - 基于主动学习的语料自动标注方法研究-计算机应用技术专业论文.docx
 - 基于主动学习的高光谱图像分类方法研究-电子与通信工程专业论文.docx
 - 基于主动带宽测量的多码率流媒体系统设计研究-电路与系统专业论文.docx
 - 基于主动差异学习神经网络集成的电力变压器故障诊断方法研究-电力电子与电力传动专业论文.docx
 - 基于主动形状模型的实时人脸特征点定位方法研究及实现-计算机视觉专业论文.docx
 - 基于主动对抗响应的网络入侵检测模型-计算机应用专业论文.docx
 - 基于主动形状模型的头部姿态估计-计算机应用技术专业论文.docx
 - 基于主动学习的图像分类分析-软件工程专业论文.docx
 
最近下载
- 2023年资料员资格考试题库答案下载.docx
 - 人教版小学语文四年级上册第二单元试卷及答案.pdf VIP
 - 安全与急救(四川警察学院)超星尔雅学习通网课章节测试答案.doc VIP
 - 铁总工电〔2018〕125号普速铁路桥隧建筑物修理规则.docx VIP
 - 煤岩复合体能量传递特性与动力灾害关联性.docx VIP
 - 高血压的危害及有效的降压方法.pptx VIP
 - 生涯发展报告.pdf VIP
 - 数学活动 月历中的奥秘及和为定值的两数积的规律 2025-2026学年人教版数学八年级上册.docx
 - 2026教育部教育技术与资源发展中心(中央电化教育馆)招聘3人(非事业编)笔试备考试题及答案解析.docx VIP
 - 弱电施工方案.doc VIP
 
原创力文档
                        

文档评论(0)