- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
了汉语字符层面的有用信息。第二,提出了将字符、词和句子三个层
面的特征混合使用,与单一层面特征相比,这种方法能够提取出文本 更多的信息。第三,将多层面混合的汉语文本作者识别方法应用于对 公安工作实践中遇到的文本作者识别问题的解决,积极运用所学知识 解决公安工作中遇到的实际问题。
关键词:文本作者识别,多层面混合,文本表示,序贯最小优化算法
RESEARCH AND IMPLEMENTATION ON THE IDENTIFICATION OF AUTHORSHIP FOR CHINESE TEXTS
ABSTRACT
The advance in computer technology promotes the research in identification technologies. Various identification technologies have been applied to public security practices. The application of Chinese texts authorship identification technology can effectively assist the police in solving the issue of texts authorship identification.
This paper proposes a multi-layer hybrid authorship identification model focusing on Chinese texts based on sequential minimum
optimization (SMO) algorithm(SM-CTAI). In this model, texts are
represented in three layers including characters, words and sentences layers. The above model based identification system consists of two components: training and identification ones. After texts are pre-proposed, they are segmented and their parts of speech are labeled. According to the processing productions, features are extracted in these three layers
through calculating and formalizing. In this way, texts are represented by vectors in the three-layer hybrid vector space. After training texts are changed into vectors, identification model is established. The texts to be tested are also converted into vectors and identified by the identification model that has been already established. The experiments show that compared with the methods based on single layer features, this one has gained higher recall and precision.
This paper gives new ideas in three aspects: first, it proposes that high-dimension features in character layer should be extracted in texts representation; second, hybrid feature combinations in character, word and sentence layers are used. In this way it can extract more information from texts than single layer features. Third, this method can be appl
您可能关注的文档
- 光伏发电系统中单相并网逆变器的分析-电力电子与电力传动专业论文.docx
- 固结磨料研抛光学玻璃的材料去除机理研究机械制造及其自动化专业论文.docx
- 冠脉支架的扩张模拟与流固耦合分析-机械电子工程专业论文.docx
- 固态继电器及其组合模块电磁干扰分析技术的研究电气工程专业论文.docx
- 管道缺陷检测与识别方法研究与实现-测试计量技术及仪器专业论文.docx
- 海南假单胞菌的致病力及致病机理研究-临床检验诊断学专业论文.docx
- 广西北海涠洲岛海岸侵蚀研究-海洋地质专业论文.docx
- 邯郸市城市住区更新研究-建筑技术科学专业论文.docx
- 过渡金属氧化物纳米复合材料在无酶葡萄糖传感器中的应用-分析化学专业论文.docx
- 光的横向小位移的量子测量-光学专业论文.docx
- 固相合成碳纳米管的方法及性能测试-物理化学专业论文.docx
- 衮矿煤炭运输调度系统设计和实现-软件工程专业论文.docx
- 汉光机车配件厂战略分析-工商管理(MBA)专业论文.docx
- 海藻酸钠纳米氧化石墨复合纤维的制备及性能研究-分析化学专业论文.docx
- 汉光机车配件厂战略研究-工商管理(MBA)专业论文.docx
- 桂林红粘土裂隙特性及强度衰减的研究-岩土工程专业论文.docx
- 寒地稻草还田培肥地力技术研究-作物栽培专业论文.docx
- 海南岛石梅湾植被景观格局研究-生态学专业论文.docx
- 哈大齐工业走廊居民地分类及信息提取研究-自然地理学专业论文.docx
- 果蝇原始生殖细胞增殖与分化的表观遗传调控初步研究-生物工程专业论文.docx
最近下载
- 中外有声读物的研究综述.doc VIP
- 级配碎石底基层施工方案.doc VIP
- 转基因的科学——基因工程知到智慧树期末考试答案题库2025年湖南师范大学.docx VIP
- 学前班数学练习题库.doc VIP
- 关键工序和特殊过程的管理程序文件.pdf VIP
- 2025工会社会工作者通用综合知识与工会专业知识题库.docx VIP
- 安全管理--课件课件--房屋市政工程生产安全重大事故隐患判定标准(2024版)解析.pptx VIP
- 10、突发事件记录表最新.docx VIP
- 2025年河北工会社会工作者招聘考试(工会基础知识)历年参考题库含答案详解.docx VIP
- 九宫格数独题目打印版.docx VIP
原创力文档


文档评论(0)