- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
研究生优秀毕业论文
大连理工大学专业学位硕士学位论文摘
大连理工大学专业学位硕士学位论文
摘 要
早在20世纪30年代,我国对档案检索学科进行比较系统的研究。随着信息技术的 飞速发展,以及档案工作与信息技术的紧密结合,从而为档案检索学科的研究提供了源 源不断的强大动力。如今,日新月异的信息技术让网络化的档案检索手段不断深入,传 统的手工信息检索手段将逐渐被计算机信息检索所取代。
计算机检索档案信息最常用的方法是关键词法,此方法一般人都能使用,但检索到 的信息范围较广,针对性不强。因此,本系统将此方法和自然语言处理技术相结合,通 过研究检索信息与被检索信息之间的文本相似度计算方法,加强检索的针对性,使系统 达到更好的检索效果。本系统运用的主要技术:
1.本系统运用自然语言处理的分词技术,将用户提交查询的关键词串和待查档案
文本的目录和内容进行分词预处理。 2.本系统在检索过程中,需要对预处理的词语进行大量计算,为提高检索时的计
算速度,在数据存储方面运用倒排索引的存储结构。
3.在多种文本相似度计算方法中,本系统采用了信息检索系统中常用的BM25算 法,通过大量实验证明,BM25的计算方法性能较好,且比较稳定。
本系统在经过大量实验以及全面细致的测试后,已经在沈阳新松机器人公司得到了
使用,系统运行快速稳定,档案检索效果显著。 关键词:档案检索学科;分词技术;倒排索引;BM25算法
万方数据
沈阳新松公司档案管理系统的设计与实现Design
沈阳新松公司档案管理系统的设计与实现
Design and Implementation of Archive Management System for Shenyang SIASUN Company
Abstract
Back in the 1 930s,our country systematic conduced research on file retrieval discipline. Closely integrated with the rapid development of information technology and the archival work,creating a steady stream of powerful driving force for research subjects to retrieve files. Nowadays,rapidly evolving information technology makes network—based file retrieval
means for the deepening of,Traditional manual information retrieval will be gradually
replaced by computer information retrieval.
The key word iS the most commonly used method of computer archival information
retrieval method,which is applied to most people,but the retrieved information is largely
broader and unfocused.Therefore,the system uses this method and natural language processing technology combined,through calculation method of text similarity between retrieving information and retrieved information,strengthen targeted retrieval,allowing the system to achieve better search results.This system applied the following techniques:
1。The system uses natural language processing technology segmentation,the catalog and user submitted content keyword query string and text files of unknown origin were pretreated word.
2.The system in the search process,the need for compute—intensive pre
您可能关注的文档
- 兰州邮政11185客服中心系统的设计与实现-电子与通信工程专业毕业论文.docx
- 流域生态需水理论和生态需水过程研究-环境科学专业毕业论文.docx
- 升压型临界导通模式功率因数校正电路的研制-工程硕士专业毕业论文.docx
- 论信用风险计量模型技术在中国信用卡产业中的开发和应用-金融学专业毕业论文.docx
- 桑树Phytocystatin基因的鉴定及表达模式分析-生物化学与分子生物学专业毕业论文.docx
- 离子液体在纤维素预处理过程中的应用研究-化学工程与技术专业毕业论文.docx
- 上市公司发行可转换债券后绩效变化趋势及成因研究-会计学专业毕业论文.docx
- 聊城供电企业绩效管理体系设计与研究-项目管理专业毕业论文.docx
- 流程重组在石嘴山电信分公司的应用研究-工商管理专业毕业论文.docx
- 连铸坯感应加热三维有限元数值模拟分析-控制工程专业毕业论文.docx
- 辽宁沿海经济带经济与环境协调发展态势分析-产业经济学专业毕业论文.docx
- 沈机齿轮公司发展战略研究-工商管理专业毕业论文.docx
- 路政管理系统的设计与实现-软件工程专业毕业论文.docx
- 类A因子级联系统对井冈霉素合成的调控-微生物学专业毕业论文.docx
- 李济与中国近代考古学之构建-考古学及博物馆学专业毕业论文.docx
- 流动性与宏观经济波动:影响效应及其实证研究-金融学专业毕业论文.docx
- 论改装商务车的设计研发-设计艺术学专业毕业论文.docx
- 论文化利益-马克思主义理论与思想政治教育专业毕业论文.docx
- 论“城市共同体”作为人类社会组织形式的内涵与价值-思想政治教育专业毕业论文.docx
- 类别非均衡性对数据混淆度影响的研究-控制科学与工程专业毕业论文.docx
文档评论(0)