网站大量收购独家精品文档,联系QQ:2885784924

格式化数据向自然语言文本转化软件关键技术研究与实现-软件工程专业论文.docx

格式化数据向自然语言文本转化软件关键技术研究与实现-软件工程专业论文.docx

  1. 1、本文档共77页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
格式化数据向自然语言文本转化软件关键技术研究与实现-软件工程专业论文

万方数据 万方数据 独 创 性 声 明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名: 日期: 年 月 日 论 文 使 用 授 权 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 (保密的学位论文在解密后应遵守此规定) 签名: 导师签名: 日期: 年 月 日 万方数据 万方数据 摘 要 摘 要 办公自动化系统普遍使用 xml 等格式化数据存储、交换信息,以便于计算机 自动处理,提高工作效率。但是,这类数据文件不便于普通人阅读与理解。在实 际应用中,通常仍需要依据格式化数据编辑拟制自然语言文本报表。这一工作通 常由用户手工完成,造成重复劳动,影响办公效率的提高。因此,有必要针对办 公系统中公文报表的特点,研究从格式化数据向自然语言文本的转换机制,以实 现这一过程计算机自动处理,减轻用户负担,提高工作效率。 本文针对办公自动化系统中常见公文报表的特点,深入分析其与格式化数据 间的映射关系,探索自动转换机制,提出了一种基于预定义模型的自动转化方法, 在此基础上设计了一个能够依据用户设定的规则自动将格式化数据转化为自然语 言文本的自动转换软件。软件能够解析格式化数据模版,并以图形方式显示格式 化模版结构供用户分析其与自然语言文本对应关系,同时支持用户自定义转换模 型以适应不同的转换环境提高转换文本可读性。 本文研究所实现的转化软件,能够支持用户自定义转化模型,并依据用户指 定的转化关系,自动将格式化数据转化为符合公文行文规范的报表文本,极大的 节省了人工编辑相应文档所需的时间,有效的提高了办公效率,具有显著的应用 价值和推广前景。 关键词:格式化数据,自然语言文本,自动转化 I ABSTRACT ABSTRACT In general, the office automation system uses xml or other format data to store and exchange information in order to process the data automatically and improve the efficiency. However, this kind of data files can’t be read or understood easily. In the practical application, people still need to edit and formulate the natural language documents according to the format data. The users often do this work manually, which causes duplicated work and lowers the efficiency. So it’s necessary to make a research on the exchange mechanism converting the format data to the natural language documents, which is based on the characteristics of documents in the office system. This research can achieve the computer’s automation process, ease users’ burden and improve the efficiency. Based on the characteristics of documents in the office automation system, this paper deeply analyzes the relationship between the documents and the data files, explores the automation exchange mechanism, and develops an automation exchange softwa

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档