针对视障人群无障碍电子政务信息服务技术与软件.docVIP

下载本文档

29
0
约3.67千字
约 8页
2018-06-21 发布于福建
举报
版权申诉

针对视障人群无障碍电子政务信息服务技术与软件.doc

1、本文档共8页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

针对视障人群无障碍电子政务信息服务技术与软件

针对视障人群无障碍电子政务信息服务技术与软件　　摘要：20世纪90年代以来，随着信息技术的高速发展，电子政务已经成为提高政府工作绩效，办事效率，增强政府透明度，联系政府和人民大众之间的重要途径和纽带。政府的门户建设使更多的人通过网络获取政务信息与政府服务，然而视力存在障碍的人群（包括盲人、色盲、色弱等）却只能望而却步。本项目将针对盲人群体，研究具有一定智能化和方便使用的盲人无障碍信息公开技术，并基于所研究的技术开发相应的独立软件系统，使其在安装后，在浏览政府网站的同时进行语音导航。　　关键词：视障人群；无障碍电子政务信息；服务技术与软件　　中图分类号：TP393.09 文献标识码：A 文章编号：1674-7712 （2013） 14-0000-02 　　一、项目背景　　20世纪90年代以来，随着信息技术的高速发展，电子政务已经成为提高政府工作绩效，办事效率，增强政府透明度，联系政府和人民大众之间的重要途径和纽带。政府的门户建设使更多的人通过网络获取政务信息与政府服务，然而视力存在障碍的人群（包括盲人、色盲、色弱等）却只能望而却步。目前，我国视力残疾人数约1233万，占残疾人总数14.86%。对于这一特殊群体，更好地获取政务信息，是他们作为公民应该享有的权利，也是他们在工作和生活中所迫切需要获得的服务。但目前我国各级政府网站的无障碍化建设仍然处于起步阶段，很多政府网站仍然缺乏有效的技术支持这些建设。　　视障人群指的是色弱、色盲、及完全失明的人士。无障碍电子政务信息服务指的是盲人无困难的浏览政府网页。技术与软件指的是我们开发的是一个具有技术含量且独立运行的软件系统。本项目将针对盲人群体，研究具有一定智能化和方便使用的盲人无障碍信息公开技术，并基于所研究的技术开发相应的独立软件系统，使其在安装后，在浏览政府网站的同时进行语音导航，使盲人通过语音输入从而自动地收听获取想要了解的信息。　　本项目的研究开发具有很好的社会效应，使残障人士充分感受到政府人性化和社会关怀，使他们更加积极地参政论政，对我国电子政务的发展，缩小与发达国家的差距也有一定的促???作用。　　二、可行性分析　　目前我国本土企业开发的读屏软件通过语音合成技术将屏幕上显示的网页文本内容读出，使盲人通过收听获取网页内容。但是软件只能根据网页有顺序地朗读它的全部内容，耗时长、浏览速度慢，这些都成为他们获取信息的最大障碍。其次，一些语音网站系统的出现，虽然克服了读屏软件本身的一些弊端，但一方面转换栏目和内容需要进行人工设置，另一方面需要根据网站内容的变化进行人工更新，此外，盲人用户需要记忆大量快捷键组合，这些都使他们感到无所适从。当然，转换网页内容也有一定条件限制，较大网站其实只能转换其中很少部分。最后，市场上还出现了盲人电脑，但是造价较高，而且需要对盲人进行专业培训。家庭条件以及家庭思想观念等各方面原因都使盲人电脑的使用得不到大范围的普及。这些技术对于方便的支持政府网站针对盲人无障碍电子政务信息公开服务具有复杂和不方便等多种局限。　　三、技术实现　　本项目的最终成果是一个可交付软件，该软件实现智能抓取电子政务网站内容并转换成语音朗读出来。因此，技术实现分为两大部分：智能抓取网页内容、文本转语音技术。　　（一）智能抓取网站内容　　（1）分析URL 　　对于待抓取网站，程序并未内置网站网址。目前，实现方式是手动输入URL，系统接收输入并分析URL。如果URL的合法性和正常连接出现问题，系统将抛出错误，正常终止。如果URL合法，将转入下一阶段进行处理。　　（2）待抓取网页预处理　　Web页面信息的抽取的基础工作是对Web文档的结构和内容进行分析，因此，对web文档进行解析是Web页面信息抽取的前提。由于HTML的语法规则有很大的随意性，经常可以有一些省略和不规范的写法存在。如只有开始标识而缺少结束标识、开始标识和结束标识的大小写不一致、链接属性缺少引号及结束标识、标识不匹配等。这类非良构的HTML文档实际上不能为抓取程序所识别。解决之一是在抓取程序中手动编写相关代码将其转换成“良好格式”的HTML文档。由于技术和能力的限制，项目实际采取忽略非规范内容，抓取时仅将范围锁定在规范文本。　　（3）基于正则表达式的过滤性抓取　　对网页内容进行智能抓取，首先要过滤的就是图片等视觉信息，将抓取范围局限于文本。同时，在网页预处理的基础上，分析Web页面树状结构标签，在文本内容范围内，锁定需要提取的文章或新闻的标题内容。　　根据确定的待提取内容，定义类似“（.*？）”的正则表达式，在整个网页源文件中进行模式匹配，相关编程语言都实现了对于给定正则表达式的模式匹配函数或方法。在java中，用pattern类定义正则，用Match