- 3
- 0
- 约1.25万字
- 约 12页
- 2017-11-17 发布于河南
- 举报
语言编码检测的复合方法
一种语言/编码检测的复合方法1. 概要本文提供了三种自动检测方法来判定无明显字符集声明的文档的编码。我们将分别讨论每种方法的优点和缺点,并提供一种复合的、更有效的方法来检测编码,这样,三种检测方法就可以互为补充。我们认为自动检测在使浏览器用户避免经常使用编码菜单手动选择编码上很有用,同时在编码菜单很少出现的情况下,提供了更合理的处理方式。我们假设,文档转化到Unicode 对用户是透明的。无论字符编码采用的是某种Unicode 编码还是本地编码,用户仅需知道字符最终显示是正确的就行了。好的自动编码检测能有效地帮助用户处理大部分编码事项而无需用户手动参与。2. 背景自从进入计算机时代以来,人们创造了许多使用计算机数据表示的编码方案来表达不同的文字/字符集。随着全球化和Internet 的发展,跨语言和区域的信息交换越来越重要。但是,现存的多种编码方案对此是一个屏障。Unicode 提供了通用的编码解决方案,但是,迄今为止,各种各样的因素使它并没有代替现存的区域编码方案,尽管W3C 和IETF 建议使用UTF-8 作为缺省编码,比如在XML、XHTML 或RDF 中。因此,现今的国际化软件不仅要处理Unicode 编码,还要处理其它多种不同的编码方式。我们当前的工作是在开发Internet 浏览器的环境中开展的。为了处理当前Web 上使用不同编码的各种语言,我们做了许多努力。为了获取正
您可能关注的文档
- 实现 Castor 数据绑定,第 1 部分 安装和设置 Castor.doc
- 常见JAVA&人事问题回顾.doc
- 构建动态Java程序.doc
- 跟踪修订和批注.docx
- 第 5 部分 数据库服务器操作.doc
- 理论_项目管理.doc
- adnroid-经典制作.doc
- dom4j入门手册.docx
- Frontpage 2003网页解答.doc
- 阿里java历年笔试整理.doc
- 北摩高科(002985)公司点评:公司进入发展蓄力期,军民航业务多点开花-260319-银河证券.pdf
- 大类资产配置新框架(13):全球资产的天平正从利率摆向通胀-260324-中信建投.pdf
- 高油价冲击,三种情景-260322-华西证券.pdf
- 电力设备行业深度报告:绿醇,氢能重要载体,绿色燃料元年-260320-开源证券.pdf
- 港股市场策略展望:港股何时能够利空出尽?-260322-广发证券.pdf
- 地产债右侧机会解析:后万科时期-260325-广发证券.pdf
- XX学校2026年春季学期教育扶贫送教上门工作方案.docx
- 人教版七年级下册语文期末试卷(1).pdf
- 2017年全国高考语文试题及答案-全国卷1.pdf
- 运放参数说明(加选型和例子).pdf
原创力文档

文档评论(0)