基于中文的GIS查询界面的初步研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于中文的GIS查询界面的初步研究.pdf

维普资讯 摹I7卷 摹1期 科 技 违雅 V0I.17 No.1 2001丰 1月 BULLETIN OF SCIENCE AND TECHNOLOGY . /an. 2001 基于中文的GIS查询界面的初步研究 周炎坤, 李满春 (南京大学城市与资源学系.江苏 南京 210093) ■ 要 ;提出基于中文 的GIS查询,以统计建模、模式匹配技术为核心,建立这种查询所需的诃 库 、规贝4库 、知识库、语吉转换器.综合模糊识别技术 ,使GIS查询变得更为简单 ,最后 以实例证明 基于中文的 GIs查询的方便性. 关键调 :GIS;中文圭询界面;跹向量太匹配鼻法 中田分类号 P208 文献标识玛 :A 文章鳙粤{1001-7119(21001)01-0035—06 0 前 言 地理信息系统 (GIS)作为空间数据的获取、组织、管理、建摸与分析 、显示,以解决复杂的 规划和管理问题的计算机系统 ,广泛应用于资源管理 、环境监测与评估、交通运输、城市规划、 经济建设及政府各职能部 门0】.可见,研究GIS各方面的理论是很有必要的. 汉语具有词汇丰富、词性广、语法和语义复杂、句型多等特点,计算机很难处理[j}但对于 GIS查询这一特定的应用领域 ,由于其使用的自然语言句式简单 ,句子短且理解 目的单一 (只 对 GIS数据库进行查询),所以实现这种意义上的GIS查询是可能的. GIS学者蚜纷提出了基于标准 sQL的空间扩展及模糊扩展 4【]、基于图标式的GIS可视化 查询框架 等.作者认为,虽然基于图标式的GIS查询有较强的可视化能力,但要求操作人 员有一定的 GIS知识和对GIS数据库有一定的了解,最重要 的是,操作人员需要将 自己脑 中 所想的(What)转化为如何操作 (How)来完成任务的执行步骤.这对于非GIS专业人员来说是 个障碍 ,因此,本文提出了基于中文的GIS查询.由于其具有高度概括性 ,稂符合人类的思维, 只要在界面上敲人中文 (如 “长江上有几座大桥 )就行了,不用构建复杂的SQL语句 ,也不用 图标组台来构 建表达式 ,可见 ,有必要对基于中文的GIS查询进行研究. 1 技术研究 1.1 总 述 GIS理解 自然语言的核心任务是要能完整地刻画句子的词法 、句法或语义信息.然后进行 收稿 日期 :1999—12—27 作者筒升 t局麦坤+男,l975年生 .广东棒县人t礤士研究生.李滴春.~J,1964年生 ·江苏常,计人,教授,理学博士 维普资讯 36 科 技 通 报 17春 信 息提取、问题求解 、向GISSQL语句转换.统计建模方法和模式匹配是 自然语言处理最有力 的武器 ,本文从这一观点出发提 出了系统实现的总技术路线图(图 1). 田 1 基于中文 GIs查询的技术路线田 1.2 选择优化的分词算法 从 1.1可知,当 GIS系统从界面上获得中文查询的字符 串时,首要任务是对其进行分词 处理,以便从中提取条件信息、目标信息以及其他信息.本文的分词技术采用双向最大匹配算 法0.这种算法描述如下:先进行顺 向最大匹配,再进行逆 向最大匹配.顾 向最大匹配的过程 是 :设 MAX表示最大词长 ,WL为词库 ,STR为查询字符 串,Le~(N,STR)函数表示从左到 右取字符串STR的N个汉字.每次从字符 中取长度为MAX的子 串与词库 WL中的诃匹配. 若成功,则该子串为词 ,指针后移MAX个汉字后继续 匹配,否则子 串长度逐次减 l进行匹配, 直至匹配戚功为止.逆 向最大匹配过程则从字符串右侧开始敢子字符串,匹配原理与顺 向最大 匹配原理相 同.若两者得到的结果相 同,则分词正确}若部分不阿,系统会报错,这时需人工交 互干预来解决 问题.

文档评论(0)

ypwx + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档