唐代地名信息更新-ProjectsatHarvard.PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
唐代地名信息更新-ProjectsatHarvard.PDF

唐代地名信息更新 邢云 2018.11.8 CBDB唐代地名的增补  CBDB原有2500 多条唐代地 名数据,主要来自于 CHGIS  将 《中国行政区划通史·唐 代卷》中的地名增补到 CBDB 中 CBDB唐代地名的增补  预处理  筛选工作  导入工作* *导入工作同时涉及上层政区的匹配及地理坐标的确认 预处理  将书中地名信 name time_ft_1 time_lt_1 … level1 level2 … 息抽取为数据 表格形式 酒泉 618 766 … 河西道 凉州都 … 督府  利用python程 抽取整理的数据表结构 序,转换数据 表格使其具有 name time_ft_1 time_lt_1 time_ft_2 time_lt_2 与CBDB地名表 开封 618 627 712 907 相似的结构形 式 name time_ft time_lt 开封 618 627 开封 712 907 转换后的数据表结构 筛选工作  一、程序初步比对  编写python程序,将从书中获取的6083条记录与 CBDB唐代2564条地名数据进行逐一比对  比较项为地名、起止年代、隶属关系*  根据比较结果分类打标签(tag) *郭书以天宝十三年(754年)为基准年代编写,从书中提取的地 名数据,其上级隶属政区也都以754年为准 ,故而并不是准确的 上级隶属关系,无法作为地名是否匹配的严格依据。由于唐代正 州县中名称和起止年月存在一定的匹配关系,而隶属关系不同的 情况,出现概率并不高。因此,最终自动比对结果只选取地名和 起止年月作为比较项。 筛选工作  二、人工初次检查6083条对应关系  去除647条无效比对 ◼ 郭数据无意义:187+69 ◼ 187条研究用名(如前**县,安氏大燕国,已修正) ◼ 69条自定区域名称(**直辖地区、**直属地区,可忽略) ◼ 比对无意义——391条 层级不同的重名地名的错误比较  将5436条有效比对进行筛选 ◼ 按分类不同采用抽查、重点检查等方式人工检查 ◼ 将隶属关系作为检查中的重要参考信息 筛选工作  三、利用程序对5436条有效比对进行筛选  2411个郭书中有而CBDB 中没有的地名  3025个郭书与CBDB数据存在某对应关系的地名, 按时间要素区分: 编 分类 数量 ◼ 657条郭真包含于CBDB 号 ◼ 1021条CBDB真包含于郭 1 书有而CBDB没有的地名 2411 2 郭<CBDB 657 ◼ 426条有交集 3 CBDB<郭 1021 ◼ 542条空集 4 C

文档评论(0)

sunguohong + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档