地理问答中实体求解问题的初步分析.pptx

地理问答中实体求解问题的初步分析.pptx

地理问答中实体求解问题的初步分析 地理问答中的实体求解选择题特点 许多实体与真实世界的对象对应,有丰富的描述 通常涉及多个相似实体的对比 一些抽象的数值关系出现频度较高 存在大量与特定知识点相关的规则 初步技术方案 激活知识点 每个题目都存在一个或多个考察点,识别题目相关的知识点可能过滤有效信息、加速求解流程、提高准确率。 知识点的识别主要依赖于题目处理后得到的关键字、流程、实体关联等 丰富知识 来自知识库的信息是解题的主要依据,根据题目处理的结果以及对知识库的利用,知识的丰富大致可分为三类情况: 查询:查询知识库获得实体描述 计算:通过相应的计算规则丰富实体的数值类型属性 推理:根据知识库中实体关系进行推理 丰富知识-查询 提供对知识库的结构化查询,包括对经纬度等数值类型的范围查询。 从题目中可能构造出不同粒度的查询,如“中国沿海”、“广东省”、“上海浦东新区”等 对于查询出的实体描述,考虑提供提取与输入的辅助信息相关度高的部分描述的功能。 知识库的实体描述可能存在大量冗余,部分 例题 (2014北京市顺义区高考文综地理二模试题 第5题) 图2为我国某山地的垂直带谱示意图。 该山地位于 A. 秦岭 B. 太行山脉 C. 南岭 D. 阴山山脉 解析: 1.如果题目中获取的知识包括海拔,由此构造查询得到的实体集合与选项中唯一的共同实体只有秦岭(其他海拔在3km以下) 2.如果实体描述中包括南北坡的植被,可以直接与题目中的林带类型关联。 3.从南北两坡的林带作为关键属性查询到对应的气候类型实体,在进一步关联到选项中实体两侧的气候带,也是可能的求解方法 例题 (2014北京市朝阳区高考文综地理二模试题 第7题) 读丹霞地貌景观图(图5)及其形成示意图(图6) 关于丹霞地貌的类型 A.甲为干旱峰林型 B.甲为湿润山地型 C.乙为湿润峰林型 D.乙为干旱峡谷型 解析: 丹霞地貌的具体分布并不是教材中已有的知识, 图6给出的示意图属于流水侵蚀而非风化侵蚀, 故排除A。 然而甘肃张掖是大陆性温带干旱气候,如果知识库中没有与答案直接对应的知识,可能造成干扰。 丰富知识-计算 对一些数值描述进行处理,得到其他相应的数值类型属性 不同的描述可能需要不同的处理手段,比如对太阳高度角、时刻、产值结构的描述。 与知识无关的通用的数值处理方法可能单独独立出来,由调用方决定如何使用。 例题 (2013北京西城一模文综试题 第2题) 2013年2月中旬,普查专家飞往乌鲁木齐 (44°N,88°E)做前期调研,于北京时间 12:50抵达。读图1“乌鲁木齐不同日期太阳 升落路线、太阳高度、日出日落时间示意图” ,专家抵达乌鲁木齐时当地太阳高度情况大约为 A.① B.② C.③ D.④ 解析: 日出日落时间与日期和地点存在函数关系、时刻之间存在时区的转换,相应的映射可以通过知识库中的计算处理实现。 丰富知识-推理 提供在知识库上推理的功能,根据输入的描述、实体等推理出目标实体。 包括对上层概念的分类推理等,如: 例题 (2014北京东城区高三期末地理试题 第24题) 读图9 图中 A.①处为向斜 B.②处断裂上升 C.③处为火山 D.④处断裂下沉 解析: 需要从结构特征基于从知识点构造的规则推理出相应的概念。 向斜成山岩层向下翘曲,两翼因侵蚀变平,核部地层较新。 实体匹配与对比 判断得到的实体是否与对应的描述、实体、结构匹配,技术上大致分三种情况: 数值:数值结构的构成是否匹配 谓词:一般的谓词关系是否匹配 结构:实体构成的结构是否匹配 实体匹配与对比-数值 对于常见的数值关系和对应的文本描述能够进行转换,能够判断给出是数值关系是否与实体集合中的某个匹配 数值关系的描述存在多种形式: 一般形式:简单的数值属性,如某地区的经纬度、海拔 图表:柱状图、折线图等处理得到的含多个属性比例或变化的结构 文本描述:一些模糊的数值关系以纯文本的形式描述,包括“主要”、“以…为主”,“高/低”,“最”甚至“雨热同期”等形式 数值关系实例 必修二对人口增长模式的描述: 文本描述:“历史发展表明,人口增长模式是由高出生率、高死亡率和低增长率的原始型向高出生率、低死亡率和高增长率的传统型,继而向低出生率、低死亡率和递增率的现代型逐步过渡。” 图描述: 表格描述(一个实例): (注意:仅从文本来看,这里3.8和2.9的出生率均属于“高”,而2.4的死亡率属于“低”,1.4的自然增长率属于“高”。即文本描述的量化不是与知识点或常识独立的) 例题 (北京市东城区201

文档评论(0)

1亿VIP精品文档

相关文档