- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1
1
家谱字辈确定方法——基于上海图书馆《上川明经胡氏宗谱》研究
摘要:本文通过研究上海图书馆收录的《上川明经胡氏宗谱》,结合世代信息和统计分析的方法,对家谱数据进行整理和提炼,得到胡氏宗谱的字辈信息,并与文献记载比照验证,证明结论正确,最终得到可复制的字辈信息整理分析方法。
关键词:上海图书馆 字辈 世代 统计分析
引言
辈分,自古以来便是家谱、宗族中极为重要的一个元素,它使族属代代不乱,长幼有序,老少尊卑各有条理。辈分高者,即使尚处垂髫之年,族人亦需行礼以示尊重。而且,一个家族经过数代繁衍,子孙栖居于各地,如若有所交集或者重修家谱,断定世系关系在中国这个崇尚礼义的国度显得极为重要。若缺失字辈这一重要信息,家族内部成员间的关系不出几代即无人知晓,甚至于出现不分长幼的混乱局面。以曲阜孔家为例,自明初得皇室赐辈分字以来,六百余年间长幼关系俨然有序,分支传承清晰明了,即使孔府封号不再家族内部关系仍然坚固,其重要意义可见一斑。由此类推至《上川明经胡氏宗谱》(以下简称胡氏宗谱),如能得出本家族的辈分字,对于判断家谱中每一代人的关系、深入挖掘家谱的内涵信息、乃至历史学者研究本家族或是地方史,都具有极其重要的作用。
在研究胡氏宗谱时,我们发现,上海图书馆(以下简称上图)在录入字辈信息时存在一定的问题,如字辈信息缺失、同一代但是字辈不同、家谱中不存在字辈但是录入了字辈信息等问题。对此,我们基于胡氏宗谱进行研究,尝试寻找出解决方案,便于今后对其他家谱的字辈信息的整理。
背景
在研究胡氏宗谱时,为了更好的了解上图录入数据的结构和信息,我们尝试通过以下几种方式抓取和提取胡氏宗谱中的数据信息,并且,在尝试各种方法研究时,我们也发现了录入数据中存在的问题:
从下往上抓取数据
我们尝试以胡适为出发点,采用SPARQL查询语句,以“childOf”为连接点,先找到胡适的父亲,然后再找到其祖父,以此类推,希望能够找到胡氏宗谱记录的世代总数。但是,在采集过程中,我们发现,当查询语句找到胡千时,循环中止。
当时,我们查看了上图数据库,发现是因为胡千在当时并未录入“childOf”字段,也就是说,在上图数据库中,胡千没有父亲的记录。对此,我们前往上图查询了胡氏宗谱影印版,发现胡千和他的父亲胡七二为始迁祖,在家谱中分开记录,属于家谱中的特殊情况。
对于这个问题,我们立即询问了上图的管理人员,很快问题得到了解决。再次使用该方法查询时,便能找到家谱始祖胡昌翼。
从上往下抓取数据
在之后采集数据时,我们采用了从胡昌翼为出发点,采用SPARQL查询语句查找所有“childOf”为胡昌翼(在查询语句中为胡昌翼的URI)的URI信息,即找到胡昌翼的第二代,再依次找寻下一代。
并且,在查询时我们设置一个计数变量,当一代人查询完时,计数变量增加一个数值,最终确认家谱中共记录胡氏家族44代。
从下往上查询上图记录的家谱字辈信息
在最先抓取胡适家谱信息的时候,我们采取的是从辈分逆推整个家谱。
即在假定上图录入字辈信息准确的情况下,先抓取胡适辈分信息,在SPARQL语句中带入胡适辈分查询该本家谱中所有该辈分的人。然后抓取表第一人的信息,抓取其父亲URI,利用父亲URI查询父亲辈分并进行循环查询。该种方法虽然存在一些问题,(比如SPARQL语句一次最多返回100条信息,可能一个辈分的人数大于100人),但是在抓取数据的过程中,意外发现家谱辈分出现问题,即在某一代辈分A之后,出现另一代辈分也是A,这导致循环语句重复运行,陷入死循环。
细究其原因,主要有两种可能,其一是我们已经找到了家族字辈语句,完成了一个循环的查询,其二便是字辈信息录入有误。
问题描述
在采集家谱字辈信息时,我们发现家谱的查询出现错误,我们对家谱中的人名进行随机查询,发现了存在的一些问题,以以下四个人为例:
图1:第七代胡时佐查询结果
图2:第七代胡全信查询结果
图3:第二十代胡春上舍查询结果
图4:第三十八代胡四喜查询结果
图5:第三十九代胡顺查询结果
从查询结果来看,主要包括以下几个问题:
胡时佐和胡全信同为家谱第七代,但字辈不一样;
胡春上舍在数据库中的字辈为上;
胡四喜字辈为四;
胡顺以及其他姓名为两个字的人名没有字辈。
根据上述例子,我们做出如下推断:
上图数据库的字辈录入采用的是选取姓名中的某个字作为字辈,如胡时佐和胡全信同为家谱第七代,但字辈分别为名字中的“时”和“信”;
上图数据库的字辈录入方法为选取姓名的倒数第二个字作为字辈名,如胡春上舍和胡四喜的字辈记录都为姓名的倒数第二个字;且字辈不能为“胡”,如两个字的姓名“胡顺”等,没有字辈记录。
问题解决
根据以上我们发现的问题和推断,我们认为已经无法直接从上图数据库中直接下载字辈(generationCharacter)信息,因此,我们需要找
您可能关注的文档
- 《不一样的日子》数字媒体技术毕业设计.doc
- 10万人口城市污水处理厂设计.doc
- 12v5a直流开关电源设计.doc
- 24点游戏软件的开发.doc
- 360杀毒案例分析.doc
- 1902法兰为割草机传动轴连接件加工设计.doc
- BISS0001红外热释电处理芯片中文资料完整版.doc
- XX手机的市场营销策略分析.doc
- 北京英语高考试题文档版(含答案).doc
- 大庆汇景花园居住小区工程监理阶段工作总结.doc
- DB44_T 2611-2025 城市排水管网有毒有害气体监测与风险分级管理技术标准.pdf
- DB44_T 2612-2025 竞赛类科普活动策划与实施服务规范.pdf
- DB43_T 2947-2024 烟草种子质量控制规程.pdf
- DB37_T 4836-2025 煤矿风量实时监测技术要求.pdf
- 叉车防撞系统,全球前22强生产商排名及市场份额(by QYResearch).docx
- 超滤膜,全球前18强生产商排名及市场份额(by QYResearch).docx
- DB62T 4172-2020 玉米品种 酒623规范.pdf
- DB62T 4160-2020 在用真空绝热深冷压力容器综合性能在线检测方法.pdf
- DB62T 4164-2020 辣椒品种 酒椒1号.pdf
- DB62T 4133-2020 公路隧道地质超前预报机械能无损探测技术规程.pdf
最近下载
- 环评报告环境影响报告新材料电磁线生产项目.pdf VIP
- 《月光下的肚肚狼》读后感.docx VIP
- 2025福建福州地铁集团有限公司招聘105人笔试备考题库及答案解析.docx
- 人才培养方案修订情况汇报.pptx VIP
- 《建筑地基处理技术规范2012》.pdf VIP
- 行政或后勤岗位招聘笔试题及解答.docx VIP
- 国外体育赛事行政管理体制【论文范文】.doc VIP
- 江西省高职高专院校人的才培养工作水平评估指标体系【范本模板】.pdf VIP
- 湖南工程学院机械设计制造及其自动化“卓越工程师教育培养计划”本科专业培养方案.doc VIP
- 五年级数学下册必考易错应用母题(六大类)(含答案).pdf
文档评论(0)