- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
学者身份识别机制和技术探究.doc
学者身份识别机制和技术探究
学者身份识别是信息组织与检索、文献计量、科研评价等领域长期关注的热点问题.随着在线学术交流模式的形成和替代计量学的发展,学者身份识别问题变得愈发重要.本文从探讨学者身份识别的概念、功能和内涵出发,深入剖析人名规范数据库和学者唯一身份识别符系统这两种典型解决方案,揭示学者身份识别的内在机制和关键技术,以期为后续学者身份识别研究提供参考和借鉴.
1学者身份识别的概念
学者指具有一定专业技能、知识水平、创造能力,能在相关领域表达思想、提出见解、引领社会文化潮流的人[1],有时被称为专家、科研工、研究人员等.从身份定位角度来说,学者身份是指学者不同于他人的特殊个性,其身份由学者姓名、学科领域和专业级别等信息加以确定.
其中姓名是确认学者身份的主要标识,学科领域和专业级别等是附加标识.在学术界,当我们提及某一专家时,首先需确认的是该专家的姓名,然后才是他的学科领域、专业级别、工作单位,以及年龄、性别、荣誉称号等信息.学者身份识别是指通过一定的方法和技术来识别学者身份,达到准确区分每一位学者的目的.就识别内容而言,学者身份识别有广义和狭义之分.狭义的学者身份识别是指将学者姓名与其名称所有版本统一起来,可简称学者姓名识别。
广义的学者身份识别不仅需要将学者姓名进行规范化处理,而且需附加学者性别、出生年月、工作单位、学科领域等相关信息,从而获得某一学者完整的身份信息.一般将相对精确、固定的附加信息称为自然属性,包括学者性别、出生日期、死亡日期、出生地等.将含混、易变的附加信息称为社会属性,包括学者工作单位、学科领域、专业级别、所获荣誉等.日常工作、生活和学习交流环境中,学者姓名是学者身份信息的统一指代,这一点毋庸置疑.由于学者个人名称复杂,同名和异名等情况屡见不鲜,增加了学者身份辨别的难度.学者身份识别的关键是研究如何将学者姓名及其名称的所有版本统一起来,建立唯一标识符.下文将分析学者异名和同名的发生机理以透视学者名称的复杂性,并剖析学者身份识别的内涵和功能,为揭示学者统一身份标识符的内在机制奠定基础.
2学者个人名称的复杂性
2.1学者异名学者异名即同一学者拥有各种不同的名称.为便于论述,本文将学者名称区分为本名和异名两种基本形式.本名指学者个人社会性身份证件上的真实姓名,除此之外的其他一切为人所知的称呼视作异名,包括全称、简称、昵称、网名、笔名、缩写名、中文汉语拼音等[2].
为什么会出现学者异名?异名是学者主动添加或更改而获得的,主要原因有三点:(1)学者在职业发展生涯中正式改换姓名,使得科研成果在改名前后有了不同署名;(2)学者在不同语种的期刊中发表研究成果,采用本名的音译、缩写或汉语拼音等方式进行署名,因而出现了异名;(3)学者交流的环境和偏好发生变化,在线科研交流环境中,学者申请使用各种网名、昵称和笔名等.不同情形产生的学者异名,在字面上与本名关联的程度不同,计算机识别的难度也不尽相同.第一种,学者改名而产生的异名,一般会延续原姓氏,与本名间存在一定字面联系,但难以自动识别;第二种异名比较普遍,与本名间不存在字面关联,但属于不同语种间的翻译和转换,借助计算机技术可自动识别;第三种异名情况较复杂,与本名间即不存在字面关联,又不属于不同语种间的翻译和转换,很难利用计算机技术进行自动识别.
因此,笔名、网名、昵称等增加了学者异名现象的复杂性和处理难度.2.2学者同名学者同名即不同学者拥有相同的名称.当把不同学者的科研成果集中起来形成数据库时出现同名异人现象,难以确认科研成果的精确归属.并且随着数据库规模的扩大,同名出现频率随之增高,即同一姓名关联到的不同学者越多,这是学者同名现象出现的根本原因.据此推理,如果将学者不同语种的出版物,以及学者的学术博客、、专业论坛帖等成果记录一并考虑,纳入更加庞大的学者研究成果库,由于简称、缩写名、译名、网名等各种异名的存在,将极大增加学者异名出现同名的概率,从而增加学者身份辨别的难度.过去图书馆、数据库商等机构在组织信息资源的过程中,一般是在各自数据范围内针对学者本名出现的同名现象进行区分和控制,较少考虑学者异名出现的同名现象.由于同名是学者被动接受的,且随着数据源的变化而变化,因此综合不同数据源,集中规范控制学者本名和异名出现的同名现象是未来信息组织领域非常值得研究的方向.
3学者身份识别的功能和内涵
如今学术交流圈已由图书、期刊等传统出版领域,扩散到微博、博客、学术论坛等网络数字环境中.学术交流网络化是趋势,在线学术交流这一全新学术交流模式正在生成.在线学术交流不仅反映了网络时代科研工交流偏好的变化,更重要的是提高了科研交流的效率和受众面.学术交流模式的改变使得科研成果不再局限于完整独立的学术论文或着作,学者们不断将学术成果
您可能关注的文档
最近下载
- 120个文言实词小故事全文翻译.pdf VIP
- 皮肤粘膜淋巴结综合症的护理.ppt
- 电声音响工程师招聘笔试题与参考答案(某世界500强集团)2024年.docx VIP
- XXX大学学生更换宿舍申请审批表.doc VIP
- 2021常用电力线路阻抗表.docx VIP
- 《城市规划原理》同济大学城市规划原理讲义.pdf VIP
- 第3课《公民基本权利》精品说课课件课件-道德与法治八年级下册.pptx VIP
- 医学影像技术专业《X线检查技术》课程标准.docx VIP
- 《社区警务工作规范(试行)》复习测试卷附答案.docx
- 《管理基础(第四版)》 课件全套 张云河 第1--6单元 管理学基础概述---控制职能.pptx
文档评论(0)