- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
护理学免费资源实现研究
1护理学免费资源知识元组织的必要性
根据是否收费,Web上护理学电子资源分为收费资源和免费资源两种。收费资源如中国知网(CNKI)、万方等电子数据库,是护理学工作者获取知识的主要途径。由于其结构严谨,内容准确,为其知识组织方式由信息元过度至知识元提供了良好的基础,如CNKI数据库已经提供了知识元检索途径。在收费电子资源发展的同时,免费资源的发展也是日新月异,主要包括三类:①基于电子图书、期刊的开源资源,如道客巴巴、百度文库等。从目前资源的种类和数量上分析,开源资源的电子图书、期刊、博硕论文已经与收费数据库大体相当;②护理学电子论坛如丁香园、天使之城等。电子论坛向所有护理学工作者敞开了大门,是广大护理学工作者交流工作经验、思想体会的主要阵地,在资源种类和内容上与电子数据库形成了良好互补;③护理学百科知识网站,如百度百科、搜搜百科等。百科类网站的诞生为广大互联网用户提供了新的信息获取途径,其发展理念强调用户的参与和奉献精神,内容整体详实准确。可见从资源的种类和数量上分析,护理学收费资源仅是免费资源的一个子集。然而,在知识的组织方式上后者与收费资源远远不能同日而语,整体处于无组织的状态。这是由于免费资源分布过于广泛,所有的内容没有统一的结构格式要求,尤其是电子论坛信息的发布没有审核的过程,不规范用语非常常见等等,在这种条件下,显然信息元不可能成为免费资源的组织方式。为了合理组织这些资源,知识元组织方式最佳的选择。
2护理学知识元的标引范围
2.1限定开源资源的标引范围
目前国内大型综合类开源资源网站主要以道客巴巴、百度文库和豆丁网为代表,笔者在3月19日以“护理学”为检索词向这三个数据库的默认检索方式进行检索,分别得到956149、901090和401445个检索结果,由于以上三者均是以电子期刊、电子图书、学术论文、电子课件等作为资源收集的内容,从资源数量可以简单的判断道客巴巴的护理学资源最为丰富。因此,将开源资源的收集范围限定在道客巴巴中,其他两个数据库没有必要做重复的分析统计。
2.2限定电子论坛的标引范围
包括护理学在内,各种电子论坛的整体资源质量与论坛服务时间往往成正比,如丁香园论坛始建于2000年7月23日,经过多年的发展,吸引了大量高素质医学工作者的关注,内容也较为准确,信息每天都在动态更新;相比之下大量小的医学论坛不具有较强的吸引力,内容的整体质量较低,而且即使对其进行标引,这些论坛未来也非常可能被市场所淘汰,无法找到标引所对应的知识内容,显然对这样的网站内容进行深入的知识挖掘几乎没有意义。因此有必要将论坛的范围限制在2年以上,以此保充分提高对电子论坛知识元标引的质量和工作效率。
2.3限定百科全书类网站的标引范围
主流的百科全书类网站主要有百度百科、搜搜百科、360百科、谷歌百科等等,通过名字即可发现这些网站均有一个共同的特点,即先有搜索引擎,后有百科,每个所有引擎都会首要的引用自身的百科知识,两者相互促进发展。以上百科类网站的知识内容几乎均涵盖所有的学科范围,种类和内容没有明显差别,但由于百度搜索引擎是市场占有率最大,在2012年11月占有率高达72.84%[2],可以说百度已经成为多数人检索信息的习惯。相应的使百度百科自然成为百科类知识点击率最高的网站,因此将范围限定在百度百科中。
3知识元标引过程
3.1护理学免费资源的分词
分词就是将连续的字序列按照一定的规范重新组合成词序列的过程,将没有间隔符中文词语变为机器可以理解的词语。常用的分词方法可分为三大类:基于字符串匹配的分词法、基于理解的分词方法和基于词频统计的分词方法。基于理解的分词方法模拟了人脑的理解过程,目前还处在试验阶段[3]。前文虽然对护理学免费资源的范围进行了限定,但整体仍然是海量的,为了提高分析效率,保证分词质量,本文设计了一种曲线高效的分词方法。“曲线”表示为首先不直接对免费资源进行分词,而是以CNKI中的期刊数据库、报纸数据库、博硕论文数据库、会议论文等数据库,和读秀电子图书数据库为对象,采用字符串配算法进行分词方法对其内容进行分词。其原因如下:①电子期刊、博硕论文、会议论文等数据库是高端人才交流前沿知识的主要阵地。这决定其内容整体具有极高的含金量,任何新的理论知识、高效的工作方法必然第一时间诞生在其中或必然有所体现,保证了分词结果的全面性;②整体内容经过作者和编辑部多次审阅和校对,几乎没有错别字和奇异词,不需要对词语进行语义理解的过程,保证了分词结果的准确性;三、文献数量范围进一步缩小。笔者利用CNKI总库检索近5年发表的有关护理学方面的文献,检索表达式为:主题=护理(出版年:2009年3月29日
我们是专业写作机构,多年写作经验,专业代写撰写文章、演讲稿、文稿、文案、申请书、简历、协议、ppt、汇报、报告、方案、策划、征文、心得、工作总结代写代改写作服务。可行性研究报告,实施方案,商业计划书,社会稳定风险评估报告,社会稳定风险分析报告,成果鉴定,项目建议书,申请报告,技术报告,初步设计评估报告,可行性研究评估报告,资金申请报告,实施方案评估报告
文档评论(0)