- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
从元数据到数据作为数据转换工具上海图书馆夏翠娟年月大学主要内容简介使用范围和场景下载安装数据导入数据清洗的相关模块的使用知识本体映射配置数据导出多源数据混搭简介数据剖析数据清洗数据转换数据关联与混搭看起来像用起来像不方便增加新的行下载下载版本插件安装在的安装包解压到某个目录要运行双击文件在的安装文件打开磁盘镜像拖动的图标到目录双击图标以启动在的安装包解压到当前用户的目录在终端命令行环境键入以启动安装插件解压到导入数据数据清洗数据清洗数据类型转换生成新的列娶娶氏分面浏览批量修改数据转换设置设置命名
从元数据到RDF数据
OpenRefine作为RDF数据转换工具
上海图书馆 夏翠娟
2018年6月 @****大学
主要内容
• OpenRefine简介——使用范围和场景
• OpenRefine下载安装
• OpenRefine数据导入
• OpenRefine数据清洗
• OpenRefine的RDF相关模块的使用
• 知识本体映射配置
• RDF数据导出
• 多源数据混搭
OpenRefine简介
• Google Refine2.5
• OpenRefine 2.6 (Oct 13, 2015)
• 数据剖析 (data profiling)
• 数据清洗 (data cleaning)
• 数据转换 (interactive data
transformation tools)
• 数据关联与混搭
• 看起来像EXCEL,用起来像database
• 不方便增加新的行
OpenRefine下载
• 下载:/download.html
• 版本
• OpenRefine 2.6-rc2 Release Candidate 2
• OpenRefine 2.6 beta 1
• Google Refine 2.5
• LODRefine
• 插件
• RDF extension 0.8 for Google Refine 2.5
• RDF extension 0.9 for OpenRefine 2.6
OpenRefine安装
•OpenRefine在Windows的安装
1)ZIP包解压到某个目录;
2)要运行OpenRefine ,双击openrefine.exe文件。
•OpenRefine在Mac的安装
1)DMG文件打开磁盘镜像,拖动OpenRefine的图
标到Applications 目录;
2)双击图标以启动OpenRefine。
OpenRefine在Linux的安装
1)gzipped包解压到当前用户的home 目录;
2)在终端命令行环境,键入./refine以启动
OpenRefine。
OpenRefine安装RDF插件
解压到\google-refine-2.5-
r2407\webapp\extensions\rdf-extension
OpenRefine导入数据
OpenRefine数据清洗
GREL (Google Refine Expression Language)
• Variables
• GREL Controls
• GREL Functions overview
• GREL Boolean Functions
• GREL String functions, including parsing, splitting,
encoding and hashing
• GREL Array functions
• GREL Math functions
• GREL Date functions
• GREL Other functions including JSON and Jsoup
OpenRefine数据清洗
1. 数据类型转换
substring(toString(value),0,indexOf(toString(value),.))
2. 生成新的列 (Edit column-add column based on this
column)
substring(value,0,2)
if(indexOf(value,娶)-1,substring(value,indexOf(value,娶
)+1,indexOf(value,氏)+1),)
3. 分面浏览
4. 批量修改
OpenRefine数据转换
1. 设置Base URI
2. 设置命名空间前缀
3. 设置 “主体”的类型
4. 设置 “主体”的URI规则
5. 设置 “谓词”及元数据字段与本体属性之
间的映射
原创力文档


文档评论(0)