DeepSeek 实战:三步搞定知识图谱构建 - 单篇提取、多篇融合、主题生成.docxVIP

DeepSeek 实战:三步搞定知识图谱构建 - 单篇提取、多篇融合、主题生成.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

DeepSeek实战:三步搞定知识图谱构建-单篇提取、多篇融合、主题生成

问题:?知识图谱很重要,DeepSeek语言模型很火,它能用来快速构建知识图谱吗?我想试试?DeepSeek?的真本事,看它在提取信息、整合知识、凭空创建图谱方面怎么样。

方法:?我做了三个实验来测试DeepSeek的知识图谱构建能力:

单篇文章建图谱:?给DeepSeek一篇文章,看它能不能准确抓取信息,建成图谱。

多篇文章融合图谱:?给DeepSeek多篇文章,看它能不能把新知识加到已有的图谱里。

主题生成图谱:?只告诉DeepSeek图谱的主题,不给文章,看它能不能自己搞出一个图谱。

结果:?实验证明,DeepSeek构建和融合知识图谱效果不错,但还有提升空间。

下面是实验的具体过程和结果,我用更简单的话说清楚。

?

一、单篇文章提取知识建图谱

目的:?测试DeepSeek从一篇文章里提取知识,构建知识图谱的能力。

过程:?我找了一篇关于NebulaGraph图数据库的文章,让DeepSeek读文章,提取关键信息,然后生成NebulaGraph数据库代码(nGQL)来创建知识图谱。

指令:?“你能帮我生成知识图谱吗?我给你文章,你提取关键信息,用nGQL代码构建知识图谱。”

操作:?直接复制粘贴文章内容给DeepSeek。

DeepSeek生成的nGQL代码:

#Schema定义(TAG类型)

CREATETAGIFNOTEXISTSproduct(

nameSTRING,

descriptionSTRING

);

CREATETAGIFNOTEXISTScompany(

nameSTRING

);

CREATETAGIFNOTEXISTSfeature(

nameSTRING

);

CREATETAGIFNOTEXISTStool(

nameSTRING

);

CREATETAGIFNOTEXISTSscenario(

nameSTRING

);

CREATETAGIFNOTEXISTSlanguage(

nameSTRING

);

CREATETAGIFNOTEXISTSauth_service(

nameSTRING

);

CREATETAGIFNOTEXISTSecosystem(

nameSTRING

);

#Schema定义(EDGE类型)

CREATEEDGEIFNOTEXISTShas_feature();

CREATEEDGEIFNOTEXISTSused_by();

CREATEEDGEIFNOTEXISTSprovides_tool();

CREATEEDGEIFNOTEXISTSsupports_language();

CREATEEDGEIFNOTEXISTSapplicable_scenario();

CREATEEDGEIFNOTEXISTScompatible_with();

CREATEEDGEIFNOTEXISTSsupports_auth();

CREATEEDGEIFNOTEXISTSintegrates_with();

#数据插入-核心产品

INSERTVERTEXproduct(name,description)VALUES

NebulaGraph:(NebulaGraph,开源的分布式图数据库,支持千亿点万亿边数据集);

#数据插入-产品特性

INSERTVERTEXfeature(name)VALUES

high_performance:(高性能),

open_source:(开源),

scalability:(易扩展),

flexible_modeling:(灵活数据建模),

read_write_balance:(读写平衡),

compatibility:(查询语言兼容性);

/*...此处省略n多数据...*/

结果:?DeepSeek代码没啥问题,语法对,还把多条数据合成一条语句,效率高。代码放到NebulaGraph跑起来,图谱长这样:

图谱以?NebulaGraph?为中心,展示了相关信息。

?

二、多篇文章融合知识

目的:?测试DeepSeek融合多篇文章知识,扩展已有图谱的能力。

过程:?先用一篇文章建了图谱,再给DeepSeek更多关于NebulaGraph的文章(来自百度百科),让它把新知识合并到现有图谱里。

指令:?“接下来,给你另一篇

文档评论(0)

AI优质资料创作家 + 关注
实名认证
文档贡献者

工业和信息化人才能力认证持证人

从事10年计算机专业,目前是AI算法工程师,致力于将自己的知识和想法整理出来帮助到有需要的朋友。

领域认证该用户于2024年06月20日上传了工业和信息化人才能力认证

1亿VIP精品文档

相关文档