Grok3以及基金投顾智能体的进展.docxVIP

  • 2
  • 0
  • 约2.27千字
  • 约 15页
  • 2025-03-18 发布于北京
  • 举报

Grok3以及基金投顾智能体的进展

马斯克号称“地表最聪明的人工智能”Grok3正式发布。周末进行了测试,手机版直接通过推特APP就可以直接进入,无需再注册账号,唯一不爽的是,使用过程中经常把手机干崩。

先说几点测试完的感受:

1.测试的版本有两个功能DeepSearch和Think

DeepSearch主要是利用Grok的快速代理搜索功能进行深入搜索,提供详细合理的答案。而Think主要是借助模型进行推理。

2.先说DeepSearch

思维展示框:在模型思考过程中,这里的内容会一直变化,告诉用户Agent当前的内心活动以及执行的动作。同时,这里也会将检索到的页面展示出来模型底层的思考内容:思考展示框下面有一个“showthinking”的按钮,点击可以看到文本形式的完整的思考过程。从这里面可以看到模型对工具的调用路线,以及对结果进行分析的过程。

Grok3和Deepseek在推理端有一个比较大的区别,Deepseek先推理再搜索,而Grok3是边推理边搜索,这一点在使用上还是有明显的体验好感,尤其是针对有关金融投资类这种密集知识型决策,准确度会更高。Grok3为了信息的准确性,会检查验证用户信息。

3.再说一下Think模式

Think模式是Grok3的“思维助手”,它会把解决问题的过程一步一步展示给你看,就像老师教你做题一样。通过看它的思考过程,你不仅能知道答案,还能学会怎么解决类似的问题。

我同样用一个关于基金投资的问题来测试这个模式强大的推理功能。为了与Deepseek进行比较,我测试同一个问题下两者的思考逻辑。

问题:持有的中国医药基金亏损了,帮我梳理过去的持基过程,从2021年1月到2024年12月,期间要分析本人的投资行为。

先看Deepseek的思考推理逻辑:

市场背景回顾→可能的行为偏差与操作问题→改进建议。整个的推理过程非常的丝滑顺畅,但有一个问题是数据的准确性确实有待验证。如果正看逻辑推理过程Deepseek已经非常接近“专家”的思考模式。

再看Grok3的思考路径:

第一步必须要定义,全网实时搜索并定义医药基金的概念,第二步分析市场环境与个人投资行为对投资业绩带来的影响占比,第三步给建议。优势是背靠推特的实时信息,建议落地性非常强,思考推理逻辑虽然没有Deepseek更丝滑,但也够用。两者都具备定位需求的功能,但全网搜索上还是Grok3更胜一筹。

4.多模态能力是Grok3目前的优势

DeepSeek-R1不同的是,Grok3还具有多模态能力。它可以分析总结上传文件、图片等。不过与Think模式和DeepSearch模式不能同时使用。

5.数据真实性与更新状态是Grok3的另一个优势

Grok3没有特定的“知识截止日期”。与GPT模型不同,GPT模型总是过时一年或更长时间,而Grok始终保持最新状态。这实际上是一件大事,可能值得进一步讨论!

6.Grok3感觉一步到位,Grok3+推特PK的是微信+Deepseek。

有关金融投资等决策建议型Grok3可落地

金融投资的关键要素有三点:

一是数据务必准确,

二是逻辑通顺且缜密,

三是策略最好能落地,即使不能千人千面。

7.感觉AI基建被官方接手了

自从Deepseek开源之后,最近一段时间明显能感觉到DS正在作为官方的“AI基础设施”出现,政府投资AI基建,民间用极地的成本在基础设施上做应用创造价值。DS的出现,元宝和微信的嫁接,感觉应用端的壁垒也在降低。至少商业模式上暂时没有找到明显的护城河。

8.个体的逻辑好像不再有价值

之前AI靠着大量的数据而得到的感知能力,在一些创作任务上表现出色,取代了一部分相关工作。反而是一些逻辑性比较强的任务,反而更难被取代。但是当Agent爆发的时候,那些机械重复的工作,在一个受限环境下且容易被验证的工作,即使对逻辑能力要求很高,也可能会被AIAgent逐渐取代。

聊聊基金投顾智能体的进展

本周借助腾讯元宝平台继续搭建公众号的智能体,也取得了一些进展,但确实优势和壁垒不明显,最后比拼的还是内容和资源知识库。

1.梳理了Agent使用手册

在之前智能体知识库的基础上,我把使用手册进行了梳理,手册的目的是对智能体的使用要有逻辑,哪些是可以从知识库调用?哪些是全网调?

手册主要分为五部分:

一、知识库的更新

二、知识库调用逻辑及顺序

三、Agent入口

四、提问流程设计

五、可视化多模态补充

有了一些进展,但决策还是不明显,尤其是数据,知识库的更新如果不及时,很难对投资决策形成指导。

2.决策类的落地,Deepseek还得靠智能体

Deepseek的打开界面已经提示对医疗,法律,金融等专业领域不够成任何的落地建议。单纯的使用AI公开的一些信息及时思考逻辑再通顺,落地都会有风险。那么作为个人智能体就需要

文档评论(0)

1亿VIP精品文档

相关文档