2025年Genspark AI Developer最新测试报告.pptxVIP

  • 1
  • 0
  • 约2.58万字
  • 约 73页
  • 2025-08-21 发布于湖南
  • 举报

测报告

2025.08.15

09

10

测试5:创建网站(个人简历)

11

测试6:创建网站(AI监控情报站)

12

测试7:创建网站(追番情报站)

13

结尾

14

附件

15

16

07

08

测试3:创建网站(宠物用品)

测试2:创建网站(家庭家务打卡器)

测试1:生成游戏(超级马里奥)

测试4:创建网站(美容养护)

前言测试任务

01

02

03

04

06

05

能力梯度表

测试任务

测试感受

测试结果

关于作者

2025/8/15

目录

|2

时间单位:秒

OAIAgent

PerpComet

Manus

Genspark

Lovable

Prompt

结果

结果

结果

结果

结果

1

生成游戏(超级马里奥)

部分成功

部分成功

成功

成功

成功

2

创建网站(家庭家务打卡器)

成功

失败

成功

成功

成功

3

创建网站(宠物用品)

成功

失败

成功

成功

部分成功

4

创建网站(美容养护)

成功

成功

成功

成功

成功

5

创建网站(个人简历)

成功

成功

成功

成功

成功

6

创建网站(AI监控情报站)

成功

失败

成功

成功

成功

7

创建网站(追番情报站)

成功

失败

部分成功

部分成功

部分成功

成功/失败比例

7/0

3/4

7/0

7/0

7/0

注:本次时间较为仓促,因此并未列出时间。

本页结果评价也较为简单,建议从业人员可以看看每一个的体验评价,以及生成的结果链接。进行自行判断。

2025/8/15

|4

主要看了一遍结果

看完了感受,这几家agent,由于对于用户需求收集反馈不同,技术选型不同,选择了不同的方向和体验。

Openai的功能体验,感觉在整合很多细节很粗糙,优化的不好。

Comet,我个人在推特和微信生态里,逐步感受到用户对其好评,其浏览器在许多场景有优势,但是这一次在体验中并没有占

到优势。大部分结果需要手动复制黏贴代码,优化的不好。

剩下三家优化的都不错。各有千秋。具体来说,我把测试员的结果放到Claude里,循环评价了一下。大概是如下图的结论。

还是我之前的观点,程序员人群占全部PC使用人群的一小部分,普通办公用户最终感受到的,无论是否套壳,就是看场景,优

化和细节体验。

还是持续看好通用Agent这个赛道!上接Claude,下吞噬各类垂类GenAI1.0应用。

2025/8/15

|5

主要测了OpenAIAgent、Comet、Manus、Genspark以及Lovable在4个Prompt的表现。

总体感受:我个人觉得Coding能力GensparkManusLovableOpenAIAgentComet。

1.OpenAIAgent:在制作游戏这块确实是不太行,做出来很丑,都给我整笑了;但是网站做的还可以,不足之处在于最后给出的是html文件或者是压缩包,不能共享网站或者游戏的链接,不是很方便。

2.Comet:Comet之前测过在其他场景的能力还是不错的,但是这次在coding这方面对比下来确实比较弱,只能给出我原始代码,让我自己去处理成html文件或者其他更复杂的操作,对于我这种编程小白来讲确实不太友好。

3.Manus:Manus的表现还是不错的,制作游戏和搭建网站都挺不错的。游戏生成和网站搭建完成后都可以在线进行分享,比较方便,而且做出来的网站界面也挺好看的。

4.Genspark:本身这次报告的缘起也是来自Genspark发布AIDeveloper,整个测试下来感觉Genspark是真的很不错,无论在制作游戏和搭建网站上,而且很友好的是在搭建网站过程中一直都是可以预览的,最后做出来的网站真的也挺好的,

在宠物用品网站这个任务上,我看到搭建的网站后,我一直惊叹于现在Agent在Coding方面的能力,你只要告诉Agent你的需求,它就能给你制作一个完整的网站,在这种情况下谁还会花钱去找人做网站呀,关键是小白也能操作明白。

5.Lovable:本身Lovable就是专门做编程的,但是测试下来感觉一般,没有很出色,综合下来甚至没有Manus和Genspark的表现好一些,中规中矩,也没什么很特别的地方,但是要吐槽一下分享对话的时候真的有点不太直观,找了挺久才找到如何正确分享链接。

2025/8/15

|6

本次测试了3个任务在OpenAIagent、Manus、Comet、Genspark、Lovable这5个平台的表现。

1.Comet偏“代码顾问”,技术小白不友好。•家庭家务打卡器:给出了完整的前端-后端-数据库方案,但无法一键下载,

文档评论(0)

1亿VIP精品文档

相关文档