传媒行业潜在受益标的梳理:国产模型Kimi突破长文本能力.docxVIP

传媒行业潜在受益标的梳理:国产模型Kimi突破长文本能力.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

一、KimiChat最高支持20万汉字输入,逐渐破圈

智能助手KimiChat具备长文本能力,近期访问量显著增加。KimiChat是国内创业公司月之暗面的首个C端产品,于23年11月正式向所有用户免费开放,能高效处理约20万汉字的上下文,完成智能搜索、高效阅读、资料、辅助创作等功能。该产品已先后推出网页版、小程序版和APP版本。据Similarweb,2月网页版访问量291万,环比翻倍;3/2-3/8周度访问量135万,环比+24%,屡创新高。据七麦数据,目前App版本排名IOS中国区效率(免费)榜20-30名,呈现上升趋势。

产品具体功能包括:

智能搜索:整合并总结互联网信息,并附上相关链接,支持在特定网站内搜索。

高效阅读:理解和处理多种文件格式,包括PDF、Word、Excel、PPT、图片等,可以基于长篇幅文本,提取关键信息、回答用户疑问。

资料:自动识别和提取文档中的关键信息,例如识别发票图片中的关键信息。

辅助创作:具备文本创作和代码编写能力,还能快速阅读和理解API文档。

图表1:KimiChat使用案例

资料来源:AI信息Gap,KimiChat,

图表2:KimiChat网页版访问量变化(万) 图表3:Kimi智能助手IOS中国效率(免费)榜排名

160

140

120

100

80

60

40

20

0

134.8

0

20

40

60

80

2024/2/112024/2/162024/2/212024/2/262024/3/22024/3/7100

2024/2/11

2024/2/16

2024/2/21

2024/2/26

2024/3/2

2024/3/7

资料来源:SimilarWeb, 资料来源:七麦数据,

月之暗面同时布局模型和应用,主推C端产品。公司成立于2023年3月,仅用一年时间完成无损长上下文窗口的技术突破,并推出主力产品Kimi智能助手。在模型侧,公司已训练了千亿级别的自研通用大模型,聚焦上下文窗口的突破;在应用侧,除了C端产品Kimi以外,还向B端开放自研模型的API接口,上下文长度8-128k,每1000tokens价格为0.012-0.06元。据每日经济新闻,公司之所以聚焦C端产品,主要是因为国内市场的B端产品往往需要私有化部署和定制化开发,而基于现有模型的某个版本做私有化部署和定制化的开发,将会导致B端产品的能力和用户体验跟不上模型能力的快速提升。

公司已完成3轮融资,估值25亿美元。据36氪、硅星人,公司分别于成立初期和23年10月获得融资5000万美元、3亿美元;2月公司完成新一轮超10亿美金融资,投资方包括阿里、红杉中国、小红书、美团等,估值25亿美元。

技术人才密度高,发力产品营销。据每日经济新闻,目前团队规模超80人,其中大部分为技术人员。创始

人团队技术背景深,其中杨植麟毕业于清华大学、卡内基梅隆大学,学术引用量自2019年起已超2万余次;另外两位联合创始人周昕宇和吴育昕也均出身清华大学,拥有Meta、旷视科技等科技公司工作经验;其余团队成员也具有CMULTI、Google、Meta、Amazon等海外大厂的工作经历。在产品和运营领域,公司相关人员曾操盘过数亿DAU产品。另据公司官网,目前在招的31个岗位中,其中6个为市场、运营类岗位,包括达人运营、国内广告投放等,反映公司对产品营销和运营的重视程度。

图表4:月之暗面招聘市场、运营类岗位

资料来源:月之暗面,

二、长文本能力拓宽大模型应用场景

大模型上下文窗口长度持续突破。文本生成以token作为处理文本的单位,复杂汉字(如“夔”)可能会分解为若干token的组合,“中国”等短且常见的短语则可能使用单个token。通常而言,1个token相当于1.5-2个汉字;最大上下文长度,则指文本输入和输出合计使用的token数量上限。23年上半年发布的GPT-4、Claude-100k上下文长度分别为32k、100k,对应2.5万、8万汉字的上下文;23年下半年发布的GPT-4Turbo将上下文长度增加至128k,预计对应10万汉字。而24年2月发布的Gemini1.5,则实现破纪录的100万token上下文。据月之暗面,KimiChat在中文上具备显著优势,实际使用效果能够支持约20万汉字的上下文,显著多于GPT-4Turbo。

图表5:大模型上下文长度持续突破

模型名称

发布时间

上下文长度

理解汉字数量

GP

文档评论(0)

535600147 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档