当前位置:首页 > 热点资讯 > 正文

他,把互联网大佬的桌子掀了

温馨提示:此页面由第三方提供! 修艺网自营维修服务电话:400-966-8255

他,把互联网大佬的桌子掀了

  来源 | 盐财经

  大模型赛道的参与者一度处于比以往更深的焦虑中。这一领域内,基础技术研究动辄融资上亿,而可行的商业模式,却还在空中摸索。

  但三月的“长文本”概念破圈,重新搅动了一池心意。

  自3月18日,刚满一岁的中国初创AGI公司月之暗面宣布旗下大模型Kimi智能助手开启200万字无损上下文内测后,国内各家大厂先后下场,秀肌肉一般宣布起各自在长文本领域的升级。

他,把互联网大佬的桌子掀了

3月中旬,阿里旗下大模型工具通义千问宣布,向用户开放免费长文档解析处理功能,支持约1000万字的超长文档处理;

百度向《科创板日报》透露,4月将在版本升级后开放长文本能力,文本处理范围在200万-500万,是当下最高2.8万字文档处理能力的上百倍;

360智脑宣布内测500万字长文本处理功能,并表示早在2月底,360AI浏览器已向用户开放100万字长文本阅读和拓展功能。

  被浓烈的FOMO(Fear of Missing Out)情绪裹挟,这场大模型文本处理能力比拼,掀起二级市场一股猛烈的跟投风。三月下旬,与Kimi有关联的上市公司被打包进“Kimi概念股”板块,强势拉涨AI应用板块。与Kimi存在关联的华策影视、掌阅科技、中广天择等多股,在18日后股价相继迎来涨停。

  高烧两周后,如今“Kimi概念”逐渐降温,但其背后这个闪烁着“小天才”光环,由90后创始人建立的、估值达25亿美元的国内初创公司,无疑让更多人看见低门槛投身大模型领域淘金的抓手。

  对资本市场而言,2023年的初始基建时期已经过去,这一领域的商业落地故事,才刚刚起势。

  01

  长文本,关用户什么事?

  在技术圈内,风头正劲的长文本并不是一个稀奇物。

  简单来说,大模型支持的上下文窗口容量,可类比计算机的运行内存,也可理解为大模型的理解力与记忆力。在与大模型进行内容交互(如问答对话)的过程中,大模型有一个可容纳的文本容量上限。这一上限不仅关系到大模型单次处理文本的能力,也关系到大模型记忆连续对话的容量。

  当大模型的长文本容量增加,该大模型在对话时可以考虑的上下文信息就越多,越有助于产生有针对性的连贯对话,也能确保在这一容量内的文本信息丢失情况减小。用户可以喂给大模型更多信息,而大模型根据这一用户与机器的历史互动,回以个性化解释。

  月之暗面CEO杨植麟曾诗意地表示,长文本(long context),是做成通用世界模型的第一步,“登月第一步”。

  这一步,在技术圈内被认可为重要但并非独特的一步。

  正如曾经计算机内存在过去几十年内涨了好几个数量级一样,越来越大的长文本容量同样出现在大模型领域。各家均会发力做内存升级,但受限于长文本对算力消耗大、成本高,真正入局卷基础技术的公司有限,长文本也不是各家大模型的宣传重心。

  月之暗面则另辟蹊径,看见了长文本技术在用户端可以产生的影响,并实行了Kimi与长文本强绑定的宣传策略。

他,把互联网大佬的桌子掀了

  早在2023年10月,推出Kimi应用的第一天,月之暗面便在官方公众号上宣传,“欢迎与Moonshot AI共同开启Loooooooooong LLM时代”。

  它高调宣称,Kimi Chat是首个支持输入20万汉字的智能助手产品,其文本容量2.5倍于Cloude的100K,8倍于GPT-4的32k。

  容量升级,导向的是更好的用户体验。月之暗面表示,当前大模型使用过程中的遗漏重要信息、不支持长文本prompt输入导致的场景设定不清晰、无法基于大量给定材料给出专业回应等问题,均会在大模型拥有足够长的上下文输入容量后迎刃而解。

  这相当于一个记忆容量更大、理解能力更好的大脑。

  “它很本质。”杨植麟如是说。

  如此强调,是为了抢夺产品在用户心中的定位。成立之初,月之暗面便定下了独特的商业模式,不做目前看来商业模式更清晰的B端,而是在做基础大模型研究的同时,面向C端发力,意图通过技术提升,攻克C端用户个性化服务的需求。

  杨植麟曾表示,在大模型领域,基础技术突破和提供个性化服务走的是同一条路。通过不断升级这一“大脑”的“脑容量”,每个C端用户都会获得一个更能记忆与自己的互动历史的模型,从而得到更独特的、无法被复刻的反馈。

  这是一招烧钱获客的险棋。由于当前各家大模型C端应用同质化程度高,普遍为对话助手形式,在资金充裕的阿里、百度等大厂仍提供免费应用的情况下,各家公司不敢贸然进行收费。当公司将商业模式定在用户端,暂时看来,其只能仰赖投资人的源源不断的资金流入,以保证研发及运营的现金流。

  根据《新浪科技》报道,月之暗面当前投放广告获客成本约为10元,加上拉新后用户问答产生的算力成本,每个用户的获客成本约为12-13元。

  按照第三方数据平台七麦数据的用户下载量预估,近一个月IOS端Kimi累计下载量超82万,仅iPhone端日均获客成本已超32万,近一个月iPhone端获客成本近一千万。若加上安卓端、网页端的运营成本,获客成本更要上一级台阶。

他,把互联网大佬的桌子掀了

  尽管费用不低,但这一数据某种程度上验证了月之暗面发展策略的有效性。

  在文心一言、通义千问这类大厂产品已形成一定的用户口碑的当下,Kimi凭借其对长文本技术和使用场景的强调,在用户心中营造出“精确+个性化”的观感,为许多用户找到了试用Kimi的理由。

  此外,在发布Kimi的半年内,月之暗面进一步宣布升级Kimi长文本容量为200万汉字,比今年2月谷歌Gemini1.5支持的100万token还高。这一技术升级在用户端完成了口碑积累与破圈。

  根据AI产品榜(aicpb.com),2023年2月,Kimi在2月访问量骤增一倍,增速在国内访问量前十的AI产品中位居第一。

他,把互联网大佬的桌子掀了

  也正因这一脱胎于初创公司的软件在用户端获得如此大的反响,各家大厂才按耐不住,参与进自家大模型长文本能力的展示中。

  在许多投资人看来,技术已不是当前大模型下一步发展的难点,更困难的在于找到适应市场的产品模式。

  多名AI行业分析师向盐财经表示,大模型技术领域的突破依赖人才、资金和数据,技术升级背后的逻辑往往能归因于规模定律。在资本投资意愿仍然旺盛、商业模式尚不清晰的当下,初创企业和大厂各有优势。

  正如峰瑞资本投资合伙人陈石在Sora发布后所言,“这轮AI行情有一个突出的特点,就是‘天底下没有秘密’。”对摆出更大数据来“围剿”Kimi的大厂而言,这不仅是秀实力,更是争夺用户市场的先声。

  02

  抢滩入局,机会与恐惧

  尽管Kimi激起了一阵水花,但在两周内迅速降温的概念股指数,展现了当下大模型领域尴尬的商业现状:不想错过,害怕做错。

  早在“Kimi概念”兴起之前,大模型领域已经历了数轮类似的技术比拼。如在更为吸睛的多模态大模型领域,国内大厂在2023年年底,已在文生视频、图生视频领域暗暗角力。

  2023年11月18日,字节跳动推出了视频生成模型PixelDance,紧随其后,阿里上线Animate Anyone模型,并先后宣布开源图生视频模型I2VGen-XL和文生视频模型ModelScopeT2V。

  今年1月,大厂在文生视频、图生视频领域角逐更甚,字节跳动、腾讯、百度相继推出视频生成模型MagicVideo-V2、VideoCrafter2和UnivG,均支持文图生成视频。

他,把互联网大佬的桌子掀了

  站在未来的风口面前,各家均不想错过抢占先机的可能。但这也导致了在技术门槛不高、规模定律起主导作用的当下,企业堆叠大量资金与精力于其中,做出来的模型却面临“重复造轮子”的窘况。

  更残酷的是,当Sora这类支持生成60秒视频,达成技术突破的大模型出现后,此前辛苦做出的“轮子”,也面临被迭代风险。

  对月之暗面这类技术信仰派的公司而言,大模型领域的种种厮杀故事,确实是在一次次验证其创始人杨植麟的“第一性原理”,即未来属于一个超级应用AGI(人工通用智能),而当前唯一要做的事是做到最强的技术能力,走向这一超级应用。

  当前,外部整体投资意愿收缩,这也导致大模型领域的投资人虽身处热门赛道,也不得不在开始时便为自己多想退路。

  根据投中研究院数据,2024年2月,中国VC/PE市场投资总规模同比下降33.17%,环比下降40.31%。

  尽管AI领域展开的投资画卷仍有吸引力,让人工智能成为当期细分领域下获投规模最高的细分赛道,但冷静的资本市场,也让投资人更愿意分散下注,期待在大模型应用领域跑出黑马。

他,把互联网大佬的桌子掀了

  资本对重复造轮的厌倦与犹豫,正如市场派的投资者,金沙江创投主管合伙人朱啸虎所言:“整出200多个大模型有啥意义呢?没啥意义。但在应用层有很多创新。中国在数据和应用场景上是远远超过美国的。”

  对技术派而言,大模型的终极意义或许在实现AGI,但在更实际的市场派看来,更终极的问题在于,“大模型的商业模式到底怎样才有效”?

  多位产业分析师向盐财经表示,当前,大模型商业化尚处于萌发期,2024年可被看作大模型应用元年,资本与技术都已积累到一定程度,在迫切地寻找可行的商业模式。比起模糊不定的C端市场,当前发展垂域大模型,与行业相结合,是一个较为可行的方向。

  创道硬科技创始人步日欣表示,当前的基础大模型由于数据来源庞杂,是一个难以实现专业化应用的泛化大模型。因此,将大模型与垂直领域数据结合,培育出专业小模型,是一条能走出差异化的路径。这类模型在预处理后可以面向B端客户,而其内部数据的稀缺性,便是产品的护城河。

  “这类似于上一个互联网时代,利用大模型技术,在各个细分领域与行业耦合。”

  这同样需要尽早入局。步日欣指出,谁在行业内有足够的数据积累,谁便更能在这场应用变革中占据优势。

  至于基础大模型的赢家将在出现在哪边,人们观感并不一致。步日欣表示,AI领域需要的资金投入远大于此前SaaS发展时期,资本雄厚的传统互联网大厂,更有发展大模型的优势。

  艾媒咨询创始人张毅则认为,在互联网大厂抬高入局门槛的情况下,新锐企业有更强的融资能力、引才能力。这就像互联网发展的早期阶段,大厂尚未成型,新锐企业更愿意试错,而新的道路往往诞生于这无畏的尝试中。

  这场围绕Kimi而起的长文本大战,背后涌动的是两种发展观念的交锋。站在技术果实成熟的前夜,原本渐趋固化的竞争格局,重新展现出许多可能。

最新文章