制片人|虎秀科技群作者|发布者: 宋思涵 |苗正清正脸照片|月之暗面 我还记得2025年的春节。那时,整个世界都处于DeepSeek狂欢之中。不出所料,类似的场景极有可能在2026年过年期间再次上演。不过,这一次业界已经做了足够的心理预判和准备。 1月27日,月之暗面推出了K2.5车型,但与该公司之前的车型发布会不同的是,这次创始人杨志林亲自上线了K2.5平台,并在自己的视频账号上发布了一段4分13秒的视频。如果单从车型特点来看,K2.5实际上是在K2的基础上进行的升级和体验提升,很难说它“令人印象深刻”。但这次发布真正不同寻常的并不是模型本身,而是杨智霖的个人平台。在大型模特行业,创始人经常采取讲台上的关键点是向外界发出信号,而不是澄清技术细节。当然,杨之琳4+分钟的视频讲了K2.5的所有新技术,这本身也是一个标志。这个时机本身非常敏感,因为它发生在新一代 DeepSeek 模型据信即将推出之前。相反,Kimi 2.5的到来更是令人期待之举。在 DeepSeek 发布新的 V4 或 R2 模型之前,月之暗面需要做一些事情。这也有助于在更重要的变量到来之前稳定局势。毕竟,从2025年的业绩来看,Dark Side of the Moon是DeepSeek推出后受到打击最严重的基础模型公司。在此人看来,这次发射更像是春节前完成的防御部署,而不是主动进攻。 K2.5 有何补充? DeepSeek在2025年带来的平台在经历了Su的影响后,Dark Side月球完成了全面的方向调整。不仅如此,《K2》发布后,《月之暗面》获得了国内外开发商的一致好评。与外界仍习惯将Kimi视为“基础模型竞争对手”不同,月之暗面在过去一年中明显将重点从单纯追求模型功能上限转向编码能力和代理系统,特别是针对国外市场的代理产品形式。但这种改变在某种程度上也是一种实用的选择。因为,在基本模型功能加速同质化的背景下,《月之暗面》需要一种生存方式,而不是完全依赖下一代模型,后者需要更强大。在此前提下,K2.5的定位就明确了。当应用于构建最强模型的历史时,K2.5 并不符合要求。但是当你将其应用到新的核心服务时框架,它看起来更像是一个工程产品。无论是完善编码相关功能,还是优化Agent场景下的稳定性、控制力和执行效率,K2.5的方向都非常明确。这并不是为了证明该模型更好,而是为了让它能够更好地支持已建立的代理和编码路径。换句话说,K2.5就像是月之暗面完成战略转变后给出的确认信号。 《月之暗面》可以在模型层面发起持续的投入并产生渐进的结果。但与此同时,业界真正感兴趣的不仅仅是K2.5。月之暗面实际上在K2发布后就调侃了K3很长一段时间。当然,最理想的情况是DeepSeek先发布K3,然后再发布V4或R2。因为在大规模的模型比赛中,如果你只能先于对手完成换代,你可能会被彻底抑制,至少在叙述和关注层面上。这是因为以下影响可以在很大程度上避免: 但问题是这种理想状态很难建立。无论是OpenAI还是DeepSeek,近两三年主流模型的更新周期都接近一年。原因很简单。随着模型规模、训练成本和系统复杂性不断增加,真正的换代将需要更长的训练、验证和工程周期。这已成为业界共识。距离K2发布仅半年时间。在这样的时间范围内,想要交付一个足以被称为 K3 的模型意味着非常高的技术和交付风险。对于已经专注于编码和代理路由的《月之暗面》来说,牺牲下一代模型的完整性来满足最后期限是更不可能的。至此,事情的真相就变得非常清楚了。 K3仍然是一个非常重要的变量可以在《月之暗面》中看到,但客观上它不可能在下一次 DeepSeek 更新之前出现。在此前提下,K2.5和杨子霖个人平台的出现,也是为了确保如果K3不提前交付的话,月之暗面必须首先使用可交付的升级来稳定自己在新航线上的存在。月球的黑暗面担心什么?去年,大型模型产业进入重组新阶段。智浦和MiniMax已经进入资本市场,另外两家公司百川智能和零一物物也完成了方向性调整并明确了新的选择。在非上市领域,原本有联系的两家公司中,步升星近日透露正在押注“AI+终端”路线。这意味着,唯一仍真正定位为“基座模型公司”的独角兽是月之暗面。这背后隐藏着更加残酷的现实。基本模型的历史德尔即将结束。目前业界的共识是“谁最强?”我们正在从“我们可以创建一个模型吗?”转向“我们可以创建一个模型吗?”到“谁可以真正使用该模型?”因此,继续坚持模型的基本叙事就成为了一个风险更大的选择。但问题是,月之暗面并没有意识到这一点。该公司已经将其编码能力转移给代理商,并希望将重点放在海外市场。然而,与已经完成上市和重定向的同行不同,《月之暗面》尚未能够完全消除对模型本身的依赖。这是杨之琳真正焦虑的第一个原因。不可避免的假设是,即使是大型上市模式公司也尚未经历真正的商业闭环。对于如何营销大型模型,目前还没有标准答案。从这个意义上来说,月之暗面的业务结构就显得尤为特殊。我们不依赖G方的命令 no我们是否将Big B的私有化部署作为我们的主要收入来源。即使在国内的C端,商业化的道路也还没有建立起来。目前,本效率主要基于国外市场。这意味着在很长一段时间内,《月之暗面》的商业模式将继续严重依赖于模型本身的功能。在这种背景下,如果一种模式在功能、成本或采用速度方面明显优于竞争对手,那么其影响将比已完成转型或在有限场景下的公司更直接。为此,DeepSeek的下一代模型永远是月之暗面不可避免的变数。这并不是因为月之暗面还想重返前置模型战场,而是因为在现有的业务架构下,它还未能完全消除对模型领导力的依赖。安克斯第二级有效性来自于验证变革过程本身的压力。虽然专注于编码能力和代理是一个合理的选择,尤其是针对国外市场的编码能力和代理,但这种方法最大的问题是验证周期很长。一旦发布,智能体能否做到并不取决于所创建模型的功能,而是取决于现实世界任务、复杂场景和长期使用的反馈。这让《月之暗面》在舆论和市场上处于不对称的地位。 DeepSeek 可以通过模型发布快速对功能产生革命性影响。另一方面,“月之暗面”只能采取更慢、更有设计性的方法来证明其路线的正确性。第三层焦虑来自于2025年农历新年期间DeepSeek推出后留下的“阴影”。当年春节前后,DeepSeek的推出不仅改变了技术比较,也迅速改写了行业叙事。就《月之暗面》而言,其效果不仅体现在技能水平上,而且对注意力、自信心和位置感也有持久的影响。又临近农历新年,普遍认为下一代DeepSeek模型即将到来,提前出牌的决定本身就是对历史经验的回应。因此,杨志林真正关心的不是K2.5能否在能力上超越对手,而是在基础模型的历史逐渐倒退、代理路径尚未完全验证、下一个外部变量即将到来之前,月之暗面如何避免再次陷入被动。本文来自虎秀,原文链接:https://www.huxiu.com/article/4830530.html?f=wyxwapp特别说明:以上内容(包括图片和视频,如有)为上传由自有媒体平台“网易号”用户编辑发布。本平台仅提供信息存储服务。
注:以上内容(包括照片和视频,如有)由仅提供信息存储服务的社交媒体平台网易号用户上传并发布。