
7月2日,据大厂日爆,消息称在美团内部已经开始下发通知,员工开始限制使用豆包大模型了。
通知要求,各个业务团队都要把用豆包的相关业务都自查一遍,然后规划往LongCat、DeepSeek等模型迁移,如果没有办法从火山大模型那边迁走的,也必要提交原因和必要的说明,并且走审批流程。
截止目前,美团方面未就限制外部大模型一事回应电商观察家。
据悉,这已经不是美团第一次给外面的大模型上“限制”了,今年4月的时候,美团就对相关大模型的使用作出过调整,例如不再推荐业务上使用阿里云提供的Qwen模型,如果业务需要使用,要提交详细的使用说明,并且上报至X3级别审批,也就是上报至老板级别的审批程度。
实际上美团的大模型很早之前就已经开始布局了,据公开信息显示,LongCat是美团自主研发的大语言模型,2023年启动研发的,后来不仅开源,还深度使用了在内部的好几块业务上,包括放在App里面的AI助手“小团”、商家经营助手等等。
据凤凰网科技报道,最近,美团发布了新一代的LongCat-2.0,这个是万亿参数级别的大模型,是对外开源的。而且它是在五万卡国产算力集群上完成全流程训练和推理的,总参数1.6T,平均激活大概48B,动态范围在33B到56B之间,预训练数据超过30Ttokens,覆盖中英文、多语言和代码等多类数据,原生支持1M超长上下文。
LongCat-2.0架构以高效稳定完成Agent代码类任务为核心,兼顾代码解析、生成与运行能力。它搭载100万Token超长上下文,自研LSA稀疏注意力机制,摒弃传统平方级运算,线性化降低长文本计算开销,解决大上下文信息遗忘问题,完整读取全项目代码等。

(图源:美团官网)
从不断的限制外部大模型来看,美团是想把自家大模型慢慢放进核心业务上,让整个美团都是在用自研的大模型进行运营,这样可以很大程度的依赖外部大模型,也可以很好的训练自家的大模型变得更精准更深入。
iPhone版
Android版
电商观察家