7月2日,据大厂日爆,消息称在美团内部已经开始下发通知,员工开始限制使用豆包大模型了。

通知要求,各个业务团队都要把用豆包的相关业务都自查一遍,然后规划往LongCat、DeepSeek等模型迁移,如果没有办法从火山大模型那边迁走的,也必要提交原因和必要的说明,并且走审批流程。

截止目前,美团方面未就限制外部大模型一事回应电商观察家。

据悉,这已经不是美团第一次给外面的大模型上“限制”了,今年4月的时候,美团就对相关大模型的使用作出过调整,例如不再推荐业务上使用阿里云提供的Qwen模型,如果业务需要使用,要提交详细的使用说明,并且上报至X3级别审批,也就是上报至老板级别的审批程度。

实际上美团的大模型很早之前就已经开始布局了,据公开信息显示,LongCat是美团自主研发的大语言模型,2023年启动研发的,后来不仅开源,还深度使用了在内部的好几块业务上,包括放在App里面的AI助手“小团”、商家经营助手等等。

据凤凰网科技报道,最近,美团发布了新一代的LongCat-2.0,这个是万亿参数级别的大模型,是对外开源的。而且它是在五万卡国产算力集群上完成全流程训练和推理的,总参数1.6T,平均激活大概48B,动态范围在33B到56B之间,预训练数据超过30Ttokens,覆盖中英文、多语言和代码等多类数据,原生支持1M超长上下文。

LongCat-2.0架构以高效稳定完成Agent代码类任务为核心,兼顾代码解析、生成与运行能力。它搭载100万Token超长上下文,自研LSA稀疏注意力机制,摒弃传统平方级运算,线性化降低长文本计算开销,解决大上下文信息遗忘问题,完整读取全项目代码等。

(图源:美团官网)

从不断的限制外部大模型来看,美团是想把自家大模型慢慢放进核心业务上,让整个美团都是在用自研的大模型进行运营,这样可以很大程度的依赖外部大模型,也可以很好的训练自家的大模型变得更精准更深入。

特此声明
本文为正观号作者或机构在正观新闻上传并发布,仅代表该作者或机构观点,不代表正观新闻的观点和立场,正观新闻仅提供信息发布平台。
分享至

电商观察家

电商那些事,出海那些事

+ 关注
查看更多文章

还没有评论,快来抢沙发吧!