
图源:长安街知事微信公号
DeepSeek再次引发关注。9月17日,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1研究论文,登上了国际权威期刊《自然》的封面。该杂志直言:目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白“终于被DeepSeek打破”。
和横空出世时带来的轰动效应不同,此次引发关注,是因为DeepSeek团队领风气之先,让AI大模型朝着透明化迈出了一大步。与今年1月发布的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏质疑:“训练数据仅来自普通网页和电子书,不包含任何合成数据。”通过完整公开训练方法,证明了该大模型演化出了多样且复杂的推理行为,成功地学会了更优的推理策略。DeepSeek-R1也由此成为了全球首个经过同行评审的主流大语言模型,填补了当前大模型领域缺乏独立学术监督的“空白”。
以“技”服人之外,更彰显出中国式创新的开放与自信:不怕同行检验,敢于将路径和方法置于审视之下。
同行评审为何如此重要?当前,尽管各大厂商的大模型早已席卷全球,但它们几乎均未经过传统意义上的同行评审。各大厂商更喜欢通过社交媒体、营销发布会等向外传递信息,而不是借助严谨的学术期刊。这种方法虽然传播效果好,却缺乏学术系统独立、客观、批判性的检验。况且,一些AI开发者还可能通过挑选最有利于自己模型的测试,进行“自我打分”。DeepSeek-R1则打破了这一局面。同行评审不仅为模型效果提供了更加客观的评价,意味着其原理、方法经得起学术标准的追问和复现。这一点,在AI治理引发出一些忧虑的当下,显得非常珍贵。
开放与自信,还体现在DeepSeek-R1开源生态中,体现在技术路线的选择上。
正如阿里云创始人王坚所说,“开源与闭源的选择,是AI竞争的关键变量。”两种路线,代表了AI技术两种不同的发展哲学。目前,市面上流行的商业大模型基本上都是闭源的,而DeepSeek却选择了模型权重开放、代码公开、训练细节披露的路线。这不仅降低了行业门槛,也更符合人工智能开放、共享的精神。开放并不意味着失去竞争力,反而能够赢得更多信任与合作机会。这种开放态度,顺应了AI领域未来的发展趋势,展现了中国科技企业已经准备好以开放的姿态参与全球科技治理。此次DeepSeek-R1获得世界顶级科技期刊的青睐,也显示出中国AI研究正从技术追随者,向规则制定者转变。在这个AI快速发展的时代,DeepSeek-R1引发的关注告诉我们,技术的终极目标不是打造封闭的护城河,而是通过开放与合作,推动整个人工智能领域向着更加健康、可持续的方向发展。
用实力说话,以自信示人。DeepSeek-R1,只是中国式创新的一个缩影。
中国是在追赶中实施创新驱动战略,创新的艰巨性和复杂性前所未有。不过,中国式创新不是闭门造车,不是与全球创新市场分割,而是在学习借鉴、开放合作中不断提高自主创新能力。9月18日,科技部部长阴和俊在“高质量完成‘十四五’规划”系列主题新闻发布会上,不仅透露了目前“我国高新技术企业超50万家”“我国研发人员总量世界第一”这些厚实的“创新家底”,也提出要建设具有全球竞争力的开放创新生态,深度参与全球科技治理等。
既要提升自主创新能力,也要与世界各种创新“流派”保持接触和交流,才能让创新成果惠及世界,实现创新的合作共赢。
(原题为《DeepSeek-R1登上<自然>封面 彰显中国式创新的开放自信》 作者 逯海涛 来源 潮新闻)
编辑:左海涛
二审:王亚平
三审:王长善