近期,国内开源大模型领域迎来了一波显著的发展浪潮,引发了业界的广泛关注。
在最新的技术动态中,新一代大语言模型(LLM)的更新让开源大模型再次站在了聚光灯下。值得注意的是,一位名为Rohan Paul的软件工程师兼自媒体人在探索过程中发现了一个引人注目的现象:在Design Arena这一全球知名的众包AI生成设计Benchmark平台上,排名前列的开源AI模型几乎全部来自中国。
Design Arena平台以其独特的评测机制著称,它让用户对由不同模型生成的回答进行投票,基于Elo Rating等级分制度来更新模型排名。这种机制确保了排名的公正性和动态性,使新模型能够迅速获得口碑反馈。
在该平台上,当筛选条件设定为“开源”时,可以看到前15名的位置被国产开源大模型牢牢占据。其中,DeepSeek-R1-0528位居榜首,紧随其后的是智谱的GLM-4.5和阿里的Qwen 3 Coder 480B。在这一榜单中,还出现了DeepSeek、Qwen、GLM等多个系列的不同型号模型,以及Kimi在7月份开源的K2模型。直到第16名,才出现了OpenAI最近开源的GPT OSS 120B。
在前15名中,各家大模型厂商的表现尤为亮眼。阿里以6款模型上榜,DeepSeek贡献了5款,智谱则有3款模型入围,而Kimi的K2模型也占据了一席之地。这一排名不仅反映了国内开源大模型的强劲实力,也彰显了国内AI公司在技术创新方面的卓越成就。
近期,国内AI公司纷纷发布新一代开源大模型,推动AI技术不断向前发展。Hugging Face发布的中国AI社区7月开放成果中,包括阿里、智谱、昆仑万维等多家厂商在内的33款大模型相继开源,这一数字足以证明国内开源大模型的蓬勃态势。
还有机构Interconnects汇总了国内顶尖的19家开源模型实验室,涵盖了DeepSeek、Qwen、Moonshot AI(Kimi)、智谱(Z.AI)等知名机构,以及一些通过技术报告和小众模型崭露头角的新兴学术实验室。这些实验室的共同努力,为国产开源大模型的崛起奠定了坚实的基础。
长期以来,以GPT系列为代表的闭源大模型在技术和性能上一直保持着领先地位。然而,随着Llama系列的兴起,越来越多的开源模型开始崭露头角,成为推动AI技术发展的重要力量。近一年多来,国产大模型的集群式崛起更是重塑了全球AI版图,让开源大模型成为了不可忽视的存在。
如今,当人们提及开源大模型时,Qwen和DeepSeek等国产模型已经深入人心。这些开源大模型不仅能够与闭源顶尖模型相抗衡,还促进了应用端公司将工作重点转向模型调优和应用优化,从而加速了AI技术的落地和应用。
有国外网友在分析中国AI模型崛起的原因时,提到了数学基础的重要性。他认为,东亚人在数学领域的主导地位为AI技术的发展提供了有力支持。这一观点虽然具有一定的主观性,但也从一个侧面反映了数学基础在AI技术发展中的重要性。