在Qwen3即将面世的前夕,国内知名科技媒体《晚点对话》有幸专访了阿里巴巴大型模型研发的核心人物——阿里云首席技术官及通义实验室掌舵人周靖人。此次访谈围绕Qwen系列模型在发布过程中遭遇的种种“意外”展开。
自Qwen问世以来,其关键版本发布似乎总难逃被其他科技新闻“抢镜”的命运,这让不少开发者戏称Qwen为大型模型领域的“汪峰”,意指其总能在关键时刻遭遇“头条危机”。先是春节期间,Qwen2.5-Max基座模型的更新被DeepSeek推理模型R1的发布光芒所掩盖;随后,在3月份,Qwen推出的推理模型QwQ-32B又恰好与备受瞩目的Agent产品Manus同日亮相,再次未能独占风头。
面对这一连串的“巧合”,周靖人显得颇为淡然。他表示自己并未听闻这一玩笑,并强调:“某一天的流量其实并不那么关键。”他进一步指出,“我们无法精准把握他人的发布节奏,研发工作有其固有的逻辑和节奏,不是临时可以调整的,这也不符合研发的客观规律。”
周靖人的这番话,不仅体现了他对研发工作的深刻理解,也透露出阿里在大型模型研发领域的从容与自信。尽管外界的关注点时有偏移,但阿里始终坚守着自己的研发路径,稳步前行。
在访谈中,周靖人还分享了阿里在大型模型研发过程中的诸多挑战与收获,以及对未来技术发展的展望。他的话语中充满了对技术的热爱与敬畏,以及对行业未来的无限憧憬。
尽管Qwen系列模型在发布时遭遇了不少“插曲”,但相信在阿里的持续努力下,Qwen定能在大型模型领域绽放出更加耀眼的光芒。