近期,大模型领域热闹非凡,各大企业纷纷推出新技术。
自7月22日起,阿里巴巴在一周内连续开源了四个大模型,覆盖了基础模型、编程模型、推理模型和视频模型等多个领域。其中,通义万相2.2是视频生成模型,千问3最新版基础模型(非思考版)、千问3推理模型以及AI编程模型Qwen3-Coder则分别强化了基础能力、推理能力和编程能力。
7月28日,蚂蚁数科和智谱AI也不甘落后,发布了各自的大模型产品。蚂蚁数科聚焦金融领域,推出了金融推理大模型Agentar-Fin-R1,包括32B和8B参数两个版本,还推出了基于百灵大模型的MOE架构模型,以及非推理版本的14B和72B参数大模型。智谱AI则发布了专为智能体应用打造的新一代旗舰模型GLM-4.5。
值得关注的是,编程能力成为近期大模型发展的重要方向。月之暗面发布的MoE架构基础模型Kimi K2,在前端开发任务中展现了强大的代码生成能力,能够生成设计感与视觉表现力兼备的代码,并支持多种表现形式。Kimi K2 One-shot甚至可以在无具体指令的情况下,自动选用TradingView搭建完整的期货交易系统界面。
智谱AI的GLM-4.5则实现了推理、编码和智能体能力的原生融合,满足了智能体应用的复杂需求。阿里的Qwen3-Coder作为千问系列中的首个代码模型,采用了混合专家MoE架构,支持Agent调用各种工具解决复杂编程任务,为智能体应用提供了有力支持。
随着AI编程能力的不断提升,越来越多的程序员开始尝试使用大语言模型来辅助编程。宇树科技创始人王兴兴在2025世界人工智能大会AI女性菁英论坛上表示,他现在已经很少自己写代码了,而是交给大语言模型来完成。他认为,今年的AI编程相比去年成功率大涨,大大降低了科学研究、AI软件算法的难度。
阿里云百炼高级产品专家徐志远也表示,AI并不是要替代程序员,而是改变了完成工作的方式。他认为,在未来的模型发展趋势下,需要重新思考如何利用新的技术、模型和编程范式来达到目标。甚至在未来,程序员的层级概念可能会进一步淡化,对AI工具的理解程度、对氛围编程的接受程度、对Coder模型的使用程度等将成为决定产出的关键因素。
除了编程能力外,金融大模型也是近期大模型发展的重要方向之一。蚂蚁数科CEO赵闻飙认为,通用大模型距离产业实际应用存在“知识鸿沟”,构建专业的金融大模型是推进金融与AI深度融合的必然路径。蚂蚁数科CTO王维也表示,金融行业在AI场景中面临很多挑战,需要把通用能力和场景鸿沟弥合,因此选择从通用大模型向专业/专用模型演进。
王维认为,金融推理模型会越来越被需要,因为金融类复杂场景的业务需要模型的推理链条和推理逻辑都很清晰才能真正解决问题。一个好的垂直大模型,特别是推理能力很强的大模型,才能成为智能体可控、可靠、可优化的智能中枢。
在金融领域,大模型的应用已经开始展现出巨大的潜力。通过构建专业的金融大模型,金融机构可以更好地应对复杂场景的业务需求,提升服务质量和效率。同时,随着AI技术的不断进步和应用场景的不断拓展,金融大模型的应用深度将成为金融机构竞争力的关键要素之一。
在编程领域,大模型的发展也已经开始改变程序员的工作方式。通过利用大语言模型进行代码生成和辅助编程,程序员可以更加高效地完成工作任务,降低编程难度和成本。同时,随着AI编程能力的不断提升和智能体应用的不断推广,AI编程将成为未来编程领域的重要发展趋势之一。