ITBear旗下自媒体矩阵:

百度文心大模型4.5系列重磅开源,引领国内AI技术新潮流

   时间:2025-07-01 01:16:54 来源:竹之夭夭文案工作室编辑:快讯团队 IP:北京 发表评论无障碍通道

在科技界的瞩目之下,百度近期宣布了一项震撼业界的决定:正式向公众开放其文心大模型4.5系列。这一举动无疑在业内投下了一颗震撼弹,彰显了百度在人工智能领域的深厚积累和开放姿态。

此番开源,百度慷慨地贡献了包括47B、3B激活参数的混合专家(MoE)模型,以及0.3B参数的稠密型模型在内的10款模型。更令人惊喜的是,百度不仅开放了预训练权重,连同推理代码也一并奉上,这样的诚意之举无疑为开发者们提供了极大的便利。目前,这些模型已在飞桨星河社区、Hugging Face等平台上线,百度智能云千帆大模型平台也提供了相应的API服务,开发者们可以轻松下载并部署使用。

其实,早在今年年初,百度就已预告了文心大模型4.5系列的即将推出,并明确了6月30日的开源日期。尽管升级版文心大模型4.5 Turbo系列并未在此次开源名单中,但仍未阻挡开发者们的热情与期待。

消息发布后,开发者社区反响热烈。Reddit上的开发者纷纷点赞,认为小参数版本对于内存有限的配置来说是一大福音。有人甚至预测,300B参数的模型能与DeepSeek V3的671B模型一较高下,而21B参数的模型也不逊色于阿里的Qwen 30B。更有开发者惊喜地发现,28B模型在基础文本能力之外,还增加了视觉功能,直呼“太酷了”。不过,大家最为期盼的还是文心大模型4.5 Turbo系列的开源,对高性能模型的渴望溢于言表。

文心大模型4.5自今年3月发布以来,便以其强大的实力赢得了广泛关注。作为百度自研的新一代原生多模态基础大模型,它在多个测试集上的表现甚至超越了GPT-4。尤其是在图片理解方面,无论是照片、电影截图、网络梗图、漫画还是图标,都能被文心大模型4.5轻松驾驭。同时,它还能精准捕捉音视频中的场景、画面、人物等特征,在生成名人、物品等方面更是栩栩如生。这些成就的背后,是百度飞桨深度学习框架的高效训练、推理和部署,以及模型FLOPs利用率高达47%的惊人效率。

百度创始人李彦宏曾在文章中提到,原生多模态大模型是实现多模态数据原生级融合的关键,是迈向通用人工智能(AGI)的重要一步。文心大模型4.5系列无疑是对这一理念的完美诠释。其背后的三大关键创新——多模态异构MoE预训练、可扩展高效的基础设施以及针对特定模态的后训练,共同构成了其强大的技术支撑。

多模态异构MoE预训练使得文心大模型4.5能够基于文本和视觉模态联合训练,捕捉多模态信息的细微差别,从而提升各种任务的性能。而可扩展高效的基础设施则通过异构混合并行、分层负载均衡策略等先进技术,实现了模型的高效训练和推理。最后,针对特定模态的后训练则满足了实际应用的多样化需求,使得文心大模型4.5在通用语言理解和生成、视觉语言理解等方面都表现出色。

对于百度此次开源的举动,南加州大学计算机科学副教授、三星年度人工智能研究员Sean Ren给予了高度评价。他认为,大型实验室开源强大模型将提高整个行业的标准,给闭源模型提供商带来压力。百度作为国内大模型研发的先行者之一,已经打造出了丰富的模型系列,并实现了日均调用量的显著增长。Sean Ren还指出,虽然消费者可能不太关心模型代码是否开源,但开源模型带来的更低成本、更好性能以及对其语言或地区的支持等好处却是显而易见的。这将为开发人员和研究人员提供更加自由的迭代、定制和部署环境。

百度此次开源文心大模型4.5系列无疑将对国内乃至全球大模型产业的发展产生深远影响。我们期待着这些开源模型能够催生出更多创新应用,为人工智能领域注入新的活力。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version