ITBear旗下自媒体矩阵：

滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

金融大模型评测出炉！蚂蚁理财AI“蚂小财”底座模型勇夺榜首

时间：2025-06-24 17:26:23 来源：界面新闻编辑：快讯团队 IP：北京 发表评论无障碍通道

在金融科技领域，随着“人工智能+”战略的深入实施，大型模型技术正逐步在金融行业中扎根生长。为了衡量这些大型模型在金融场景下的专业性和可靠性，上海财经大学近期对其金融领域大模型评估基准进行了升级，推出了Fineval 6.0版本，并首次引入了金融严谨性等新的评估维度，同时发布了首份详细的评测报告。

作为国内金融领域大模型测评的先行者，上海财经大学早在2024年就参与了《金融大模型应用测评指南》的制定工作，该指南是全国首个聚焦于金融业务能力的团体标准。此次升级，Fineval 6.0基于广泛的行业调研和投资者反馈，特别强化了金融严谨性的评测样本，从金融学术知识、行业理解、严谨性测试、安全认知以及智能体应用等多个方面，对大型模型在复杂金融场景中的实际应用能力进行了全面评估。

在Fineval 6.0的评测中，国内外共9款具有代表性的大型模型接受了考验，包括DeepSeek-R1、GPT-4等通用基础模型，以及专注于金融领域的垂直模型。评测结果显示，虽然所有模型在金融学术知识方面均表现出色，但在金融严谨性和行业理解等关键能力上，各模型之间的差异显著。蚂蚁集团旗下的理财AI“蚂小财”凭借其强大的模型底座，在金融严谨性等多个维度上脱颖而出，总分超越了多款通用大模型。

特别是金融严谨性这一维度，行业平均得分仅为70.27分，而“蚂小财”则以高出均值17分的优异成绩遥遥领先。作为蚂蚁集团旗下的AI理财助手，“蚂小财”不仅连接了蚂蚁财富平台上的200多家基金公司、券商和财经媒体的内容与服务，还在通用大模型的基础上，构建了金融智能增强技术体系，显著提升了金融场景下的专业功能和交互体验。

上海财经大学教授张立文作为测评团队的负责人指出，金融领域是AI技术应用的重要场景之一，对AI的专业性和严谨性提出了更高要求。近年来，国内AI在金融领域的应用水平不断提升，逐渐从“博学多才”向“专业审慎”转变，为下一阶段的大规模应用奠定了坚实基础。这些积极的探索不仅有助于提升我国在国际AI产业竞争中的地位，还将为数字金融和普惠金融的发展开辟新篇章。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

化工厂沉淀池清淤新纪元：水下机器人如何智能破局？

数字孪生驱动：通过多波束扫描生成沉淀池三维模型，AI 算法自动识别淤泥堆积热点（如流速死角区），规划螺旋式清淤路径，较传统随机作业覆盖率提升28%。结语：在化工行业向智能化、绿色化转型的进程中，水下清淤…

06-24

外贸金融新突破！TradePilot大模型引领中小微企业全球展业新风尚

根据初步反馈，该模型不仅大幅提升了交易的安全性和效率，还显著降低了中小微外贸企业的成本，已逐步在多个领域进行有效落地应用。 XTransfer外贸金融大模型TradePilot的成功落地，不仅为外贸企业带来…

06-24

盛合晶微IPO在即，华为昇腾“芯”动力背后的封装王者将如何改写行业格局？

1、目前已经进入华为核心先进封装产线盛合晶微，对应产品应用在了鲲鹏、昇腾以及麒麟芯片中稻恭肿郝（金研指南），带走，2、盛合晶微的唯一国产PSPI供应商（半导体先进封装的“卡脖子”材料），公司国内唯一突破该…

06-24

AI超级搜索时代：360纳米AI让普通人也能拥有专家级助手

在1.0的AI搜索阶段，国内外搜索引擎普遍采取的策略是：借助AI对用户问题进行提前总结，并将总结结果置于搜索结果首位。近日，纳米AI升级为超级搜索智能体，面对复杂问题时，纳米AI超级搜索智能体可以实现从单…

06-24

360纳米AI超级搜索：让普通人轻松拥有AI专家级助手

06-24

极光亮相HDC2025：AI Agent如何重塑企业生产力版图？

在为期三天的活动中，极光通过精彩的主题演讲、深入的专题论坛以及丰富的创新案例展示，全方位呈现了其在鸿蒙生态建设与AI Agent技术领域的突破性实践。论坛结束后，意犹未尽的热情客户将极光团队包围，持续深入交流…

06-24

湖北华威科：电子皮肤让千台人形机器人“触感灵敏”

讯（记者戴文辉、通讯员杨呈虎）6月24日从武汉华威科智能技术有限公司（以下简称“华威科”）获悉，该公司第2000只人形机器人灵巧手电子皮肤已于近期下线交付，这意味着，。朱晓辉介绍，华威科将推动第二代…

06-24

百胜中国首推餐厅营运智能体Q睿，餐饮AI时代如何重构管理？

其功能已经覆盖了包含招聘、培训、排班、盘点等管理任务和自动订补货、智能安防、生产管理、巡检等营运任务在内的20余个场景，可以为餐厅经理提供全方位辅助支持。我们希望AIGC可以帮助管理者从大量数据中迅速提取关键…

06-24

Rust编程精髓：陈天训练营深度解析十大难点，重塑系统编程思维

泛型编程是现代语言提高代码复用率的重要手段，Rust的泛型系统与特质(trait)机制相结合，提供了强大的抽象能力而不损失运行时性能。从基础的所有权概念到高级的并发模式，从安全的错误处理到高效的性能优化，训…

06-24

穿越时空，沉浸式体验大唐！《长安三万里》虚拟现实影片立项

1905电影网讯据国家电影局最新备案、立项公示，虚拟现实影片《长安三万里》立项，编剧为王微。备案单位：北京吾知视界科技有限公司、上海追光影业有限公司。梗概：将以“进京赶考的书生”身份穿越至一幕幕电影中的…

06-24

具身智能：引领中国制造业攀上新高峰的钥匙？

我们最核心的想法是，今天既然我们轮式、轮+臂的机器人已经大规模推向市场，如果我们是用同一个底层模型去学习的时候，它不仅仅可以让我们的轮式、轮+臂机器人变得越来越智能，也能够让我们的人形机器人变得越来越智能，所…

06-24

小红书素人种草：品牌如何精准寻找合作对象？

在小红书上做种草宣传时，品牌可以选择与达人合作，也可以选择与素人合作。在这个过程中，品牌要学会倾听素人的声音，鼓励他们以自己的方式讲述品牌故事，这样既能保证内容的真实性和原创性，也能让品牌形象更加鲜活立体。…

06-24

华为云携手西安翻译学院，共筑数字化人才培育新高地！

在产业发展中，开发者是科技进步的推动者，通过创新和技术实践，为各行各业带来了无限可能；在数字化转型的时代，开发者是创新的引领者，为产业的未来奠定了坚实的基础；而开发者的培育和输出，主要依托于高校人才培养。华…

06-24

百度文心快码打造Comate AI IDE，开启编程新纪元！

根据官方数据，Comate AI IDE已广泛应用于百度内部开发流程中，公司每天新增的代码中，有超过43%来自文心快码的生成。该工具在智能编码、系统扩展、跨端协作以及创意激发四个方面实现了重要突破，尤其在前…

06-24

知乎盈利之路：是否已偏离核心资产？

行业分析人士向鳌头财经表示，“降本终究会面临边际效应递减的局面，到了那时知乎想要持续提升利润率则需要从增效下手，可业务的持续收缩会导致增效的空间越来越小，从长期来看这一模式不可持续。”2022年至2024年，…

06-24

点击查看更多 +

全站最新

Rust编程精髓：陈天训练营深度解析十大难点，重塑系统编程思维

穿越时空，沉浸式体验大唐！《长安三万里》虚拟现实影片立项

具身智能：引领中国制造业攀上新高峰的钥匙？

小红书素人种草：品牌如何精准寻找合作对象？

华为云携手西安翻译学院，共筑数字化人才培育新高地！

百度文心快码打造Comate AI IDE，开启编程新纪元！

热门内容

本栏最新

百胜中国首推餐厅营运智能体Q睿，餐饮AI时代如何重构管理？

Rust编程精髓：陈天训练营深度解析十大难点，重塑系统编程思维

穿越时空，沉浸式体验大唐！《长安三万里》虚拟现实影片立项

具身智能：引领中国制造业攀上新高峰的钥匙？

小红书素人种草：品牌如何精准寻找合作对象？

华为云携手西安翻译学院，共筑数字化人才培育新高地！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.