滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

苹果自研多模态AI模型Manzano：混合分词器架构，解码器三版本支持多分辨率

时间：2025-09-28 12:14:53 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

苹果公司正在秘密推进一项名为Manzano的图像模型研发项目，该模型试图在图像理解与生成两大领域实现突破性整合。目前这项研究仍处于实验室阶段，仅通过预印本论文披露了技术框架，并释放了少量低分辨率演示图像。

技术文档显示，Manzano系统由三大核心模块构成：负责特征提取的混合分词器、处理多模态数据的统一语言模型，以及支持动态分辨率的图像解码器。其中解码器特别开发了轻量版、标准版和专业版三种形态，分别对应720P、1080P和4K级输出能力。训练阶段使用了超过20亿组图文对数据，内部测试表明该模型在处理包含复杂文本的图像场景时，准确率较同类产品提升37%。

性能曲线分析显示，Manzano的各项指标随模型规模扩大呈现显著提升趋势，这印证了研发团队关于"规模效应"的假设。不过苹果工程师坦承，当前基础版本在细节渲染精度和语义理解深度上，仍与行业顶尖水平存在15%-20%的差距。他们计划通过引入三维空间感知模块和动态注意力机制，在后续版本中弥补这些短板。

这项研究引发了AI领域的广泛关注。有专家指出，Manzano采用的混合编码方案可能为多模态大模型开辟新的技术路径，但其复杂的架构设计也对硬件算力提出了更高要求。苹果方面表示，该模型未来将优先应用于增强现实和内容创作领域，具体商业化时间表尚未确定。

更多>同类资讯

小米MiMo-Embodied具身大模型发布并开源，打通多领域实现跨域能力协同

11-22

赛力斯魔方技术平台2.0发布：AI赋能，打造高端智慧安全新体验

11-22

魏牌广州车展焕新启航！双山销量领跑，VLA辅助驾驶大模型首搭登场

11-22

豆包AI赋能车机升级荣威M7 DMH凭智能实力与硬核配置出圈

11-22

蚂蚁灵光4天下载破百万，超越ChatGPT成2025年底最亮眼通用AI助手

11-22

广州车展魏牌全系车型闪耀登场，品牌焕新与智驾革新共启新程

11-22

广州车展首秀！极石ADAMAS携皇家定制版登场，开启全地形豪华新体验

11-22

蚂蚁灵光AI助手上线仅4天下载量破百万，创全球主流AI产品新速度

11-22

联想AI业务占比三成驱动增长，杨元庆谈应对存储涨价与AI泡沫论

11-22

小米汽车HAD增强版发布：技术升级不忘安全边界提醒驾驶者专注驾驶

11-22

吉利智驾整合新动态：极氪员工陆续换签至新合资公司

11-22

AI冲击白领岗位？美国超四分之一失业者有本科及以上学位，就业市场遇冷

11-22

谷歌BigQuery AI重磅登场：智能体赋能数据分析，自然语言指令解锁全流程

11-22

南北大众严要求推动燃油车智驾升级坚守初心引领科技出行新体验

11-22

广州车展重磅发布！赛力斯魔方2.0平台，开启AI汽车新征程

11-22

点击查看更多 +

全站最新

广州车展新亮点！MG4半固态安芯版交付在即智趣满配实力再升级

全新奔驰V级焕新登场，曲面屏+按摩座椅，商务出行舒适新选择

东方美学邂逅超混科技！岚图梦想家山河上市开启顶奢MPV新境界

广州车展首秀！极石ADAMAS携皇家定制版登场，开启全地形豪华新体验

广州车展自主新车新技术亮眼 “安全”成车企竞逐新焦点

2025广州车展：上汽奥迪双品牌发力，电动燃油齐进开启豪华出行新篇

热门内容

本栏最新

广州车展首秀！极石ADAMAS携皇家定制版登场，开启全地形豪华新体验

南北大众严要求推动燃油车智驾升级坚守初心引领科技出行新体验

广州车展重磅发布！赛力斯魔方2.0平台，开启AI汽车新征程

极石ADAMAS广州车展亮相：全地形实力与皇家定制，开启豪华新体验

魏牌携多款车型亮相广州车展启动焕新计划并首搭CP Master辅助系统

2025广州车展：长城汽车“新岭南”焕新登场，六大品牌秀硬核实力

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.