ITBear旗下自媒体矩阵：

滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

谷歌Gemini Embedding2模型登场：跨媒体理解新突破，助力AI读懂多元世界

时间：2026-03-11 17:13:10 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

谷歌近日宣布推出全新Gemini Embedding2模型，这款模型作为谷歌首个原生多模态嵌入解决方案，突破了传统技术对单一数据类型的限制。通过将文本、图像、视频、音频及文档统一映射至高维数学空间，该模型实现了跨媒体内容的深度语义关联，为人工智能理解复杂信息提供了全新路径。

与生成式模型不同，Gemini Embedding2专注于构建机器可理解的语义表征。其核心机制是将不同模态的数据转化为标准化向量，使系统能够捕捉到"苹果"在文字描述、产品图片、种植视频中的共同语义特征。这种处理方式相比传统关键词匹配，在上下文关联准确度上提升了40%以上，尤其在处理多义词和隐喻表达时表现突出。

该模型的技术架构呈现三大创新：支持PNG/JPEG图像、120秒MP4/MOV视频、原生音频及6页PDF文档的直接处理；覆盖100种语言的语义理解能力；允许单次请求中组合输入图像+文本、视频+音频等多模态数据。这种设计使得模型能够分析新闻配图与正文的关系，或识别产品演示视频中的关键操作步骤。

在法律取证场景中，Gemini Embedding2展现出显著优势。某试点项目显示，该模型可在300万条跨媒体记录中，用12秒定位到包含特定合同条款的邮件附件、相关会议录音及签署视频。这种效率源于其多维度联合分析机制，能够同时解析文本中的法律术语、视频中的手势动作及音频中的语气特征。

开发者可通过Gemini API和Vertex AI平台调用该模型，快速构建具备跨媒体理解能力的应用。某医疗团队已利用其开发诊断辅助系统，该系统能同步分析患者描述、检查报告图片及历史问诊录音，生成更精准的诊疗建议。这种能力标志着人工智能从单一数据解析向综合信息理解的重要跨越。

目前模型已开放预览版本，支持每分钟1000次的调用频率。谷歌工程师透露，后续版本将增加对3D模型、AR/VR数据的处理能力，并优化长视频的语义分割精度。这项技术突破正在重塑信息检索、内容推荐及知识图谱构建等领域的技术标准。

更多>同类资讯

前OpenAI核心人物自立门户：以持续学习与自动化研究，挑战AI现有格局

他在 OpenAI 待了近 7 年，2019 年加入时公司只有 30 来人，离开时是研发副总裁，主导过 o1 和 o3 两代推理模型，深度参与GPT-4 的后训练与 2025 年 GPT-5 的部署，也是 …

04-25

Perplexity CEO：AI发展强化iPhone地位，个人数据成苹果关键壁垒

IT之家查询公开资料，斯里尼瓦斯曾任职于 OpenAI、DeepMind 和 Google Research，致力于通过生成式 AI 打造更优质、更智能的信息检索体验。他强调，这些数据是真正属于用户的个人资…

04-25

谷歌Cloud Next 2026：AI Agent规模化落地，推理芯片开启独立增长新篇

摩根大通在研报中回溯了这一演进路径：2024年的重心在Gemini与Workspace的集成和早期agent探索，2025年开始强调A2A协议与第七代TPU Ironwood，到了2026年，围绕Agent…

04-25

DeepSeek V4上线：参数与上下文双突破，国产开源模型再掀性价比风暴

将1.6万亿参数和1M上下文放在一起看，才能真正理解V4这次的技术定位：用更大的参数池承载更多知识，用更稀疏的激活控制推理成本，用全系标配的百万上下文把长文本处理从高端功能变成基础设施。 V4-Flas…

04-25

小米折叠屏新机“2608BPX34C”代码曝光或跳过“玄戒O2”直上“O3”芯片

IT之家 4 月 24 日消息，据外媒 ximitime报道，小米旗下一款神秘折叠屏新机“2608BPX34C”目前已现身代码库，该机有望为小米 MIX Fold 5，也有可能被命名为小米17Fold。 …

04-24

REDMI测试万级电池新机百瓦闪充加持或重夺续航领域优势

目前，REDMI旗下电池容量最大的机型为REDMI Turbo 5 Max，其电池容量达9000mAh，被官方称作“迄今最大小米金沙江电池”。在技术层面，该电池采用了16%的硅碳负极方案，能量密度高达894…

04-24

前OpenAI副总裁离巢创业：以持续学习与自动化研究挑战AI既有格局

04-24

马斯克豪掷4000亿收购00后公司：AI时代人才与财富的“狂飙”进行时

但就算没有马斯克的收购，Cursor现在的估值也不低了，不管继续做下去还是被巨头收购，都会产生巨大的财富效应，所以现在你如果有好的想法，那不妨去试一试。老方说大家在这个时代不是急急忙忙去学使用AI，实际上你…

04-24

百度APP升级双Agent引擎：搜索体验跃升，AI生态与创作者共繁荣

4月24日，百度在2026百度创作者大会上正式介绍全新升级的搜索AI引擎，搜索体验从“找到、知道”全面升级为“得到、做到”。并同步公布一系列核心数据：主动日活用户同比增长1.6倍；百家号创作者规模同比增长2…

04-24

OpenAI推出GPT-5.5大模型：智能编程自主操作，引领人机交互新变革

【太平洋科技】美东时间周四，OpenAI正式推出全新人工智能模型GPT-5.5，距离上一代GPT-5.4发布不足两个月，模型主打编程、计算机操作与复杂任务自主执行能力，官方称其为当前更智能、更易用的版本。…

04-24

谷歌Cloud Next 2026：AI Agent规模化部署加速推理芯片开启独立增长新篇

04-24

科大讯飞携手成立量智开物：不设KPI，探索“AI+量子”新未来

刘庆峰讲道，早在两年前，科大讯飞已开始与两仪万象的合作，而双方对量子科技结合AI的思考与互动则可追溯至三年之前。在接受媒体采访时，刘庆峰展望了量智融合的未来图景：“一旦量子计算对现代人工智能有帮助，讯飞肯…

04-24

想用七年不换机？这三款“性能王者”手机，16+512GB配置价格都超赞

最后，上面这三款“性能顶尖”的性能旗舰，搭载的都是最强SoC，iQOO 15拥有顶级2K屏，荣耀WIN拥有10000mAh超大电池，红米K90 Max拥有超大体积的散热风扇，同时也是首款天玑9500性能旗舰…

04-24

智能手表怎么选？从长辈舒适到运动达人，五款实用之选不踩坑

说实话，我自己也踩过坑，之前图便宜买过个杂牌，心率数据跟闹着玩似的，根本不准。我姐儿子在商场走丢过一次之后天天戴着，十重定位+视频通话，家长手机上能看位置，她说这钱花得值。要我选的话，给长辈买OPPO，自…

04-24

2026年暗光夜景手机大比拼：哪款能成为你掌心的“夜拍神器”？

综合来看，2026年在暗光夜景拍摄这个细分赛道上，OPPO Find X9 Ultra 凭借其哈苏全大底五摄的硬件碾压、第二代丹霞镜头对色彩和动态范围的革命性提升、以及哈苏大师模式带来的专业级氛围感，体验优…

04-24

点击查看更多 +

全站最新

守拙者"降维"：石头科技的第一性原理生意经

北京网络文化经营许可证全攻略：条件资料流程有效期一站式解读

Agent落地企业新趋势：从“能说会道”到“高效交付”的转变

AI生图真假难辨引热议：有图有真相时代是否已成过去式？

美伊二谈现转机？伊朗代表团被曝今夜抵巴，油价上蹿下跳！

美股异动｜亚马逊盘前拉升涨超2%，Meta将使用亚马逊CPU芯片用于人工智能

热门内容

本栏最新

Agent落地企业新趋势：从“能说会道”到“高效交付”的转变

AI生图真假难辨引热议：有图有真相时代是否已成过去式？

雷军带队拆解SU7至零部件级，北京车展将展全拆解版车身显实力

雷军在北京车展披露小米汽车新进展：新一代SU7锁单交付成绩亮眼，多款车型获佳绩

小米汽车欧洲研发中心亮相：宝马保时捷兰博基尼等豪车专家齐聚 YU7 GT将首发

雷军体验小米超跑VGT上车遇“小插曲”：网友笑称身高181cm成“阻碍”

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.