滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

13人团队4个月创奇迹！华人主导GPT Image 2研发，无锡才俊领衔破局

时间：2026-04-23 12:30:00 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

GPT Image 2的发布引发全网热议，其突破性表现令行业内外惊叹。研究团队负责人陈博远在接受采访时透露，这一成果源于底层架构的彻底重构，但具体采用何种技术路径仍保持神秘，仅以“通用模型”或“图像领域的GPT”概括。这种模糊表述反而激发了更多猜测，有观察者认为其可能融合了扩散模型与自回归技术的优势。

开发团队的核心竞争力令人瞩目——仅用13人便在四个月内将GPT Image 1.5升级至2.0版本。团队负责人Gabriel Goh晒出的“AI全家福”引发网友对成员构成的讨论，其中亚洲面孔占比引发关注。这种精干高效的研发模式，与OpenAI一贯倡导的“小团队突破后资源倾斜”策略高度契合。

陈博远的学术轨迹堪称典型的技术跃迁案例。这位从不懂Python的高中生成长为研究领军人，其博士期间提出的Diffusion Forcing训练范式被NeurIPS 2024收录。该技术通过结合逐token扩散与因果预测，实现了自回归模型与全序列模型的优势互补。在谷歌实习期间，他主导开发的SpatialVLM系统更将视觉语言模型的空间推理能力提升至新高度，相关技术已被Gemini 2.0采用。

团队成员的多元背景构成另一大亮点。中科大博士Jianfeng Wang负责的指令遵循系统，成功破解了传统模型生成时钟永远指向10:10的痼疾。新模型能精准呈现2:25、7:45等非常规时间，在复杂空间布局任务中同样表现卓越，可准确执行“苹果居中、相机在左”等指令。这种对世界知识的深度理解，使模型输出与用户意图的匹配度显著提升。

跨界经验在团队中屡见不鲜。Yuguang Yang的职业生涯横跨计算化学、量化交易、语音识别等多个领域，这种复合背景使其在信息图表生成功能开发中独树一帜。新系统可自动将75页学术论文转化为7张专业幻灯片，其生成的科研图表被评价为“能节省研究者数周时间”。他特别提醒用户，启用“思考模式”可获得更优效果。

技术传承脉络在团队中清晰可见。从DALL-E时代就参与多模态研究的Gabriel Goh，见证了OpenAI图像生成技术的完整演进。新晋成员Weixin Liang在meta实习期间提出的Mixture-of-Transformers架构，通过模态解耦技术将预训练成本降低40%，这种创新思路直接影响了GPT Image 2的技术路线。提示词大师Kiwhan Song的加入，则确保了官方演示效果的艺术水准。

人才流动并未削弱OpenAI的创新能力。新成员Bing Liang带着Google Imagen3的开发经验加盟，Ayaan Haque则将Luma视频生成模型的训练心得注入新系统。这种开放的人才策略，使团队在保持技术连续性的同时持续注入新鲜血液。工程专家Mengchao Zhong负责的多模态产品落地，确保前沿研究能快速转化为实用功能。

更多>同类资讯

神舟二十三号乘组挑战一年期驻留探索深空新征程夯实技术根基

神舟二十一号乘组太空出差7个月，刷新了中国航天员乘组在轨驻留最长纪录，而前来接班的神舟二十三号乘组中，有一名航天员将向一年期在轨驻留发起挑战。在航天医学领域，充分利用一年期飞行机遇，探索更长期飞行人的适应…

05-29

神舟二十一号乘组返程在即，东风着陆场有何奥秘？一文揭秘返回细节

航天员在返回舱里是什么感觉飞船返回的时候再入会产生剧烈的摩擦高温，不过飞船做了很多的防护，乘组是没问题的。最后离地1米，反推发动机点火，会听到“砰”的一声，伴随一下轻微的撞击——这也就意味着，返回舱稳稳…

05-29

神舟二十一号乘组归途在即，揭秘东风着陆场背后的返回“密码”

那神舟飞船返回为什么选择东风着陆场?航天员回到地球后为何坐在椅子上?他们吃的第一顿饭是什么呢?你会不会也有这些疑问，让我们一起走进东风着陆场，跟着记者一起寻找答案。航天员返回为什么要选在陆地着陆?在总面积约…

05-29

Meta加速AI布局：推出付费服务并调整架构，剑指商业化与效率提升

对于普通消费者，Meta旗下三大社交平台也将推出了梯度化社交平台Plus订阅套餐，其中Instagram、Facebook月度订阅费用为3.99美元，WhatsApp订阅定价更低，定价2.99美元/月，并支…

05-29

抖音生活服务开放日：以三层服务体系升级筑牢消费信任基石赋能实体经济新发展

活动现场，抖音生活服务服务体验与治理负责人郭亮表示，平台始终以消费者信任为核心导向，聚焦生活服务场景中宣传失真、履约不稳、维权烦琐等行业痛点，通过全链路治理、标准化服务、智能化赋能，构建所见即所得、履约可确定…

05-29

联发科天玑8550移动平台参数揭晓：4nm工艺加持，AI性能迎来显著提升

【太平洋科技】联发科官网正式公布天玑8550移动平台参数，该芯片采用台积电4nmN4P工艺，定位中高端市场，在保持高性能的同时重点强化端侧AI能力。天玑8550采用全大核8核设计，全部为Cortex-…

05-29

阿里Qoder上线Cloud Agents：全栈能力赋能，企业Agent开发周期大幅缩短

05-29

从流量到信任：本地生活商家如何在“心价比”时代实现突围？

05-29

SpaceX IPO前夕引合并猜想：早期投资人称与特斯拉合并或成定局

05-29

智元机器人携手地铁设计等在穗布局新公司聚焦智能机器人研发销售

天眼查App显示，近日，智合广行（广州）科技有限公司成立，法定代表人为邓一帆，注册资本3000万人民币，经营范围包括智能机器人的研发、服务消费机器人销售、智能机器人销售等，由广州智运科技投资合伙企业（有限合伙…

05-29

字节跳动前高研陈龙履新！出任基模CTO，助力江行智能物理AI再进阶

陈龙，上海交通大学博士、西蒙菲莎大学博士后、字节跳动前高级研究员——他的学术成果曾被加拿大国家主流媒体CBC和MITSOLVE报道，他的工程经验覆盖火山引擎大模型从架构到落地的全链路。这不仅是一次高…

05-29

百度百万年薪抢AI人才，以人才为基探索AI时代组织新范式

放在一起看，你会感觉到一种紧迫感——百度不是单纯的在“补人”，而是在为某种全新的组织形态储备力量。但百度想做的，是把组织的know-how真正沉淀下来，变成可以被智能体调用、执行的能力。说实话，很多公司还…

05-29

清华团队连夜开源Agent神器，Token成本狂降70%

05-29

罗永浩与脱口秀演员抬杠了：直言杠精也分三六九等

05-29

多名三星等安卓平板用户反馈无法打开Chrome浏览器

05-29

点击查看更多 +

全站最新

广汽传祺向往M8 PHEV L开启预订：高阶智驾+超长续航，MPV市场再添实力新选

兰博基尼CEO：纯电车客户接受度未升，市场未准备好时投资不负责

电车真实体验大揭秘：网上吐槽多是浮云，五大优势让日常出行幸福感爆棚

6.18万元起享焕新体验！新款吉利星愿上市，配置续航全面升级

抖音生活服务开放日：以三层服务体系升级筑牢消费信任基石赋能实体经济新发展

AI接管工作流时代：核心知识放云端，是便利还是“失控”危机？

热门内容

本栏最新

抖音生活服务开放日：以三层服务体系升级筑牢消费信任基石赋能实体经济新发展

小米汽车答网友问第248集：YU7隔音、底盘、制动系统等配置全解析

小米YU7 GT明日开启首批交付雷军携手舒淇共同见证交车时刻

百度百万年薪抢AI人才，布局“组织AI化”开启管理新范式实验

国内首个汽车振动噪声综合评价体系发布，为消费者购车提供“静谧”新参考

5月新车大放送！7款热门车型来袭，哪款能成为你的心头好？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.