滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

顶级科学家描画大数据未来百度深度学习领跑人工智能

时间：2013-11-04 13:39:56 来源：互联网编辑：星辉 IP：北京 发表评论无障碍通道

2013年11月，百度亮相全球软件开发大会QCon上海2013。在会上，百度 IDL首席科学家张潼发表了大数据及深度机器学习的演讲，展示了百度IDL(深度学习研究院)取得的成绩，引起了全球软件开发人员的浓厚兴趣。

百度 IDL首席科学家张潼亮相揭示深度学习四大成功条件

作为机器学习领域的知名学者，百度 IDL首席科学家张潼的亮相引起了专业观众的关注。张潼1999年获得美国斯坦福大学计算机系博士学位，曾任职于美国IBM研究院及雅虎研究院，在机器学习、数据挖掘、自然语言处理、优化算法，及统计学等领域发表多篇论文，曾担任国际上主要机器学习机构NIPS、ICML的Area Chair和COLT主席。

会上，张潼回顾了大数据处理技术的发展和变革，指出大数据分析的主要工具，机器学习的方法也在不断创新，如深度学习技术，就在近些年取得了许多令人振奋的成果并在多个国际大型项目中运用，如2012年6月谷歌大脑项目、2012年11月微软智能同声传译项目、2013年9月facebook用户数据和社交关系挖掘项目。

张潼认为，近年来深度学习的成功条件可以归纳为“大数据+大规模计算能力+复杂模型+高效算法”，近年来，深度学习的训练数据每年成倍增长，图像达到数千万训练样本、语音达到数百亿训练样本、广告达到数千亿训练样本;而与此同时，多机GPU/CPU分布式计算能力也得到显著加强，模型上则由大型线性模型演进到树模型，可把特征发到不同机器;在算法上，则应用了深度神经网络等分布式算法。

百度机器学习成就：错误率降低30%，准确率升100%

百度在2012年夏季开展了深度学习方面的工作。2013年，百度IDL(深度学习研究院)成立，面向全球延揽一流学术人才，人才布局日趋完整，在深度学习上也取得了巨大成功，如用GPU提升计算效率，处理海量训练数据，语音识别，OCR识别，人脸识别，图像搜索水平得到巨大提升，到目前为止，已经有超过8项深度学习技术在百度产品上线。

图片百度与谷歌相似图片检索结果对比

深度学习对百度的影响深远，如语音，错误率相对降低20-30%;OCR，错误率相对降低30%;人脸识别，LFW测试世界领先，世界上首个全网人脸搜索引擎;全网相似图像搜索，效果显著超越国际搜索引擎同类产品;全流量上线广告CTR预估，提升CTR3.7%;基于深度学习的色情图像识别准确率超过传统方法100%，用于贴吧图搜黄反作弊。

百度机器学习发展路径：理论创新+应用实践

在深度学习方面，百度已经在学术理论、工程实现、产品应用等多方位取得了显著的进展，已经成为业界推动“大数据驱动的人工智能”的领导者之一，提交国家专利22项。在第30届国际机器学习大会(International Conference on Machine Learning, ICML 2013)上，百度IDL常务副院长余凯博士与美国佐治亚理工学院学者合作的有关深度学习的论文“Smooth Sparse Coding via Marginal Regression for Learning Sparse Representations”获得大会最佳论文奖银奖;基于深度学习人脸识别技术的PK大咖获得2013艾菲奖大中华区金奖。

在图像技术应用中，传统的从图像到语义的转换是极具挑战性的课题，业界称其为语义鸿沟。百度深度学习算法构造出一个多层非线性层叠式神经元网络，能够很好地模拟视觉信号从视网膜开始逐层处理传递，直至大脑深处的整个过程。这样的学习模式能够以更高的精度和更快的速度跨越语义鸿沟，让机器快速对对图像中可能蕴含的成千上万种语义概念进行有效地识别，进而确定图片的主题。

在人脸识别方面，最困难的是识别照片中的人是谁或者通过照片寻找相似的人。百度在深度学习的基础上，借鉴认知学中的一些概念与方法，探索出了独特的相似度量学习方法来寻找图像的相似性和关联，能够做到举一反三。

在深度神经网络训练方面，伴随着计算广告、文本、图像、语音等训练数据的快速增长，传统的基于单GPU的训练平台已经无法满足需求，为此，百度搭建了Paddle(Parallel Asynchronous Distributed Deep Learning)多机并行GPU训练平台。数据分布到不同的机器，通过Parameter Server协调各机器进行训练，多机训练使得大数据的模型训练成为可能。

在算法方面，单机多卡并行训练算法研发，难点在于通过并行提高计算速度一般会降低收敛速度。百度则研发了新算法，在不影响收敛速度的条件下计算速度图像提升至2.4倍，语音提升至1.4倍，这使得新算法在单机上收敛速度达到图像提升至12倍、语音提升至7倍的效果。相比Google的DistBelief系统用200台机器加速约7.3倍而言，百度的算法优势更加明显。

目前普遍认为深度学习是最接近人脑的复杂模型，也是目前向人工智能走得最近的方法，将会在百度得到越来越多的应用，同时，深度学习也将使得百度的智能性大为增强。以张潼等为代表的百度科学家群体，对深度学习的未来发展充满信心。而在足够的智力资源奠基优势下，百度IDL极有望成为像AT&T-Bell labs，Xerox PARC这样的顶尖研究机构，在国际互联网创新科技前沿领跑。

关于百度IDL

百度深度学习研究院(Institute of Deep Learning，IDL)是百度历史上首个正式成立的前瞻性研究机构，2013年成立，致力于“让计算机像人脑一样智能”的科学研究。除斯坦福大学等高校研究机构外，唯有百度、IBM、谷歌、微软四家企业设立了专门研究机构，位列深度学习研究的第一阵营。

百度深度学习研究院成立以来，就面向全球延揽一流学术人才。随着前Facebook资深科学家徐伟、美国新泽西州立大学统计系教授张潼、前AMD异构系统首席软件架构师吴韧等世界级专家的陆续加盟，百度IDL的人才布局日趋完整，并以其广阔的发展前景赢得越来越多顶尖技术人才的认可与青睐。

关于Qcon上海2013

QCon全球软件开发大会是由InfoQ主办、始于2007年的全球顶级技术盛会。本次QCon上海2013秉承 “促进软件开发领域知识与创新的传播”的宗旨，吸引了传统制造、金融、电信、互联网、航空航天等领域的架构师、项目经理、团队领袖和高级开发人员参加，其中不乏Twitter、LinkedIn、Facebook、百度、新浪等全球顶级互联网公司代表。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

Gemini 2.5 Pro联袂CAMEL-AI，共筑数据自动化与可视化新篇章

07-15

MiniMax获近3亿美元融资，携国资力量加入三百亿大模型企业行列

07-15

Meta或调整AI战略：Behemoth模型或遭弃，转向封闭开发模式？

07-15

UTCP引领AI工具调用新潮流，直接连接原生端点开启高效时代

07-15

英伟达为中国市场定制B30计算卡：性能调整，订单火爆

07-15

苹果推送iOS 18.6 Beta 3，国行Apple Intelligence上线仍待审核

07-15

阿里前钉钉总裁叶军离职，钉钉创始人陈航回归掌舵

近期，业界传出消息，阿里巴巴集团内部发生高层人事变动，前钉钉业务负责人、集团副总裁叶军已悄然离开公司。

07-15

英特尔CEO坦承战略失误，跌出半导体前十，新战略聚焦边缘与代理AI

【环球网科技综合报道】7月13日消息，据外媒coincentra报道称，英特尔首席执行官陈立武近日在内部会议上首次公开承认，公司因多年战略失误已跌出全球半导体企业前十，并披露去年第三季录得160亿美元巨额亏损…

07-14

科大讯飞商标布局加速，研发投入大增，人工智能领域持续领跑

这样的投资力度，充分体现了科大讯飞对技术进步的重视，尤其是在当前人工智能和大数据快速发展的时代，持续的研发投入将为其未来的发展奠定坚实的基础。科大讯飞的最新商标申请和持续的研发投入，标志着其在竞争激烈的市场…

07-14

AI眼镜市场升温：新品频发，未来3-5年或迎产量突破拐点

“看一下支付”“是智能助手，更是生活搭子”……近段时间，灵伴科技、小米、大朋VR等厂商不断推出新品AI眼镜，且在功能和适用场景上不断迭代。豪鹏科技透露，公司始终专注于高能量密度电池技术的研发与产品制造，在…

07-14

OpenAI延期发布开源大模型，安全审查成重中之重

07-14

HuggingFace发布Reachy Mini智能机器人，五小时热卖百万，入门价299美元

07-14

高盛启用AI编码助手德文，加速金融行业数字化进程

07-14

Meta全资并购PlayAI，加速布局语音AI赛道

值得注意的是，JohanSchalkwyk作为Meta语音AI研发领域的核心负责人，此前曾任职于知名语音AI初创公司SesameAIInc.，在自然语言处理、语音合成算法优化及技术团队搭建等方面拥有超过15年…

07-14

Meta全资并购PlayAI，加速布局语音AI赛道

值得注意的是，JohanSchalkwyk作为Meta语音AI研发领域的核心负责人，此前曾任职于知名语音AI初创公司SesameAIInc.，在自然语言处理、语音合成算法优化及技术团队搭建等方面拥有超过15年…

07-14

点击查看更多 +

全站最新

天舟九号“太空快递”揭秘：新款航天服、核心肌肉锻炼装置等物资亮相

月球背面大揭秘：为何难见真容？背面又有何不同？

月球背面揭秘：中国卫星图像证实霍金观点，月球探索需谨慎前行

超高速恒星携超级行星，共赴银河系狂飙之旅

蜜雪冰城在云南成立食品和农业科技公司

小米旗下天津金米等退出深圳七面服饰

热门内容

本栏最新

英特尔CEO坦承战略失误，跌出半导体前十，新战略聚焦边缘与代理AI

AI眼镜市场升温：新品频发，未来3-5年或迎产量突破拐点

Meta全资并购PlayAI，加速布局语音AI赛道

Meta全资收购PlayAI，加速布局语音人工智能赛道

半导体巨头加速布局：3D IC成下一代计算设备关键

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.

顶级科学家描画大数据未来 百度深度学习领跑人工智能

顶级科学家描画大数据未来百度深度学习领跑人工智能