您的位置:主页 > 公司动态 > 公司新闻 > 公司新闻

再次细品百度的这段往事,会更明晰为何强调自

若是把人工智能这个行业自己也想像成一个“算法模子”的话,那么从一最先,训练它的数据,无论有意无意,着实都是带着“私见”的。

上周我们曾讲述了一个,事实上,它就可以看作是这个“算法模子”的一个带私见的“元数据”——我们决议再去深挖一下这场收购, 由于它所出现出的私见能带我们更好地明晰为何中国生长人工智能必须自己掌握焦点手艺,以及为何百度是这场要害竞争里绕不开的主要公司。

草蛇灰线,伏脉千里。让我们再次回到故事的原点。


人工智能苏醒

当乌克兰出生、加拿大长大的Alex Krizhevsky 联系到 Geoffrey Hinton,希望在多伦多大学修盘算机科学博士课程时,他只是不想这么快找一份程序员的事情。他断然想不到,他的这个私人选择,竟成了人工智能领域苏醒的一个伏笔。

2018 年荣获图灵奖的 Hinton,在那时只是多伦多大学一位不怎么得志的教授。他所研究的领域——神经网络(人工智能的一种实现方式),可以追溯到 20 世纪 50 年月。这种手艺从未到达先驱研究者所期望的效果。2000 年之后,大多数研究职员都已经放弃了这个偏向,Hinton 是少数仍坚持的人之一。

2006 年是转机的劈头。那一年 Hinton 揭晓了论文《A fast learning algorithm for deep belief nets》(深度信心网络的一种快速学习算法)。这篇论文提出了一种训练深度网络的方式,行使 GPU 来加速训练速率,对每一层网络先举行预训练,然后再微调,网络的学习速率大幅提高。

这之后,Google、微软和百度等一些大型科技公司,注重到了深度神经网络。但总体来说,这仍是个盘算机领域小众的研究偏向。

更大的发作,源自 Alex Krizhevsky 的一个实验。2012 年,在 Hinton 的指导下, Alex Krizhevsky 和 Hinton 的另一个学生 IIya Sutskever 加入了昔时的 ImageNet 挑战赛。ImageNet 是一个大型视觉数据集,由李飞飞所主导缔造,拥有 1400 多万张标注过的图像。2010 年起,基于 ImageNet 数据集的视觉识别挑战赛每年举行一次。

Krizhevsky 和 Sutskever用前者设计的卷积神经网络(CNN)加入竞赛。两个研究深度学习没几年的学生,以 10.8% 的伟大优势击败了其他对手,包罗一些学术界的顶级团队。而 Krizhevsky 设计的谁人神经网络,厥后被命名为 AlexNet。


让 AlexNet 受到学术界之外关注的是,Google 也加入了那一年的竞赛。但他们不是以果然的形式,而是在数据集上做了内部测试,也用了深度学习算法,但识别精度比 Hinton 团队差了许多。Google 拥有大多数团队无法企及的硬件和数据资源,但却输给了一个学界的团队,这让工业界感应受惊。

但率先意识到这个新方式的推翻性的,却不是直接体验到威力的Google。

“事情变得有点超现实。”Krizhevsky 说,“我们很快就最先收到收购邀约。大量的电子邮件络绎不停。”其中最早的一封邮件,来自百度。


错过,只因中国公司的身份

百度是中国甚至全球最早意识到深度学习主要性的公司。早在 2009 年 8 月,百度 CEO 李彦宏提出了“框盘算”的计谋,实验把 NLP(自然语言处置)和知识图谱这些现在科技界耳熟能详的手艺,运用到搜索中。2011 年前后,当微软、Google 和 IBM 在用深度学习提高语音识别准确率时,百度内部也在做相同的事情。李彦宏甚至在全员邮件中,形貌了深度学习壮大的功效。

2012 年,当 Krizhevsky 用 GPU 训练 CNN 时,百度已经最先大规模采购和确立 GPU 运算集群,开发了天下上第一个支持 GPU&CPU 的并行深度学习平台 Paddle。这个平台厥后演化成深度学习框架,而且更名为 PaddlePaddle。

这种在那时全球人工智能领域都属前沿的手艺判断能力,让百度自然而然率先“挖掘”了Hinton。

那时 Hinton 远没有今天着名,但百度决议很快,李彦宏放置那时卖力百度战略投资的副总裁与 Hinton 取得联系,并直接提出邀约。百度提出的方案是,出价 1200 万美元约请 Hinton 及其学生,合约期三年。双方希望很快——Hinton 和他的学生险些成了百度的员工。

但历史往往就是云云戏剧性。眼看要杀青协议前,Hinton 的那两名学生 “拦住” 了 Hinton,之后发生的故事,都在我们此前的报道中讲述过了。

简朴来说,在学生的建议下,Hinton 确立了一家只有三人的公司,并在征得百度赞成后最先了一场“非正常”竞拍。

百度,Google、微软和 DeepMind 介入了竞拍。即便从一最先的唯一选择酿成了四个竞拍者之一,百度依然坚信这场竞拍的“公正性”,并显示出拿下标的的伟大刻意——百度的一位高管从北京提出报价,2500 万美元、3000 万美元、3500 万美元,百度是竞拍中出价意愿最坚定的一个。

“这感受就像我们在拍影戏一样。” Hinton 感伤道。但事实上,虽然Hinton没有明说,他着实心里已经给这个影戏想好了最终的主角,那就是Google。

为什么 Hinton会以为Google 比百度更适合?在人工智能已经成为大国新军备竞赛的今天,Hinton的选择变得很容易明晰——由于归根到底,百度是一家中国公司。Hinton 除了由于背伤而无法长时间搭乘飞机,更主要的是,在他心里Google就是他研究功效的“最合适归宿”,哪怕百度最先意识到这些功效的主要,哪怕百度按着他定的规则出到了天价,也无济于事。


那就走自己的路

Google 将 Hinton 的公司收购后,Hinton 没有完全放弃多伦多大学的教职,他一半时间在教书,一半时间在 Google 事情。Hinton 和他学生的事情,被应用于 Google 的产物中。好比,行使卷积神经网络使 Google Photos 具备精准的图片搜索功效。2014 年,Google 又收购了 DeepMind,延续扩大 AI 人才队伍。

但Google并没有就此靠着Hinton的加持完全甩开百度。百度继续按自己的设计推进深度学习手艺系统建设。

2013 年 1 月是一个标志性的时间节点。百度确立了全球第一个以深度学习命名的研究院(IDL),李彦宏亲自担任院长。一年后,著名的“少帅设计”启动,面向全球招募人工智能领域 30 岁以下的年轻研究职员。此外,百度还确立了人工智能实验室和大数据实验室,对 AI 的重视可见一斑。

2015 年是 2012 年之后,深度学习生长的又一个里程碑。这一年,ImageNet 大赛的所有最高成就,都是基于深度学习,而且运行在 GPU 加速的系统上。Google 和微软在 ImageNet 挑战赛中击败了人类的最佳成就——没错,是人类,而不是人类编写的程序。不久,微软和中国科技大学宣布了一个 DNN,其 IQ 测试分数到达了大学研究生的水平。百度也宣布了一个名为Deep Speech 2 的深度学习系统,用一种算法就学会了英语和通俗话。

2016 年 3 月,DeepMind 开发的 AlphaGo 在围棋竞赛中战胜了李世石,深度学习声名大噪。那是大部门人第一次确立了对 AI 的认知。然而在那时,百度对AI的最高难度手艺分支——自动驾驶,都已经投入了3年的研究,到2017年,Apollo 正式推出,在一个移动互联网还如日中天的年份,百度已经最先了人工智强人才的网罗,研发偏向的试错,和手艺的积累结构。逐步成为全球AI专利申请量超1万件,中国专利7000多件的公司,在语音识别、自然语言处置、知识图谱和自动驾驶四个细分领域的专利量排名海内第一、深度学习专利全球第二。

在百度内部,手艺气氛一直粘稠。始于 2005 年的“百度之星”手艺大赛,16 年来累计参赛选手靠近 30 万,一度成为了海内程序员的“造星工厂”。

研发支出也能更直观说明问题。百度在 2011 年到 2020 年前三季度的研发投入强度划分是:9.2%、10.33%、12.86%、14.23%、15.33%、14.39%、15.24%、15.42%、17.08%、18.02%。比例在近几个季度已经跨越Google的投入力度。

通过这些日复一日的投入,百度将当初挖掘Hinton的眼光以及对前沿手艺的嗅觉延续了下来。而更要害的是,百度对这些焦点手艺的研发,早早就放弃了“宴客用饭”的理想——想要有竞争力,那么一切都要自食其力。

因此,10年前百度虽然与Hinton 失之交臂,但某种水平也酿成了一件好事——百度和中国公司们更早地意识到两件事情,一是西欧顶尖的科学家和手艺公司最终照样会选择西欧公司;二是无论在手艺能力,照样人才培育,以及对新手艺的判断上,中国科技公司是不差的。

明晰了这两点,也就自然明晰了最前沿的手艺永远不能能等别人支持,还得靠自己研发。

这些讨论在百度回港二次上市的节点上显得更有意味。只有自己从土壤中摸爬滚打得来的器械,才会让自己加倍放心。如李彦宏在上市演讲中所说,“路的起点是中国,纳斯达克只是其中一站,最终百度会回到中国来,由于我们的根在中国”。

沿着这样的思绪,百度才得以从搜索引擎手艺衍生出知识图谱、自然语言处置等人工智能手艺,而且在一轮又一轮新手艺迭代中,都成为全球最先行动的科技公司,从深度学习,到自动驾驶,再到AI芯片,完成了主要的手艺积累,成为了今天全球人工智能领域不能能绕开的要害公司。