InfoQ:感谢余凯接受专访,请首先介绍下百度深度学习研究院的情况。
余凯:这个研究院是2014年初由Robin(百度CEO李彦宏,下同)宣布成立的,当年7月份正式投入运营。这不仅是百度首个前沿技术的研究院,可能在整个中国互联网行业都是首家。现在我们成立了百度研究院,IDL是其中的一部分,也叫深度学习实验室。最近有更多的企业关注技术研究,我们很高兴扮演了引领者的角色。在公司内部,人工智能技术在广告、搜索、语音、图像以及面向未来的领域,如自动驾驶等,我们都做了前沿技术的探索和积累,并且在公司的核心业务中已经落地。前段时间,Robin在一次演讲中表示,他之前以为人工智能这样的技术可能要在5年或者10年之后才能见到成果,但目前的进展和速度是超过他的想象的。
InfoQ:目前百度在深度学习的一些研究成果上超越了Google、Facebook等国外巨头,这是如何做到的,哪些因素起了关键作用?
余凯:这是个好问题。最近,Robin在“两会”期间表示,中国在人工智能领域与国外的差距并不是很大,在某些方面甚至超过了他们。主要是因为无论对于哪个国家来说,这都是一个新的领域,而传统的行业比如材料等领域,需要很多年的技术积累,跑在了我们前面。整体来讲,信息产业是个新的领域,我认为有机会(超越)。从百度来讲,公司的决心和投入都足够大,对人才的吸引举措也相当有决心。比如说,我们可以从全球招聘最优秀的人才,像Andrew Ng(吴恩达,现任百度首席科学家,2014年5月加入百度)这样的领军人物我们都可以引进,此外,研究院内部的年轻人才对工作投入了很大的热情,使我们走的更快。另外还有一个原因,和百度的基因和所从事的领域有关系。整个搜索领域,需要应用大量的机器学习、自然语言理解等,天然地和技术紧密的联系,可以让我们走的更快。
InfoQ:据说百度凤巢系统在使用深度学习之后,广告的点击率实现了显著的提升,这种基于大数据和人工智能技术形成的技术壁垒是否意味着小公司很难在这些领域生存?是几大巨头的专属领地吗?
余凯:百度的广告系统在过去两年里引入了深度学习之后,效果的确是相当不错。那是不是说这个领域就是大公司的菜,小公司很难做呢?我认为一定不是这样!因为深度学习技术恰恰正在促使世界向更加扁平化的方向发展。语音识别领域在以前只能少数几个大公司来做研究,但是现在来看,很多的小公司自己就能开发语音识别系统。为什么呢?因为当一个更好的技术出现的时候,它往往是让这个世界更加的扁平。当技术不太好的时候,我们需要投入很多的资源去做一件事情才能做好。通常我们讲技术发展的时候,它的意义在于新技术能以更小的资源做更多更好的事情。对于小公司来说,不需要投入很多的智力资源,不需要了解里面复杂的东西,就可以把事情做好。所以,深度学习让更多的小公司有更多的发展机会。特别是,现在有很多的开源项目,大家都可以受益。
InfoQ:作为一位知名科学家,您成功地将研究成果应用到了广泛的商业产品中,在这样的转化过程中,您应该承担了比科学家更多的职责和角色,有什么感受?
余凯:很多科学研究,一定意义上来讲,就是捅破一张窗户纸,当然不完全是这样。最难的地方在于,在这么多窗户当中,你需要知道哪一个窗户是可以捅破的,而且捅破之后是有意义的。所以我觉得,我的一个角色就是把大家组织起来,然后说这个方向是有前途的,能产生重要价值,能走得通。具体的事情,是我们这些年轻的科学家和工程师来做的。所以,我自己所做的,就是营造一个好的环境,获取资源,指引方向,帮助年轻的科学家们展现才华。
InfoQ:您认为深度学习的应用范围有多广?它最终可以多大程度上替代人类?
余凯:首先要纠正大家一个误解。整个技术的发展目标,不是替代人类,而是延展人的能力。技术能够让人在不太擅长的领域也能具备相当的能力。比如说,人不擅长在高维的数据里面做精确的描述和计算,像广告系统。未来,在一些危险的领域,比如矿工,工作很危险,应该让机器人来做。深度学习在这些领域当中,起到了一个大脑的作用,信息综合的分析、建模、识别、判断、决策。
InfoQ:百度正在研制的各种智能产品,进展如何?何时会正式推向普通消费者?
余凯:比如BaiduEye,不是一个面向消费者的产品,而是垂直领域,比如博物馆等,作为更加亲密的导游,比如医疗,通过实时的第一视角的视频分享,在手术等场景,纱布的使用是不是符合流程,都可以采用BaiduEye。另外一个是筷搜,能够帮助普通老百姓分析菜的营养成分,是不是盐分过多。我们的目标是能够广泛地改善人的生活。由此,你可以理解我们对智能驾驶的兴趣, Robin最近在“两会”上说,百度在年底会推出智能驾驶的汽车,和车厂合作,在高速公路上自动行驶。短时间内我们会觉得高估了技术发展的速度,但是在10年这样的时间维度上看,我们会发现往往低估了技术对我们的影响。
嘉宾简介
余凯博士,百度研究院副院长,深度学习实验室(IDL, Institute of Deep Learning)主任,兼任负责百度图片搜索产品的高级总监。中组部第九批"千人计划“国家特聘专家,国际知名机器学习专家。他在中国率先推动大数据人工智能在互联网行业的技术研发和创新。他所带领的团队将深度学习技术成功应用于广告,搜索,图像,语音等方面,取得突破性进展,相继三次获得“百度最高奖”。在他的影响下,Andrew Ng等一批世界顶尖技术专家相继加入百度等中国互联网公司。他曾担任斯坦福大学计算机系Adjunct Faculty, 现在是南京大学、北京邮电大学和北京航空航天大学兼职教授,以及中科院计算所客座研究员。
“总编访谈”是InfoQ推出的一个高端访谈栏目,由总编辑崔康主持,致力于深入采访国外内顶尖技术力量,报道最前沿、最有深度的内容,分享干货和经验。