正式发布cloud automl后的半个月,谷歌ai中国中心总裁、谷歌云ai研发主管李佳亮相谷歌在北京举办的think with google创想大会。接受采访时李佳分享了谷歌云ai团队的工作、automl研发过程中最大难点、如何将研究与产品结合起来形成良性循环等数十个最为关注的话题。
2月6日,谷歌think with google大会在北京举办,旨在向广告客户及其他机构介绍最新研发技术,细分行业思考、产品打磨落地等热点以及帮助开发者解决问题、探索新机会。
距cloud automl正式发布不到半个月,同时作为谷歌去年在中国布局ai最隆重的一笔,李佳,谷歌ai中国中心总裁、谷歌云ai研发主管亮相大会自然受到最大关注。
过去短短几年,面向企业的ai从一个萌芽想法变成商业利器,李佳认为缩短科技创新最佳途径就是研究先行,深入了解细分领域的需求,个性化打磨产品使之成为一个良性循环,而谷歌ai云就是其中最关键的加速器。
ai赋能的精髓在于所有人都使用它,在过去短短两个月时间,automl的注册用户已经超过1万家,其中包括企业、学校、创业公司、研究组织等等。一个简单的例子,伦敦动物学会利用automl自动标注图片追踪野生动物种群以学习更多关于它们的分布信息,更好地理解人类对这些物种的影响。
李佳:用研究来推动ai,对垂直领域深入思考后最终产品落地,这是良性循环
问:关于ai 在教育和医疗的落地的情况,中国有没有具体案例和推进的进度?
李佳:现在中国 ai 中心的关注点还是在基础研究上面,但在教育方面有很多有意思的问题还需要大家去探讨,比如说教育理念的对话,学生和老师如何去交流,由于双方的角色不一样,知识水平不一样,对对话内容的交流和理解也不同,所以我们很关注这方面教育的研究,但目前还没有具体落地的进展。
问:automl现在服务的企业都是什么样类型?哪一些行业最集中在用?有何反馈?
李佳:automl 目前注册的用户背景很广泛,我们看到有很多有意思的案例,就像刚才提到的伦敦动物学学会它用来保护野生动物,还有像零售业也有很多对此感兴趣的,还有用来保护环境的,比如去检测哪里有垃圾?哪里有矿泉水瓶子之类的,像这种很有创造力的案例还是很多的,而且有很多我们以前也没有见到过。当然云上面也有不少用户在做医疗,有些医疗企业对这些功能也很感兴趣。
问:您刚加入的时候已经在研究或者准备automl了,但是却等到今年1月才发布,是不是过程中有遇到什么困难?最重要的一个或者最具挑战性的技术难点是什么?
李佳:我们刚加入的时候做的一个事情实际上是看到底哪些机器学习和 ai 的应用会比较受欢迎。automl 实际上已经研究了有一段时间。大家也看到,包括我们在发布的博客里面也列出了很多文章。
一般来说研究先行,而且我们还和很多团队,包括 google brain,包括 research,都有紧密合作。我觉得最大的难点在于,大家都觉得研究技术做的好,自然产品就有人用,但是在实际生活当中,特别是在企业 ai 这个方面,对产品的打磨和考量,是要与用户的需求相结合的,我觉得这两点的结合最关键。可能攻克了这一点以后,后面就会顺利很多。
比如说在 automl 产品里面,它最先进的技术是learning to learn这一块,我们得到的效果也是最好的。但是同时我们会考量到learning to learn技术在计算方面的资源需要,我们实际上最后推出产品的时候是有两个特点,一个是非常简单的迁移学习(transfer learning),很多的客户他们可以在一分钟或者几分钟之内就能得到他们的结果。第二个是learning to learn与其他相结合的,这个更加的先进,而且他们的性能也会好很多,但是目前需要一天来达到产品级的效果。
虽然听起来一天时间是比较长的,但是我们可以想想原来,刚刚我在演讲里面也列出来了,在传统意义上,大家去做一个机器学习定制的算法和产品的话,他这个周期是非常长的,包括你要去招募机器学习的一些专家,包括要去设计机器学习的算法、收集数据,实际上通常要花费数个月或者数年。automl 实际上现在自动生成的模型已经比专家设计的模型在图片分类上效果要更好,所以这样比起来产品开发的周期是大大缩小了,企业的花销也是大大的缩小了。
问:在 cv 跟语言结合的方面,google 有哪一些探索?您认为 cv 的研究在图象识别这类的感知领域进化到图像描述以及回答认知领域还需要哪些突破?
李佳:在 cv 和语言方面,我自己进行了一些比较浅的工作,包括去年我们在 cvpr 有对图片描述的工作,用强化学习来做图片的描述,这些我觉得大家现在做的都还比较初期,因为这个问题确实非常的难,其中几个重要的问题需要去探索的就是怎么样把我们的知识和感知结合到一起。
因为现在最有效的这些算法,让大家都听性能有多好,但是人去理解一个图片或者一个场景的时候,我们通常都带着自己的知识和背景,也不需要那么大量的数据来做训练,其实领域里面也有一些很早的先行者在探索这方面的工作,但是我觉得真正要突破它还是需要一定的时间。
问:cloud automl 会不会成为 ai 中心的核心产品?您能否分享一下ai 中国中心的发展规划?
李佳:我们 ai 中国中心主要的关注点还是在基础研究上,目前中国中心我们想聚集最好的ai的人才和国内很多的优秀的 ai 人才一块来推动基础研究的发展,而且希望影响力是全球性的,刚才我也提到了 ai 本身是没有国界的,所以我们希望最后 ai 的技术大家都能够用的到。
automl 是今年我们在 cloud ai 团队重点的一个产品,它确实是我们想用于普及 ai 的一个很好的工具。刚才我在演讲当中也提到了想用 ai 的用户分为几种:
第一种是对 ai 非常熟悉的,这些人他们可以用 tensorflow 去开发,他们可以用 cloud,或者大家提供一些工具,自己就能够把这个机器学习开发做的非常的好。
第二种是 api 的用户,这些用户通常没有自己的数据,他需要一些比较通用的或是描述性的东西,比如他只需要提供一张照片马上就能达到结果,或者是给他提供一个音频片段,他就可以得到一段转录,根本不需要花时间开发自己的模型,这是对很多大量的用户非常方便的,包括翻译之类的,我们刚才看到很多的用户他们也是 google 翻译的 api 用户。
第三种是他们有一些想法和数据,想要定制自己的模型,但是他们不知道自己怎么去做。automl 能够把这个门槛降低,让他们不需要再去招募大量的机器学习的人才,也不需要花大量的时间去标注他们的训练数据,就直接可以得到自己定制的东西。
还有一种在演讲里面没有提到,其实有很多的传统行业他来找我们谈ai合作的时候,通常他们都是说 ai 我们觉得是一个非常重要的方向,我们不想错过这个方向,但是我们不知道要做什么?我们不知道拿它来怎么做?
我们通常都是把他们跟我们的高级解决方案实验室(advanced solution lab)进行密切的合作,在我们高级解决方案实验室(advancedsolution lab)可以邀请我们的客户到 google 来,我们教他们怎么用机器学习,怎么用深度学习,深度的密切合作,去了解行业领袖他们需要解决什么样的问题,google 的工程师会跟他们深度的合作,帮他们开发这些算法。所以实际上ai整个产业,他的范围非常的广,我们需要开发各种不一样的产品来帮助我们各种各样的用户都能够从 ai 当中受益。
问:现在云市场的竞争非常激烈,您觉得 google云最大的优势是什么,以及未来三到五年如何来保持这样的优势呢?
李佳:最大的优势是 ai,google是一个 ai first 的公司,我们现在几乎所有的产品都是 ai 赋能,其实是十几年的产品的迭代以及对 ai 的理解,所以把我们带到了这一步。在云上面,我们想把很多很好的科技分享给更多的用户,让他们能够创造很多更好的产品,所以云目前是一个 ai 很好发挥的机会,ai 也是云很好的一个优势,我们非常想用 ai 作为战略方向,来帮助普及 ai 的使用。
问:目前已经知道 automl 可以替代很多机器学习开发者的工作,但如果现在一个企业想使用 automl,那么他还需要这方面的开发者吗?如果需要开发者,他们做的任务会发生哪些变化?
李佳:这是一个很好的问题,但有一点我想纠正一下,automl 他是为开发者所打造的一个产品。目前来看,全球可能有100万人有能力去开发机器学习的算法,而根据我们的统计全球有大概2100万的开发者可以使用这些 api 或者像 automl 这样的产品。
实际上,我们发展 automl 就是把使用机器学习的门槛降低了,能够让更多的开发者或者对机器学习了解不多的人,更好的把产品发展起来,更好的把ai的技术运用起来,因为我们始终认为当所有人都可以使用 ai 的时候,它才是最有力量的。而现在是存在这样的技术门槛,我们就是想把这个技术门槛降低,让更多的人能使用的上。
由于有了像 automl 这样的产品,或者将来会出现的各种各样的 ai 产品,我看到的是会有更多的人能够把这个技术能用起来,能够创造去更多的机会。所以我反倒觉得这样可能机会会变的更多,到那个时候就有更多懂行业、懂产品的人,能够把他们的特长发挥到极致。
问:去年有两个比较轰动的事件,一个是facebook 的虚假新闻,另一个是 google youtube 里一个叫做艾沙门的事件。有一些儿童影片看起来色彩很鲜艳,但是里面的内容其实比较暴力,不太适合儿童观看。比较有意思的是 facebook 、google 以及 今日头条,他们目前选择的方式是上线到近万名的人工来审核这些内容。我的问题是:我们的机器学习算法能够在哪一些方式上改进这些机器审核,不再让技术型的企业变成劳动密集型的产业。
李佳:实际上这种 adversarial(对抗性) 的行为是最难做的。因为机器的算法是人设计的,他只是根据人的设定去进行工作。另外一边是一些恶意去干扰机器算法的人。目前来看,这还是一个非常活跃的研究领域,google 内部成立了一个专门的团队从研究的角度来解决类似偏见、隐私这类的问题。
另外一方面,确实也反映 ai 实际上处在一个非常初期的状态,我们希望有更多的聪明人,把他们的聪明和才智用在好的方面,去创造更多正面的价值,而不是用来进行一些很恶意的行为。因为ai 其实只是一个工具,就像绳子一样,你可以用它来做好的事情,也可以用它来做坏的事情,我们希望有更多的正面的人去做更多的正面的事。
问:是像杀毒软件一样,有恶意的攻击,杀毒软件就来进行应对?
李佳:有一点像这样,我希望研究能够进展到一定的程度,这样能够使人工方面和研究方面的任务都可以有所缓解。
问:李佳老师您好,最近ai芯片的话题比较火热,就像云服务器芯片跟端智能芯片,而 google 也有tpu芯片,您觉得ai芯片的热潮是一种短时间?还是会长时间影响ai产业?
李佳:我觉得芯片代表的是算力,在我半年前的演讲里面提过,人工智能有几个支柱,包括:数据、算法、算力以及人才。所以算力也是给我们带来了很多的新的机会,包括像 learning to learn (学会学习)这种做 neural architecturesearch 的算法,如果没有大量的算力支撑,是无法办到的。以前都是靠专家自己通过大量的调试,通过多年的经验才能做到这样的效果,现在因为算力的进步,我们看到了这些新的机会出现,所以芯片的进步对于 ai 来说一直都是一个非常正面的支持。
问:今天分享了很多ai+行业的话题,比如说教育以及医疗的,我想知道这些具体行业的选取标准是什么?是 google 的一个兴趣?还是看到一些技术已经成熟了,可以能够更好的进行结合,或者说这类的领域的需求度比较高?
李佳:我认为,做产品的话,通常是会关注用户的需求和技术的发展去进行结合。而做研究就需要更大胆一些,我们会看到哪一领域出现的一些重要的问题,但是目前还没有办法来解决。我们就会选择这些方面来进行探索,比如说像医疗这种很难啃的领域,实际上它也是需要更多的人来助力把这些事情做好。
问:当某一个零售行业要使用 automl 来做一个 ai 模型的时候,他在什么场景下用?因为我知道现在做零售要 ai 软硬件结合,automl 可能只是软件方面,那硬件方面呢,需要如何与其他的硬件供应商进行配合?
李佳:零售方面大家都在考虑线上线下、软硬结合的模式。就如我刚提到的例子,他是专门针对在商品图片上面的分类。比如说在迪斯尼里,如果你需要找一个米老鼠或者是想找一个艾莎的照片,他们需要定制的模型才能够实现你的需求。当然如果我们提到这种无人店,他对于机器学习和洞察力这样的需求就更多了。
别克全新一代君威于今日上市-全新的设计理念,搭载了3.6L的V6发动机!
你是否相信机器人也可能拥有情感?
浅谈MES与ERP的关系和区别
苹果2020年iPhone全面采用OLED屏,背后没那么简单
清华大学研究院全力攻关石墨烯“宏量制备”技术关卡
李佳:AI团队的工作、AutoML研发的难点以及如何将研究与产品结合
7nm掀高端处理器价格战 优势不如最初预期
人工智能作为智慧城市发展的新动能,正在推动各领域向智能化加速跃升
三星申请Space Zoom商标,将用于手机上的长焦镜头
基于CAN总线的A320模拟器硬件仿真
ARM9和STM32什么关系?
基于Matlab有限元编程的变截面悬臂梁分析
剖析自动驾驶的模拟场景驾驶技术
什么是信号完整性?
库存消化后NVIDIA应仍有成长表现
荣耀手环5的血氧检测功能怎样升级
哪些手机音质比较好?魅族pro6,vivox9,荣耀v9HiFi音乐手机良心推荐!
中国2022年将成全球最大的物联网市场
怎样消除蓄电池硫化
华为的专利揭示了他们关于智能功能的想法