GAN之父Goodfellow回顾自己当年的科研经历

编者按：近日，neuroascent联合创始人、数据科学家sanyam bhutani对ian goodfellow博士进行了一次采访。在他们的对话中，深度学习研究员、gan之父goodfellow回顾了自己当年的科研经历，简要介绍了自己对于科研、行业和未来发展的一些看法。
sanyam bhutani：您好，gan之父，感谢您愿意接受我的采访。
ian goodfellow：非常欢迎！非常感谢你愿意采访我，以及撰写博客来帮助其他学生。
sanyam bhutani：作为google ai的研究科学家，同时也是生成对抗网络（gan）的发明人，您能向我们的读者透露一下自己的科研经历吗？比如您是什么时候开始研究gan的？是什么让您对深度学习产生了兴趣？
ian goodfellow：我从本科开始就已经在研究人工智能了，只不过那时机器学习主要是svm、boosted tree等。在课余，我也是游戏编程的业余爱好者，会用glslang制作一些小项目。一次，我的朋友ethan dreyfuss（他现在在zoox工作）告诉了我两件事：geoff hinton在谷歌的技术演讲上提到了深度信念网络（dbn）；cuda gpu。
我当即就意识到深度学习能弥补svm带给我的很多缺憾。一方面，svm在设计模型上不够自由，投入更多数据资源后，它不会直接变得更“智能”，但深度神经网络可以随着投入数据的增加不断提升性能。另一方面，cuda gpu能允许我训练更大的神经网络，由于有游戏编程经验，我知道该怎么编写gpu代码。
就在那个寒假，我和ethan在斯坦福大学搭好了第一台cuda计算机，并用它开始训练玻尔兹曼机。
sanyam bhutani：正如您所讲的，你只花了一晚上就写出了第一个gan，但一般在研究上作出突破都至少需要几个月甚至几年。您能谈谈自己为什么能在一夜之间就实现突破吗？
ian goodfellow：如果你有一个和新想法相关的高质量codebase（代码库），实现这个想法其实很容易。早在几年前，我和同事就已经围绕theano和pylearn2的库做了很多工作，它们都是第一个gan的构建基础。早年有篇论文叫maxout networks，我们曾仿照它自己写了个mnist分类器，到训练gan时，我们直接复制了分类器的代码，论文的超参数在gan里也很好用，所以我们基本没做什么更新。再加上在mnist上训练用时很短，我认为第一个mnist gan只花了我大约一小时的时间。
sanyam bhutani：自发明以来，我们在gan上看到了很多可喜的进展，您最欣赏其中的哪一个呢？
ian goodfellow：这很难选。当emily denton和soumith chintala提出lapgan的时候，我第一次意识到gan的广大前景。当然，lapgan只是暴风雨前的一朵小浪花。
sanyam bhutani：除了gan，你最好看深度学习的哪个领域呢？
ian goodfellow：我在研究模型对于对抗样本的稳健性上花了不少时间。为了把机器学习用于实际应用，确保它的安全性非常重要。我也希望这项研究能帮我们更好地理解什么是机器学习。
sanyam bhutani：对于那些有兴趣从事深度学习的读者和初学者，对于那些梦想着有一天能进入google工作的人，您有什么好的建议吗？
ian goodfellow：首先要学习基础知识：编程、debug、线性代数、概率论。大多数高级研究项目最看重一个人的基础知识掌握水平，而不是他对先进技术的了解程度。举个例子，今天我就在调试内存泄露，因为它让我没法实验，我也在加快软件库的单元测试，以便尝试更多研究思路。当我还在读本科、读博士的时候，我经常会向吴恩达讨教，他建议我一定要彻底掌握这些基础知识。那时我觉得这些工作很无聊，希望他能多跟我说说超实数之类的东西，但现在几年过去了，我觉得他的建议真的是正确的。
sanyam bhutani：您能跟我们说说您在google的一天是什么样的吗？
ian goodfellow：对于不同人，甚至是同一个人的不同人生阶段，这种体验是非常不一样的。有时候，我就是写写代码、跑跑实验、读几篇论文，或者写写书。有时候，我就需要花大多数时间参加几个不同的会议，检查许多不同的项目。现在我在检查别人工作上花去的时间要占60%，处理自己的项目则占40%。
sanyam bhutani：有一种普遍想法是，如果想在深度学习中取得重大成果，一个必要前提是有大量资源。您是怎么看待这个观点的呢？你是否觉得存在那么一个人，他没有google能提供的那么多资源，但他最终做出了突破性贡献？
ian goodfellow：我同意，当然存在这么一个人，但他首先得选好合适的研究项目。比如证明一个有趣的理论结果可能不需要计算资源，设计一个只需极少数据但性能好、通用性强的算法也不需要超大型数据集。但是，如果你没有足够多的硬件做并行计算，你最好不要去挑战构建全世界训练速度最快的imagenet分类器。
sanyam bhutani：鉴于研究成果的爆炸性增长，您是怎么让自己与时俱进的？
ian goodfellow：不久前，我觉得自己已经掌握了深度学习的所有知识，尤其是在我编书的时候。但现在我做不到了，我真的只能关注和自己的研究有关的主题，我甚至都说不清gan发生了什么变化。
sanyam bhutani：您觉得机器学习被高估了吗？
ian goodfellow：就其长期潜力而言，我实际上认为机器学习还是被低估了，因为外行人还没有像我们一样对它津津乐道。但我认为机器学习确实经常被“错误炒作”：人们会夸大现阶段这种技术的可能性，或者夸大个别项目的进展等。
sanyam bhutani：您认为非机器学习专业的博士/硕士能否为深度学习领域做出贡献？
ian goodfellow：我认为培养专业知识很重要，但我不认为博士学位是获得这种专业知识的唯一途径。最优秀的博士生往往都是自学型人才，只要有足够时间学习，他们也能做到边工作边成长。
sanyam bhutani：最后，您能给那些对深度学习感到不知所措的初学者一些建议吗？
ian goodfellow：从一个简单项目开始，重新实现那些你已经了解，而且知道肯定能成的东西，比如cifar-10分类器。很多人都会想一开始就直接去做一些新的事情，然后项目失败了，你也不知道是项目本身行不通，是你自己的思路有问题，还是你对一些关键点的理解有误。我觉得有一个可以实践的项目很重要：深度学习有时就像开飞机，你可以读很多东西，但你也要亲自上手体验并发现另一些直观的经验。

苹果WWDC 2015：Swift开源与Apple Music平台
2019年中国MEMS传感器市场分析和国内MEMS优秀企业资料说明
WD无线存储体验功能强大体积便携备份首选
卡巴斯基回应 Incaseformat 蠕虫病毒爆发：十年前 6.0 版本都可查杀
英特尔软件保护扩展介绍
GAN之父Goodfellow回顾自己当年的科研经历
基于FPGA的RFID板级标签是怎样设计的
智能汽车高歌猛进：特斯拉、蔚来们狂奔，宝马们不想成为“诺基亚”
油烟在线监测仪有哪几种测量原理
光纤光栅传感系统的现状及发展趋势
中国工业机器人投资发展的三个效应思考
巨哥科技是一家什么样的公司？
电动式继电器的基本结构、优缺点、工作原理、触点方式、应用、安装步骤、常见故障及预防措施
华为即将收割中国汽车市场?
曝AirPods廉价版即将投产主动消除噪音功能去留成为争议点
玄龙MR+将于11月11日正式开卖
关于“创新”与“传统”之碰撞和分析
Rolith宣布安装由SUSS MicroTec建造的第2代纳米结构原型工具
工业ANDON无线安灯系统拉绳按钮盒应用场景
一起由静电起火事故引发的思考