机器学习模型重要特征值可视化相关知识

aia (ai adventures)系列现在已经进入第五期了。前三期分享当中,yufeng 介绍了机器学习的核心概念、基本逻辑,也介绍了要进行机器学习需要经过哪些步骤,并根据这些基本知识尝试使用线性评估器 api 打造了鸢尾花分类模型。今天的分享中,他会与我们分享一个非常有力的工具:tensorboard,让你能“看穿”模型,监测训练过程。
为了更方便 tensorflow 程序的理解、调试与优化,tensorflow 团队发布了一套名为 tensorboard 的可视化工具。开发者们可以用 tensorboard 来展现 tensorflow 图,绘制图像生成的定量指标图以及显示附加数据(如其中传递的图像),请看 yufeng 为大家带来的分享:
当你能「看清」问题所在时,调试起来是最简单的。但是当大量的训练数据如潮水般涌入复杂模型的时候,调试的过程往往会变得无比复杂。不过别怕,幸亏有 tensorboard,一切变得简单起来。
机器学习可不像传统的编程,它往往变幻莫测。模型间的细小差别以及数据的质量、参数微调中的小小改变都可能对最终成功与否造成巨大的影响。
用 tensorboard 发现问题所在
只有当我们纵览模型整体结构,并跟踪某些特征数据在整个训练过程当中的变化时,才能有效调校模型并调试所「看到」的问题。
这一抽象的流程往往难以通过可视化的方式呈现,不过现在 tensorflow 内置了解决方案将会带来改变。
现在一起来看看内置于 tensorflow 的可视化方案 — tensorboard,一个让你更能把控大量操作的工具。不论是观察模型整体结构还是监视整个模型训练过程。
tensorflow 在内部使用了计算机图形理论的思想。
也就是说,为了取缔传统意义上两数相加的思维,tensorflow 构造了新的加法运算,并将之作为参数传入,随后数值将会被这一运算加在一起。
所以我们回头思考 tensorflow 训练过程,其实就是将所有操作当成图的一部分来执行的过程。tensorboard 可以将这些模型可视化,所以你能看到模型抽象出来是什么样子,更让你得以检查是否所有部分都按要求组合在了一起。
下面来个更复杂点的例子,同样是用 tensorflow 将模型可视化的例子。注意看上图,tensorflow 让我们可以缩放、扫视、展开模型的各个元素以得到更多细节。这就是说,我们可以从不同的抽象层次观察模型,从而降低了视觉复杂度。
并且,tensorboard 除了向我们展示模型的结构,还会将各项特征值的变化很好布局在图上。我们会将精确度、失真、跨熵等拿来布局观测,且另一方面,依赖于模型的众多特征值往往都非常重要。至于 tensorflow 的预置发射器,它们自带了一套预设值用于在 tensorboard 中使用。这一特性为后续使用做好了铺垫。
tensorboard 除了上述功能,还能展示包括条形图、分布图以及诸如声音、图像、文字等与模型共生的数据等等大量的信息。不过关于那部分的详细介绍要等到后面的视频。
回归正题,我们来看看之前一直使用的线性模型在 tensorboard 当中的表现。首先需要启动 tensorboard 并将之指向目标模型层次结构及重要中间文件所在的目录:
tensorboard --logdir=」/tmp/iris_model/」
此项操作会启动一个侦听 6006 端口的本地服务器。
6006 看起来是不是非常像「goog」呢?
我们可以看到一些线性 classifier 默认提供的标量特征值。稍后可以通过缩放和展开来研究这些图像。
双击能够回退到更高的缩放级别。可见,我们的模型训练随着时间推移正以逐渐降低的失真井然有序进行。并且我们能清晰看到模型训练尚未完成,原因是当前的失真下降率仍然较高。它提示我们,也许应当再多训练一会儿,进而从训练过程中获得更多收益。
接下来看看 graph 小分页。注意看,此时图还是非常简单的。
我们能通过点击小块儿上面的加号展开查看更详细的内容。比如,我现在展开了「linear」这个模块,可以看到它由不少子模块组成。我们可以通过滚轮来缩放视野,也可以通过点按拖拽来查看其他部分。
注意我们给特征列的名字,比如此处的 flower_features 在图中以模块形式呈现。
这种方式将有助于调试并了解上面展示的图中各部分是怎样联结起来的。大多数 tensorflow 的操作是可以命名的,所以这是一个将模型阐述清楚和观察当前训练进展的好机会。
今天,我们学到了简单有趣的机器学习模型重要特征值可视化相关知识。tensorboard 将让你轻松体验到这种乐趣,并且最妙之处是它已经完全内置在 tensorflow 当中了。
记住下一次你想要把机器学习过程可视化时,tensorboard 是你的不二选择。

绝缘栅双极型晶体管(IGBT)及应用进行讨论
ABB宣布将协作机器人引入医疗室设立全新的医疗保健研究中心
未来电动工具行业的发展,需要一些先进技术的推动
制冷压缩机的选购
常见的视力保健台灯电路图
机器学习模型重要特征值可视化相关知识
一文汇总电子工程师基本的技术要求
边缘计算多角色智能计量插座: 用电监测和资产管理的未来智能化引擎
科华数据顺利完成国家核安全局民用核安全设备许可证续证工作
探讨碳化硅在电动汽车领域的应用
苹果iPhone14后壳被透明改造 可看见内部组件
英威腾网能荣获“技术创新”奖
AMD执行长苏姿丰19日会台积、电子5哥
电感器的充放电过程
Vivox60如何切换系统,如何切换到经典桌面
STM8S如何实现Atomthreads最低功耗
战事升级:高通要求美国禁止进口iPhone
合力泰积极布局LCP柔性线路板领域,解决智能终端产品高需求
为什么 MySQL 单表不能超过 2000 万行?
!销售/收购/维修MT8852A蓝牙测试仪MT8852B!