摘要:前言在对深度学习神经网络模型进行训练时,我们通常需要观察其训练的状态,通过当前模型的训练情况来作为进一步操作的依据比如,从loss曲线上看到它的数值已经很难再降下去了,那么我们就可以停止训练了在本文中,我们将介绍百度飞桨的可视化分析工具 VisualDL 的使用方法。 基于 PaddlePaddle 框架创建模型并对其进行训练时,借助 VisualDL 工具,我们就可以实时观察到模型的训练情
前言在对深度学习神经网络模型进行训练时,我们通常需要观察其训练的状态,通过当前模型的训练情况来作为进一步操作的依据比如,从loss曲线上看到它的数值已经很难再降下去了,那么我们就可以停止训练了在本文中,我们将介绍百度飞桨的可视化分析工具 VisualDL 的使用方法。
基于 PaddlePaddle 框架创建模型并对其进行训练时,借助 VisualDL 工具,我们就可以实时观察到模型的训练情况Vis
安装 VisualDL这里我们使用最简单的方式进行安装,一行命令即可:pytho
训练过程中记录日志文件想要查看模型在训练过程中的实时状态,我们需要在代码中合适的位置(比如在每一轮结束时),将我们感兴趣的状态参数(如:loss,accuracy,learning rate等)通过 LogWriter 函数记录下来,写入日志文件。
关于 LogWriter 函数的参数,如下图所示:
")writer.addscalar(tag="acc", step=1, value=0.5678)writer.addscalar(tag="acc", step=2, value=0.6878)writer.addscalar(tag="acc", step=3, value=0.9878)writer.close()
程序会在 logdir 指定的目录下生成日志文件,运行一次程序所产生的训练数据会记录到一个日志文件中启动 VisualDL 服务生成日志文件后,我们就可以启动 VisualDL 服务了,通过读取我们在训练过程中保存的日志文件来获取各个参数的值。
这里我们使用 visualdl 命令行启动的方式(这种方式最简单)。启动命令如下:visualdl --logdir ./vdl --host 192.168.10.108
值得注意的是,上面的指令中,--host 指定的是服务器的可供外部访问的 IP 地址。这样方便我们在服务器外面的浏览器中查看模型训练情况。visualdl 完整的参数列表以及详情如下图所示:
在浏览器中查看 VisualDL 可视化面板启动 visualdl 服务后,我们可以看到提示“Running VisualDL athttp://192.168.10.108:8040/(Press CTRL+C to quit)”,其中“http://192.168.10.108:8040/”就是我们要访问的地址了。
在浏览器中输入这个地址即可打开 VisualDL 的可视化面板
至此,我们的目标就达成了,通过 VisualDL 可视化面板就能够查看模型训练的实时状态注意事项训练代码用于保存 vdlrecords 文件时使用的 visualdl 版本要与查看的版本相一致,否则可能无法正常显示。
--host 指定的 ip 地址,要确保在服务器外面能访问得到,否则在浏览器中无法打开 VisualDL 可视化面板--logdir 指定的是 vdlrecords 文件保存的目录