Caffe读取训练和测试日志

2023-12-25 14:18

本文主要是介绍Caffe读取训练和测试日志,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

用Caffe训练模型时,我们常常想保存训练和测试过程中数据一便于进一步分析。一种方法是在python中调用caffe的API训练并自己写代码读取layer中的数据保存结果,但这种方法毕竟比较繁琐。其实在用命令行训练的时候,caffe已经提供了保存训练日志并解析训练和测试数据的功能。只要在训练的命令上加一行命令即可。如下:

#!/usr/bin/env sh
set -e
CAFFEROOT=/home/meringue/Softwares/caffe-master
CIFAR10PY=/home/meringue/Documents/CaffePy/cifar10py
MODEL=$CIFAR10PY/cifar10_caffemodels/model_Alex_ST
TOOLS=$CAFFEROOT/build/tools
echo 'start training...'GLOG_logtostderr=0 GLOG_log_dir=$MODEL/LOG/ \ # save log file
$TOOLS/caffe train \--solver=$MODEL/cifar10_quick_solver.prototxt $@ 

这样就会在GLOG__log_dir路径下生成一份日志文件,打开看一下,里面其实就是你在执行训练脚本时生成的一大堆东西。但我们需要的是里面准确率和误差等有用的信息,这时候需要用到caffe-master/tools/extra/路径下的extract_seconds.py,parse_log.sh和plot_training_log.py三个文件,把这三个文件复制一份到你自己定义的LOG文件夹下,先把之前的LOG日志重命名成以.log后缀的文件,如model.log,在当前文件夹下用parse_log.sh model.log命令可以解析出model.log.train和model.log.test两个文件,打开可以看到类似下图的内容:


log.train_test

可以发现,我们需要的数据已经被解析出来了,这个时候可以用这些数据来画图了。当然Caffe也提供了画图功能,用的就是plot_training_log.py,可以设置不同的参数来画你所需要的图,这力里就不再展开了,因为代码里关于参数的说明写的很详细,自己看看就懂了。
其实,既然已经有了这些数据,我们完全可以自己写一个python函数来读取这些数据并画图,下面是我自己写的函数,可以用来读取上面两个日志文件中数据,代码中一些细节都加了注释。

## read log file of training process created by Caffe
class ReadLogFile(object):def __init__(self,_LogFilePath):"""get log file path from LogFilePath"""self.LogFilePath = _LogFilePathdef read_trainLog(self,LogName):"""get iterations and training loss from training log file named LogName"""LogPath = self.LogFilePath+LogName# load all training datawith open(LogPath) as f:data = f.readlines()data = data[1:] # remove the first row (title) data_len = len(data)Iters = []TrainLoss = []for row in range(data_len):data_row = data[row].split(' ') # splitted by ' 'while '' in data_row: # remove 'None'data_row.remove('')Iters.append(int(data_row[0]))TrainLoss.append(float(data_row[2]))           return Iters, TrainLoss    def read_testLog(self,LogName):"""get iterations, test accuracy and test loss from test log file named LogName"""LogPath = self.LogFilePath+LogNamewith open(LogPath) as f:data = f.readlines()data = data[1:]data_len = len(data)Iters = []TestAccuracy = []TestLoss = []for row in range(data_len):data_row = data[row].split(' ')while '' in data_row:data_row.remove('')Iters.append(int(data_row[0]))TestAccuracy.append(float(data_row[2]))TestLoss.append(float(data_row[3]))     return Iters, TestAccuracy, TestLoss

这篇关于Caffe读取训练和测试日志的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/535810

相关文章

MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页:https://tangyuan96.github.io/minigpt_3d_project_page/ 代码:https://github.com/TangYuan96/MiniGPT-3D 论文:https://arxiv.org/pdf/2405.01413 MiniGPT-3D在多个任务上取得了SoTA,被ACM MM2024接收,只拥有47.8M的可训练参数,在一张RTX

matlab读取NC文件(含group)

matlab读取NC文件(含group): NC文件数据结构: 代码: % 打开 NetCDF 文件filename = 'your_file.nc'; % 替换为你的文件名% 使用 netcdf.open 函数打开文件ncid = netcdf.open(filename, 'NC_NOWRITE');% 查看文件中的组% 假设我们想读取名为 "group1" 的组groupName

Spark MLlib模型训练—聚类算法 PIC(Power Iteration Clustering)

Spark MLlib模型训练—聚类算法 PIC(Power Iteration Clustering) Power Iteration Clustering (PIC) 是一种基于图的聚类算法,用于在大规模数据集上进行高效的社区检测。PIC 算法的核心思想是通过迭代图的幂运算来发现数据中的潜在簇。该算法适用于处理大规模图数据,特别是在社交网络分析、推荐系统和生物信息学等领域具有广泛应用。Spa

SigLIP——采用sigmoid损失的图文预训练方式

SigLIP——采用sigmoid损失的图文预训练方式 FesianXu 20240825 at Wechat Search Team 前言 CLIP中的infoNCE损失是一种对比性损失,在SigLIP这个工作中,作者提出采用非对比性的sigmoid损失,能够更高效地进行图文预训练,本文进行介绍。如有谬误请见谅并联系指出,本文遵守CC 4.0 BY-SA版权协议,转载请联系作者并注

Detectorn2预训练模型复现:数据准备、训练命令、日志分析与输出目录

Detectorn2预训练模型复现:数据准备、训练命令、日志分析与输出目录 在深度学习项目中,目标检测是一项重要的任务。本文将详细介绍如何使用Detectron2进行目标检测模型的复现训练,涵盖训练数据准备、训练命令、训练日志分析、训练指标以及训练输出目录的各个文件及其作用。特别地,我们将演示在训练过程中出现中断后,如何使用 resume 功能继续训练,并将我们复现的模型与Model Zoo中的

argodb自定义函数读取hdfs文件的注意点,避免FileSystem已关闭异常

一、问题描述 一位同学反馈,他写的argo存过中调用了一个自定义函数,函数会加载hdfs上的一个文件,但有些节点会报FileSystem closed异常,同时有时任务会成功,有时会失败。 二、问题分析 argodb的计算引擎是基于spark的定制化引擎,对于自定义函数的调用跟hive on spark的是一致的。udf要通过反射生成实例,然后迭代调用evaluate。通过代码分析,udf在

下载/保存/读取 文件,并转成流输出

最近对文件的操作又熟悉了下;现在记载下来:学习在于 坚持!!!不以细小而不为。 实现的是:文件的下载、文件的保存到SD卡、文件的读取输出String 类型、最后是文件转换成流输出;一整套够用了; 重点: 1:   操作网络要记得开线程; 2:更新网络获取的数据 切记用Handler机制; 3:注意代码的可读性(这里面只是保存到SD卡,在项目中切记要对SD卡的有无做判断,然后再获取路径!)

ROS1 + Realsense d455 固件安装+读取rostopic数据

目录 安装固件(一定要匹配)ROS1 wrapper 安装方法Realsense SDK 安装方法Realsense Firmware 安装方法 修改roslaunch配置文件,打开双目图像和IMU数据其他坑点参考链接 安装固件(一定要匹配) 如果你是使用ROS1获取realsense数据的话,一定要注意,SDK, Firmware的版本不是越新越好!!,这是因为intel已经不

Python批量读取身份证信息录入系统和重命名

前言 大家好, 如果你对自动化处理身份证图片感兴趣,可以尝试以下操作:从身份证图片中快速提取信息,填入表格并提交到网页系统。如果你无法完成这个任务,我们将在“Python自动化办公2.0”课程中详细讲解实现整个过程。 实现过程概述: 模块与功能: re 模块:用于从 OCR 识别出的文本中提取所需的信息。 日期模块:计算年龄。 pandas:处理和操作表格数据。 PaddleOCR:百度的

多云架构下大模型训练的存储稳定性探索

一、多云架构与大模型训练的融合 (一)多云架构的优势与挑战 多云架构为大模型训练带来了诸多优势。首先,资源灵活性显著提高,不同的云平台可以提供不同类型的计算资源和存储服务,满足大模型训练在不同阶段的需求。例如,某些云平台可能在 GPU 计算资源上具有优势,而另一些则在存储成本或性能上表现出色,企业可以根据实际情况进行选择和组合。其次,扩展性得以增强,当大模型的规模不断扩大时,单一云平