七、训练模型,CPU经常100%,但是GPU使用率才5%左右
现象:

大概原因:GPU运算完毕后,花费了大量时间在写日志和存储pth文件,所以GPU使用率一直过低,CPU使用率一直很高。
具体原因分析参见【深度学习】踩坑日记:模型训练速度过慢,GPU利用率低
这里直接上解决办法:
- 减少日志IO操作频率
- 使用pin_memory和num_workers(num_workers调整不合适,会显示内存不够之类的问题,根据实际情况调整)
- 使用半精度训练
- 更好的显卡,更轻的模型
- 增大batch size提高epoch速度,但是收敛速度也会变慢,需要再适当升高学习率
本文解决办法:这里我采用的是调整batch_size,由8调成10(本来想调成16,结果显示GPU内存不够,只能调到10):

本文来自网络,不代表协通编程立场,如若转载,请注明出处:https://net2asp.com/671370842f.html
相关推荐
-
Canal+RabbitMQ实现MySQL数据同步至ClickHouse
ClickHouse作为一个被广泛使用OLAP分析引擎,在执行分析查询时的速度优势很好的弥补了MySQL的不足,但是如何将MySQL数据同步到ClickHouse就成了用户面临的第…
1天前 -
【学习记录】SPSS问卷调查表分析法
用excel将收集的问卷数据存储,并用SPSS进行数据分析 文章目录 一、对收集的excel数据进行数据转换 二、将调整合适的excel数据导入SPSS,并进行变量调整 1.导入e…
1天前 -
AttributeError: module ‘backend
bug的产生 是在使用python的matplotlib库的时候发现无法绘制和老师一样的图 原因 一开始我还以为是我的matoltlib和我的python版本不匹配后面发现真正原因…
1天前 -
SLAM 轨迹评估方法 evo(包括GPS坐标转换成TUM)
安装 evo pip install evo –upgrade –no-binary evo SLAM轨迹 运行ORBSLAM rosrun ORB_SLAM3 Stereo …
1天前 -
寒假本科创新学习——机器学习(一)
绪论 1.1什么是机器学习 1.1.1 Arthur Samuel给出的定义 1.1.2 显著式编程和非显著式编程 1.1.3 Tom Mitshell给出的定义 1.2基本术语 …
1天前 -
如何将人工智能与游戏技术结合提高学习效果
1.背景介绍 随着人工智能(AI)技术的不断发展,越来越多的领域都在借鉴和应用这一技术。游戏技术也不例外。在过去的几年里,游戏技术与人工智能技术的结合已经取得了显著的进展,这种结合…
人工智能 1天前 -
ChatGPT中文指令(Prompt)角色预设大全!让你的AI更懂你!
ChatGPT的回答总是不令人满意,那可能是你对AI下错了指令/提示词(Prompt),想要ChatGPT更懂你,回答更精准,就要给它下对指令。 在国外有大佬们已经整理出一些标…
1天前 -
win10 cuda11.8 和torch2.0 安装
文章目录 (一) 安装cuda11.8 1)先确定cuda 版本 2) 安装cuda 11.8,因为torch2.0 目前只支持cuda11.7 和cuda 11.8 3) 安装c…
人工智能 1天前
