云GPU运行yolov5模型训练

  • Post author:
  • Post category:其他


1.为啥需要云训练呢?

一般来说,模型训练的时间长达十几个小时,而且对于运行设备的要求极高,一般的学生(比如说我)想拿自己的笔记本电脑跑训练的话,首先就可能因为GPU的设置问题跑不起来,就算跑起来了,速度也很慢,

而且对于电脑的伤害是很大的

2.恒源云GPU

恒源云_GPUSHARE-恒源智享云

在控制台-我的实例 中,点击创建实例


接下来选择想租什么配置的设备,操作系统建议会linux的就linux,实在不会才windows(后面的操作步骤是linux的命令),计费模式建议按量付费,也就是按小时付费

然后如图选择预装的python环境(尽量和yolo的版本匹配)最后点击创建实例。

然后先别着急开机,开机就计费了。

如果系统默认开机,赶紧关机。

如图打开帮助文档(文档中心),找到 数据上传里面的OSS命令上传,后面就是照做,把自己的项目文件夹打包传上去。

这里软件下载是按照自己电脑的系统,注意不要搞混

如果实在不会使用oss,也可以参考文档里的其他方式(xftp等),上传速度可能会很慢

以下是oss的操作过程

下载完之后运行,然后login(登录用的是你注册网站的账号)

然后使用linux的文件命令将本地的项目压缩包上传到文件系统中

cp (你的压缩包路径) oss://

这样就算成功

接下来无卡启动(为了省钱,该模式下内存只有1G,费用是0.1元/小时)

启动完之后使用JupyterLab进行操作 (从这里开始是linux系统下操作,如果前面实例创建选择了windows系统,请类比操作或参考帮助文档)

打开一个命令行,先进入hy-tmp目录

登录oss客户端

oss login

从oss文件系统中下载项目压缩包

 oss cp oss://dataset/yolov5.rar ./

这样就上传好了

解压rar包

 7z x yolov5.rar

然后就可以在这个终端上正常运行项目啦

一般来说库的都是预装好的,也可以检查一下

可以在训练代码的最后一行加上

import os
os.system('shutdown')

这样训练完就自动关机了



版权声明:本文为EXYlkx原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。