1.为啥需要云训练呢?
一般来说,模型训练的时间长达十几个小时,而且对于运行设备的要求极高,一般的学生(比如说我)想拿自己的笔记本电脑跑训练的话,首先就可能因为GPU的设置问题跑不起来,就算跑起来了,速度也很慢,
而且对于电脑的伤害是很大的
。
2.恒源云GPU
恒源云_GPUSHARE-恒源智享云
在控制台-我的实例 中,点击创建实例
接下来选择想租什么配置的设备,操作系统建议会linux的就linux,实在不会才windows(后面的操作步骤是linux的命令),计费模式建议按量付费,也就是按小时付费
然后如图选择预装的python环境(尽量和yolo的版本匹配)最后点击创建实例。
然后先别着急开机,开机就计费了。
如果系统默认开机,赶紧关机。
如图打开帮助文档(文档中心),找到 数据上传里面的OSS命令上传,后面就是照做,把自己的项目文件夹打包传上去。
这里软件下载是按照自己电脑的系统,注意不要搞混
如果实在不会使用oss,也可以参考文档里的其他方式(xftp等),上传速度可能会很慢
以下是oss的操作过程
下载完之后运行,然后login(登录用的是你注册网站的账号)
然后使用linux的文件命令将本地的项目压缩包上传到文件系统中
cp (你的压缩包路径) oss://
这样就算成功
接下来无卡启动(为了省钱,该模式下内存只有1G,费用是0.1元/小时)
启动完之后使用JupyterLab进行操作 (从这里开始是linux系统下操作,如果前面实例创建选择了windows系统,请类比操作或参考帮助文档)
打开一个命令行,先进入hy-tmp目录
登录oss客户端
oss login
从oss文件系统中下载项目压缩包
oss cp oss://dataset/yolov5.rar ./
这样就上传好了
解压rar包
7z x yolov5.rar
然后就可以在这个终端上正常运行项目啦
一般来说库的都是预装好的,也可以检查一下
可以在训练代码的最后一行加上
import os
os.system('shutdown')
这样训练完就自动关机了