(2022)Ubuntu16.04 搭建mujoco环境+强化学习gym
    
    
    
    前言
   
   
    随着人工智能和物联网的不断发展,一些商用性产品逐渐出现在大众的视野中,例如智能家居、无人机、服务型机器人等等。本文主要是Ubuntu系统下mujoco环境的配置,未来将使用mujoco进行机器人的可视化建模以及运动学分析。
   
    
     提示:最新更新于2022.2.23
     
     本人的配置方案如下:
     
     
      ubuntu16.04
     
     
     
      mujoco 200
     
     (mujoco150 我没试过 网上好像是可以的)
     
     
      mujoco_py 2.0.2.5
     
     (这个版本是一个坑,需要跟 mujoco 的版本对应)
     
     
      python3.6.4
     
     (按我走过的坑来说 python3.7 可以省去一些麻烦)
     
     
      gym0.21.0
     
     (这个也有坑,主要是在更新上,机械臂建模应该不会用到这个强化学习环境)
    
   
    
     参考网址:
     
     
      安装步骤参考1
     
     
     
      安装步骤参考2
     
     
     
      避坑指南
     
     
     
      测试参考
     
    
   
    
    
    一、Ubuntu16.04系统安装
   
    参考文档:
    
     Windows10安装ubuntu16.04双系统教程
    
    
    制作刻录 u 盘软件:
    
     UltralSO
    
    (试用版 30 天就够了)
   
    
     
      前 期 准 备 工 作
     
    
   
- 
     安装 nvidia 驱动:
 
 ubuntu16.04安装NVIDIA驱动
 
这个驱动安装教程基本上是没有问题的
- 
     安装 python3.6 :
 
 ubuntu安装python3.6
 
由于 ubuntu16.04 适配的是 python2.7/python3.5,不能用 sudo apt-get 去获取 python3.6 以上版本。
切忌不要卸载系统自带的 python,否则会有各种奇奇怪怪的 bug 等着你
。最好不要删除之前的软链接这样的话也会让系统有一些问题出现。
- 为 python3.6 安装 pip
    
     代码如下:
    
   
(sudo)curl https://bootstrap.pypa.io/ez_setup.py -o - | python3.6 && python3.6 -m easy_install pip
或者
(sudo)curl "https://bootstrap.pypa.io/get-pip.py" -o "get-pip.py" python3 get-pip.py –user
报错权限不够就加 sudo ,最好是使用第一个代码。
然后用
pip -V
验证自己下载的 pip 是在 python3.6 的根目录下,
pip3 -V
同理验证pip3的安装路径。
    
    
    二、mujoco安装
   
    
    
    1.安装教程
   
    
     教程中安装 mujoco 的流程大同小异,只是现在 license 开源可直接下载(就是说获得许可证那一步可以直接跳过,
     
      license下载网址
     
     ,mujoco 也在这个网址的 download 下载,建议解压文件夹重命名为 mujoco200,后面下载 mujoco-py 的时候会用到。
    
   
打开终端,输入以下命令
mkdir ~/.mujoco
然后将解压好的mujoco200文件夹复制到这个隐藏的mujoco文件中,ubuntu系统中在Home文件夹下,按Ctrl+H可显示隐藏文件夹,然后复制即可,也可使用指令复制:
cp /你的文件目录/mujoco200_linux.zip ~/.mujoco
cd ~/.mujoco
unzip mujoco200_linux.zip
(PS:这里解压之后的文件夹名为mujoco200_linux,个人建议将其改为mujoco200,以下工作都是根据于此来进行的)完成这些工作之后可以添加环境变量
sudo gedit ~/.bashrc
将下面这两条命令复制到最后一行
export LD_LIBRARY_PATH=~/.mujoco/mujoco200/bin${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export MUJOCO_KEY_PATH=~/.mujoco${MUJOCO_KEY_PATH}
然后将在网址上下载的注册表文件mjkey.txt复制到~/.mujoco文件夹里以及~/.mujoco/mujoco200/bin文件夹下,也可以使用以下指令复制
cp mjkey.txt ~/.mujoco
cp mjkey.txt ~/.mujoco/mujoco200/bin
    
    
    2.程序验证
   
测试结果是一个画面,然后有一个木偶小人。
    
     代码如下:
    
   
 cd ~/.mujoco/mujoco200_linux/bin 
 ./simulate ../model/humanoid.xml
    
    
    三、mujoco-py 安装
   
    
    
    1.安装教程
   
    安装 mujoco-py 第一步就是一个坑,
    
     git clone
     
      https://github.com/openai/ mujoco-py.git
     
    
    这个命令会默认安装网址中最新版本,如下图所示。
    
     
   
看说明这个版本是跟 mujoco2.1 版本(mujoco210)是匹配的。所以下载这个是不行的,要到
releases
找到早期版本下载,如下图所示。(建议v2.0.2.5)后缀是
tar.gz
的,形式是这样的。
    
    
    
    解压,默认在下载的路径上,把这个剪切到/home/(自己计算机名字)的文件夹里,并改名为 mujoco-py。
   
    剩下内容参考知乎(
    
     安装步骤参考2
    
    ),但是需要注意的是我这里没有用到 conda 虚拟环境是直接安装的,问题不大会有警告,直接忽略掉即可。(也可以直接下载conda安装,下面给出我的代码)
   
- 安装 patchelf
 curl -o /usr/local/bin/patchelf https://s3-us-west-2.amazonaws.com/openai-sci-artifacts/manual-builds/patchelf_0.9_amd64.elf 
 
 sudo chmod +x /usr/local/bin/patchelf
- 安装 依赖
cd ~/mujoco-py 
cp requirements.txt requirements.dev.txt ./mujoco_py 
cd mujoco_py
sudo pip3.6 install -r requirements.txt 
sudo pip3.6 install -r requirements.dev.txt
需要注意的是,pip install -r requirements.txt和pip install -r requirements.dev.txt命令需要修改,因为要用到python3.6以及管理员权限。修改如下:sudo pip3.6 install -r requirements.txt 和 sudo pip3.6 install -r requirements.dev.txt
安装依赖会遇到time out 情况。这里有解决方法,建议就是换源。
https://blog.csdn.net/weixin_42455006/article/details/121957633
- 安装mujoco-py
cd ~/mujoco-py/vendor 
./Xdummy-entrypoint 
cd ..
sudo python3.6 setup.py install
安装也同理需要用到管理员权限,以防万一后面的python一律改成python3.6。或者打开终端输入
sudo gedit ~/.bashrc
    在最后一行加入
    
     alias python=python3
    
    。
   
    
    
    2.程序验证
   
测试也是一样,需要先进入mujoco-py文件夹,输入python3.6进入python,然后键入
import mujoco_py
导入数据,第二次没有输出为正常。结果如下图所示。
    
    
    
     完整测试代码如下:
    
   
import mujoco_py
from os.path import dirname
model = mujoco_py.load_model_from_path(dirname(dirname(mujoco_py.__file__))  +"/xmls/claw.xml")
sim = mujoco_py.MjSim(model)
print(sim.data.qpos)
#[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
sim.step()
print(sim.data.qpos)
#[ 2.09217903e-06 -1.82329050e-12 -1.16711384e-07 #-4.69613872e-11
# -1.43931860e-05  4.73350204e-10 -3.23749942e-05 #-1.19854057e-13
# -2.39251380e-08 -4.46750545e-07  1.78771599e-09 -1.04232280e-08]
    
    
    四、gym 安装
   
    
    
    1.安装教程
   
最后一步就是安装gym,由于版本的原因(
gym21.0只能兼容python3.7及以上
)也不能使用
git clone https://github.com/openai/gym.git
,而是进入
https://github.com/openai/gym.git
去找早期版本gym20.0就可以了。然后解压,剪切,重命名。
    剩下的安装教程可以参考:
    
     测试参考
    
   
    
     代码如下:
    
   
cd gym
sudo apt-get install -y python-numpy python-dev cmake zlib1g-dev libjpeg-dev xvfb libav-tools xorg-dev python-opengl libboost-all-dev libsdl2-dev swig
sudo pip3 install -e 
千万不要用
pip install -e.[all]
,这又是一个坑,因为gym的依赖是mujoco150,你一运行就会删除mujoco200而且会报错。所以就先安装简易版本。
    
    
    2.程序验证
   
    
     完整测试代码如下:
    
   
cd ~/gym
python
import gym
env = gym.make('Hero-ram-v0')
for i_episode in range(20):
    observation = env.reset()
    for t in range(100):
        env.render()
        print(observation)
        action = env.action_space.sample()
        observation, reward, done, info = env.step(action)
        if done:
            print("Episode finished after {} timesteps".format(t+1))
            break
会报错,因为缺少一些部件,这里缺什么ctrl+D退出python环境运行
sudo pip3.6 install -e.[缺少的部件]
报错会提示下载的。然后重新运行测试代码,成功!后续机械臂可能也会缺部件,也是缺啥就补啥吧。
    有如下输出说明安装成功:
    
     
   
    
    
    总结
   
   
    以上就是今天要讲的内容,本文仅仅简单介绍了Ubuntu16.04下mujoco环境的搭建,mujoco的使用以及机器人(臂)可视化建模并未在本文中体现。通过本博客,可以发现环境搭建一个最大的问题就是版本不匹配。未来的工作计划是结合自己的研究内容和项目进展,进行该系列的博客撰写。
   
  
 
