Pytorch
PyTorch是一个开源的Python机器学习库,基于Torch,用于自然语言处理等应用程序。
安装Pytorch
在安装前确保已经安装或导入集群预装的conda环境
创建虚拟环境并安装pytorch,具体安装指令参考官网,可能会存在变化,如下图所示,选定语言,需要的cuda版本后会生成安装指令:
# 创建conda环境,命名为pytorch
conda create -n pytorch
# 进入创建好的环境
source activate pytorch
# 执行安装指令
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
提交作业
第一步: 创建工作目录并进入;
第二步: 将运行pytorch需要的相关文件上传到该文件夹下,这里创建一个简单的test.py
程序,用于检测GPU是否可用;
第三步: 在该文件夹下编写作业脚本,如脚本名为job1.sh,脚本内容如下,GPU分区在不同集群命可能不同;
#!/bin/bash
#SBATCH -o job.%j.out
#SBATCH --partition=GPU
#SBATCH -J pytorch_job_1
#SBATCH -N 1
#SBATCH --ntasks-per-node=2
#SBATCH --gres=gpu:1
#SBATCH --qos=low
source activate pytorch
python test.py
第四步: 提交作业;