跳转至

Pytorch

PyTorch是一个开源的Python机器学习库,基于Torch,用于自然语言处理等应用程序。

安装Pytorch

在安装前确保已经安装或导入集群预装的conda环境

创建虚拟环境并安装pytorch,具体安装指令参考官网,可能会存在变化,如下图所示,选定语言,需要的cuda版本后会生成安装指令:

pytorch

# 创建conda环境,命名为pytorch
conda create -n pytorch
# 进入创建好的环境
source activate pytorch
# 执行安装指令
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

提交作业

第一步: 创建工作目录并进入;

mkdir pytorchJob1
cd pytorchJob1

第二步: 将运行pytorch需要的相关文件上传到该文件夹下,这里创建一个简单的test.py程序,用于检测GPU是否可用;

import torch
print(torch.cuda.is_available())
torch.zeros(1).cuda()

第三步: 在该文件夹下编写作业脚本,如脚本名为job1.sh,脚本内容如下,GPU分区在不同集群命可能不同;

#!/bin/bash
#SBATCH -o job.%j.out
#SBATCH --partition=GPU
#SBATCH -J pytorch_job_1
#SBATCH -N 1
#SBATCH --ntasks-per-node=2
#SBATCH --gres=gpu:1
#SBATCH --qos=low

source activate pytorch
python test.py

第四步: 提交作业;

sbatch job1.sh