TensorFlow
TensorFlow™是一个基于数据流编程(dataflow programming)的符号数学系统,被广泛应用于各类机器学习(machine learning)算法的编程实现,其前身是谷歌的神经网络算法库DistBelief。
GPU版本对显卡驱动的要求请查看GPU支持;
由于TensorFlow的更新较快,可以通过conda来管理TensorFlow环境。
1. 安装
Step 1. 导入conda环境;
在自己的HOME目录安装Conda,具体查看conda安装;
Step 2. 创建虚拟环境并安装TensorFlow GPU版本,这里安装的是TensorFlow GPU 2.2.0版本;
conda create -n tf-gpu-2.2.0 tensorflow-gpu==2.2.0 -y
Step 3. 进入和退出创建好的虚拟环境;
source activate tf-gpu-2.2.0
conda deactivate
2. 提交作业
Step 1.创建工作目录并进入;
mkdir tensorflowJob1
cd tensorflowJob1
Step 2. 将运行tensorflow需要的相关文件上传到该文件夹下,这里创建一个test.py
程序,用于获取gpu_device_name
;
import tensorflow as tf
gpu_device_name = tf.test.gpu_device_name()
print(gpu_device_name)
Step 3. 在该文件夹下编写作业脚本,命名为tensorflowJob1.sh,脚本内容如下;
#!/bin/bash
#SBATCH -o job.%j.out
#SBATCH --partition=GPU
#SBATCH -J tensorflow_job_1
#SBATCH -N 1
#SBATCH --ntasks-per-node=2
#SBATCH --gres=gpu:1
#SBATCH --qos=low
source activate tf-gpu-2.2.0
python test.py
Step 4. 提交作业;
sbatch tensorflowJob1.sh