未名生科一号
型号:联想深腾X8810;试运行日期:2018年06月22日;正式上线日期:2018年10月26日;CPU计算节点LINPACK测试效率:70.17%(128个节点)。
一、硬件环境
节点配置
节点类别 | 型号 | 主要规格 | 节点数 |
CPU 节 点 | Lenovo SD530 |
2*Intel Xeon Gold 6142,128G,双口万兆 | 129 |
GPU 节 点 | Lenovo XS1500 |
2*Intel Xeon E5-2690 V4,256G,4* NVIDIA Tesla V100,双口千兆 | 7 |
合计 | CPU节点配120G SSD、GPU节点配1920G SSD、并均配有Intel OPA 100 Series Single-port PCIe 3.0 x16 HFA | 136 | |
登 录 节 点 | Lenovo SR650 |
2*Intel Xeno Gold 6142,256G | 1 |
管 理 节 点 | Lenovo SR630 |
2*Intel Xeno Silver 4110,256G | 2 |
存储节点 1 | Lenovo SR650 |
2*Intel Xeon Silver 4114, 128G, 24*3.84TB SSD | 1 |
存储节点 2 | Lenovo X3650 M5 |
2*Intel Xeon E5-2690 v4,256G, 600GB SSD | 10 |
2. 节点性能
节点类别 | 单核主频 | 单节点核心数 | 单周期指令执行数 | 节点数 | 理论峰值/GFlops | |
CPU节点 | 2.6GHz | 32 | 32 | 129 | 343449.6 | |
GPU/CPU | 2.6GHz | 28 | 16 | 7 | 8153.6 | |
GPU/GPU | NA | 640Tensor core+ 5120 cuda core |
NA | 7 | 218400 | |
登录节点 | 2.6GHz | 32 | 32 | 1 | 2662.4 | |
管理节点 | 2.1GHz | 16 | 32 | 2 | 2150.4 | |
存储节点 1 | 2.2GHz | 20 | 32 | 1 | 1408 | |
存储节点 2 | 2.6GHz | 28 | 16 | 10 | 11648 | |
合计 | 150 | 587872 | ||||
计算节点:136个、登入/管理/存储节点:14个、CPU核心:4688个、GPU卡:28块 |
3. 存储配置
型号 | 主要规格 | 套数 |
联想 DSS G240 |
2*X3650M5 3*D3284(84*6TB NL SAS) 1*D3284(82*6TB NL SAS+2*400GB SSD) |
5 |
存储容量合计:6864.8 TB,聚合读带宽:120GB/s,聚合写带宽:100GB/s |
二、分区设置
分区名 | 单节点规格 | 数量 |
---|---|---|
C032M0128G | 32核、128G内存(申请一核心,可用大约4G内存) | 129 |
GPU | 28核,256G内存,4块GPU卡 </br> 申请GPU资源时,请以1块卡配7个CPU核心的方式进行,避免额外费用 | 5 |
具体可用分区通过以下指令查询,以下查询结果为可用分区,以及分区中允许的QOS:
sacctmgr show ass user=`whoami` format=partition%15,qos%15
三、QOS设置
QOS | 内容 |
---|---|
low | 优先级:100 \ 最大运行时长:5天 \ 最大可提交作业:100 \ 最大可用核心数 :6400 |
normal | 优先级:500 \ 最大运行时长:5天 \ 最大可提交作业:100 \ 最大可用核心数 :6400 |
high | 优先级:1000 \ 最大运行时长:5天 \ 最大可提交作业:100 \ 最大可用核心数 :6400 |
QOS具体情况可通过以下指令查询:
sacctmgr show qos format=name,Priority,MaxWall,MaxJobsPU,MaxTRESPA
作业优先级越高,作业越优先进行计算。