Skip to content

集群硬件综述

1.1 概述

本套集群系统共有八台高性能主机组成,其中一台为登录节点(无GPU),其余七台为计算节点。计算节点的主要计算设备为 GeForce GTX TITAN X(compute02/03),GeForce RTX 3090(compute01/04/05),Tesla P100(compute06/07),其中 GeForce GTX TITAN XGeForce RTX 3090 单精度浮点运算能力强,适合进行适合于做大规模的可视化渲染,机器学习模型训练等计算,Tesla P100 双精度浮点运算能力强,适合用于科学计算等双精度浮点运算应用。用户可以根据需求选择不同的设备运行作业,达到最好的加速效果。

1.2 硬件配置

节点名称CPU内存GPU
loginIntel(R) Xeon(R) Gold 5218R CPU @ 2.10Hz144GNone
compute01Intel(R) Xeon(R) Gold 5218R CPU @ 2.10Hz144GGeForce RTX 3090 × 2
compute02Intel(R) Xeon(R) CPU E5-2620 v2 @ 2.10Hz32GGeForce GTX TITAN X × 4
compute03Intel(R) Xeon(R) CPU E5-2620 v2 @ 2.10Hz144GGeForce GTX TITAN X × 4
compute04Intel(R) Xeon(R) CPU E5-2620 v2 @ 2.10Hz144GGeForce RTX 3090 × 2
compute05Intel(R) Xeon(R) CPU E5-2620 v2 @ 2.10Hz144GGeForce RTX 3090 × 2
compute06Intel(R) Xeon(R) CPU E5-2620 v2 @ 2.10Hz144GTesla P100 × 2
compute07Intel(R) Xeon(R) CPU E5-2620 v2 @ 2.10Hz144GTesla P100 × 2

1.3 网络配置

集群所有计算节点的网络出口均为login节点,也就是说,只要login通过netlogin登录,整个集群均可访问互联网。
由于上述配置,请用户在访问完毕互联网后,及时使用netlogin logout命令退出登录,否则,若登录的运营商为"校园网",将消耗大量流量。

GPU性能特点

  • GeForce RTX 3090: 适合机器学习模型训练、深度学习等单精度计算密集型任务
  • GeForce GTX TITAN X: 适合大规模可视化渲染、图形处理等应用
  • Tesla P100: 适合科学计算、数值模拟等双精度浮点运算应用

用户可根据具体计算需求选择合适的GPU节点,以获得最佳的计算性能。