超算使用简介

实验中心推出的超算平台采用了高性能的并行计算模式使用十几台高性能服务器同时运行同时使用多种计算资源解决计算问题用多个处理器来协同求解同一问题大大提高了大型复杂应用程序的计算速度。集群平台中的计算节点采用了高性能的Intel处理器,为CPU配备了较高的峰值带宽,降低内存延迟。每个计算节点还配备了Infiniband HCA卡,实现高效的网络互联,使得所有计算节点可以保持点对点全线速通信带宽。在文件存储方面采用了并行文件存储技术,由单独的IO节点和光纤存储系统组成,充分提高了存储带宽和系统读写性能。

超算平台采用高性能计算集群的架构,通过100G高速计算网络对28台高性能CPU服务器和38A800GPU服务器进行统一管理和调度。

超算平台现有31台服务器,1224CPU核、24A800GPU。提供从多个作业在多台服务器上运行的多任务计算模式、多台服务器同时计算一个任务的并行计算模式,到多机多卡的训练模式,再到CPUGPU(单机单卡,单机多卡)单实例环境模式。

超算平台提供两种使用方式:集群方式,通过slurm调度器进行提交作业计算,已部署alpacaglsllamamatlabcudaanaconda等应用;实例方式,用户通过平台创建一个自己独占的软件环境进行交互操作,已部署RstataspssjupyterlabmatlabTensorFlowPytorchcentosUbuntuwindows等。为降低用户使用门槛,平台提供了web作业模板、web控制台、桌面可视化、web交互和ssh端口远程访问等交互方式来方便用户的使用。

  1. 申请开通

  我校超算平台目前对统招的博士硕士生及教职工开放,用户须首先登录“上海财经大学教学实验软件平台”(https://software.sufe.edu.cn)进行申请,如下图所示。

提交完成后,每个工作日下午5点左右会开通。

  1. 登录使用

  1. 登录平台

       开通完成之后,您就可以登录系统进行使用了。 使用浏览器(只支持ChromeFirefox较新版本不支持IE等其他浏览器)地址栏中输入平台登录地址https://chaosuan.sufe.edu.cn/,使用上海财经大学统一身份认证(NetID)登陆。

  1. 申请资源

      点击顶部菜单栏“➕申请资源”按钮,进入申请资源页面,然后点击下方具体应用的创建实例按钮直接添加至我的实例中。

  1. 启动实例

      点击顶部菜单栏“我的资源”,然后点击左侧菜单栏"实例", 可以在工作窗口中看到自己所能使用的应用实例。点击实例中的启动按钮启动相关应用(如果平台硬件物理资源不足时,会发生排队现象,该实例状态会显示“分配中”)

  1. 传输数据

      点击每个实例右边的“实例数据”图标按钮,进入数据传输界面,根据需要来传输相关的文件。


  超算平台详细具体的使用说明可通过点击超算平台右上角的“帮助中心”来获取。

版权所有:上海财经大学实验中心