伴随 20 世纪 70 年代初第一代向量计算机的出现,超级计算概念兴起。一直以来,超级计算也与 ” 大型 “、” 高速 “、” 昂贵 “、” 复杂 ” 等一系列形容词包裹,对于普通企业和个人而言如同远在云端。
事实上,近几年随着大数据、人工智能技术的深入发展和广泛应用,大数据和人工智能呈现出与超算日趋融合的趋势。一方面,科学研究人员为了不断提高计算精度采用的研究数据规模越来越大,大数据驱动存储跟算力融合。另一方面,人工智能应用全面爆发,而人工智能训练阶段需要进行大量的浮点运算,这也要求企业拥有足够的算力支撑。
算力已经成为重要生产力。
现在,青云科技发布的全新弹性高性能计算平台—— QingCloud EHPC ,期望借此让超算算力走下 ” 神坛 “,深度赋能数字新基建。
QingCloud EHPC 是基于青云公有云 IaaS、PaaS 层基础架构,联合国家级超算中心,构建数据和算力相融合的资源池,为生命科学、海洋气象、地理测绘等基础科研领域,以及前沿科学与大数据、人工智能技术结合形成的新兴场景,提供从上云计算到结果产出的全流程 SaaS 化计算服务。
QingCloud EHPC 高性能计算平台有哪些能力?
在青云云平台 & 服务部高级总监陈海泉看来,高性能计算通过采用大量服务器并行地对某一个任务执行运算,来解决工程和科学上的问题。它的用途很多,最核心的是用来模拟世界万物。宏观上,可以用卫星图像、遥感数据、气象数据利用高性能计算来模拟地球、海洋和气侯;微观上,能模拟分子原子来了解生命的原理,使药物的研发更快速、更精确。
QingCloud EHPC 产品正是基于青云公有云 IaaS 平台、PaaS 平台的云基础设施,既能为用户提供公有云上的超算服务,又能为有需求的用户提供专属云和混合云等多种形态的产品。应对生命科学、CAE 仿真、海洋气象等相关领域的高性能计算需求,提供丰富多样的使用模式,适配多种应用场景。通过统一管理的平台,使工程师、研究人员可以突破本地的 HPC 基础设施限制,快速开始云上创新。
据悉,QingCloud EHPC 拥有行业领先的高配置资源,支持 CPU 计算、GPU 计算、裸金属计算。其中,CPU 计算采用行业领先的 Intel 6258R 型号 CPU,主频 2.7GHz,单核心峰值 86.4Gflops,单节点峰值 4.823Tflops;GPU 计算采用 Intel 8358 处理器,配置 8 个 NVIDIA A100 GPU 卡。
QingCloud EHPC 采用专用 IB 网络,CPU 服务器内网带宽达到 100Gbps,GPU 服务器内网 带宽达到 200Gbps,带来更高吞吐、更低延迟,大大解决了高性能计算领域上的数据量大传输的瓶颈。
除了提供强劲的算力外,QingCloud EHPC 提供 300 多款软件,覆盖分子生物学、新能源、新材料、大气海洋环境、地球、物理等诸多领域,用户可以即来即用。
青云 QingCloud EHPC 产品经理苗慧介绍,QingCloud EHPC 提供了一种快捷、弹性、安全以及互通的公共云高性能计算服务,它能支持计算资源的弹性定制,降低成本,提高资源利用率,具有极大的灵活性。
具体而言,QingCloud EHPC 具备节点动态调整能力,弹性伸缩、可扩展,用户按需选择计算实例类型,无需排期,即买即用。
同时,QingCloud EHPC 用户只管使用,无需关注 EHPC 集群本身的设备运维、网络安全、机房故障等一系列运维事件。借助平台提供的运维管理模块,就能实时查看运行状态、消费详情、业务执行进展等,省心又放心。
费用方面,QingCloud EHPC 既可按传统的核时方式,又可以按使用时长支付资源费用,同时内置软件平台,可帮用户节省大量设备投入和软件采购许可费用。
另外,保障数据安全性方面,QingCloud EHPC 提供多租户隔离机制,可大大提高数据安全性和高可用性,有效消除安全隐患。
苗慧表示,科研院校、研发类企业,包括汽车制造、新能源 / 新材料、芯片制造等行业将是 QingCloud EHPC 首批重点关注拓展的行业。
如何使用 QingCloud EHPC?
那么用户要如何才能使用到 QingCloud EHPC 这项服务呢?其实步骤也很简单。
QingCloudEHPC 提供两种集群。第一种形式是青云作为平台方,提供 400 多个节点的共享队列,采用传统超算的形式,用户进来提交作业,按照核心数和作业运行时间进行计费。第二种形式是用户购买专属的 EHPC 集群,支持 root 权限,可以对集群进行最高权限的配置,可以采用 EHPC 集群的形式,既构造自己专属的计算节点,这一形式根据计算节点的配置和计算节点的使用时长进行计费。
QingCloudEHPC 的集群创建过程分为三个步骤:
第一步,准备网络。点击新建网络,为了保证集群内所有节点、存储、共享软件仓库在一个私有网络内,因此需要准备一个私有网络。
第二步,创建集群的配置,需要对登录节点、管控节点、计算节点进行配置,进行数量上的确定。
第三步,点击确定。
如此,集群将在 5 分钟内创建完成,用户即可提交作业。
提交作业也分为三步:
首先,选择软件,勾选青云内置的一些软件版本号。
其次,指定作业执行命令。
最后,点击确定,直接运行。
这样最终系统将根据用户指定的作业执行命令文件创建作业输出目录,每一个作业都会自动创建一个作业输出目录,相关输出文件都会输出到目录中,用户可以进行结果文件查看、日志文件查看、过程文件查看。