站长网 云计算 零基础搭建AI计算平台,改善计算效率50%

零基础搭建AI计算平台,改善计算效率50%

面对上述问题,各企业开始着手构建基于公有云和容器的AI计算平台,基于公有云的容器平台,能给客户带来什么样的好处呢? 更快速的获取算力资源 面对AI计算需要的超大规模算力,自建IDC扩容周期长、一次性投入大,后期维护成本高,采用公有云,可以即申请即用,快速

面对上述问题,各企业开始着手构建基于公有云和容器的AI计算平台,基于公有云的容器平台,能给客户带来什么样的好处呢?

 

更快速的获取算力资源

 

面对AI计算需要的超大规模算力,自建IDC扩容周期长、一次性投入大,后期维护成本高,采用公有云,可以即申请即用,快速补充企业IDC算力的不足,同时具备更低的使用成本、无需关注基础设施维护、避免资源闲置造成浪费等优势,成为了客户扩充算力的最佳选择。

 

降低日常使用和运维难度

 

用户搭建深度学习训练环境,需要准备带GPU的机器、安装Python、TensorFlow、GPU驱动等,如果要从开发环境到测试环境,再从测试环境到生成环境,涉及环境迁移过程中需要花很大精力来保证环境的一致性。

 

容器带来的标准化打包能力可以提供了绝佳的解决方案,将相关软件一并打包到镜像中,一次构建,即可在不同平台上运行,极大降低安装、部署的复杂度;同时各容器间相互隔离,可实现多训练框架并存,而且每一个框架都可以独立进行升级而不会影响其他业务,降低的日常运维的难度,让客户可以将更多的精力集中在AI训练上。

 

但是,我们在与用户交流过程中发现,用户虽然认可公有云+容器的模式,但是在公有云上自建一套容器化的AI计算平台,对部分用户仍存在较大的技术门槛,尤其是那些尚未接触过容器的用户。华为云就此推出了面向AI计算场景的容器服务——AI容器,并于2018年在华为全联接大会发布,今年我们对AI容器进行了升级,在性能、易用性、可运维等方面都有了很大的提升。

 

华为云AI容器:更易使用和运维,提升AI计算效率50%

 

开箱即用 免除基础设施运维

 

AI容器采用华为云容器实例(CCI)作为基础设施层,得益于CCI的Serverless架构,用户完全无需关心主机的创建、管理、运维,而只需要在使用时申请所需要的算力资源即可(算力类型、CPU核数、内存量),省去了基础设施的日常运维工作,用户可以更加专注于AI计算本身。

 

高效调度,快速获取海量算力

 

AI容器基于全新的Volcano平台进行任务调度管理,Volcano是华为云高性能批量计算平台,具有更高的调度性能,最高可达1000容器/秒,将算力获取的效率提升近10倍。

 

同时,有了Volcano的加持,AI容器还可以基于拓扑和资源亲和进行任务调度,根据策略将关联任务调度到同一物理节点或二层网络内,极大的提升了AI训练过程中任务间通信及数据交互的效率。

本文来自网络,不代表站长网立场,转载请注明出处:https://www.tzzz.com.cn/html/yun/2021/0605/9536.html

作者: dawei

【声明】:站长网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。
联系我们

联系我们

0577-28828765

在线咨询: QQ交谈

邮箱: xwei067@foxmail.com

工作时间:周一至周五,9:00-17:30,节假日休息

返回顶部