会员登录 注册新帐号电脑店行业门户 | U盘启动工具

首页

 电脑店主页 > 产品技术 > 服务器储存 > 服务器 > HPC > 联想Scott Tease:商业化HPC的四大关键要素

联想Scott Tease:商业化HPC的四大关键要素

发布时间:2016-11-15 09:16      点击:     关注官方微博:

摘要:联想近年来不论是在HPC TOP500榜中,还是在中国高性能计算机TOP100排行榜,都在份额项目中取得榜首或中国第一、世界第二的好成绩,与联想的HPC商业化策略密切相关。

联想特别专注要做的,就是让HPC从研究性应用为主,拓展到更多的商业化应用领域。”联想数据中心业务集团全球高性能计算高级总监Scott Tease在“2016年全国高性能计算学术年会”上对笔者表示。

应该说,联想近年来不论是在HPC TOP500榜中,还是在中国高性能计算机TOP100排行榜,都在份额项目中取得榜首或中国第一、世界第二的好成绩,与联想的HPC商业化策略密切相关。

实际上,在10月28日举行的“2016年全国高性能计算学术年会”上,联想在《2016年中国高性能计算机TOP100排行榜》中以34套的份额荣膺榜首,已经是联想连续第三年位居中国高性能计算TOP100份额榜首。

在Scott Tease看来,如果要让HPC商用化,首先就要降低使用的复杂度,易于使用;其次,HPC不光是满足大型企业需求,同时还要为更多中型、小型客户提供新的选择,这就需要HPC不仅是大而贵的,同时也有小而美的,满足更多用户的需求。

 

高性能计算普及化时代来临

众所周知,HPC是高性能计算的简称——通常HPC被应用到需要大量计算的应用中,比如气象预报的模拟计算,比如飞行模拟计算,比如生命科学的基因分析,比如基础研究的大量测试计算和推导。传统上,这些计算应用所涉及的领域相对较窄,因为大多数的应用,并不需要一直保持超高的计算能力。

不过,随着云计算、物联网、大数据和移动互联的普及,数据的采集呈爆发式增长,这就使得HPC有机会进入到更多行业领域和业务领域——因为数据采集本身并不能带来价值,从数据中挖掘价值的关键,在于计算模型和分析结果,这就对IT系统的硬件性能有了较高要求。

举个例子,传统的银行每一笔账单的交易,是以数据形式读写到交易型数据库之中的,其对计算量的要求并不高,但是对高并发的数据读写、存储和系统的安全稳定有着极高的要求——在交易高并发的时候,数据库不能出现任何错误。而银行同时还需要一套系统,针对交易中出现的异常行为进行辨别,反金融欺诈,这时候就需要把所有相关的交易数据抽取到数据仓库中,启用特别搭建的数据模型,进行计算分析,来识别欺诈行为——往往数据仓库对IT硬件系统的计算性能要求较高。

事实上,数据仓库的另一大应用是BI分析报表,往往一家大型企业在月底关帐之后进行结算,直至各项分析报表出具结果,都是对IT系统计算性能的一次考验。而这样的考验,在大数据分析逐步应用到社交舆情分析、用户画像、物联网、工业4.0、智慧城市等各个领域之后,传统的交易型数据库同时也就有了分析型数据库的属性,甚至数据库和数据仓库合二为一,例如SAP的HANA数据库,其对计算性能的要求从延迟变成了实时,实际上也会催化HPC的应用范围急剧扩大。

 

要素一:易用

很明显,面对越来越广泛的市场需求,HPC确实需要降低使用的复杂度,易于使用;同时还应该推出更多档次的产品和解决方案,以满足各种层次用户的应用需求。

为此,联想早在去年就推出了拥有自主知识产权的HPC一站式解决方案——LiCO是一个开放的HPC集群,可实现集群和作业模板定制化。它集成了计算软件、计算库、调度软件、监控软件、报警软件和分布式文件软件等,可帮助快速部署HPC集群;提供了易用的web页面,大大降低了使用门槛,管理员可通过web监控及管理集群,普通用户则可通过web模板提交作业,在web页面查看作业执行状态和执行结果。

毫无疑问,LiCO在推进HPC技术创新并提供先进、易用、开放的HPC平台方面起着关键作用。实际上,LiCO适用于联想的各种刀片和机架服务器,支持各类高性能网络,比如10GB网络或Infiniband网络等。据Scott Tease透露,今年,联想已经把LiCO进一步优化更新为2.0版,并且即将面向全球发布。

“现在很多HPC的应用还是处在命令行就是特别技术层面,我们希望未来它会出现像Windows那样简单易于操作的应用层面的界面。所以联想推出了基于Open HPC的软件堆栈LiCO。”Scott Tease表示,“在这个软件堆栈上以开源软件为核心,加载了非常简单的易于操作的同行界面,正因为这种简单易操作的同行界面使得操作非常简单易用,而且成本非常低,所以这样就能大大的推进它的商业化进程。”

 

要素二:节能

另外一个方面,由于高性能计算集群的密度不断增加,使得高性能计算集群能源成本急剧上升——内置普通服务器的机柜能耗都达到30kw——这时候,高性能计算集群的冷却系统变得至关重要。

在Scott Tease看来,如何有效解决能耗问题,也是HPC未来商业化普及的一个关键点。一般情况下,数据中心不是采用空调空气制冷,就是采用低温水冷。然而,空气制冷的能耗极高,因此有部分数据中心选择建设在寒冷的北方,比如中国电信的内蒙古数据中心,但这些地方相对偏远,带宽和专网成本极高,也不适宜商业化普及。

而普通的数据中心水冷是采用16摄氏度入水,经过数据中心服务器散热升温后,排水温度大约在20度左右,很难再做其它用途。为此,联想位于德国莱布尼茨的实验室首创45℃温水水冷技术,经过系统后排出的水能够达到70多度,可以实现水的二次利用,有效降低数据中心PUE值。

根据测算,联想温水冷却技术在降低能耗方面,PUE可达1:1,能效比风冷系统降低40%,比传统水冷技术降低20%。以莱布尼茨实验室自身的SuperMUC为例,其作为首个采用温水水冷技术的HPC集群,整机效能高达90.95%,5年来整体电费下降37%。

事实上,水冷技术在欧洲市场已经有了非常常熟的落地实践,联想可以把欧洲的成功经验和模式复制到中国市场,帮助中国市场不仅是大型客户,还有中小型客户获得更好的能耗比,助力HPC的普及推广。

 

要素三:行业专业

由于HPC原本应用领域相对窄众而高端,因此要推广HPC,除了简单易用和低能耗之外,还有一个关键要素就是了解行业的应用需求,帮助行业客户解决实际应用难题。

“其实HPC传统的应用领域已经相当广泛,比如计算机辅助的工程设计、生命科学、生物医药,医药研发、化工领域、石油天然气领域、金融行业、气象学领域。”Scott Tease解释说,“每一个领域,随着技术的进步、人工智能的普及,需要HPC的地方越来越多。而联想恰好从IBM继承了很多非常优秀的人才和专业的技能,包括特别深入的垂直行业经验,无论是在石油天然气领域、生命科学领域、计算机辅助的工程设计领域等,这些方面本来就是对HPC这种高性能计算有大量需求的行业,我们有着非常艰深的垂直行业的积累。”

在Scott Tease看来,联想所拥有的这些行业专家,可以从行业应用代码层与硬件性能调优方面入手,大幅提升整体系统性能,从而形成行业专属的解决方案。

 

要素四:开放

“除了行业深入、降低能耗、方便易用这几方面之外,还有一个重要环节就是灵活的模块化系统,能够帮助用户降低成本。”Scott Tease认为,在统一的平台架构之上,联想可以装载不同的技术,包括不同的处理器,无论是ARM、英特尔、GPU存储还是通过空气进行冷却,通过温水进行冷却等等,这些技术都可以加载在统一的平台上,这种模块化的能力,为客户带来了很多好处,而不是像有些友商那样,采用不同的系统,增加客户的总体拥有成本。

“开放的心态加上创新,可以引入我们迈向成功。”在Scott Tease看来,联想的开放体现在联想对合作伙伴的选择是开放的,对于IP也是开放的,同时通过模块化的设计,帮助用户降低成本。

实际上,联想是英特尔最大的客户,是三星最大的客户,也是Seagate最大的客户——模块化和开放的全球供应链确保联想拥有非常好的成本优势。而这,显然也是HPC商业化普及的关键要素。

 

Scott Tease举了一个例子:以前硬件系统和软件系统都是高度专有的,都是自己开发的,有大量被捆绑、锁定在原有的平台上;而现在无论是中国移动、中国联通还是中国电信,他们都认为开放式的平台是未来的发展趋势,在这样的开放平台上,电信运营商们可以选择各种开源软件和模块化的部件进行集成,而联想的OPAL开放平台,就满足了客户的新需求。

★★★ 电脑店行业门户(www.diannaodian.com)独家文章,欢迎大家转载 ★★★

    上一篇:联想HPC为何能陪宇航员上天入地?
    下一篇:没有了