【消費(fèi)電子實(shí)驗(yàn)室-2019/6/24】最近這幾天,有許多美國媒體幸災(zāi)樂禍,認(rèn)為中國超算行業(yè)將受到致命打擊,離開了美國的CPU,中國將造不出超算。事實(shí)是這樣的嗎?這個禁令對我國的超算行業(yè)有什么影響? 據(jù)多家媒體報(bào)道,在當(dāng)?shù)貢r間6月21日,美國商務(wù)部以國家安全為由,再次將中國的5家實(shí)體列入進(jìn)出口管制的實(shí)體清單,禁止它們從美國的供應(yīng)商采購零部件,相關(guān)決定于6月24日生效。這五家實(shí)體與中國超算行業(yè)的“三巨頭”中的兩位相關(guān),涉及到“曙光”和“神威”兩款超算。這五家實(shí)體中的江南計(jì)算技術(shù)研究所就是“神威”超算的研發(fā)制造單位。而其他四家實(shí)體,中科曙光,天津海光(Higon)、成都海光集成電路、成都海光微電子技術(shù)全都與“曙光”系列超算有關(guān)。 最近這幾天,有許多美國媒體幸災(zāi)樂禍,認(rèn)為中國超算行業(yè)將受到致命打擊,離開了美國的CPU,中國將造不出超算。事實(shí)是這樣的嗎?這個禁令對我國的超算行業(yè)有什么影響?本文將對這個問題進(jìn)行詳細(xì)分析。 首先,美國為什么要再次對我國超算企業(yè)進(jìn)行制裁? 實(shí)際上,早在2015年初,美國商務(wù)部就將中國的四大超算中心列入了禁運(yùn)清單。這源于美國長久以來的焦慮:在大約40年中,中國的超算行業(yè)從完全進(jìn)口美國產(chǎn)品,到購買美國的CPU自己制造超算,再到使用自己的CPU和加速器制造超算; 從只有幾臺超算,在全世界超算市場里不值一提,到擁有超算的數(shù)量全球第一,大大超越美國;從擁有的超算性能低下排不上號,到稱霸全球最快超算排行榜第一名多年;中國超算行業(yè)走出了一條完美的逆襲之路。 世界超算組織top500.org每半年推出一次全球最快的500臺超算排行榜。今年6月剛剛推出了最新的榜單。全球最快的500臺超算數(shù)量按國家的分布圖如下: ▲數(shù)據(jù)來源于top500.rog,由筆者整理 ▲數(shù)據(jù)來源于top500.rog,由筆者整理 TOP500榜單中,中國超算的數(shù)量達(dá)到了219臺,占全球的44%,世界第一;美國以116臺的數(shù)量占全球的23%,比中國落后甚多。 要知道,在僅僅一年前的2018年6月,中國在TOP500中的超算總數(shù)還是206臺,美國還是124臺。這一年中,中國又有了進(jìn)步,美國又在退步。從趨勢來看,中國的優(yōu)勢會越來越大。 由于超算在軍事,科研和經(jīng)濟(jì)中的巨大作用,美國心里的焦慮是可以理解的。他們急于抑制住中國的發(fā)展勢頭,于是就把商業(yè)誠信和公平貿(mào)易原則仍進(jìn)下水道,祭出了禁運(yùn)大法。那么,這次的禁運(yùn)措施對中國超算行業(yè)有什么影響? 對中國正在研制中的三臺E級超算影響不大 在2018年夏天,美國的超算SUMMIT終于排上了TOP500的第一名,把霸榜多年的中國“太湖之光”擠到了第二名,它比“太湖之光”快60%左右;接著,美國的另一臺超算Sierra投入使用,它以微弱的優(yōu)勢把“太湖之光”擠到了第三位。 美國的媒體興奮起來,一改多年的沉默,開始吹噓下一代E級超算的威力。所謂E級超算,是指每秒鐘運(yùn)算一百億億次的超級計(jì)算機(jī),比SUMMIT還好快許多倍。美國的E級超算計(jì)劃在2021年左右投入使用,而中國為E級超算準(zhǔn)備了三個方案,全部使用國產(chǎn)CPU和加速器,也計(jì)劃在2020到2021年期間陸續(xù)投入使用。 這里需要介紹一下加速器,超算的核心部件不止是CPU,由于超算做的是密集的科學(xué)計(jì)算工作,CPU執(zhí)行這樣的計(jì)算任務(wù)并不是效率最高的,擁有眾多運(yùn)算單元的加速器處理器的效率更高,比較典型的加速器芯片就是Nvidia公司的通用型GPU,以及英特爾公司的至強(qiáng)Xeon Phi處理器。 最近幾年出現(xiàn)的超算有一個趨勢,就是使用一顆CPU帶多顆加速器的架構(gòu),計(jì)算任務(wù)主要由加速器芯片完成,CPU主要做協(xié)調(diào),通訊和分配任務(wù)的工作。 那么,美國的這次禁運(yùn)對我們的E級超算有什么影響呢?讓我們來仔細(xì)看看。 我國為下一代E級超算準(zhǔn)備的三套方案,全都使用國產(chǎn)CPU和加速器芯片: 天河三號E級超算: 2018年5月19日,國家超算天津中心展示了天河三號原型機(jī),在2018年底投入使用。天河三號的全配置主機(jī)計(jì)劃在2020年投入使用,性能計(jì)劃為1EFlops。 天河三號將使用國產(chǎn)飛騰FT2000plus或者后續(xù)型號的CPU,以及國防科技大學(xué)的Matrix2000plus或者后續(xù)型號的加速器芯片。 飛騰CPU采用ARM架構(gòu)。 Matrix2000加速芯片是國防科大的通用DSP芯片,GPDSP,就像英偉達(dá)公司通用GPU(GPGPU)那樣,DSP(數(shù)字信號處理器)也擁有大量的運(yùn)算單元。 神威E級超算: 神威系列超算是由江南計(jì)算機(jī)研究所研制的。2018年7月神威E級原型機(jī)落戶于國家超算濟(jì)南中心,需要三年左右的研發(fā)時間,將在2021年正式投入使用。神威的CPU肯定是申威系列的最新型號,加速器可能也會采用Matrix2000plus或者其后續(xù)型號。 申威系列CPU脫胎于DEC Alpha處理器架構(gòu)。 曙光E級超算: 中科曙光主要使用X86架構(gòu)的CPU。在最新的TOP500榜單里,共有曙光公司制造的63臺超算。除了一臺以外,其它62臺全部使用英特爾的至強(qiáng)CPU,有些超算還使用了英偉達(dá)的Tesla加速器芯片。 猛的一看,似乎這次禁運(yùn)對曙光公司是致命的打擊。因?yàn)橛⑻貭柡陀ミ_(dá)的芯片以后都買不到了。但是,曙光公司早就有了全國產(chǎn)化布局。秘密就在這62臺之外的那一臺超算上。 CPU: 這臺型號為TC8600的超算是2018年投入使用的,它的CPU采用的是天津海光公司的Hygon Dhyana處理器,32核,2Ghz頻率。天津海光公司在2016年初得到了美國AMD公司的第一代ZEN架構(gòu)的永久授權(quán),起點(diǎn)相當(dāng)高,要知道AMD公司在2018年才推出第二代ZEN2的架構(gòu)。海光3000系列CPU使用的是x86通用架構(gòu),完全支持Windows10 Pro, Windows Server2019, Linux Centos 7.x等主流操作系統(tǒng),而且還有類似AMD EPYC的服務(wù)器版,最多32核64線程,基礎(chǔ)頻率2.0GHz,加速頻率可達(dá)3.0GHz,而且涵蓋了從4核到32核在內(nèi)的多個產(chǎn)品線。 在這次禁運(yùn)公布后,海光公司無法再得到AMD新的產(chǎn)品架構(gòu)授權(quán),但這并不影響已經(jīng)得到的授權(quán)。海光公司已經(jīng)組建了超過500人的研發(fā)團(tuán)隊(duì),有能力在已經(jīng)得到的授權(quán)的基礎(chǔ)上,進(jìn)一步開發(fā)新的產(chǎn)品,提升CPU的性能。這也意味著未來X86架構(gòu)的CPU在中國可能會產(chǎn)生硬分叉,我們將從此與美國分道揚(yáng)鑣,走出自己的路來。 加速器芯片: 而這臺曙光超算的加速器芯片更有意思:它的名稱為Deep Computing Processor。根據(jù)公開的新聞報(bào)道,曙光的加速器芯片是基于我國寒武紀(jì)公司的AI處理器架構(gòu)研制的,全球獨(dú)一無二。曙光公司的通稿上說:“2017年11月,曙光基于寒武紀(jì)低功耗深度學(xué)習(xí)處理器,率先推出PHANERON,引起業(yè)界廣泛關(guān)注。時隔6個月,寒武紀(jì)發(fā)布性能更為強(qiáng)勁的MLU100,曙光同步升級PHANERON產(chǎn)品,并發(fā)布一系列搭載寒武紀(jì)MLU100的服務(wù)器產(chǎn)品,保持著在智能服務(wù)器領(lǐng)域的持續(xù)領(lǐng)先” 這意味著曙光TC8600超算應(yīng)用于AI領(lǐng)域?qū)碛袠O大的優(yōu)勢。 未來曙光公司的E級超算,應(yīng)該就是基于海光公司的最新CPU和曙光自己設(shè)計(jì)的PHANERON AI加速芯片的最新版本。 由此也可以看出美國商務(wù)部的這次禁運(yùn),也根本影響不了曙光公司的E級超算產(chǎn)品。 禁運(yùn)可能對曙光公司的商用超算產(chǎn)品線的影響巨大 我們還需要看到,由于曙光公司的主要產(chǎn)品線都是基于英特爾的CPU和英偉達(dá)的加速器芯片,在這次禁運(yùn)之后,這些產(chǎn)品線都難以為繼了。從商業(yè)層面來說,對曙光公司的影響巨大。但是好在曙光有了全國產(chǎn)的CPU和加速器芯片替代產(chǎn)品。我們可以從排名第43的曙光TC8600和排名第88位的曙光TC4600LP/W740l這兩臺超算的測試數(shù)據(jù)看出一些細(xì)節(jié)來: 表格來源于top500.org,筆者進(jìn)行整理分析 曙光TC4600LP超算是基于英特爾至強(qiáng)CPU和英偉達(dá)Tesla加速器的產(chǎn)品。從以上測試數(shù)據(jù)來看,使用國產(chǎn)CPU和加速器的TC8600超算,在使用了3倍多的CPU核心數(shù)量以及5倍左右的加速器核心數(shù)量的情況下,跑分只不過增加到了1.4倍到1.7倍。但是功耗下降了很多,功耗效率提升了3倍多。 筆者分析這主要是因?yàn)門C8600采用的AI加速器并不適合傳統(tǒng)的浮點(diǎn)運(yùn)算,它只是在AI運(yùn)算上具有巨大優(yōu)勢。 這也意味著,曙光公司缺乏合適的加速器芯片,來提升系統(tǒng)的浮點(diǎn)運(yùn)算能力。這可能會對曙光公司的商業(yè)發(fā)展產(chǎn)生不利影響。 也許曙光公司的未來銷售重點(diǎn)將轉(zhuǎn)向AI運(yùn)算。但是,也不排除未來曙光公司開發(fā)基于國產(chǎn)Matrix2000加速芯片的產(chǎn)品。 在這里必須介紹一下,為何曙光公司不能放棄X86架構(gòu)的CPU。 全球TOP500強(qiáng)的超算100%都使用Linux操作系統(tǒng)的不同發(fā)行版。這些版本都為各自的CPU和加速器芯片做了優(yōu)化。而在超算上跑的應(yīng)用軟件也會受到CPU架構(gòu)的影響。 從目前來看,對X86架構(gòu)優(yōu)化的Linux系統(tǒng)最成熟,應(yīng)用軟件最多,程序開發(fā)最容易,整個軟件生態(tài)系統(tǒng)最成熟,穩(wěn)定。而國產(chǎn)申威和飛騰CPU的系統(tǒng)則有些不足,軟件工具為它們優(yōu)化得少,編程也有些麻煩,系統(tǒng)bug也較多,整個軟件生態(tài)系統(tǒng)只是解決了可用,離X86系統(tǒng)那樣的好用仍然有一定距離。 所以,無論從國家的戰(zhàn)略方面,還是從曙光公司的商業(yè)前景而言,X86架構(gòu)都是應(yīng)該堅(jiān)持做下去的。 中國半導(dǎo)體制造技術(shù)的進(jìn)步將極大地推進(jìn)國產(chǎn)超算CPU和加速器芯片的性能 中國的半導(dǎo)體制造業(yè)長期以來是我們最大的短板。在臺積電和三星電子已經(jīng)量產(chǎn)7納米工藝,英特爾已經(jīng)小規(guī)模量產(chǎn)10納米工藝的時候,我國目前最先進(jìn)的半導(dǎo)體制造工藝還是中芯國際的28納米工藝。 而在上面提到的國產(chǎn)CPU,要么使用國產(chǎn)較落后的工藝,自主性能夠保證,但性能落后;要么在海外找半導(dǎo)體代工企業(yè)生產(chǎn),性能可以提升,但自主性無法得到保證,說不定什么時候就會被掐脖子。 但這個狀態(tài)很快就要結(jié)束了。中芯國際在2018年8月的第二季度業(yè)界報(bào)告中宣布,其14納米生產(chǎn)工藝取得了重大進(jìn)展,第一代FinFET技術(shù)研發(fā)已經(jīng)進(jìn)入了客戶導(dǎo)入階段。而正式量產(chǎn)則計(jì)劃在2019年中期。所以,很快,我們就會擁有自己的14納米半導(dǎo)體生產(chǎn)工藝了。 14納米有多厲害?要知道,現(xiàn)在英特爾所有的臺式機(jī)和服務(wù)器芯片都是14納米的。英特爾在剛剛過去的臺北電腦展上宣布會小規(guī)模量產(chǎn)10納米工藝的低電壓筆記本電腦處理器,并且預(yù)計(jì)未來幾年14納米仍然是它的主力工藝。只有AMD在臺積電的代工下,剛剛宣布實(shí)現(xiàn)了CPU的7納米工藝生產(chǎn)。 如果國產(chǎn)超算CPU和加速器芯片都使用中芯國際的14納米工藝生產(chǎn),它們的性能將會得到一個飛躍。 美國終將搬起石頭砸自己的腳 實(shí)際上,美國在2015年對中國的四大超算中心的禁運(yùn),已經(jīng)砸了它自己的腳:英特爾的至強(qiáng)Phi加速器芯片停產(chǎn)。 ▲圖為美國《個人計(jì)算機(jī)》雜志當(dāng)年對美國封殺中國四大超算中心,禁止因特爾提供至強(qiáng)Phi加速器芯片給它們的報(bào)道 筆者在這里列一些事實(shí): 中國的天河2號超算分別使用了3.2萬顆Xeon E5 CPU和4.8萬顆Xeon Phi加速器。 對于Xeon Phi的銷量,Intel CEO曾表示過2016年的目標(biāo)是10萬顆出貨量。 可見,單單我國的天河2號就能達(dá)到Intel 2016年約一半的Xeon Phi銷量。 2015年4月9日,美國商務(wù)部宣布對中國的四家超算中心禁運(yùn)英特爾的至強(qiáng)Xeon處理器和至強(qiáng)Phi加速器芯片。 2016年6月18日,至強(qiáng)Phi 7290/7250加速器價(jià)格直接腰斬。到2017年8月24日,英特爾宣布至強(qiáng) Phi 7200系列協(xié)處理器加速卡進(jìn)入停產(chǎn)退市進(jìn)程。 ▲圖為美國《個人計(jì)算機(jī)》雜志在當(dāng)年的報(bào)道中也提到美國禁令將給因特爾帶來沉重打擊 筆者毫不懷疑英特爾至強(qiáng)Phi加速器芯片的停產(chǎn)就是因?yàn)閷χ袊慕\(yùn)。這甚至影響到了美國下一代E級超算的開發(fā)。美國的E級超算,CPU可選擇英特爾和AMD的X86處理器以及IBM的Power處理器,而加速器芯片目前只有一個選擇,就是英偉達(dá)的通用GPU。 那么美國商務(wù)部的這次禁運(yùn)會有什么結(jié)果呢?筆者相信,在我們自力更生的努力之下,幾年之后,世界上會出現(xiàn)幾個新的超算CPU生態(tài)圈,徹底打破美國的壟斷。 實(shí)際上,美國《紐約時報(bào)》和《華爾街日報(bào)》也都不認(rèn)為美國政府的這一打擊中國超算的舉動會阻礙中國的發(fā)展。這兩家媒體采訪幾位不同的美國超算專家就表示,美國政府的行為雖然短期內(nèi)或給中國的超算發(fā)展帶來阻礙,卻也會更加堅(jiān)定中國開發(fā)本土技術(shù)替換美國科技的決心。 而一件必然會要發(fā)生的事,就是在2020年和2021年,中國有三臺E級超算將會沖擊TOP500排行榜的冠軍位置,把美國超算踢下去。讓美國看看,誰才是超算領(lǐng)域的王者!(標(biāo)題為消費(fèi)電子實(shí)驗(yàn)室修改,原標(biāo)題為:《美國的最新禁運(yùn),會讓中國下代超算遭致命打擊?告訴你實(shí)情!》) |
合作伙伴
網(wǎng)站介紹 廣告業(yè)務(wù) 歡迎投稿 招聘信息 聯(lián)系我們 友情鏈接 法律顧問 網(wǎng)站地圖
CopyRight 2012消費(fèi)電子實(shí)驗(yàn)室 版權(quán)所有 京ICP備12048044號-4號
電話:13701384402 郵編:100040 郵箱:BICQ6688@QQ.COM