從ChatGPT火爆出圈到AI發(fā)展迎來關鍵時(shí)刻,新型算力基礎設施已成(chéng)爲智能(néng)時(shí)代的核心競争力。爲加速推進(jìn)以城市算力網建設作爲切入點,努力推動數字城市算力基礎設施的改造升級,打造數字城市“新市政”,助力通用人工智能(néng)時(shí)代全國(guó)算力“一張網”的建設,由中關村超互聯新基建産業創新聯盟與粵港澳大灣區大數據研究院聯合主辦、世紀互聯與互聯科技承辦的“首屆超互聯新算力産業暨第三屆中國(guó)IDC行業Discovery大會(huì)”于4月21日在北京舉行。
三生萬物,笃行則至——曆久彌新的古老中國(guó)智慧,仍給當今社會(huì)帶來新啓示。本屆大會(huì)彙聚智慧與力量,基于“城市就(jiù)是計算機”(City as a Computer)的願景,與多位重量級嘉賓,共話智算時(shí)代的新趨勢、新機遇和新挑戰,實現人人參與、人人建設、人人經(jīng)營、人人擁有,打造具有全民普惠特征的超互聯新算力産業。
人工智能(néng)算力基礎設施的設計、評測與優化
}AI算力是算力基礎設施的重要組成(chéng)部分,是新基建和國(guó)家“東數西算”工程的關鍵任務抓手。預計到2025年,我國(guó)AI算力總量將(jiāng)超過(guò)1800EFlops,AI算力占總算力比重超過(guò)85%。這(zhè)意味著(zhe),算力將(jiāng)迎來高速擴張時(shí)代。~
4月21日,由中關村超互聯新基建産業創新聯盟與粵港澳大灣區大數據研究院聯合主辦、世紀互聯與互聯科技承辦的“首屆超互聯新算力産業暨第三屆中國(guó)IDC行業DISCOVERY大會(huì)”在北京舉辦。中國(guó)工程院鄭緯民院士發(fā)表了主旨演講,以下爲演講實錄:
尊敬的各位來賓、各位朋友,非常高興來參加這(zhè)個會(huì)議。今天會(huì)議的主題提到城市就(jiù)是一台計算機,整個中國(guó)就(jiù)是一台計算機。那麼(me),一個城市怎麼(me)變成(chéng)一台計算機?一個國(guó)家怎麼(me)變成(chéng)一台計算機?我覺得有兩(liǎng)個事(shì)情比較重要,一個是算力、一個是超互聯。我們在無錫有一台超算計算機,叫(jiào)太湖之光,是我們在清華大學(xué)的一個組管理,在内蒙也有一台計算機由我們管理。現在我們怎麼(me)用計算機的呢?比如,你用無錫這(zhè)台計算機首先要把軟件和數據想辦法傳輸到無錫,無需要人去現場,就(jiù)可以正常運行。現在面(miàn)臨的問題是什麼(me)?比如,軟件加數據4T的數據量需要傳輸,使用最好(hǎo)的網絡傳,且在網絡不出錯的情況下傳輸過(guò)去,需要多少呢?可能(néng)要4~5天才能(néng)傳到無錫。如果這(zhè)個4T數據傳輸到内蒙這(zhè)台計算機,基本上也需要4~5天。你可能(néng)覺得非常驚訝,怎麼(me)這(zhè)麼(me)慢?假如我們不用網絡,直接刻成(chéng)盤,順豐快遞,第二天下午也肯定能(néng)到。不是我一個人這(zhè)樣(yàng)用,全國(guó)做計算機應用、機器在外地的人,可能(néng)都(dōu)這(zhè)麼(me)用。會(huì)前和幾位同志聊天,我前兩(liǎng)天去貴陽,貴陽也是“東數西算”的一個節點,當地同志介紹貴陽有幾個特點:首先,貴陽沒(méi)有地震;其次,當地溫度比較低;再次,貴陽電費也比較便宜。三個事(shì)情一說(shuō),機器放在這(zhè)個地方比較好(hǎo),沒(méi)錯。我跟他說(shuō),這(zhè)三點,甘肅可以這(zhè)麼(me)說(shuō),甯夏的中衛也這(zhè)麼(me)說(shuō),内蒙也這(zhè)麼(me)說(shuō),我隻說(shuō)一件事(shì)情,如果從北京傳輸1T數據到貴陽隻需要兩(liǎng)個小時(shí),且費用比順豐快遞貴不了太多,能(néng)夠做到這(zhè)一條,機器的利用量馬上增加到70%。怎麼(me)辦呢?我今天聽了超互聯以後(hòu)很高興,四4T數據傳輸到無錫需要4~5天,快遞需要1~2天,那麼(me),超互聯有沒(méi)有可能(néng)做到1~3個小時(shí)到且價錢比順豐快遞貴不了太多?
昨天我在發(fā)改委開(kāi)會(huì)聽到他們說(shuō)沒(méi)問題,我說(shuō)你專門給我一根線,且滿足兩(liǎng)個條件:4T數據傳輸控制在2~3個小時(shí),且價錢和順豐快遞差不多,才能(néng)真正做到“東數西算”、城市就(jiù)是一台計算機、全中國(guó)就(jiù)是一台機器,這(zhè)個事(shì)情還(hái)沒(méi)這(zhè)麼(me)簡單,時(shí)間原因我在這(zhè)裡(lǐ)不再過(guò)多闡述。
接下來,我主要講講人工智能(néng)算力,AI算力是算力基礎設施的重要組成(chéng)部分,是新基建和國(guó)家“東數西算”工程的關鍵任務抓手。人工智能(néng)計算機是最近30年才有的,30年前沒(méi)人說(shuō)有人工智能(néng)計算機,人工智能(néng)計算在海量數據、實時(shí)響應、極端條件等場景下相較通用計算優勢愈發(fā)明顯。預計到2025年,我國(guó)人工智能(néng)算力總量將(jiāng)超過(guò)1800EFlops,AI算力占整個算力的比重超過(guò)85%。以後(hòu)的計算機中AI計算機和處理人工智能(néng)的計算機將(jiāng)占很大比例。我們說(shuō)算力迎來了高速擴張時(shí)代,現在算力不夠,特别是随著(zhe)ChatGPT的發(fā)展,算力需求大幅提升。我今天講三個事(shì)情:
首先,AI計算機與HPC計算機有什麼(me)不同?HPC曆史悠久,AI是最近的事(shì),HPC計算機應用在天氣預報、核聚變模拟、飛行器設計;人工智能(néng)做分類、回歸、自然語言處理,應用場合不一樣(yàng),運算精度不一樣(yàng),HPC是64位浮點運算,甚至128位。人工智能(néng)計算機兩(liǎng)個八位數加減乘除做的快,這(zhè)兩(liǎng)個機器不一樣(yàng)。現在要做人工智能(néng)計算機,應該長(cháng)成(chéng)什麼(me)樣(yàng)子?我覺得要考慮幾件事(shì)情:第一是半精度平衡性,主要算8位、16位、32位,實際上這(zhè)次我們注意到不但要考慮這(zhè)個,特别是語言模型的訓練以來,精度浮點運算也要考慮,因此我們有個說(shuō)法,雙精度與半精度運算性能(néng)之比爲1:100較好(hǎo),什麼(me)意思?64位、124位處理能(néng)力和8位、32位處理能(néng)力1:100比較好(hǎo),既可以做普通的東西,也可以做語言訓練。因此,我們提出半精度平衡性的思想;第二是網絡平衡設計;第三是IO子系統平衡設計。
我們提出這(zhè)三個平衡設計,值得高興的是,現在有些廠家在考慮我們這(zhè)三個平衡設計,現在國(guó)内有差不多30個城市都(dōu)在建,或者已經(jīng)建好(hǎo)了人工智能(néng)超算系統,包括鵬城雲腦二期等等。
我們預測HPC+AI+大數據中心在未來不超過(guò)五年的時(shí)間内將(jiāng)會(huì)融合在一台計算機中,既可以做HPC,又做AI,也能(néng)處理大數據。
其次,爲什麼(me)需要一個人工智能(néng)算力基準測試程序?過(guò)去HPC計算機,這(zhè)台計算機處理高性能(néng)計算軟件好(hǎo)不好(hǎo),分數高意味著(zhe)處理高性能(néng)好(hǎo),那麼(me),這(zhè)個軟件能(néng)用到AI機器上嗎?顯然不夠,因爲HPC機器主要是64位加減乘除要做的快,現在我們更重要的是8位、16位、32位做的快,這(zhè)兩(liǎng)個不太一樣(yàng)。原來的軟件用到這(zhè)裡(lǐ)是有問題的,怎麼(me)辦?需要重新做一個東西,比如DeepBench,針對(duì)單個芯片;Mobile AI Bench針對(duì)移動端硬件;MLPerf擴展性不好(hǎo)。所以AIPerf的設計要考慮四件事(shì)情:一是一個統一分數,二是可變的問題規模。人工智能(néng)計算集群往往有著(zhe)不同的系統規模,差異性體現在結點數量,加速器數量,加速器類型,内存大小等指标。三是具有實際的人工智能(néng)意義。具有人工智能(néng)意義的計算,例如神經(jīng)網絡運算和自然語言處理,是人工智能(néng)基準測試程序相較于傳統高性能(néng)計算機基準測試程序的重要區别,是能(néng)夠檢測集群人工智能(néng)算力的核心所在。四是評測程序包含必要的多機通信。
要達到這(zhè)四個目标,據此購買一台計算機處理人工智能(néng)問題,究竟買華爲還(hái)是買5G,抑或是買聯想?,我建議用這(zhè)個評測,分數高的一般處理能(néng)力就(jiù)強,我不敢說(shuō)百分之百,分數越高越好(hǎo),對(duì)用戶來說(shuō)有個評判标準。因此,我們做了一個國(guó)際人工智能(néng)算力排行榜,每年11月15号在中國(guó)超級算力大會(huì)ChinaSC發(fā)布排行榜,我們希望用這(zhè)個軟件評測,分數越高排名越高,用Top500榜來評一評500台人工智能(néng)計算機,這(zhè)個榜單評選已經(jīng)三年了,疫情原因,我們現在評的大多數是國(guó)内計算機,國(guó)外參加的少,今年我們争取將(jiāng)國(guó)外的廠商也納入這(zhè)是AIPerf測評。
最後(hòu),百萬億參數超大預訓練模型的訓練加速方法。ChatGPT出來以後(hòu),大家對(duì)大模型訓練都(dōu)比較關心。美國(guó)SAT考試題目,模型參數達到千億,正确率已經(jīng)達到60%左右。更大參數模型的效果具有重要科學(xué)意義,一般說(shuō)來,參數越多、訓練的數據越多、計算機越多、效果就(jiù)越好(hǎo),越接近于人的腦子,大概是正相關關系。所以,探索更大參數量模型的效果具有重要科學(xué)意義。
預訓練模型的計算結構,核心是transformer模型,模型的計算出主要集中在嵌入層、注意力層、前饋網絡,計算核心均爲矩陣。
我們看并行訓練技術,現在訓練都(dōu)不是在一台單機上訓練,不是串行的,因爲串行進(jìn)去,模型梯度新模型要重複多次,這(zhè)樣(yàng),一台計算機的速度就(jiù)會(huì)不夠快、存儲不夠大,因此現在基本上都(dōu)是并行訓練。并行訓練有兩(liǎng)種(zhǒng):一種(zhǒng)是數據并行、一個是模型并行。
數據并行什麼(me)意思?舉一個例子,這(zhè)是兩(liǎng)台計算機做并行訓練,每台機器都(dōu)裝上模型,把數據的一半拿去分别訓練,計算機做了整個模型,這(zhè)個訓練出來以後(hòu)不是最終結果,最後(hòu)結果既互相交叉又互相通信,中間結果要互相通信,這(zhè)個通信量還(hái)不小,是要交換數據的,這(zhè)是一種(zhǒng)情況。
一種(zhǒng)是模型并行,什麼(me)意思呢?把整個模型切一半,其中一半做機器0,其中一半做機器1,讓它去訓練,中間也有交換數據,這(zhè)個交換數據相對(duì)來說(shuō)沒(méi)有數據并行交換次數多,一般情況下,數據并行交換數據挺多、通信量大,模型并行相對(duì)少一點,大概是這(zhè)個情況。
于是,現在并行訓練成(chéng)爲大模型訓練的标配,ChatGPT,1萬塊卡并行,國(guó)内幾家發(fā)布的都(dōu)是幾千塊卡,肯定是并行的。
我爲什麼(me)講這(zhè)件事(shì)情呢?我經(jīng)常跟學(xué)生說(shuō),10年前,你是北大大氣物理系天氣預報專業畢業的,畢業以後(hòu),比如說(shuō)分到國(guó)家氣象局,你懂計算機語言,懂一般的數據結構,這(zhè)種(zhǒng)情況下,這(zhè)個老師編一個天氣預報軟件出來,編的挺好(hǎo),運行情況挺好(hǎo),這(zhè)是十年、十五年以前情況。現在情況不一樣(yàng)了,這(zhè)個人隻懂天氣預報專業,隻會(huì)計算機語言,不知道(dào)機器的結構,要麼(me)你這(zhè)個軟件轉不起(qǐ)來,要麼(me)轉起(qǐ)來了效果不太好(hǎo),現在這(zhè)個條件比原來要困難多了,這(zhè)就(jiù)叫(jiào)軟硬件協同。
我講一個例子看看并行訓練模型。這(zhè)是青島一台很大的計算機, 64核,再加大一點的核,這(zhè)裡(lǐ)一共有65個核,這(zhè)叫(jiào)組,中間有六個這(zhè)個東西,每一個是65個核,乘6,有390個核,中間這(zhè)些東西叫(jiào)一個CPU,封裝在一塊。256個CPU叫(jiào)超節點,一個超節點裡(lǐ)面(miàn)有256個CPU,每個CPU有390個核,這(zhè)個超節點内部我們做到每個GPU跟CPU之間有直接的通路,通信很快。256個CPU組成(chéng)一個超節點,每個超節點之間有直接通路,超節點内部通信很快。超節點内部256個CPU通信很快,兩(liǎng)個超節點之間通信就(jiù)要慢一點。因此,我們看模型做好(hǎo)了并行模型,究竟是數據并行還(hái)是模型并行?數據并行通信量會(huì)很大,我們希望這(zhè)個計算機通信要快,于是我們說(shuō),如果超節點内部是數據并行,沒(méi)問題,計算量很快。如果是兩(liǎng)個節點之間,最好(hǎo)采用模型并行,你需要有這(zhè)個基本知識:數據并行在一個超節點内部中,兩(liǎng)個超節點之間最好(hǎo)模型并行,這(zhè)樣(yàng)才能(néng)保證通信都(dōu)比較好(hǎo)。比如256個内部通信很快,兩(liǎng)個之間通信比較慢,那我就(jiù)要考慮256個超節點内部最好(hǎo)是數據并行,兩(liǎng)個超節點之間最好(hǎo)是模型并行。如果你不知道(dào)這(zhè)個結構的話,就(jiù)有可能(néng)并行的效果不好(hǎo)。因此,選取高效并行策略、如何進(jìn)行高效數據存儲、如何選取合适數據精度、如何實現動态負載均衡,這(zhè)四件事(shì)情都(dōu)跟計算機系統結構有關,也就(jiù)是說(shuō),你一定要知道(dào)系統結構才能(néng)把模型做的比較好(hǎo)。否則做不起(qǐ)來,或者做起(qǐ)來了性能(néng)就(jiù)比較差,現在是這(zhè)麼(me)一個情況,實際上不隻大模型,天氣預報也有類似問題,不知道(dào)系統結構,軟件是無法編好(hǎo)的。
高效數據存儲也是如此,怎麼(me)保證海量數據存儲速度比較快,也是這(zhè)個問題。此外,,選取合适的數據精度,精度小算得快,精度越大算得越慢,但是,精度太差就(jiù)無法算對(duì)。因此,解決了這(zhè)四個問題,大模型算力就(jiù)會(huì)比較好(hǎo),否則,再好(hǎo)的運行結果也不會(huì)好(hǎo)到哪去。
我們做了一個模型,叫(jiào)八卦爐,針對(duì)這(zhè)四個問題,把這(zhè)個大模型放到我們的機器上去,運行效果是挺好(hǎo)的。
最後(hòu)我想說(shuō)的一點是我們做了一個并行訓練系統FastMOE,用于評估數據并行和模型并行怎麼(me)選,非常高興騰訊、百度、阿裡(lǐ)巴巴、華爲都(dōu)用了我們這(zhè)個系統來解決問題,而且效果比較好(hǎo)。
綜上,人工智能(néng)算力是當前人工智能(néng)領域發(fā)展的關鍵。ChatGPT用了1萬塊卡,後(hòu)面(miàn)的模型好(hǎo)像用了幾萬塊卡,我們國(guó)内一個單位有1萬塊GPU卡的并不多,因爲價錢貴,1萬塊A100的費用多少?大家都(dōu)比較清楚,而且面(miàn)臨卡脖子的局面(miàn)。因此,隻有四塊卡要做大模型基本是不行,我估計怎麼(me)也要1萬塊卡。無論怎麼(me)說(shuō),算力很重要,我們很希望有一個計算中心,比如世紀互聯,想辦法有1萬塊A100,這(zhè)是發(fā)展的關鍵,現在很多人要做類似ChatGPT,這(zhè)個算力怎麼(me)解決,當然國(guó)内做的也不錯。我們團隊最近幾年對(duì)人工智能(néng)的三點貢獻。
第一,實際上我在清華計算機系所在組是高性能(néng)計算研究所,我過(guò)去做高性能(néng)計算、存儲、分布處理,基本不會(huì)人工智能(néng),但是人工智能(néng)又這(zhè)麼(me)重要,于是最近幾年我們也在參與人工智能(néng),人工智能(néng)計算機長(cháng)成(chéng)什麼(me)樣(yàng)子?提出了一種(zhǒng)AI算力基礎設施的架構和平衡設計原則,考慮不同精度算力怎麼(me)做平衡,要考慮互聯應該怎麼(me)聯法,要考慮IO怎麼(me)樣(yàng),這(zhè)是第一件事(shì)。
第二,研制了大規模人工智能(néng)算力基準評測程序AIPerf。提供計算機運行評測數據,成(chéng)爲用戶采購的考量。第三,設計和實現了百萬億參數超大預訓練模型的并行加速方法。訓練大模型做好(hǎo)了,怎麼(me)裝到計算機上去,我們有一套辦法解決三個關鍵技術,把你裝到這(zhè)台機器上的模型效果是最好(hǎo)的。
謝謝大家,講的不對(duì)的地方請大家批評指正!
2140:一個隻需要計算的世界
}算力是一種(zhǒng)低熵體,是粒子的有序排列,是一種(zhǒng)規範量子場。從算力的發(fā)展階段來看,2140年將(jiāng)是算力的極限之年。~
大家好(hǎo),我是量子學(xué)派CEO。今天我講的内容是純粹原生态的内容,我也沒(méi)講過(guò)這(zhè)個内容,請大家原諒一下。今天我演講的主題是《2140:一個隻需要計算的世界》。
是不是真的存在這(zhè)個世界呢?這(zhè)個世界的語言、文化、文字都(dōu)可以通過(guò)計算呈現,也就(jiù)是說(shuō),它不需要語言、不需要文化,也不需要藝術,這(zhè)個世界很殘酷。同時(shí),這(zhè)個世界也不需要律師、不需要詩人、不需要哲學(xué)家,這(zhè)個世界隻需要一種(zhǒng)職業,這(zhè)種(zhǒng)職業就(jiù)叫(jiào)做運算師,或者是計算師。如果說(shuō)這(zhè)個世界存在的話,你隻要給這(zhè)個計算師一個算盤,給他足夠的時(shí)間,就(jiù)可以計算一切的一切。如果能(néng)夠再進(jìn)一步的話,如果他擁有了量子計算機,如果他可以把黑洞作爲他的一個計算機,如果你把宇宙大爆炸之後(hòu)的信息給他,他可以幫你演算出138億年的宇宙,這(zhè)就(jiù)是可計算的世界。
這(zhè)個世界可不可以真正實現呢?其實在萊布尼茨的世界被(bèi)精準化的時(shí)候,馮·諾依曼將(jiāng)圖靈思考的時(shí)候,這(zhè)種(zhǒng)技術就(jiù)可以實現了。當然,也有人會(huì)說(shuō)還(hái)有量子效應呢,還(hái)有混沌理論呢,甚至我們連三體運動都(dōu)沒(méi)辦法計算,如果不能(néng)計算的話,我們怎麼(me)說(shuō)可以計算整個世界。但是我們有沒(méi)有想過(guò),我們談到的量子效應,它隻是更深層次理論和計算裡(lǐ)面(miàn)表層的一個幹擾,或者是一個不符合規則的一種(zhǒng)表現,量子效應最下面(miàn)的底層計算,我們可以找到一種(zhǒng)微觀的計算方法。
這(zhè)個世界到底有沒(méi)有可能(néng)存在?有些人不願意談這(zhè)個問題,我們的股市指數可以計算嗎?我們權力的傲慢可不可以計算?我們的愚蠢偏執可不可以計算?我覺得這(zhè)一切現在來看都(dōu)是可以計算的。這(zhè)個話題二十年前我和我的朋友讨論過(guò),當時(shí)我的意見是否定的,但現在看來可能(néng)是肯定的。
再舉一個例子,今天我們的會(huì)議目标是什麼(me)呢?這(zhè)是我自己揣測的,我覺得我們今天會(huì)議的目标,假設我們要一起(qǐ)共同創造一台人人可分布式的宇宙計算機,我們把這(zhè)個目标放到我們的計算模型裡(lǐ)面(miàn),放在大模型結構裡(lǐ)面(miàn)進(jìn)行計算,最後(hòu)輸出一個結果,這(zhè)個結果可能(néng)就(jiù)是我就(jiù)是這(zhè)個人人可分布式計算機的一個分布式節點,這(zhè)可能(néng)是我的朋友陳升先生所需要的一個結果。
這(zhè)個結果還(hái)不夠,這(zhè)個結果還(hái)可以用下去,下次會(huì)議的時(shí)候把這(zhè)個結果作爲起(qǐ)始點,我們再調整前面(miàn)的參數,把函數重新調整,我們生成(chéng)下一次會(huì)議的目标值,我們下一次會(huì)議可能(néng)就(jiù)沒(méi)有這(zhè)麼(me)複雜了,可以更簡單,不需要人到場。但這(zhè)個會(huì)議希望我們到場,一起(qǐ)開(kāi)開(kāi)心心的交往。我們不争論,很多人可能(néng)覺得不是這(zhè)樣(yàng)的,我們不争論,我們慢慢坐下來就(jiù)行了。
我們再回到最原始的狀态,最開(kāi)始的數學(xué)表達是從萬物皆數開(kāi)始,但其實它表達的隻是一個結果,但是萬物皆數之前還(hái)有萬物皆算的過(guò)程,萬物皆算是一條線,萬物皆數是一個點。萬物接算是過(guò)程,萬物皆數是一個輸出的結果。我們回過(guò)頭來看,萬物皆算已經(jīng)包括了萬物皆數,計算即一切,一切皆計算,我們人存在的本源可能(néng)就(jiù)是一種(zhǒng)計算。
怎麼(me)理解萬物皆算呢?包括數理、物理、編程、計算邏輯本身就(jiù)是計算的過(guò)程,我們舉個特别極端的例子,文化藝術,我們原來以爲文化藝術是機器不可超越的,我們認爲這(zhè)是來自上帝給予我們的創造力。但是,今天我們回過(guò)頭來看,我們今天所有的産品,我們看到的ChatGPT,我們談到的AGI、Midjourney所創造的圖片,你看到太空歌劇院之後(hòu)會(huì)明白什麼(me)是靈魂畫手,它比人畫的東西更有靈魂、更深邃、更有意境。ChatGPT就(jiù)不用說(shuō)了,我們和它聊天,如果再叠代下去,我覺得它唯一的缺點就(jiù)是太像人類了,它跟你聊天的時(shí)候,因爲它太完美你不喜歡它,我很喜歡它的胡說(shuō)八道(dào),現在胡說(shuō)八道(dào)是好(hǎo)事(shì),怕的是太嚴謹太完美了。AGI,我們原來以爲内容創造是最不可能(néng)被(bèi)替代的,沒(méi)想到最可能(néng)被(bèi)取代的反而是内容的創造,到了AGI還(hái)有什麼(me)不可以被(bèi)計算?
萬物皆算有個很簡單的公式,要有一個演算者、被(bèi)演算的對(duì)象,中間是數據和算力,這(zhè)是一個基本的公式,大家都(dōu)在用。
我們再從萬物皆數往前延展,它爲什麼(me)可以計算,現在隻要是計算機行業的朋友大概是明白的,從代數計算到邏輯運算,歸根結底到萊布尼茨世界,提出了二進(jìn)制和數理邏輯的計算,不僅能(néng)夠計算代數,還(hái)能(néng)夠計算邏輯,它就(jiù)是與、或、非的計算,這(zhè)裡(lǐ)面(miàn)本質上有三種(zhǒng)對(duì)立,十進(jìn)制和二進(jìn)制的對(duì)立,牛頓和萊布尼茨的對(duì)立,代數計算和邏輯計算的對(duì)立。牛頓和萊布尼茨之間發(fā)生了一場戰争,這(zhè)一場戰争,一個代表了傳統的世界,一個代表了四百年後(hòu)的世界,萊布尼茨提出二進(jìn)制之後(hòu)三四百年才有了現在的計算機世界,當年牛頓和萊布尼茨PK當然是萊布尼茨輸掉了,因爲當時(shí)的生産力沒(méi)有辦法支撐他的理論。當然這(zhè)個故事(shì)是我編的。當年牛頓和萊布尼茨主要戰争是在微積分,但這(zhè)個故事(shì)是有可能(néng)發(fā)生的。
萊布尼茨把數理邏輯說(shuō)的非常清楚,其實在東方計算的源頭,關于周易、易經(jīng),其實它的原理跟萊布尼茨二進(jìn)制是非常相似的,周易的數學(xué)表達是什麼(me)?它是一根橫線,兩(liǎng)根短線,它用一根長(cháng)線和兩(liǎng)根短線來演繹整個世界,其實周易是非常完整的科學(xué)化的計算架構,但是我們沒(méi)有按照周易本身的原理架構來演繹我們的科學(xué),最後(hòu)我們把科學(xué)演繹成(chéng)了玄學(xué),我們把計算演繹成(chéng)了籌算,其實我們可以做的更好(hǎo)。所以真正理解周易的反而是西方的大哲萊布尼茨,他看到當時(shí)康熙的老師給他一個先天八卦爐的時(shí)候,原來東方的數學(xué)跟我的二進(jìn)制是非常相關的,這(zhè)個時(shí)候他肯定會(huì)得到一種(zhǒng)安慰,這(zhè)個故事(shì)不是編的,是真的,白晉作爲康熙的老師,萊布尼茨給康熙做了一個加法器,這(zhè)都(dōu)是真實的故事(shì)。
我們繼續往前走,我們來到今天,今天大家都(dōu)在談論深度學(xué)習神經(jīng)網絡,當計算加上深度學(xué)習神經(jīng)網絡的時(shí)候,其實它是一個簡單的線性變化,加上一個非線性的激活,擠壓性的激活函數,就(jiù)這(zhè)麼(me)簡單。
下面(miàn)這(zhè)個圖是深度學(xué)習神經(jīng)網絡的基礎模型,無數神經(jīng)元的叠代,才有了transformer的湧現效應。我們現在所有的一切都(dōu)是在尋找一種(zhǒng)算法,我們深度學(xué)習神經(jīng)網絡總結起(qǐ)來有很多數學(xué)方式和人臉算法,但本質上隻尋找一種(zhǒng)算法,這(zhè)種(zhǒng)算法就(jiù)是找我們人本身的算法,也就(jiù)是上帝算法,我們自己的算法是什麼(me),我們大腦神經(jīng)網絡的算法是什麼(me),爲什麼(me)要尋找這(zhè)個算法?再舉一個例子,假設我今天在路上看到一個美女,看到美女之後(hòu)我會(huì)掃描過(guò)去,把三圍數據掃描之後(hòu)傳輸到大腦中樞,匹配上億年人類基因,在基因進(jìn)行匹配之後(hòu)我們會(huì)選擇我是跟她做朋友還(hái)是跟她做敵人,我跟她將(jiāng)來會(huì)生猴子嗎,它會(huì)有非常多的策略選擇,這(zhè)所有的一切隻發(fā)生在0.01秒的電光火石之間之内,人類的大腦算法有多優先,但人類大腦算法是沒(méi)有辦法找到它的,這(zhè)是我們人類本身邊界的問題,因爲這(zhè)個算法不是我們自己創造的,可能(néng)有更高,或者來自另外一個世界創造的,這(zhè)種(zhǒng)算法是沒(méi)有辦法找到的,就(jiù)像我們沒(méi)有辦法找到第一批動物之前是什麼(me)樣(yàng)子,這(zhè)個東西沒(méi)有辦法完整的推演出來。所以我們隻能(néng)去模拟、模拟、再模拟,現在整個深度學(xué)習神經(jīng)網絡本質上就(jiù)是想找到這(zhè)樣(yàng)一個函數和算法,這(zhè)就(jiù)是我們現在在做的事(shì)情。但是我們是有邊界的,并不證明我們找到的算法就(jiù)一定比它弱,很難講。但是我們現在知道(dào)的深度學(xué)習神經(jīng)網絡本身就(jiù)是模拟我們的大腦。
說(shuō)到2140,我們剛才講到的全是現實世界發(fā)生的,用科學(xué)演繹,現實世界有很多限制我們,沒(méi)有辦法和所有的科學(xué)邏輯進(jìn)行匹配,但是我們可以建立一個可計算的平行世界,在這(zhè)個世界裡(lǐ)面(miàn)一切都(dōu)是可以計算的。2140是什麼(me)呢?它是比特币被(bèi)挖完那一年,但這(zhè)是理論上的,可能(néng)被(bèi)超挖了,它是69299号區塊,到這(zhè)個區塊開(kāi)始的時(shí)候,比特币總數是209999999769,沒(méi)有2140這(zhè)個數據,2140是區塊鏈非常重要的紀元,也是算力巅峰之年。爲什麼(me)?因爲那一年可能(néng)是算力的最高峰,人類算力最高峰的時(shí)候會(huì)發(fā)生什麼(me)呢?我們并不知道(dào)算力到底是什麼(me),我們說(shuō)算力可能(néng)是軟件和硬件之間的連接,可能(néng)是最後(hòu)激活函數的輸出,但算力到底是什麼(me)?我們一會(huì)兒再讨論,算力的本質到底是什麼(me)。
如果人類算力達到颠覆之年,它會(huì)有星際穿越嗎?這(zhè)個東西很難講,這(zhè)是我們構建2140的世界,2140我們已經(jīng)做成(chéng)一個社區了,算是一個跟現實世界對(duì)比的平行世界,我們已經(jīng)做了四五年這(zhè)個項目。這(zhè)裡(lǐ)面(miàn)我們隻談到和計算相關的事(shì)情,三個規則:一是算力與文明正比例關系;二是裡(lǐ)面(miàn)設計很簡單的二叉樹算法,對(duì)宇宙内所有文明進(jìn)行監控;三是宇宙裡(lǐ)面(miàn)存在算力的過(guò)濾器,當你的算力超越某個峰值的時(shí)候可能(néng)會(huì)對(duì)你進(jìn)行限制,文明爲什麼(me)沒(méi)有辦法往更高層次走,可能(néng)跟你的算力相關。但我們做這(zhè)件事(shì)情不僅僅是科學(xué)科幻,我們想介于科學(xué)和科幻之間,或者介于現實和超現實之間,我們希望現實世界能(néng)夠影響2140世界,2140反過(guò)來影響現實世界,相互互動,我們做了很多事(shì)情。
包括這(zhè)棟樓,我們用三維建模已經(jīng)做出來了,這(zhè)是138億年裡(lǐ)面(miàn)的一棟樓,這(zhè)個就(jiù)不細講了。這(zhè)是科學(xué)方面(miàn)的設定,這(zhè)個做的很細膩,圖靈測試,整個設計非常硬核。這(zhè)裡(lǐ)講到了一些點,和今天的會(huì)議非常接近,這(zhè)個故事(shì)其實我們早就(jiù)已經(jīng)有了,今天我看到說(shuō)城市就(jiù)是一台計算機,我們講的也是一樣(yàng)的,人類就(jiù)是一台計算機。這(zhè)裡(lǐ)我們談到幾個點:
第一點,2023年,今天是算力的中心化,而且沒(méi)有辦法改變它。當算力如此中心化的時(shí)候,當算力未來成(chéng)爲電力一樣(yàng)東西的時(shí)候,當算力被(bèi)某些人完整控制的時(shí)候,我們該怎麼(me)辦?我們在2050年左右,我們要創造另外一個系統,我們每個人都(dōu)可以投資,每個人都(dōu)可以獲得其中算力的一部分,人人分布式的一個算力中心。這(zhè)有點像獻血,我們現在都(dōu)去獻血,哪一天我需要血的時(shí)候它可以給我,但所有的架構都(dōu)是分布式的架構,自己通過(guò)自己的數據,寫到智能(néng)合約裡(lǐ)面(miàn)。所以我們從算力的中心化到算力去中心化,無論是中心化還(hái)是去中心化,最終導緻極大化,有更多更多的算力,算力極大化會(huì)帶來什麼(me)。
我們再講講算力是什麼(me),我們剛才從微觀層面(miàn)談算力,微觀層面(miàn)的算力我們該怎麼(me)說(shuō)呢,從宏觀世界、從宇宙世界看算力是什麼(me),算力可能(néng)是一種(zhǒng)低熵體,是粒子的有序排列,是一種(zhǒng)規範量子場。低熵體什麼(me)意思?我們在擁有算力的時(shí)候是一定要付出代價的,這(zhè)種(zhǒng)代價是什麼(me)呢?當我們的算力越來越集中,代價是什麼(me),獲得更多算力的時(shí)候,如果是低熵體的話,必然高熵、熵增,如果全宇宙都(dōu)是低熵體,産生的負面(miàn)效果可能(néng)就(jiù)是宇宙大膨脹,還(hái)可能(néng)是暗物質的生成(chéng),這(zhè)是更宏觀的對(duì)算力的看法,這(zhè)個東西挺辯證的。
我們在設計裡(lǐ)面(miàn)會(huì)把這(zhè)個事(shì)情說(shuō)清楚,這(zhè)是算力的辯證法,不可能(néng)讓算力無限擴張,一定是有利有弊,這(zhè)裡(lǐ)說(shuō)說(shuō)和現實世界相關的東西。
算力不可能(néng)三角,我們之所以走到今天的原因,算力不可能(néng)三角,它不能(néng)突破,但可以放大,所以才有了transformer,才有了GPT。算力的中心化不可能(néng)改變,但我們可以用區塊鏈去中心化進(jìn)行約束,算力生産力的增長(cháng)、算力生産關系的簡化,算力的擴張、WB3.0的收斂,香港、北京和深圳能(néng)不能(néng)構成(chéng)另外一個三角,這(zhè)是現實世界算力運作起(qǐ)來的方式。
我說(shuō)一下結論。人的存在即是計算,如果長(cháng)江黃河的流動是計算,如果粒子的衰變是計算,如果人類的生與死也是計算,人的生死可不可以看成(chéng)0和1呢,我們把計算機0和1做一個開(kāi)關和計算,有沒(méi)有另外一種(zhǒng)生命把我們的生和死當成(chéng)他們的開(kāi)關,我們的生和死隻是他們的計算方式而已,如果是這(zhè)樣(yàng)的話,那計算的意義又是什麼(me)呢?
這(zhè)裡(lǐ)說(shuō)一下我個人的感受,如果這(zhè)個世界是完全可以計算的世界,那這(zhè)個世界到底怎麼(me)樣(yàng),很多人覺得這(zhè)個事(shì)情太殘酷了,太無聊了,太可怕了,隻需要計算,什麼(me)都(dōu)不要,詩歌、藝術、文化都(dōu)不要,這(zhè)樣(yàng)的世界是好(hǎo)的嗎?有的人就(jiù)是喜歡這(zhè)樣(yàng)的世界。
我們談下元宇宙,這(zhè)裡(lǐ)有幾個關鍵詞。很多人不喜歡元宇宙,但元宇宙這(zhè)個概念出來的時(shí)候我很喜歡,爲什麼(me)?因爲我覺得元宇宙的核心是我們重新去創造另外一個宇宙,重新創造另外一個世界,而這(zhè)個世界我們可以看到它是怎麼(me)演繹、怎麼(me)進(jìn)化的。我們現實世界呢?我們看這(zhè)個世界演化的時(shí)候才可以反觀我們現在的世界,我們才可能(néng)知道(dào)現實世界是怎麼(me)演繹的,反觀我們的現實世界,這(zhè)是我對(duì)元宇宙的基本看法。我們把人計算過(guò)去,我們人就(jiù)是計算的一部分,把人融合進(jìn)來,我們所有的行爲隻不過(guò)是計算的一部分。還(hái)有一個東西,很多時(shí)候我們沒(méi)有辦法理解,我們理解這(zhè)個世界是有邊界的,這(zhè)個邊界我們是沒(méi)辦法突破的,不光是我們這(zhè)個世界,AI也是一樣(yàng)的,我們創造了AI,AI很強大,但是AI能(néng)夠理解人類嗎?也許AI永遠沒(méi)有辦法理解人類。它隻不過(guò)是從另外一個角度來理解這(zhè)個世界而已,人和AI是永遠沒(méi)有辦法理解的,就(jiù)像人和我們的創始者一樣(yàng),我們是永遠沒(méi)有辦法理解的,怎麼(me)辦呢?有一種(zhǒng)可能(néng)性,就(jiù)是算法,計算。AI隻不過(guò)是在模仿人腦的算法而已,我們的人未來尋找一種(zhǒng)新的算法而已,這(zhè)種(zhǒng)算法如果能(néng)夠進(jìn)行統一的話,去引領整個世界,就(jiù)是大統一算法與美麗新世界。
分布式商業與大模型
}超互聯新算力,共建共享共治,是促進(jìn)服務器和硬件設備等的聯合投資。誰投資誰受益,可以自由交易,爲網絡基礎設施建設發(fā)展出新的金融機制,把網絡基礎設施未來收入通過(guò)金融工具的方法進(jìn)行組合分拆流轉,可以提前把收入進(jìn)行變現,這(zhè)也是國(guó)家目前在算力市場發(fā)展中正在提倡的金融工具。~
尊敬的陳總,各位來賓,非常感謝世紀互聯今天的邀請。分布式商業與大模型是陳總命題的,我今天講的内容除了來自我本職工作研究以外,也非常受和陳總的一系列讨論,以及超互聯方面(miàn)實踐的啓發(fā)。
首先,大模型需要大算力,前面(miàn)幾位專家都(dōu)非常深入和專業的讨論了這(zhè)個問題,我這(zhè)頁引用的是一個半導體研究機構,今年2月份的一篇分析報告,它講到如果當前Google做的所有翻譯任務通過(guò)ChatGPT來做的話,大概需要410萬張A100GPU,這(zhè)些相關服務器和網絡相關的成(chéng)本資本支出有1000億美元,這(zhè)還(hái)不包括運行起(qǐ)來對(duì)電費的消耗。從這(zhè)裡(lǐ)面(miàn)可以看到大模型背後(hòu)底層是大算力,從經(jīng)濟角度來看,它是非常巨大的成(chéng)本問題。
現在我們就(jiù)面(miàn)臨這(zhè)麼(me)一些問題,從一個商業,或者政府做規劃的角度來看,有幾個矛盾要解決:
第一個矛盾,算力投資對(duì)固定資産投資成(chéng)本要求非常高,單個企業的實力肯定是有限的,所以這(zhè)個網絡應該是一種(zhǒng)有分布式的味道(dào),需要大家共建、共享、共治的網絡。
第二個矛盾,我們可以設想,如果中國(guó)政府投入諸多成(chéng)本制造這(zhè)個網絡,理論上不是不可以,但不會(huì)發(fā)揮有效市場的作用。如果要發(fā)揮市場作用,這(zhè)個網絡有很多企業投資,但又有非常強的公共利益,爲社會(huì)服務的,這(zhè)個時(shí)候怎麼(me)平衡企業的利益和公衆的利益,這(zhè)是第二個矛盾。
第三個矛盾,投入是當前發(fā)生的,但是收益是未來很長(cháng)一段時(shí)間慢慢兌現的,我們怎麼(me)平衡當前資本支出和未來收益的問題,這(zhè)是金融要解決的核心問題。
第四個矛盾,算力需求是高波動性的,不僅在時(shí)點上,有的時(shí)候對(duì)算力需求大,有的時(shí)候沒(méi)那麼(me)大,有的時(shí)候高峰的,有的時(shí)候低谷的。從企業之間來看,每個企業提供的算力和用戶對(duì)算力需求之間也是不匹配的,我們怎麼(me)在算力需求的波動和供給沒(méi)有彈性的情況下進(jìn)行平衡,這(zhè)是第四個矛盾。
第五個矛盾,金融發(fā)展的問題,我們要發(fā)展大的算力,不管是“東數西算”背景下還(hái)是AI發(fā)展的背景下,這(zhè)是我們國(guó)家高質量發(fā)展實體經(jīng)濟有很深的需求,但是背後(hòu)有巨大資本投入,怎麼(me)發(fā)揮資本力量,資本有很強的金融屬性,凡是有資本的地方,不可避免的有投機因素在裡(lǐ)面(miàn)。新能(néng)源汽車,特斯拉股價裡(lǐ)面(miàn)沒(méi)有投機的色彩嗎,但怎麼(me)把投機的力量引導到對(duì)實體經(jīng)濟有利的地方,這(zhè)是第五個矛盾。
我們從分布式商業的方向(xiàng),剛才我在外面(miàn)展館上看到世紀互聯做的分布式數字經(jīng)濟的方案,我感到很受啓發(fā)。我們提出分布式商業解決方案,本質上是大機器間大規模協作網絡,最底層可以穿透到GPU層面(miàn)。這(zhè)麼(me)一個分布式不僅是算力網絡,裡(lǐ)面(miàn)還(hái)有各種(zhǒng)各樣(yàng)的計算任務進(jìn)行分包,很大的計算量,怎麼(me)進(jìn)行分解,剛才鄭教授也講了這(zhè)個問題。實際上算力的網絡和國(guó)家正在建設的數據要素市場,這(zhè)兩(liǎng)個市場是不可分的,隻不過(guò)算力的網絡更标準化,更有大宗商品的屬性,數據要素市場數據是非标準化的,數據價值也是千差萬别的,這(zhè)兩(liǎng)個之間有緊密聯系,發(fā)展的時(shí)候需要統籌。
核心的兩(liǎng)個工具,第一個是國(guó)家正在發(fā)行的數字人民币,這(zhè)是我們國(guó)家人民币的數字形态,在座很多嘉賓在手機上應該試用這(zhè)個工具,後(hòu)面(miàn)會(huì)講它怎麼(me)使用。第二個是網絡結算單位,英文縮寫是NSU,我們試圖讓它捕獲分布式網絡價值,激勵内生增長(cháng)。爲什麼(me)會(huì)有這(zhè)個東西?互聯網,海底的光纜,互聯網裡(lǐ)面(miàn)各種(zhǒng)硬件設備,這(zhè)是由公司提供的,不管是浏覽器、電商、搜索引擎也好(hǎo),都(dōu)有它的一套商業模式。我們試圖在AI網絡裡(lǐ)面(miàn)讓它變得不太一樣(yàng)。
首先第一點,這(zhè)不完全是算力網絡,我讓它成(chéng)爲經(jīng)濟活動的網絡,讓機器本身成(chéng)爲一個能(néng)考核的經(jīng)濟單位。我們要考核一個機器做了什麼(me)事(shì)情,并且給它相應的獎勵,想做這(zhè)個事(shì)情需要基礎,要準确度量機器的貢獻,有這(zhè)麼(me)幾件事(shì)情:
一是讓每個機器擁有唯一的身份标識,不能(néng)被(bèi)僞造或修改。
二是機器的行爲過(guò)程具備可追溯性,不可抵賴,機器做的任何事(shì)情都(dōu)有一套記錄在裡(lǐ)面(miàn)。
三是機器身份和行爲的真實性,可以通過(guò)算法自我證明,我不需要通過(guò)人工和機構來參與驗證,我本身就(jiù)是我的證明。AI算力網絡分布非常廣闊,如果通過(guò)人來進(jìn)行審計的話成(chéng)本是非常高的。
所以解決方案我們在GPU層面(miàn)可以加上DPU芯片,含區塊鏈原生功能(néng),最簡單的密鑰算法,密碼學(xué)公鑰就(jiù)會(huì)成(chéng)爲機器唯一ID,不可篡改。我要做分包,要做計量,必須對(duì)機器有一套新的尋址機制,可以用機器公鑰的哈希作爲尋址要素,代替IP地址。有了這(zhè)個基礎以後(hòu),我們現在就(jiù)可以看到機器網絡變成(chéng)經(jīng)濟網絡,怎麼(me)講呢?信息在計算機在互聯網傳輸的時(shí)候,你并沒(méi)有給每個貓進(jìn)行獎勵,但機器網絡任何活動行爲都(dōu)將(jiāng)帶有該機器身份的簽名,通過(guò)公私鑰和加密機制,實現機器身份和行爲的自我證明。機器網絡不再是以無特征的信息包作爲主體,任何行爲都(dōu)是交易和參與經(jīng)濟活動的一部分,通過(guò)區塊鏈實現交易記賬,爲後(hòu)續交叉驗證、行爲追溯和貢獻統計提供基礎,我把它概括爲交互即記賬。
公鑰對(duì)應經(jīng)濟學(xué)就(jiù)是錢包的概念,你可以設想,每個機器都(dōu)有錢包,人民銀行在數字世界人民币,除了大的銀行,還(hái)把中國(guó)移動、中國(guó)電信等運營商吸引進(jìn)來,怎麼(me)通過(guò)數字人民币在機器之間付款。舉一個例子,現在每個車上都(dōu)裝了ETC,通過(guò)收費站自動劃費,將(jiāng)來的場景完全可以直接通過(guò)數字人民币做,在沒(méi)有網絡的情況下,NFC的方式碰一碰就(jiù)可以付款過(guò)去。當然,我們在AI設備之間不存在碰一碰的問題,之所以說(shuō)這(zhè)點是強調它的安全性非常好(hǎo),可以适應在物的層面(miàn)進(jìn)行支付這(zhè)麼(me)一個環節。
當然,數字人民币如果用在機器網絡更重要的是智能(néng)合約功能(néng),每個機器做了什麼(me)工作,直接在錢包之間進(jìn)行人民币付款。
第二個是AICU錢包,這(zhè)是我接下來重點提的概念,TCTIP網絡沒(méi)有股權的概念,隻有公司才有股權,但是網絡産生網絡價值,我通過(guò)什麼(me)方式進(jìn)行度量和捕獲,這(zhè)是AICU做的事(shì)情。不管怎麼(me)樣(yàng),這(zhè)并不是烏托邦機制,獎勵機制背後(hòu)這(zhè)個機器誰控制的,誰買過(guò)來的,最後(hòu)的人可以很多樣(yàng)。人計算的基礎設施,也可以是IDC,也可以是公司,甚至是個人參與這(zhè)個市場。
計算任務的發(fā)包、計算任務的分包,計算任務與算力的匹配,目标是動态調劑算力供需,提高算力利用效率。盡可能(néng)減少閑置。我們希望所有的計算任務都(dōu)獲得相應的報酬,所有的計算任務都(dōu)按照市場經(jīng)濟規則來做,數字錢包的方式機器之間支付。更重要的是智能(néng)合約,算一下你到底做了多少貢獻,我應該給你多少錢。這(zhè)個網絡有公共産品的味道(dào),網絡裡(lǐ)面(miàn)需要有人維護,激勵網絡内生增長(cháng),怎麼(me)辦?引用稅收機制,分布式網絡裡(lǐ)面(miàn)每發(fā)生一筆數字人民币流動,我自動提取一筆流到公共錢包裡(lǐ)面(miàn),這(zhè)筆錢用來做基礎的系統建設。同時(shí),也構成(chéng)了NSU的價值基礎。NSU本身是機器網絡裡(lǐ)面(miàn)的token,它是一個有現金流支撐的token,總量是固定的,定期發(fā)放,每個周期裡(lǐ)面(miàn)它的發(fā)放量指數衰減,總量是收斂的,我們設想每個周期開(kāi)始的時(shí)候,系統決定這(zhè)個周期發(fā)放多少NSU,已有算力貢獻了多少計算量,等比例發(fā)給他們。
經(jīng)濟網絡活動,稅金平均分配給NSU,如果你有一個NSU,不斷有未來現金流的收入,因爲它是分布式網絡,有治理問題,這(zhè)裡(lǐ)就(jiù)可以引進(jìn)DAO機制,不管是雲計算設施、數據中心,公司和個人通過(guò)投票參與公共事(shì)務。
NSU能(néng)産生現金流收入,并攜帶治理權,相當于分布式計算網絡的“準股權”。我們通過(guò)一套設計方式讓它具備“準股權”的地位。一個節點,不管是IDC還(hái)是設備,持有NSU越多的話,在算力匹配裡(lǐ)面(miàn)優先級越高。比如打車,你的評分級和司機評分級越高,你們就(jiù)會(huì)被(bèi)優先匹配。NSU作爲網絡價值的計量單位,將(jiāng)随著(zhe)分布式計算網絡的發(fā)展而增值,再加上前面(miàn)通縮的機制,越早聯網的算力和計算量,同樣(yàng)的算力和計算量,獲得更多的NSU,激勵大家越早加入越好(hǎo)。
比如讨論在中國(guó)範圍内這(zhè)個東西的可行性,其實不存在任何問題,它确實借鑒了目前區塊鏈DePin領域做的事(shì)情,分布式公共基礎設施,這(zhè)裡(lǐ)最典型的項目是Helium,發(fā)展通訊網絡,之前很多人做過(guò)探索都(dōu)沒(méi)有成(chéng)功,但是它通過(guò)這(zhè)麼(me)一種(zhǒng)方式,很快把節點在全世界範圍内鋪開(kāi)了,這(zhè)體現了經(jīng)濟的作用和資本在裡(lǐ)面(miàn),完全符合中國(guó)對(duì)貨币的監管,也符合人民銀行現在發(fā)展數字人民币的方向(xiàng)。NSU并不是說(shuō)一個空的token,有堅實的現金流基礎,它有價值基礎支撐。至于將(jiāng)來有沒(méi)有一天NSU放在主流股票交易所去做,這(zhè)取決于後(hòu)面(miàn)的發(fā)展和監管政策,當下是完全沒(méi)必要的。在條件不成(chéng)熟時(shí),可以定期在區塊鏈上開(kāi)展針對(duì)NSU的公開(kāi)透明的拍賣,以在網絡節點之間調配NSU。NSU在分布式計算網絡中的地位,類似未上市公司授予員工的“影子股權”。它就(jiù)能(néng)實現當前資本投入和未來收入之間怎麼(me)平衡,通過(guò)資本把資金收進(jìn)來。
爲分布式計算網絡的建設者、運營者和維護者提供公平、可持續的激勵機制,通過(guò)政府來做成(chéng)本太大了,收益不見得高。公司壓力也很大,超互聯新算力的方式來做,共建共享共治,促進(jìn)服務器和硬件設備等的聯合投資,誰投資誰受益,可以自由交易,爲網絡基礎設施建設發(fā)展出新的金融機制,把網絡基礎設施未來收入通過(guò)金融工具的方法把它進(jìn)行組合分拆流轉,可以提前把收入進(jìn)行變現,這(zhè)也是國(guó)家目前在算力市場發(fā)展中正在提倡的金融工具,我們這(zhè)個和它有點像。但不一樣(yàng)的是,REITS沒(méi)有網絡效應,兩(liǎng)個REITS持有者之間沒(méi)有任何關系。但是持有NSU有巨大的網絡效應,這(zhè)也反映了現在大家讨論web3.0的事(shì)情,美國(guó)讨論web3.0主要是各種(zhǒng)應用,我們更多偏向(xiàng)基建方面(miàn)。
建設大模型與元宇宙的多元算力網絡
}“大模型+元宇宙”雙重風口的疊加,加速了算力爆炸式增長(cháng)。~
尊敬的鄭院士、窦教授,各位來賓,大家上午好(hǎo)!
我是摩爾線程的張建中。剛才大家談了很多基礎算力跟算力網絡,鄭教授花了很多時(shí)間跟大家分享新的大模型訓練跟推理對(duì)于算力的需求。其實我把它總結在去年跟今年這(zhè)兩(liǎng)年當中發(fā)生的事(shì)情,大模型跟元宇宙其實它們更加催生了全社會(huì),或者是新的計算世界對(duì)算力的大量需求。
剛才分析報告講,按照這(zhè)樣(yàng)估算,大家都(dōu)要購買A100的話,這(zhè)100billion的投資是不是必須的,如果我們講價錢是不是必須的,答案是不一定的。但算力是不是必須的,我相信答案是yes,而且很多都(dōu)證明,我們今天在座的每一位可能(néng)都(dōu)在經(jīng)曆一個巨大的變化,如何讓我們的一個傳統經(jīng)濟轉向(xiàng)數字經(jīng)濟,傳統經(jīng)濟轉向(xiàng)數字經(jīng)濟的過(guò)程當中,無論你是用GPT的方法去打造和增強你的數字經(jīng)濟的發(fā)展,或者是你可能(néng)有更加超現實的想法去把元宇宙的建設去改造我們傳統的數字經(jīng)濟的話,這(zhè)兩(liǎng)個風口其實都(dōu)在加大我們對(duì)所有算力的焦慮。
人工智能(néng)正在高速發(fā)展,它的下一步是每年的叠代還(hái)是每幾個月的叠代,如果我們要去看它的算力需求,其實跟我們産生數據的量是有關系的。我們都(dōu)知道(dào)每天智能(néng)汽車采集的數據不是以T爲單位,現在是以Z爲單位。我們的手機,我們每天的聊天記錄,我們每天的微信交流的記錄,圖片也好(hǎo),視頻也好(hǎo),文字也好(hǎo),它的交互方式,它的多元化數據來源,都(dōu)會(huì)增加我們對(duì)新型算法和新型算力的強大需求。這(zhè)些模型我相信立刻使用讓我們每一個人都(dōu)會(huì)碰到兩(liǎng)個不可跨越的我把它叫(jiào)鴻溝。
第一個是算力鴻溝,無論你算力有多快,馬上就(jiù)會(huì)用光。無論你的存儲有多大,很快會(huì)用掉。有的時(shí)候就(jiù)像我們自己的辦公室家居環境一樣(yàng),無論給你多大空間你都(dōu)會(huì)很快把它占滿。
怎麼(me)樣(yàng)跨越這(zhè)些鴻溝呢?在很多的算法、速度、數據跟我們的知識積累當中,人類最好(hǎo)的經(jīng)驗就(jiù)是吸取和學(xué)習别人已經(jīng)獲取的知識。所以說(shuō),大模型訓練不一定每個人都(dōu)要去做一遍,爲什麼(me)不從别人那去學(xué)習呢?爲什麼(me)我們不能(néng)夠在全世界通用呢?如果我們大家都(dōu)能(néng)夠把資源更好(hǎo)的節約起(qǐ)來,把算力更好(hǎo)的互通起(qǐ)來,把城市變成(chéng)一台計算機,把一個國(guó)家變成(chéng)計算機,把全球全人類變成(chéng)一個大的計算網絡的話,這(zhè)樣(yàng)會(huì)給我們節約大大的資源。
所以在技術演變當中,如果說(shuō)怎麼(me)樣(yàng)去搭建和組成(chéng)一個全人類都(dōu)能(néng)夠共享的計算網絡,就(jiù)成(chéng)了我們一個新的研究方向(xiàng)。摩爾線程雖然成(chéng)立不久,但是我們緻力于在算力網絡當中提供一個多元化的算力平台,我們都(dōu)知道(dào)每個人的數據不能(néng)千篇一律,即便是我們在今天可能(néng)很流行transformer的時(shí)候大家去使用,可是它的下一步呢?我們想一想,在transformer之前那些算法呢,之後(hòu)的算法呢,數據的多樣(yàng)性,多模态的轉變,每個人,每個算法學(xué)家,每個科學(xué)家,他們源源不斷的創意會(huì)給我們帶來很多大量的複雜的或者是非常多元化的數據格式。
所以一個算力網絡它必須要支撐多元化的數據格式,如果我們把它去看我們的大模型訓練也好(hǎo),推理也好(hǎo),計算也好(hǎo),你的輸入跟輸出結果都(dōu)不會(huì)是文字到文字,可能(néng)以前從一對(duì)一或者一對(duì)多,未來一定是N to N,輸入有完全的輸入,輸出也會(huì)是無窮的輸出,你的計算單元一定能(néng)兼顧到方方面(miàn)面(miàn)的格式。我把簡單的計算方式統稱爲元計算。因爲元道(dào)特别強調一生二、二生三、三生萬物,我把它選元計算也是因爲我相信一切,講元宇宙計算和元計算,其實它的輸入和輸出哲學(xué)上講會(huì)比較玄,但從我們所有計算格式上去看,它能(néng)夠包括的數據量就(jiù)是千千萬萬我們人類創造的各種(zhǒng)各樣(yàng)的數據。它的文本生成(chéng)也好(hǎo),圖像生成(chéng)也好(hǎo),二維的視頻,甚至于三維的模型生成(chéng),都(dōu)可能(néng)加深數據算力需求量。
如果我們把這(zhè)些計算要求在一個大的數據中心當中完整的處理好(hǎo),我們想象一下,這(zhè)樣(yàng)的處理器可能(néng)處理我們的科學(xué)計算,我們的視頻處理,我們的3D計算,或者是我們的雙精度、高精度的科學(xué)計算,或者是一些物理仿真計算,都(dōu)有可能(néng)在其中把它集成(chéng)起(qǐ)來。理想的狀态是需要一個全功能(néng)的GPU,我把它叫(jiào)全功能(néng)GPU是希望它的覆蓋面(miàn)可能(néng)會(huì)在今後(hòu)的應用當中不停的增加,卻能(néng)夠滿足不同用戶的需要。我們看這(zhè)個結構和架構,我們希望GPU(英文)能(néng)夠處理各種(zhǒng)不同的數據單元,剛才鄭老師講,我們希望它有FP32,有FP16,有IN8,除此之外,鄭老師希望至少有一個1:100的64,我們要滿足,不光是矩陣的計算。除此之外,我們不光需要2D計算,還(hái)需要3D的計算。當然,基本上這(zhè)些算力以後(hòu)一定會(huì)在數據中心,而這(zhè)些數據中心一定會(huì)不知道(dào)在哪裡(lǐ)。如果我們今天世紀互聯能(néng)給我們大家形成(chéng)一個超互聯的網絡,其實這(zhè)個放在内蒙古的烏蘭察布,或者放在貴州,對(duì)我們來講這(zhè)個沒(méi)有問題的時(shí)候,解決了鄭老師的快遞順豐成(chéng)本的時(shí)候,一切就(jiù)不是問題。
但是在計算環節當中,這(zhè)個處理器作爲基礎設施,把它建在城市大腦當中,我們就(jiù)不能(néng)把它建錯,所以在建設基礎設施的時(shí)候,算力的綜合性、多功能(néng)性、多元化性,可能(néng)就(jiù)成(chéng)爲我們人類搭建數字經(jīng)濟基礎設施的時(shí)候一定要考慮的一點。
我們把這(zhè)個叫(jiào)全功能(néng)GPU的時(shí)候,希望大家利用GPT和元宇宙兩(liǎng)個風口同時(shí)發(fā)展的過(guò)程當中,無論是國(guó)家的基礎設施建設,還(hái)是我們每一個民營企業、國(guó)營企業在建設大模型、大數據的智算中心的時(shí)候能(néng)考慮到更加全面(miàn)一點。這(zhè)樣(yàng)的産品我們希望能(néng)夠把這(zhè)些元計算的能(néng)力通用的計算加速的能(néng)力源源不斷的在我們數據中心當中搭建起(qǐ)來,當然要搭建這(zhè)樣(yàng)一個通用性,你就(jiù)要有一個完整的支持全功能(néng)GPU的基礎架構,我把這(zhè)個架構叫(jiào)MUSA。MUSA就(jiù)是元計算統一系統架構,利用這(zhè)樣(yàng)的架構搭建一個芯片,其實我們在考慮搭建整個城市大腦的時(shí)候,它就(jiù)像一個小的芯片是一樣(yàng)的。我剛才和元道(dào)讨論也是一樣(yàng),我們搭建城市的時(shí)候,考慮的計算機體系結構是一樣(yàng)的。所以我們等于從一個macro architecture變成(chéng)是一個micro architecture。無論你是計算、存儲、網絡通訊,這(zhè)是一樣(yàng)的道(dào)理,在大的計算機裡(lǐ)面(miàn)是一樣(yàng)。小到一個超算也是一樣(yàng),再小到那個節點裡(lǐ)面(miàn)也是一樣(yàng),剛才鄭老師講的超節點也一樣(yàng),到了節點裡(lǐ)面(miàn)的處理器還(hái)是一樣(yàng),它永遠都(dōu)是在最大化的利用你的算力,去搭建适合你的算力的網絡。
我們把全功能(néng)GPU運用在各個行業的時(shí)候你會(huì)發(fā)現,今天很多應用都(dōu)可以滿足我們實際應用當中圖形處理、科學(xué)計算、仿真計算、數據分析、AI計算、推理等等。在很多應用過(guò)程當中,我們搭建強大的基礎網絡的時(shí)候,其實作爲一家芯片公司你很難隻是做芯片,芯片隻是提供這(zhè)個算力當中的一個部件。作爲一家GPU公司我們能(néng)做的一定要在芯片的基礎之上,爲大家能(néng)夠搭建一個完整的算力網絡,這(zhè)個算力網絡可能(néng)包括你的雲端的管理平台,從怎麼(me)去部署單顆芯片,到端的節點,節點裡(lǐ)面(miàn)可能(néng)放幾百個GPU,超節點有幾千個GPU,組成(chéng)大的計算網絡,甚至在跨城市之間遠距離的大型計算網絡就(jiù)會(huì)成(chéng)爲GPU公司研發(fā)的重點方向(xiàng)。
如何讓GPU跟CPU、跟DPU,或者是其他的一些存算多功能(néng)異構計算的各種(zhǒng)不同處理器能(néng)夠綜合在一起(qǐ)使用的話,這(zhè)個管理平台就(jiù)會(huì)非常重要。所以我們專門搭建了一個MCCPlatform元算力管理調度平台目的是跨平台、跨月去管理和支持各種(zhǒng)不同的算力,去建構一個算力網絡。在這(zhè)樣(yàng)的算力網絡之上能(néng)夠提供更多的工具,讓開(kāi)發(fā)者和用戶更好(hǎo)的使用這(zhè)樣(yàng)的計算網絡,他能(néng)夠自動化調度,按需分配算力,按照各種(zhǒng)不同的任務去節約大量的成(chéng)本。像這(zhè)種(zhǒng)大型的網絡基礎設施作爲一個企業單獨去購買、單獨使用成(chéng)本是很高的,就(jiù)像我們全社會(huì)不可能(néng)人人都(dōu)建一個飛機場,也沒(méi)必要每個人建一個高鐵站。但是這(zhè)樣(yàng)的基礎設施大型網絡設備應該是作爲一個公共的基礎設施去把它設計好(hǎo),讓各個企業、個人和單位都(dōu)能(néng)夠充分的享受這(zhè)些數字經(jīng)濟給我們帶來的改變。
我相信,這(zhè)樣(yàng)的一些基礎設施可以幫助整個科技行業從研發(fā)到生産,到最後(hòu)部署運營,都(dōu)能(néng)夠有一套完整的解決方案,讓每一家企業都(dōu)能(néng)順利轉型到數字經(jīng)濟當中去。我們都(dōu)知道(dào),由于GPT大力出奇迹以後(hòu),很多行業都(dōu)希望用GPT的方式方法去改造他們行業的GPT。對(duì)于訓練一個行業的GPT,你從數據收集開(kāi)始,怎麼(me)有一整套工具在網絡當中收集好(hǎo)、存儲好(hǎo),運用好(hǎo)這(zhè)些預訓練好(hǎo)的模型,别人已經(jīng)預訓練好(hǎo)的模型沒(méi)必要再做一次,搭建你自己的網絡。如果我們有些行業知識,可能(néng)你認爲是你的核心競争力的時(shí)候,這(zhè)些行業知識你可能(néng)不願意分享給public,這(zhè)些data可以在自己行業當中專有的支持和搭建你自己的專業網絡,這(zhè)些專業網絡可以幫助我們很多專業公司提升他們自己的整體核心競争力。
部署很簡單,統一的網絡,全國(guó)全社會(huì)你可以很容易的把你的知識服務到各行各業。所以利用GPT和元宇宙的全功能(néng)大型的基礎集成(chéng)網絡可以幫助很多行業能(néng)夠用低成(chéng)本就(jiù)可以服務到各行各業的全社會(huì)。我們希望利用摩爾線程全功能(néng)GPU能(néng)夠和像世紀互聯基礎網絡設施合作夥伴搭建基礎網絡服務,能(néng)夠讓社會(huì)大家都(dōu)能(néng)夠共享這(zhè)些科技帶來的發(fā)展機會(huì)。
當然,還(hái)有很多這(zhè)上面(miàn)的基礎研究也是我們公司在這(zhè)方面(miàn)做的一些成(chéng)果,我們在利用GPU的圖形渲染、人工智能(néng)的計算以及在雲端的分布式管理和虛拟化技術,可以讓這(zhè)些産品去服務數字人服務人工智能(néng)的推理,去支撐各行各業的應用,都(dōu)可以得益于基礎網絡的建設。我們也希望能(néng)夠和我們的很多合作夥伴在國(guó)内建立一套更加國(guó)産化的服務本地的很多用戶的需要,滿足我們在基礎設施當中這(zhè)些算力提供的服務。因爲在國(guó)内我們有很多本地的合作夥伴,他們生産的CPU操作系統等等,這(zhè)些産品都(dōu)可以跟我們的GPU組合在一起(qǐ),能(néng)夠提供和服務各行各業的用戶,這(zhè)樣(yàng)的生态系統也可以在國(guó)内培養出一批大量基于新型的人工智能(néng)和元宇宙計算的各方面(miàn)的合作夥伴。在國(guó)内很多的開(kāi)發(fā)者以前可能(néng)都(dōu)在利用國(guó)外成(chéng)熟的API開(kāi)發(fā)自己的軟件,比如說(shuō)ChatGPT之後(hòu)我相信有很多人去想試圖利用ChatGPT API,打造能(néng)夠服務各行各業用戶的軟件。但不幸的是這(zhè)些軟件可能(néng)在國(guó)内用不了,怎麼(me)辦?要搭建自己的基礎設施。所以作爲基礎設施的供應商和開(kāi)發(fā)平台,咱們國(guó)内有很多很多研發(fā)機會(huì),去建立一個更加适合本地的生态系統。
我們也希望能(néng)夠利用這(zhè)些機會(huì)跟國(guó)内更多的合作夥伴一道(dào)去打造基礎服務網絡,這(zhè)些不光是芯片,不光是硬件,也不光是網絡設施,同時(shí)還(hái)包括服務更多開(kāi)發(fā)者的軟件的基礎設施,隻有這(zhè)樣(yàng)才能(néng)讓我們的經(jīng)濟轉型走的更順,走的更遠。
謝謝大家!
AI時(shí)代的雲計算
}在确定性消失的時(shí)代,思想上的最大問題是以爲按照确定性的方法可以解決不确定性的問題。~
各位領導,各位來賓,大家下午好(hǎo)!
我們現在所處的這(zhè)種(zhǒng)狀态是不是因爲過(guò)去認知水準上做出的決定造成(chéng)?無論是先進(jìn)的還(hái)是落後(hòu)的,不管是受制的還(hái)是不受制的,我今天20分鍾就(jiù)想講一個話題:我們相不相信依據過(guò)去的想法和思路能(néng)夠讓我們解脫今天的困境,或者說(shuō)是先進(jìn)性。如果這(zhè)個思維方式不改的話,我們有極大概率會(huì)在一年之後(hòu)、十年之後(hòu)、五十年之後(hòu)還(hái)在談同樣(yàng)的話題,因爲我們的思維方式還(hái)是在用老的思想方式去看新的現象。
但是,這(zhè)裡(lǐ)有一個很麻煩的情況,人類的大腦、我們的思維本身以及我們的物理空間、時(shí)空空間,理論上根本不知道(dào)下一秒鍾會(huì)發(fā)生什麼(me)的,當我們對(duì)下一個動作預測的時(shí)候依據的是過(guò)去的經(jīng)驗,過(guò)去的經(jīng)驗适用于現在和未來的概率是多少?肯定不是百分之百,而且大概率事(shì)件,我們今天所處的這(zhè)種(zhǒng)情況就(jiù)是因爲我們用了舊的想法才讓我們變成(chéng)今天這(zhè)樣(yàng)子。大家問自己一個問題,我們是否接受現在的狀況?如果接受,說(shuō)明我們過(guò)去的邏輯和決策是對(duì)的;如果不接受,我們想再去拿現在的邏輯套明天,或者回到本源,去仔細考慮一下我們的邏輯是否符合時(shí)代的需求。
所以剛剛接到這(zhè)個任務說(shuō)今天和大家交流,20分鍾很難講很多細節内容,我想咱們就(jiù)套題目,三生萬物,行則至。
請問,一生二、二生三、三生萬物,一之前是什麼(me)?是零,如果我們不從零上重新想問題的話,大概率事(shì)件我們還(hái)是從過(guò)去形成(chéng)的邏輯走到今天,今天走到明天。談到這(zhè)個有些人還(hái)不是很接受,我問大家三個問題:
第一,大家都(dōu)坐過(guò)高鐵。第二,大家是不是都(dōu)坐過(guò)汽車。第三,第一次坐高鐵的時(shí)候,沒(méi)有安全帶,會(huì)不會(huì)安全?高鐵的安全性和汽車比,一個系安全帶,一個不系安全帶,誰高誰低,它是範式的改變,用過(guò)去的想法套今天是無法理解的,但人的大腦又沒(méi)法思考到你的認知圈之外的東西,你不可以想象你不知道(dào)的東西。請問大家,我們說(shuō)即將(jiāng)進(jìn)入一個智能(néng)時(shí)代,即將(jiāng)進(jìn)入一個元宇宙,即將(jiāng)進(jìn)入Web3.0,我們真的知道(dào)我們將(jiāng)進(jìn)入一個什麼(me)時(shí)代了嗎?因爲人的大腦是一定要用舊有範式,否則沒(méi)法接受。人是不主動活在未知的未來,當你邁出左腳往前走的時(shí)候,我們很難接受我根本不知道(dào)這(zhè)個腳放下去是一個坑,你要想象它不是一個坑,哪怕是一個坑,然後(hòu)往前走。
像我們最近看的所有文章、所有報告、所有預估,都(dōu)一定是拿過(guò)去的一個筐裝今天的瓜,筐和瓜有沒(méi)有關系我們不管了,但是必須暗示自己有一個因果性,哪怕它隻是相關性。所有學(xué)概率學(xué)統計的都(dōu)知道(dào),第一門課講的就(jiù)是相關性不是因果性。那麼(me),現在看的所有東西是不是隻是相關性,因果性是什麼(me)?所以今天的題目特别好(hǎo),我今天想交流的是,真的是相信三生萬物,行則至。那個三就(jiù)必然問二是什麼(me),二就(jiù)必然問一是什麼(me),一就(jiù)必然問零是什麼(me),這(zhè)樣(yàng)咱們才能(néng)夠把我們從現在這(zhè)種(zhǒng)不管是好(hǎo)的局面(miàn)還(hái)是不好(hǎo)的局面(miàn),抽出來,上一個台階,否則的話咱們還(hái)在這(zhè)裡(lǐ)面(miàn)打轉,一會(huì)兒我會(huì)講過(guò)去發(fā)生的一些事(shì)情。
我們要相信,我們既不是前無古人,也不是後(hòu)無來者,我們隻是技術發(fā)展中一個非常小的螞蟻,我們趕上好(hǎo)時(shí)代了,這(zhè)個很危險,因爲我們不知道(dào)它是什麼(me),能(néng)不能(néng)接受我們不知道(dào),把過(guò)去的包袱放掉,幹什麼(me)?随時(shí)按照當前信号給你的分析,而且你要知道(dào)信号信道(dào)比怎麼(me)樣(yàng),機器可以産生很多數據信息,請問大家,我們每天看朋友圈裡(lǐ)這(zhè)些信息,你覺得它是誰寫的,你覺得它是把你往一個坑裡(lǐ)帶還(hái)是往一個山坡上帶,我們想過(guò)嗎?因爲我們大腦還(hái)是用海德堡印刷機時(shí)代,我們堅信隻要是寫出來的,隻要是放在我面(miàn)前的,原先說(shuō)耳聽爲虛、眼見爲實,如果現在跟大家講眼見也是虛的,隻有行則至,我們願不願意這(zhè)麼(me)想問題、這(zhè)麼(me)去做事(shì),還(hái)是說(shuō)不,這(zhè)個大咖說(shuō)了怎麼(me)樣(yàng)我就(jiù)這(zhè)麼(me)做了,有可能(néng)對(duì),有可能(néng)不對(duì),但是在劇變的時(shí)代這(zhè)樣(yàng)非常危險。如果OpenAI那些人信了大咖說(shuō)的話,今天就(jiù)不會(huì)有ChatGPT。如果不是他們兩(liǎng)三年前開(kāi)始換思維範式,覺得當時(shí)未被(bèi)證明的ChatGPT方式比雙向(xiàng)bard好(hǎo)一點,我相信我們今天不會(huì)談這(zhè)個話題的,包括世紀互聯,如果當初陳總創業時(shí)相信了專家跟他講的話,我相信不會(huì)有這(zhè)家公司的,也不會(huì)有微軟。
我們爲什麼(me)相信我們聽到的所謂專家的意見,不是說(shuō)專家的不是,而是現在技術發(fā)展把每個點給連在一起(qǐ)了,連在一起(qǐ)的好(hǎo)處是網絡效應,但有一個後(hòu)果,什麼(me)後(hòu)果?人的腦子已經(jīng)想不明白了。這(zhè)是網絡,比如村裡(lǐ)有10戶人家,傳統的網絡效應,就(jiù)算雙向(xiàng),不除2,90個,如果10個節點實時(shí)連接,實時(shí)産生0和1的互動,我同意或者我不同意,是10的27次方指數關系,請問,有哪個腦袋能(néng)夠把這(zhè)個問題想明白?所以我們要靠機器去算,幫我們計算這(zhè)些各種(zhǒng)可能(néng)性以及之後(hòu)産生的答案,給我們做參考。AI時(shí)代,一方面(miàn)雲計算會(huì)有足夠的算力來算這(zhè)些事(shì)情,但是很重要的,算的這(zhè)些東西也能(néng)夠反哺雲計算,讓雲計算更高效,它的虛機、容器分布,誤差信息的及時(shí)檢測,各種(zhǒng)自動化,現在雲計算如果還(hái)在靠腳本去管的話,不是不可以管,這(zhè)是兩(liǎng)難問題。它意味著(zhe)兩(liǎng)點:第一,你确實用腳本管,還(hái)管成(chéng)了;第二,你剛好(hǎo)有資本去管雲計算,還(hái)沒(méi)有到用算法管雲計算。當你不用算法管雲計算還(hái)管的很好(hǎo)的時(shí)候意味著(zhe)什麼(me)?意味著(zhe)你的連接才是90的連接,而不是10的27次方的連接,這(zhè)種(zhǒng)信号會(huì)誤導你,覺得我是行的,所以本質上出問題了。
這(zhè)是我非常喜歡的一個英國(guó)作家,他寫的這(zhè)部戲,200年前維多利亞時(shí)代和當下新的思維方式做同一件事(shì),萬一你認爲的基礎都(dōu)錯了再往上搭樓就(jiù)沒(méi)法搭了。微軟裡(lǐ)面(miàn)我觀察到的現象,誠懇地講,我根本不知道(dào)現在發(fā)生什麼(me)事(shì)了,因爲每個人每天都(dōu)在刷新昨天的認知,我在這(zhè)個行業中看到,如果有資格說(shuō)我昨天錯了,恰恰不意味著(zhe)你不行。如果每個人說(shuō),老闆抱歉,我昨天想錯了、昨天說(shuō)錯了。這(zhè)個人一定要嘉獎,一定要鼓勵,爲什麼(me)?因爲他昨天真錯了。如果有人跟你說(shuō)老闆,去年定的方案我想的特别對(duì)。要小心,這(zhè)種(zhǒng)有可能(néng)是幸存者偏差,小概率現象極大表現。
在這(zhè)種(zhǒng)情況下,大衛斯諾登(音)是IBM的科學(xué)家,他在本世紀初就(jiù)跟情報系統做應對(duì)複雜性挑戰的事(shì)情,這(zhè)裡(lǐ)有個框架,他去年寫了一個論文,作爲綱領,他跟大家講這(zhè)年頭方向(xiàng)對(duì)了就(jiù)行了,不要那麼(me)較真你要去哪。東北的朋友知道(dào),每年春節要去海南過(guò)冬,那個就(jiù)是終點。其實東北朋友們的春節沒(méi)必要去海南過(guò)冬,你隻需要去一個溫暖的地方就(jiù)可以了。你的溫暖的定義和别人是不一樣(yàng)的,如果你走到福建覺得夠溫暖了你就(jiù)走到福建,如果預先說(shuō)别人說(shuō)了海南過(guò)冬,造成(chéng)交通擁堵,你說(shuō)是海南錯了還(hái)是你的方向(xiàng)本來是找移居溫暖的地方,結果被(bèi)框在裡(lǐ)面(miàn)了,目的變成(chéng)方向(xiàng)了。如果我今天知道(dào)了否定昨天,跟老闆說(shuō)明天要把今天否定掉,這(zhè)對(duì)老闆的挑戰就(jiù)來了,你說(shuō)這(zhè)人該不該用?
所以敢于承認不知道(dào),但還(hái)是行則至的人才和想法、公司才有未來。
我既不知道(dào)它是什麼(me),我也不确定它不是什麼(me),但大緻知道(dào)是什麼(me)和可能(néng)不是什麼(me)。古人講做個明智的人,這(zhè)個智我加了個知人者智,自知者明。光知道(dào)人不夠,還(hái)要知道(dào)機器,在這(zhè)種(zhǒng)情況下,我把微軟Microsoft 365裡(lǐ)面(miàn)每一個詞掰開(kāi)了揉碎了講一下,再次強調,不是答案,隻是觀察,可能(néng)就(jiù)把它破掉了,但是不破不立,這(zhè)種(zhǒng)物種(zhǒng)的生存能(néng)力可能(néng)就(jiù)好(hǎo)過(guò)我想知道(dào),因爲知道(dào)在哲學(xué)領域稱之爲全是主觀的,知識本來就(jiù)是主觀的,你認爲怎麼(me)樣(yàng)就(jiù)怎麼(me)樣(yàng),我們都(dōu)是盲人,今天可能(néng)我摸的是大象的屁股,AI時(shí)代雲計算像一堵牆,小馬過(guò)河下水了,摸象的鼻子說(shuō)像根繩子,咱倆誰對(duì)誰錯?沒(méi)有誰對(duì)誰錯,行則至,貝葉斯大腦,它的最大特點是你随時(shí)用新知識新信息糾正原來的PA,然後(hòu)變成(chéng)PAB。
40分鍾産品發(fā)布,我問了很多人,大部分人看了後(hòu)面(miàn)的演示,很炫,但演示基本上做的那一刻就(jiù)過(guò)時(shí)了,今天和你講的技術明天就(jiù)過(guò)時(shí)了,這(zhè)是劇變的時(shí)代,你一定要知道(dào)當時(shí)那個想法怎麼(me)出來的,聖人畏因,凡人畏果。你追因有可能(néng)把土地弄好(hǎo)了長(cháng)出參天大樹出來,等别人桔子樹長(cháng)出來了你說(shuō)我也種(zhǒng)一個桔子樹,萬一你的土地在淮北,你就(jiù)不應該種(zhǒng)桔子樹,種(zhǒng)蘋果就(jiù)完了,要有一棵能(néng)夠在這(zhè)片土地上長(cháng)出來可以吃的水果,把蘋果做的最好(hǎo)是可以和桔子交流互換的,因爲淮南長(cháng)不出這(zhè)麼(me)好(hǎo)的蘋果樹。
推薦大家看這(zhè)篇文章,1945年寫的,提到了memex信息設備,世界上所有名字選的都(dōu)是随機的,代表想法,但是更多是願意讓你聽的,是名字後(hòu)面(miàn)的邏輯,我把它抽象成(chéng)selection by association,生成(chéng)往下下一個詞怎麼(me)出來?一個布什,一個恩格爾巴特,搭建了特别好(hǎo)的數字化轉型範式,你學(xué)那個範式比誰都(dōu)強,未來也是跟他學(xué)的,咱們一直想解決的就(jiù)是大腦的問題。
未來十年内,如果每個人手邊都(dōu)有一個小D,你問他這(zhè)個人是什麼(me)人,它站在我們所有人肩膀上,以一個個體在衆智的基礎上大家互相PK,那個時(shí)候現在很多範式就(jiù)完全解開(kāi)了,教育的方法、選人的方法。如果招程序員的話,一個會(huì)刷題的,跟一個老闆你能(néng)不能(néng)給我聯網,我直接在大預訓練模型上算法,把活給幹了,我想你當然是想要把活幹了的程序員。可是我們的考試和選人機制沒(méi)辦法那麼(me)快把活幹出來,新的大預訓練模型都(dōu)是概率模型,有時(shí)候是會(huì)發(fā)瘋的,不放在0,放在1度,有時(shí)候胡說(shuō)八道(dào),不能(néng)不懂,又不能(néng)全記下來,還(hái)要做活快。所以我們現在需要的是完全不同物種(zhǒng)的程序員、管理人員、公司形态、社會(huì)形态,如果我們還(hái)拿過(guò)去去套web3.0、人工智能(néng)、元宇宙、區塊鏈,元宇宙已經(jīng)三十年的詞了還(hái)當真,信息時(shí)代知識經(jīng)濟,别追那些新詞,會(huì)誤導我們的,我們就(jiù)是讓機器用知識幫人類做決策,讓機器幹活。
正是因爲這(zhè)樣(yàng),機器很容易成(chéng)爲神,人的大腦思維很容易産生共情,一旦産生共情,當機器的行爲方式跟人有一定匹配度的時(shí)候,我們沒(méi)法想,機器怎麼(me)做的,拿一個人類的詞給它,機器會(huì)思考,機器會(huì)判斷,機器會(huì)把人殺掉?NO,機器是用它的方式,如果思考的話請給它加一個金字旁,機器的判斷和人是不一樣(yàng)的,我們如果産生共情的話很容易錯誤判斷機器的能(néng)力,真以爲它知道(dào)什麼(me)叫(jiào)排序了,它不知道(dào)。它的每一個token都(dōu)是概率算出來的,這(zhè)時(shí)候人就(jiù)知道(dào)怎麼(me)做了,做機器的主人。
這(zhè)是大都(dōu)會(huì),一個默片,講的是思考的決策大腦和行動手之間需要有一個中間調解人,這(zhè)個調解人必須是人心,這(zhè)是將(jiāng)近一百年前說(shuō)的。
我們現在做數字化轉型,管理雲計算中心。在它沒(méi)有被(bèi)自動化之前,每一個節奏都(dōu)是很浪費精力的,但你想象一下,這(zhè)裡(lǐ)的每一個動作都(dōu)是事(shì)件Base的,每一個動作都(dōu)是沒(méi)有記憶力的,就(jiù)是有一個動作。公司裡(lǐ)面(miàn)無論是财務、人事(shì)、運營,還(hái)是銷售、生産,把所有流程都(dōu)變成(chéng)一個Action,然後(hòu)給它一個信息,如果公司全都(dōu)這(zhè)樣(yàng)的話,馬上就(jiù)能(néng)做數字化轉型,馬上就(jiù)能(néng)讓機器幫你把這(zhè)裡(lǐ)面(miàn)的每一個trigger,根據某種(zhǒng)commission移步往前走。這(zhè)個我認爲就(jiù)是AI要搭架子的基座、腳手架。所有公司所有流程如果沒(méi)有這(zhè)個腳手架的話,你再請AI、再好(hǎo)的工程師、再好(hǎo)的算法都(dōu)沒(méi)有意義,因爲你沒(méi)有一個可被(bèi)trigger的,每個actor與actor之間彼此要互相調用,而且是沒(méi)有記憶力的,有記憶力就(jiù)亂了,記憶力要在外面(miàn)記,裡(lǐ)面(miàn)隻管做事(shì)。這(zhè)是機器的做法,每一個都(dōu)是trigger。
我們的雲計算流程,我們的公司,有沒(méi)有形成(chéng)這(zhè)個毫無用處的機器,如果沒(méi)有形成(chéng)的話,我們談人工智能(néng)就(jiù)稍有點距離。這(zhè)裡(lǐ)有trigger、有定時(shí)器,用機器算法做的定時(shí)器,不同的(同上),讓這(zhè)個事(shì)情有并行、有串行,有延時(shí),慢慢往前走,這(zhè)就(jiù)是數字化标準的模型。
哥德兩(liǎng)百年前寫的小說(shuō)《魔法師的學(xué)徒》,這(zhè)東西你會(huì)開(kāi)就(jiù)要會(huì)關,不會(huì)關就(jiù)出問題了,還(hái)要像寶瓶中的精靈一樣(yàng),能(néng)收回去,最後(hòu)的備份方案永遠是人,這(zhè)個公司又能(néng)夠最高效,同時(shí)又不會(huì)被(bèi)機器搞死。這(zhè)就(jiù)是它的邏輯,其實就(jiù)是兩(liǎng)件事(shì),人是有弱點的,咱們有一堆毛病,機器能(néng)幫我們解決這(zhè)些毛病,它也腦補了,我們不得不腦補,否則就(jiù)活不到今天,現在機器沖著(zhe)人的思想去的,我們不能(néng)老自己腦補,比如你看這(zhè)人,一定是你有一個固化思維它就(jiù)怎麼(me)樣(yàng),不是這(zhè)樣(yàng)的,但是人要智慧機器。
所以第二個問題,Copilot,智能(néng)副駕優先過(guò)自動駕駛,爲什麼(me)?通常我們認爲先有智能(néng)副駕,再有全自動駕駛,不是的。微軟是說(shuō)Autopilot是Copilot之前的事(shì),以後(hòu)我們要的是智能(néng)副駕,誰爲主體誰爲客體不要小看這(zhè)個,這(zhè)時(shí)候腦補一下,十年以後(hòu)路德主義風行。對(duì)技術能(néng)力的信仰,促成(chéng)了對(duì)技術能(néng)力的實現。對(duì)人類價值觀的信仰,才能(néng)守住人類的主體性。總說(shuō)機器代替人,這(zhè)樣(yàng)很容易産生誤導,而且讓這(zhè)個社會(huì)甚至走向(xiàng)一個本來不應該走的方向(xiàng),其實Copilot就(jiù)是以人爲本,Autopilot以機器爲本。
左邊是大語言模型,右邊是應用,中間是知識圖譜,一個數據庫,這(zhè)個我覺得是核心,如果所有公司都(dōu)在用大語言模型的話你是everyone,因爲每個人都(dōu)有。如果存成(chéng)知識圖譜,被(bèi)大語言模型語義匹配,那麼(me)你們公司說(shuō)的促銷跟可口可樂說(shuō)的促銷,語義上是不一樣(yàng)的,這(zhè)時(shí)候你們公司才能(néng)真正擁抱機器的能(néng)力,否則的話是沒(méi)有核心競争力的。你的第一步是擁抱大語言模型,才更需要踏踏實實做數字化轉型,其實就(jiù)是信息化,信息化遠沒(méi)有完呢。
談到AI,也别隻是一個OpenAI,是整個系統工程,複雜的巨系統工程,是一個短闆效應加長(cháng)闆效應的結合,一個機器連一個螺絲釘,如果不結實的話這(zhè)個機器就(jiù)跑不了,哪一個能(néng)不做呢?哪一個都(dōu)得做。
最後(hòu),其實還(hái)是知識,還(hái)是數字化轉型,還(hái)是流程再造,還(hái)是全員賦能(néng),還(hái)是AIX,是所有的東西。這(zhè)麼(me)談AI就(jiù)容易了,AIOps就(jiù)是把客戶需求、服務内容和工程全部自動化,然後(hòu)一步一步的,從以人爲本的技術,到模型安全合規,到可解釋的AI模型,小步快跑式的AI功能(néng)落地。用幾個模型演示一下,你能(néng)幹這(zhè)活是微軟做的事(shì),在座各位千萬别做這(zhè)種(zhǒng)事(shì),因爲你是拿來賺錢的,微軟是賣這(zhè)個能(néng)力的,給您演示的是結果,從您來講您是一下達不到這(zhè)個結果的,需要一步一步從一樓走到十樓,這(zhè)個邏輯千萬别忘記。
初看都(dōu)是技術,全都(dōu)是人的問題,人的問題全是思想的問題,思想的問題最大的問題就(jiù)是死不悔改,我比你有經(jīng)驗,我比你牛,我比你官位高,我比你知識多,所以才聽我。這(zhè)個時(shí)代怎麼(me)可能(néng)呢,是誰站在時(shí)代最前沿聽誰的。從個體到集體,得有領域模型,沒(méi)有領域模型你跟其他公司是一樣(yàng)的,你的每個流程,每個動作,全都(dōu)有個副駕,人在中間來做決策,最後(hòu)從整體來講我認爲咱們面(miàn)臨的挑戰遠比AI大得多,是文明之争,文明生存與發(fā)展之争。這(zhè)個以後(hòu)有興趣可以深談,當我們說(shuō)人工智能(néng)、工業革命,我傾向(xiàng)于它說(shuō)小了,它就(jiù)是一次文藝複興,人類知識再造,還(hái)是要解放思想,不要把機器當神,謝謝大家!
超互聯新算力的創新發(fā)展
}今天不再是一切皆信息,現在變成(chéng)一切皆計算。算粒(Computinglet)+超級互聯將(jiāng)帶來新算力的三大突破:突破計算節點算力供給極限難題、突破高速總線網絡廣域部署難題、突破算力網絡協同建設機制難題。~
尊敬的鄭院士,尊敬的各位好(hǎo)朋友,非常高興有機會(huì)和大家在這(zhè)裡(lǐ)做一個小小的分享和彙報。我是一名在民營企業做數字基礎設施的老兵了,見證了一路上的發(fā)展,很激動人心看到現在最新的通用人工智能(néng)的發(fā)展,可以想象對(duì)未來基礎設施的變化,在這(zhè)裡(lǐ)和大家做一些對(duì)未來思考的分享。
有以下七點:
第一個,兩(liǎng)個戰場,多大的戰場?前面(miàn)幾位嘉賓都(dōu)談到了,三四個月翻一翻的算力,從華爲角度看,如果綜合下來,到2030年是500倍的通用人工智能(néng)訓練所帶來的算力增長(cháng),有不同的角度。剛才微軟中國(guó)CTO韋青說(shuō)的非常好(hǎo),每天刷新自己,我們不做任何判斷,我們把不同的數據擺在自己面(miàn)前,我們用自己的眼睛去觀察,看看最後(hòu)哪個判斷是對(duì)的,從我個人來看,我更願意相信,确實,如果是每三到四個月以100天的速度翻一番的話,确實是面(miàn)臨百萬倍指數級增長(cháng)。
針對(duì)中國(guó)這(zhè)樣(yàng)的國(guó)家,這(zhè)件事(shì)情一定不是純市場化的。今天我們的優勢,我們的體制,一定是跟舉國(guó)體制相關,去看待算力。如果是傳統的舉國(guó)體制,百分之百依賴傳統舉國(guó)體制,還(hái)是今天數字文明的時(shí)候我們可以同時(shí)此消彼長(cháng),既有主戰場也有第二戰場,國(guó)家所提出來的新型舉國(guó)創新體制。本質上講,繼承舉國(guó)體制創新的基礎上,我們要看商品不能(néng)隻看産品,我們看效益不僅僅實現目标,像這(zhè)些理念如果搬到這(zhè)個行業來,搬到算力領域來,這(zhè)兩(liǎng)個戰場看得很清楚。一邊是大的美,統一的美,自上而下的美。另一邊是自下而上的美,是多姿多彩的美,是個性化的美,是來自群衆智慧的美,如果這(zhè)兩(liǎng)種(zhǒng)力量都(dōu)能(néng)夠彙聚在一起(qǐ),共同爲今天我們舉國(guó)體制的優勢在新的數字文明時(shí)代發(fā)揮好(hǎo),兩(liǎng)條腿走路。
這(zhè)是第一個和大家分享的觀點。
所以我們今天的行業不僅僅是舉國(guó)體制的超算,還(hái)包括非超算,非超算一樣(yàng)可以超互聯,一樣(yàng)可以打造新的算力産業。
對(duì)于第一個戰場,今天是思想的盛宴,大咖雲集,群星閃耀,聊的非常多,我不展開(kāi)談了。有很多數字,從半導體工業來的數字,如果今天Google上所有的搜索全部轉成(chéng)通用人工智能(néng)體系的話,需要400萬張以上的A100卡,像這(zhè)樣(yàng)一個自上而下的美,這(zhè)樣(yàng)一個強大的美,我們看到了它的美,很多時(shí)候是仰望星空,可望而不可及,我們不能(néng)完全依靠一條腿走路。
如果我們談說(shuō)除了這(zhè)些平台的強大自上而下的推動之外。第二個方向(xiàng),我們說(shuō)的很容易,多中心化,多姿多彩,在工程上,在科學(xué)基礎上,它的支點是什麼(me)呢?爲什麼(me)可以做到呢?我們怎麼(me)樣(yàng)把烏托邦變成(chéng)今天是我們工程師可以相信的一步一個腳印往前走的東西呢?第二個主題詞是Computinglet,這(zhè)個詞怎麼(me)來的呢?不是我們聯盟在談,不是中國(guó)人在談,是全球很多今天對(duì)去中心化超大規模100萬倍指數級增長(cháng)基礎設施有想法的科學(xué)家、工程師、芯片設計者都(dōu)開(kāi)始意識到一個問題,我們要在過(guò)去,如果說(shuō)最底層是芯片設備,再往上走是基礎設施,當我們去談一個100萬倍基礎設施的時(shí)候,過(guò)去基礎設施從來沒(méi)有這(zhè)麼(me)增長(cháng),如果算力基礎設施按照100萬倍增長(cháng)的時(shí)候,我們今天可以借鑒的工業路線圖應該去芯片裡(lǐ)去找,芯片過(guò)去發(fā)生過(guò)的故事(shì)是“芯粒”。
這(zhè)麼(me)一個芯粒的故事(shì),從不同的角度來解讀,一個7納米制成(chéng)的芯片,如果說(shuō)在一些非關鍵性的一些模塊上,能(néng)不能(néng)和22納米器件這(zhè)成(chéng)的,能(néng)夠組合在一起(qǐ),互相間連接在一起(qǐ),不要百分之百依賴7納米器件,這(zhè)些在半導體工業發(fā)生過(guò)的精彩故事(shì)能(néng)不能(néng)吸納到基礎工業領域,這(zhè)是“算粒”Computinglet。
從芯粒到算粒不是簡單一個字的改變,一個新算力,我們的一個願景,一個百萬倍未來十年增長(cháng)的願景,我們去找到工程師的切入點,我們想到了算力,這(zhè)種(zhǒng)算力,如果它每一個最小顆粒,我們去借鑒一個7納米和22納米制成(chéng)的一個新模塊,能(néng)夠無縫銜接在一起(qǐ),構成(chéng)一個不依賴于7納米,但同樣(yàng)能(néng)達到很好(hǎo)效果的一個芯片力量。同樣(yàng),今天非超算的最小計算單元和超算的計算單元,國(guó)家發(fā)改委在提到“東數西算”的時(shí)候用了三異,異構、異數、異地。這(zhè)三異的運算能(néng)不能(néng)高效互聯、能(néng)不能(néng)高效協同、能(néng)不能(néng)組成(chéng)合力、能(néng)不能(néng)東西南北全調度。在這(zhè)種(zhǒng)情況下,我相信從這(zhè)套政策思考是可以在半導體工業界的工程師的方案裡(lǐ)面(miàn)去找到很多答案的,我們一批的工程師,一批沒(méi)有分國(guó)界的,對(duì)開(kāi)源軟件信仰,對(duì)密碼學(xué)信仰的一批人,我們在做這(zhè)件事(shì)情。
我們希望把這(zhè)些東西能(néng)夠做成(chéng)對(duì)下一個從互聯網有http,今天不是一切皆信息,現在變成(chéng)一切皆計算的時(shí)候,我們能(néng)不能(néng)有一批工程師一塊兒來做出一個能(néng)夠超越不是爲點到點的信息交換而做的一個網絡,我們今天是爲一個異地、異構、異數,一個高速交換的超算和“非超算”高速互聯的一個新型的計算總線而做的開(kāi)發(fā)協議,這(zhè)套東西叫(jiào)超互聯,它是hyper connected computing architecture下的思考。在這(zhè)裡(lǐ)面(miàn)要形成(chéng)突破,算力有各種(zhǒng)各樣(yàng)的形态,規模上不限制,既可以有太湖之光這(zhè)種(zhǒng)超大規模的超算基地,也可以有家裡(lǐ)放的一個小小的算力節點,這(zhè)些不同大小的異地、異構、異數的節點,如果能(néng)夠真正形成(chéng)超級互聯,它就(jiù)可以實現把我們今天原來談“東數西算”,強調東和西的均衡配置,提“東數西算”的時(shí)候還(hái)沒(méi)有這(zhè)麼(me)大規模的通用人工智能(néng)的爆發(fā),但今天已經(jīng)不是東西配置了,是東也不夠、西也不夠,兩(liǎng)邊都(dōu)不夠,面(miàn)臨的是每三到四個月100天的速度在翻一番的速度訓練,這(zhè)種(zhǒng)情況下,我們原來所談的算力規模的瓶頸,廣域連接網絡的瓶頸,清華大學(xué)高性能(néng)計算小組,到内蒙古,到太湖之光,像這(zhè)樣(yàng)的廣域網絡的瓶頸以及協同的瓶頸,這(zhè)三大瓶頸我們能(néng)不能(néng)在一個新的結構裡(lǐ)面(miàn),今天我們走出原來的一個在大樓裡(lǐ)面(miàn)的高性能(néng)計算,一個在數據中心裡(lǐ)面(miàn)的計算,我們把這(zhè)兩(liǎng)種(zhǒng)在高性能(néng)科學(xué)計算,這(zhè)一群機器裡(lǐ)面(miàn)所發(fā)生過(guò)的網絡芯片、連接、平衡、測量等等,把這(zhè)些技術提煉出來。我們也把雲計算裡(lǐ)面(miàn)過(guò)去所發(fā)生的超大規模雲計算,滿足雙11億萬次并發(fā)沖擊的很多最佳實踐,我們把它提煉出來,打造一個開(kāi)放式的,能(néng)夠超越過(guò)去互聯網的新的Cyber Space。
這(zhè)和過(guò)去的有什麼(me)區别呢?過(guò)去的網絡沒(méi)有股權,過(guò)去的公司是有股權的,中國(guó)電信上市,中國(guó)移動上市,各個電信公司因爲享受了互聯網寬帶的增長(cháng),業績持續增長(cháng),像世紀互聯,像萬國(guó),像其他友商秦淮等等,我們都(dōu)分享了互聯網基礎設施巨大發(fā)展而形成(chéng)的股權。那麼(me),每一個用戶家裡(lǐ),每一個個人隻是作爲用戶,就(jiù)像我們坐滴滴,每一個滴滴用戶是滴滴經(jīng)濟體的重要成(chéng)員,完全被(bèi)動式的作爲滴滴經(jīng)濟的成(chéng)員。在我們談算力的時(shí)候,能(néng)不能(néng)引入此算力再加上彼算力,這(zhè)兩(liǎng)個事(shì)情組合,如果每一個算力單元它都(dōu)是有獨立的身份,它是一個可以計量的經(jīng)濟活動,它是一個可以進(jìn)行點到點交易的主體。在這(zhè)種(zhǒng)情況下,是不是我們今天建設百萬倍指數級增長(cháng)的時(shí)候不僅僅依靠國(guó)家開(kāi)發(fā)性金融,我們依靠REITs,依靠更多點到點的,中國(guó)過(guò)去在各地建立起(qǐ)來的數據交易所,我們看到的這(zhè)些數據交易,這(zhè)些完全數字文明,完全數字化世界裡(lǐ)面(miàn)的金融産物,把這(zhè)裡(lǐ)面(miàn)所發(fā)生的一些行爲範式能(néng)夠用到我們的算力世界裡(lǐ)面(miàn)去。
除了經(jīng)濟規模之外,還(hái)有一件事(shì)情大家可能(néng)也都(dōu)注意到了,大概兩(liǎng)周左右的時(shí)間,中央網信辦提出對(duì)生成(chéng)式人工智能(néng)監管的臨時(shí)規範,這(zhè)套規範出來意味著(zhe)什麼(me)呢?今天任何一家大模型公司滿足監管和合規的成(chéng)本非常巨大,我們今天在短視頻時(shí)代,像抖音、快手,爲了保證中心化平台視頻合規需要付出巨大代價,這(zhè)隻是短視頻,如果變成(chéng)人類文明裡(lǐ)面(miàn)知識系統,全部以這(zhè)種(zhǒng)方式打造一個新型的矽基和碳基融合的世界,靠這(zhè)套方法還(hái)行嗎?我們覺得在這(zhè)個時(shí)候,當我們在談算力的時(shí)候,它不僅僅是工程師的問題了,它涉及到很多治理,涉及到一個國(guó)家對(duì)數智體系再往下走的時(shí)候法律監管的體制。這(zhè)個體制裡(lǐ)面(miàn)不應該隻是一個傳統平台,一個傳統服務商的監管邏輯,應該是把人請進(jìn)來,把家庭請進(jìn)來,應該human in the loop,城市之所以稱爲城市,不僅僅是冷冰冰的建築,它有家庭,有很多最小單元,有民宿,應該把這(zhè)些力量成(chéng)爲新的生成(chéng)式人工智能(néng)時(shí)代,矽基碳基,這(zhè)是一個探索性的事(shì)業,應該讓所有的參與者,所有的用戶,用自己自律的力量,成(chéng)爲監管的組成(chéng),成(chéng)爲大平台公司監管上的成(chéng)本和代價以及風險。
從這(zhè)個意義上講,要支持剛才所講的這(zhè)套力量,同樣(yàng)需要一套能(néng)夠超越現在TCPIP的底層協議,能(néng)夠超越現在互聯網計算結構的一個新型網絡基礎設施結構。這(zhè)裡(lǐ)我和大家分享一本書《大教堂與集市》,大家有空可以看一看。這(zhè)背後(hòu)所談的自律,今天群體的力量怎麼(me)能(néng)夠比一個單一的力量更加強大。
剛才我談到了很多城市,今天的主題之一,城市就(jiù)是一台計算機,這(zhè)台計算機是什麼(me)計算機呢?它不是傳統的這(zhè)一台計算機的概念,它已經(jīng)是一種(zhǒng)新型的,我們叫(jiào)citylet,就(jiù)像剛才韋青所談的,我們上高鐵不需要戴安全帶,這(zhè)和我們傳統的認知已經(jīng)完全不一樣(yàng)了。這(zhè)台計算機的工程雛形,在高性能(néng)計算裡(lǐ)我們已經(jīng)看到了,在數據中心内部是高速的、立體的、無縫銜接的二層網絡。這(zhè)套結構我們在數據中心内部,不管是支持是HPC的還(hái)是支持super cloud,走出機房,走到城市每一個角落,走到每一個家庭的桌面(miàn),走到辦公室裡(lǐ)面(miàn)去,這(zhè)個結構是我們所談的city as a computer的節點,也是一個城市算粒(粒子的粒)的起(qǐ)點。
今天是一個思想的盛宴,我們和一般的談AGI的會(huì)議不同,我們既有鄭院士,我們有通用人工智能(néng)最領先的微軟公司,有摩爾線程這(zhè)樣(yàng)的芯片公司,當我們談基礎設施的時(shí)候,基礎設施不僅僅是工程師邏輯,它有哲理,有哲學(xué),一個工程師背後(hòu)已經(jīng)是城市文明的标識,基礎設施既有硬核可以向(xiàng)大家服務,同時(shí)作爲文明符号,它有很多哲學(xué)的含義,文明的含義。另外,它也代表了當一個城市進(jìn)步,如果說(shuō)一個城市有24小時(shí)熱水可以提供,有很好(hǎo)的甚至你可以家裡(lǐ)不安裝空調,因爲有非常好(hǎo)的共享式的能(néng)源系統,這(zhè)樣(yàng)的城市,這(zhè)樣(yàng)新型的基礎設施,它就(jiù)代表文明演進(jìn)的前進(jìn)方向(xiàng)。同樣(yàng),當我們今天看到在信息基礎設施上,各個城市要雙千兆入戶,不管是千兆還(hái)是雙千兆,它都(dōu)是針對(duì)信息交換。
今天當我們談價值交換世界的時(shí)候,當我們今天連接的不僅僅是信息,我們是一切皆計算的世界,我們連接的每一個節點可以是一台帶電設備,可以是機床,萬物連接無所不計算的世界的時(shí)候,我相信不管是千兆還(hái)是雙千兆,都(dōu)不能(néng)滿足需要了。在這(zhè)種(zhǒng)情況下我們所談的基礎設施,今天我們所邀請的,爲什麼(me)用聯盟的方式來推動,要做産業算芯,要一塊兒跨界的融合,來共同打造這(zhè)個新物種(zhǒng)。從産業上我們看到在一個城市裡(lǐ)面(miàn),如果從主線索上,市政過(guò)去從來不管數智經(jīng)濟,數字經(jīng)濟過(guò)去底座隻有三大運營商,除了三大運營商的力量,我們能(néng)不能(néng)把中國(guó)最有活力的基層的行政單元的力量,把這(zhè)些縣長(cháng)、區長(cháng)、區委書記,把他們對(duì)數字基建的力量,把他們對(duì)算力的理解,放到基礎設施裡(lǐ)面(miàn)來。構成(chéng)用新市政、新算力以及新的虛拟電廠,一個城市的百分百的綠電已經(jīng)完全不能(néng)依靠簡單的電網了,它一定是源網荷儲,有新能(néng)源的源頭,有電網,有高質量的,像數據中心這(zhè)樣(yàng)高載能(néng)負荷平衡,然後(hòu)引發(fā)大規模儲能(néng)。源網荷儲聯動,所以我們今天談超互聯新算力産業的時(shí)候,不僅僅是左邊的雲計算IDC,全光的城市網絡産業,今天是一體兩(liǎng)翼的右翼,是數據的持有權、經(jīng)營權、受益權,中國(guó)創造性的把數據作爲生産要素市場化改革,以發(fā)改委來推動,很快就(jiù)會(huì)迎接來國(guó)家數據局的成(chéng)立,對(duì)數據二十條的推動,我相信這(zhè)些事(shì)情精彩還(hái)沒(méi)開(kāi)始,但我們看到了通用人工智能(néng),看到了ChatGPT的演進(jìn),看到了千億個參數模型已經(jīng)給我們帶來的震撼,再到鄭院士談的百萬級參數方向(xiàng)演進(jìn)的時(shí)候,大家真的會(huì)覺得精彩還(hái)沒(méi)有開(kāi)始。
我們不斷提到參數,億,百億,千億,到百萬億級,參數非常重要,我們在談過(guò)去雲計算的時(shí)候,當我們作爲雙11用戶的時(shí)候,阿裡(lǐ)雲CTO談阿裡(lǐ)雲能(néng)夠承載雙11巨大沖劑的四大法寶之一,是馬雲率先大規模超大規模部署RDMA,我們剛才所提的第五個關鍵詞,從雙戰場到芯粒,到家庭芯粒,到城市芯粒,第五個關鍵詞是RDPA,我們把MA的M,一個内存訪問改成(chéng)了參數訪問,今天在通用人工智能(néng)時(shí)代,一切的一切,都(dōu)是以參數作爲對(duì)象,參數是關鍵。過(guò)去我們談RDMA的時(shí)候是說(shuō)一台機器内存和另外一台機器的内存我們不需要動用各自的操作系統的情況下,能(néng)夠直接訪問,能(néng)夠(英文)到原來的操作系統,這(zhè)套邏輯能(néng)夠大大提升效率,能(néng)夠大大減少時(shí)延。這(zhè)套邏輯如果用在我們的算力體系裡(lǐ)面(miàn),用在我們所談的超互聯裡(lǐ)面(miàn),那麼(me)這(zhè)套協議我相信和剛才宣傳片所看到的,在引入一個底層是一個原汁原味的密碼學(xué)基礎設施,公鑰就(jiù)是地址,我們不需要從一個機構那去拿,不需要從美國(guó)申請V4、V6,我們今天能(néng)夠在用戶側用數學(xué)産生全球具有唯一性的一個公鑰地址。像這(zhè)樣(yàng)的東西,RDPA,一個密碼學(xué),分布式計算,這(zhè)個結合構建起(qǐ)來一個新型的超越過(guò)去TCPIP作爲信息交換全球共識網絡的底座,互聯網依然偉大,互聯網會(huì)繼續偉大,但是互聯網會(huì)就(jiù)到上面(miàn)去,在互聯網下面(miàn)可能(néng)會(huì)被(bèi)一個超互聯所代替。就(jiù)像今天我們想象互聯網的時(shí)候,我們的通信、我們的電話依然偉大,隻不過(guò)今天你不再用電話機了,今天你用微信APP把過(guò)去所有電話做的事(shì)情代替了。
當我們剛開(kāi)始用互聯網的時(shí)候,電話網在上面(miàn),互聯網在下面(miàn),可是今天倒過(guò)來了,互聯網在下面(miàn),我們今天的微信代替了電話網,電話跑上面(miàn),那麼(me)同樣(yàng),我們在今天這(zhè)個時(shí)代,在談互聯網的時(shí)候,我們一樣(yàng)的,我們在談如果說(shuō)互聯網的下面(miàn),一個二層網絡,一個傳統的二層全程關鍵化的網絡,能(néng)不能(néng)被(bèi)RDPA,能(néng)夠被(bèi)HCCB,被(bèi)這(zhè)套密碼學(xué)和借鑒超大規模雲計算和超大規模科學(xué)超算裡(lǐ)面(miàn)的網絡經(jīng)驗吸納出來,我們再把芯片工業界裡(lǐ)面(miàn)發(fā)生過(guò)的chiplet這(zhè)套工程拿出來,這(zhè)可能(néng)就(jiù)是我們要做的事(shì)情。
最後(hòu)還(hái)有兩(liǎng)個關鍵詞,一個偉大時(shí)代到來,我們暢想各種(zhǒng)各樣(yàng)應用場景的時(shí)候其實都(dōu)離不開(kāi)一個應用場景,都(dōu)應該和它的基礎用戶,基礎用戶都(dōu)應該連著(zhe)基礎應用。所以像我這(zhè)樣(yàng)做基礎設施的,我們天天談基礎協議,談基礎設施,談基礎資源,像域名,像IP地址,這(zhè)些屬于基礎資源,我們談的是三基,基礎協議、基礎資源和基礎設施。可是這(zhè)三個東西你真正想要拿到它還(hái)有兩(liǎng)個更重要的,一個是基礎用戶;一個是基礎應用。我們今天談“東數西算”,我們今天談通用人工智能(néng),如果對(duì)這(zhè)套體系最了解的用戶他們一定是新一代原住民,他們不滿足于我的數據停留在别人的平台上,除了平台之外,根據中國(guó)的《個人信息保護法》,每個人都(dōu)擁有你自己數據的持有權,可以和平台共同共同發(fā)展,這(zhè)套東西我相信我相信世紀互聯從超大規模數據中心開(kāi)始,除了服務超大規模用戶,我們服務實體經(jīng)濟中型用戶,我們未來還(hái)會(huì)服務千家萬戶個人數據中心。
最後(hòu),當我們談到computinglet,除了最小單元的,從家庭到城市,合起(qǐ)來的這(zhè)些單元,同時(shí)我們也要談到,就(jiù)像今天羅金海老師從科幻小說(shuō)這(zhè)個領域裡(lǐ)面(miàn)來去看待2140,我們今天所談的計算,軍事(shì)上有空天地,未來學(xué)上有星際以及宇宙計算,這(zhè)套東西從今天來講,我們看當ChatGPT出來的時(shí)候,這(zhè)一切都(dōu)不是故事(shì),行則至。人去駕馭機器核心要有想象力,想象力就(jiù)要先看見再相信,而不是先相信再看見,這(zhè)是想象力的基礎。
最後(hòu)簡單介紹一下中關村超互聯新基建産業創新聯盟,我們是一家按照海星文化、部落文化創建的聯盟組織,我們是非常正規的社會(huì)組織,我們希望有更多的工程師文化、更多的代碼文化,有更多互聯網IET的精神,所以我把它總結爲海星+數字部落。
最後(hòu)是超互聯新算力願景展望,前面(miàn)我們所放的介紹片,我擔心會(huì)有誤導,很多時(shí)候出現去中心化這(zhè)個詞,其實任何世界都(dōu)是平衡,都(dōu)是中心化的力量,多中心化的力量和去中心化的力量,一個友好(hǎo)共存的世界。如果說(shuō)一個算力單元能(néng)夠在超互聯計算結構裡(lǐ)面(miàn)跑起(qǐ)來,它一定會(huì)推動我們今天的金融機構都(dōu)是中心化的,一定有牌照,也能(néng)強監管。但是這(zhè)些機構也會(huì)被(bèi)數字化變革,他們開(kāi)始用一個集中式的分棧系統和今天區塊鏈世界裡(lǐ)面(miàn)一個分布式的記賬系統,甚至一個完全去中心化的計算系統,完全可以找到大家的見面(miàn)點,是可以友好(hǎo)并存。
我展示這(zhè)張圖,這(zhè)個結構裡(lǐ)面(miàn),我們今天合規的數據交易所,我們今天新一代數字銀行,我們今天從北京到深圳、到香港,今天大家在web3上京港合作,可以各自走出自己的精彩,香港可以去迎接全球的金融創新,北京可以成(chéng)爲新算力的一個新基建,中國(guó)作爲基建狂魔國(guó)家不負稱号下的創新發(fā)源地。
我是一個數據中心的老兵,原來做的是黑盒子,冰冷水泥般的東西,天天做,做了二十幾年,也沒(méi)有做膩,隻是今天守正才能(néng)創新,把數據中心業務做好(hǎo),把數據中心客戶服務好(hǎo),我們站在非常中立的角度,我們今天爲芯片公司,爲做雲計算的公司,爲做大模型的公司,我們來提供賦能(néng),我們做好(hǎo)伴奏,我們做好(hǎo)共振,我們去迎接一個上善若水的,一個像右邊這(zhè)樣(yàng),一個芯粒無所不在無處計算的新世界。我就(jiù)說(shuō)這(zhè)些,謝謝。
科技賦能(néng) 全域服務
}随著(zhe)Web3.0技術的快速發(fā)展和大模型爆發(fā)式應用場景驅動,基礎設施將(jiāng)迎來新的一輪重構,未來的雲計算將(jiāng)是去中心化、面(miàn)向(xiàng)算力調度和共建共創的基礎設施。~
大家下午好(hǎo)!非常高興在這(zhè)樣(yàng)一個下午跟大家分享我的主題。今天除了非常多的合作夥伴和我們一起(qǐ)分享,同時(shí)我們也邀請了互聯在過(guò)去二十多年一起(qǐ)陪伴的客戶和重要夥伴。
我今天分享的主題叫(jiào)《科技賦能(néng),全域服務》,相信很多人聽了上午的演講,确實心潮澎湃,有很多思想的碰撞,有很多大咖分享了非常精彩的觀點,以及對(duì)未來的一些看法,甚至是上升到了哲學(xué)、社會(huì)學(xué)層面(miàn)的很多議題,我覺得都(dōu)是非常好(hǎo)的思想激蕩。下午的主題,我們更多會(huì)聚焦在這(zhè)麼(me)一個科技浪潮蓬勃發(fā)展的時(shí)刻,怎麼(me)把這(zhè)些好(hǎo)的想法、好(hǎo)的技術落地下來,所以我今天的主題叫(jiào)《科技賦能(néng),全域服務》。
在過(guò)去二十多年裡(lǐ)面(miàn),其實我也是一個在IT行業、在雲計算、在網絡領域的老兵,二十多年中我們的技術不斷發(fā)展,其實是一個非常跌宕起(qǐ)伏的過(guò)程,從傳統IT到私有雲、公有雲,上完雲了以後(hòu)有些人考慮要下來,兜兜轉轉,其實誰也沒(méi)有完全戰勝誰,到最後(hòu)的狀态你會(huì)發(fā)現非常多的客戶變成(chéng)了混合IT的狀态。我就(jiù)在想,這(zhè)麼(me)多技術、這(zhè)麼(me)多産品在變化,到底有哪些東西是不變的,其實是面(miàn)向(xiàng)企業級的一站式IT服務,企業希望獲得一站式IT服務這(zhè)件事(shì)情在過(guò)去二十年從來沒(méi)有變過(guò)。
互聯是一個做IDC和網絡起(qǐ)步的廠商,在過(guò)去二十多年裡(lǐ),我們服務了大概6000多家大大小小的互聯網企業,有非常多大家耳熟能(néng)詳的企業都(dōu)是從我們的數據中心裡(lǐ)面(miàn)成(chéng)長(cháng)出來的。這(zhè)個過(guò)程當中非常有意思的是,在過(guò)去差不多十年時(shí)間中,我們也做了非常多的托管雲項目,爲什麼(me)會(huì)做這(zhè)些托管雲呢?有幾個特征:首先,有廣泛的IDC節點;其次,有專業第三方運維服務;再次,能(néng)夠充分保障客戶的數據主權,甚至是整個IT安全。它能(néng)夠很好(hǎo)地解決公有雲和私有雲存在的一些問題,和公有雲、私有雲是相互互補的關系。互聯科技走到今天這(zhè)樣(yàng)一個時(shí)間,再往下一步應該怎麼(me)發(fā)展?這(zhè)是我深刻思考的一個問題。我經(jīng)常在内部講,其實互聯不需要太大步地往前走,隻要往前跨半步就(jiù)可以了,這(zhè)半步是什麼(me)呢?就(jiù)是我們二十多年一直沒(méi)有變的全域一站式服務和托管雲服務,把它們結合在一起(qǐ)就(jiù)是全域托管雲,全域托管雲希望定位在我們面(miàn)向(xiàng)客戶側的新基建提供全域一站式IT服務,成(chéng)爲企業數字化轉型的合夥人。
爲什麼(me)叫(jiào)全域呢?這(zhè)個圖是我們現在定義1.0版本的全域托管雲,至少四個域:一是自有IT域;二是托管IT域,把自己的IT托管到第三方機房裡(lǐ)面(miàn),比如托管在互聯的機房或者其他服務商的機房,托管IT域;三是彈性IT域,同一個機房有沒(méi)有彈性IT給客戶提供服務;四是公有IT域。在四個IT域環境裡(lǐ)面(miàn)我們有沒(méi)有平台或者工具能(néng)夠給他們提供一站式的運維服務、一站式容災服務、一站式算力服務,甚至可能(néng)還(hái)有一站式的安全服務、一站式的數據倉庫服務,我相信都(dōu)是存在這(zhè)樣(yàng)的可能(néng)性的。
那麼(me),這(zhè)四個核心平台是什麼(me)呢?下面(miàn)我們分享的主題也會(huì)圍繞這(zhè)四個平台來展開(kāi),這(zhè)個地方我需要和大家說(shuō)明的是四個平台第一期版本中隻有兩(liǎng)個平台是互聯自己完全開(kāi)發(fā)的,另外兩(liǎng)個平台是互聯和合作夥伴一起(qǐ)共研、共創、共赢的平台,稍後(hòu)我會(huì)邀請我們核心的合作夥伴一起(qǐ)分享這(zhè)些平台的核心能(néng)力。
我們通過(guò)四個平台服務到四個域,通過(guò)自動化、在線化、智能(néng)化的能(néng)力幫助客戶實現全域托管的服務。
首先,第一個平台是互聯科技自研的LCloud托管雲平台。互聯不會(huì)定位爲雲公司,但我們爲什麼(me)做雲平台呢?道(dào)理很簡單,就(jiù)是客戶需求。這(zhè)樣(yàng)的雲平台和過(guò)去傳統意義上的雲平台不同,需要四個統一:統一服務目錄、統一業務入口、統一的運營計量、統一運維監控,我們可以用不同組件部署到相應的域中,形成(chéng)産品和方案。
在運營管理層,可以納管到私有雲,甚至多個公有雲,這(zhè)是互聯科技全域托管雲要做的事(shì)情。值得一提的是,我們會(huì)站在用戶角度幫助他思考需要什麼(me)。做了這(zhè)麼(me)長(cháng)時(shí)間的IT服務、做了這(zhè)麼(me)長(cháng)時(shí)間的雲,你會(huì)發(fā)現客戶非常需要站在自己的角度定義那朵雲到底長(cháng)什麼(me)樣(yàng),因爲它已經(jīng)不僅僅用一朵雲或者一個IT現狀,混合IT就(jiù)是目前的現狀,越是發(fā)展良好(hǎo)的用戶越會(huì)用混合IT支撐業務發(fā)展。所以,面(miàn)向(xiàng)客戶多雲的管理平台,過(guò)去我們叫(jiào)CMP,包括它的運維标準是不是可以由客戶自己來定義或者由客戶視角來定義,這(zhè)個是我們非常關心的問題。所以,從這(zhè)個角度來講,我們希望至少把管理層面(miàn)的産品完全開(kāi)放給我們的客戶,後(hòu)面(miàn)也會(huì)有一個闡述。
我們一期實現了非常簡單的功能(néng),但也非常實用,過(guò)去互聯有大量的DC客戶,但是很多DC客戶的機櫃分布在不同的數據中心,通過(guò)這(zhè)個平台可以非常簡單地把分布在各地數據中心的資源,用一個LCloud平台插件管理起(qǐ)來,不僅僅管理到數據中心的機櫃,還(hái)可以管理到機櫃裡(lǐ)面(miàn)各類IT産品、服務器等等。通過(guò)這(zhè)樣(yàng)一個非常簡單的創新,讓我們客戶能(néng)夠對(duì)機櫃的網絡服務一目了然,對(duì)機櫃裡(lǐ)面(miàn)的IT環境也能(néng)夠進(jìn)行實時(shí)的監控管理。
同時(shí),LCloud裡(lǐ)面(miàn)有非常簡單的插件,通過(guò)這(zhè)個插件把整個公有雲的一些平台能(néng)力進(jìn)行實現,它可以實現産品集成(chéng)、賬号管理,包括折扣管理、資源運營、服務支撐等,都(dōu)在這(zhè)個平台上用一個小的插件完成(chéng),方便我們的用戶快速獲得公有雲資源,提供整體方案的交付,并且實現一站式的服務。目前我們已經(jīng)開(kāi)通了和阿裡(lǐ)雲、華爲雲的平台,其他雲廠商也在積極的對(duì)接過(guò)程當中。
今天上午我們聊了非常多“城市就(jiù)是一台計算機”超互聯新算力這(zhè)樣(yàng)一個核心主題。我們要做一個面(miàn)向(xiàng)客戶的全域托管雲非常重要的一件事(shì)情就(jiù)是連接,互聯是做連接起(qǐ)家的一家企業,我們會(huì)爲了全域托管雲打造一個全新的NEOLINK CC(Cross Connect)平台,網絡連接平台。因爲我們認識到,隻有把我們的數據中心和各家公有雲、私有雲通過(guò)高速網絡打通,才可以幫助用戶提供大量的混合組網、數據流通、跨域的多雲調度。所以,這(zhè)樣(yàng)的CC平台是非常重要的一部分。我們現在已經(jīng)在北上廣深,和微軟、阿裡(lǐ)雲、華爲雲、百度雲這(zhè)些雲廠商開(kāi)通了非常好(hǎo)的CC網絡連接服務。
今天上午這(zhè)張圖分享過(guò),這(zhè)是我們對(duì)未來“城市即計算機”的一個認知,或者是願景,讓我們傳統IDC裡(lǐ)面(miàn)部署的過(guò)去DC級網絡怎麼(me)樣(yàng)能(néng)夠推到城市邊緣,服務于我們的企業客戶,甚至服務于個人家庭用戶,用我們自研的HCCB(Hyper Connected Computing Bus)協議延展到城市每一個角落,幫助城市做成(chéng)一個新的地鐵系統、城市新市政系統。這(zhè)有别于過(guò)去一個完全不可靠或者帶寬不足夠寬的公交系統,我們已經(jīng)看到了這(zhè)張網的巨大需求,就(jiù)像鄭院士講到的,我們講這(zhè)麼(me)多大模型、這(zhè)麼(me)多超級計算中心,有個最簡單的需求,我到底能(néng)不能(néng)先把我的數據搬過(guò)去,現在都(dōu)是用非常原始的辦法,把盤刻好(hǎo),通過(guò)一個快遞給寄過(guò)去。其實不是一句玩笑話,我們在講“東數西算”的時(shí)候,在講跨廣域數據調度的時(shí)候,我們的基礎設施還(hái)沒(méi)有完全達到這(zhè)樣(yàng)的能(néng)力。過(guò)去一年多時(shí)間裡(lǐ)面(miàn),我們頻繁和國(guó)家發(fā)改委、工信部溝通,大家都(dōu)有一個共識,就(jiù)是我們的目标是完全正确的,但是我們的基礎設施還(hái)是要一步步走。在城市範圍内去實現超互聯新算力,在我們看來,目前還(hái)是一個更加容易實現的目标,但這(zhè)裡(lǐ)面(miàn)的難題也非常多,我會(huì)把它抛出來,今天沒(méi)辦法一一展開(kāi)。
比如說(shuō)城市大二層的網絡,立體矩陣fullmesh架構,爲了計算而生的網絡不可能(néng)像互聯網訪問一樣(yàng)是多跳的環境,它必須是點到點,所有的節點都(dōu)是一跳達成(chéng)的網絡,通證化調度,“數據二十條”發(fā)展的背景下,算力和數據的确權、認證、計費這(zhè)樣(yàng)一個過(guò)程都(dōu)需要基于一個有3A能(néng)力的基礎設施之上。所以它需要一個通證化調度的能(néng)力,還(hái)需要超高帶寬,我們現在非常高興地看到我們的客戶在他的數據中心裡(lǐ)面(miàn),或在他的托管雲裡(lǐ)面(miàn)已經(jīng)大量使用200G、400G,甚至800G的帶寬,這(zhè)在過(guò)去是不可想象的,現在往往一個U都(dōu)可以提供32位、64位的400G接口,這(zhè)是一個非常誇張的網絡演進(jìn)。就(jiù)是因爲算力網絡,其實是算力大量爆發(fā),導緻我們的網絡帶寬快速增加,同時(shí)還(hái)有超低時(shí)延,以前我們的印象裡(lǐ)面(miàn),網絡傳輸毫秒級網絡就(jiù)已經(jīng)非常不錯了,但是在算力網絡裡(lǐ)面(miàn)是微秒級,1點幾微秒的算力時(shí)延都(dōu)會(huì)覺得太長(cháng)了,因爲時(shí)延再大一些,或者再抖動的話,如果單任務的整個計算過(guò)程都(dōu)有可能(néng)失敗。我們在過(guò)去和國(guó)内幾個大模型頭部玩家交流的時(shí)候,他們提到當真正把幾千張卡放到一個模型裡(lǐ)的時(shí)候,最大的問題是機器啓動的成(chéng)功率非常低,單任務,如果說(shuō)是一個分布式任務,在一個非常大的集群裡(lǐ)面(miàn),小小的網絡時(shí)延和網絡抖動都(dōu)會(huì)造成(chéng)計算過(guò)程的失敗。上次蘇州一個會(huì)議上,一位合作夥伴說(shuō)算力到底能(néng)不能(néng)調度?我覺得大家如果參加了今天上午的會(huì)應該會(huì)有答案。算力在目前這(zhè)樣(yàng)的階段最多是撮合、最多是數據傳送,還(hái)到不了調度。當然,長(cháng)遠的目标我相信是沒(méi)有問題的,從物理學(xué)的第一性原理,它終將(jiāng)實現,需要我們要一步一步腳踏實地把這(zhè)件事(shì)實現了。
近期非常火的技術,比如RDMA、RoCE、infiniband、Nvlink、CXL,現在有這(zhè)麼(me)多協議,因爲傳統互聯網已經(jīng)和算力網進(jìn)行交融,或者大家已經(jīng)有點模糊了邊界,我相信在未來相當長(cháng)一段時(shí)間裡(lǐ)面(miàn)這(zhè)個領域會(huì)有非常大的技術突破,才能(néng)支撐算力網絡的演進(jìn)。這(zhè)個是我們對(duì)整個超互聯,包括超互聯在城市範圍内落地的理解,也是我們這(zhè)次整個活動的一個主題。
所以,互聯科技是一家中立的第三方運營商,是一個以服務爲核心的公司,我們可以用到這(zhè)個世界上最好(hǎo)的産品和技術,理解客戶的需求,做出支撐AGI和元宇宙的客戶側新基建,這(zhè)個就(jiù)是我們一個遠大的理想。
未來我們會(huì)陸陸續續推出很多一站式服務,面(miàn)向(xiàng)四個域和全棧,業務應用運維、雲平台運維、IT基礎架構運維、IDC基礎設施運維,我們會(huì)和合作夥伴一起(qǐ)打造全棧全域托管雲的能(néng)力。今天的主題一直在講AGI,大模型對(duì)IT運維服務領域到底可以帶來哪些提升和服務,它給的這(zhè)幾個答案和我們的想象非常匹配。比如故障自動診斷,預測性維護,安全監控,自動化運維等等。
上周,我在上海見一位非常重要的客戶,這(zhè)個客戶現場給我們提了一個問題,他們過(guò)去在使用IT基礎設施和IDC時(shí)候,有一個困擾問題,整個設施運維和IT運維過(guò)程中有90%的誤報率,機器有很多時(shí)候錯誤誤報,導緻他經(jīng)常半夜三更接到報警電話,但其實是錯誤的,問我們有沒(méi)有辦法解決這(zhè)個問題。我和ChatGPT做了一次溝通,ChatGPT說(shuō)有幾個辦法,優化監控指标,包括調整閥值,做新的監控濾波,優化監控系統、告警維護等等。
基于此,我又告訴他,如果有異常毛刺出現,可以考慮哪些算法進(jìn)行優化。它告訴我均值濾波、中值濾波、自适應等等,我問它能(néng)不能(néng)寫一個算法出來,它寫了一個非常簡單的中值濾波算法,同時(shí)我們把一段數據導入進(jìn)去,直接給我輸出了一個濾波數據,全部非常平穩的數據流了。這(zhè)應該是一個非常簡單的客戶需求,在運維領域,在前面(miàn)幾個平台之上,我們都(dōu)在嘗試用這(zhè)樣(yàng)的方法來優化AI和運維相結合的基礎能(néng)力。所以這(zhè)個我相信是值得期待的。
一站式算力服務,我們今天講了很多一站式算力服務,要把這(zhè)個算力做好(hǎo)其實是不容易的,尤其像現在大模型的出現,動辄上萬張卡,尤其對(duì)于中小創業者來講,挑戰非常大。我們的做法是除了幫助客戶提供托管雲服務之外,在一些重要的數據中心爲他提供彈性算力的補充,也就(jiù)是說(shuō),當他自有算力不夠用的時(shí)候,能(néng)夠非常快速地調用彈性算力。由于我們CC網絡的存在,他也可以調用到目前非常主流的大玩家的算力資源和一些閑置的資源,我想這(zhè)都(dōu)是可以去做的一些工作。同時(shí)還(hái)有一站式容災服務,這(zhè)是很小的功能(néng)。但非常有意思的是我們在多雲多域的IT環境,一鍵恢複的雲容災解決方案,是一個效能(néng)非常高的備份容災解決方案,我相信絕大多數客戶可以通過(guò)這(zhè)樣(yàng)的解決方案達成(chéng)容災需求。
最後(hòu),我們在開(kāi)源和開(kāi)放上的策略。中心側接口開(kāi)放,包括測試版下載的開(kāi)放,在開(kāi)源這(zhè)部分,我們在有些管理的組件上希望和合作夥伴把客戶側那一部分都(dōu)開(kāi)源,因爲客戶需要有自己定義的全域托管雲平台,定向(xiàng)開(kāi)源,包括納管接入的開(kāi)源。今天是典型的共創模式,大家一起(qǐ)應用共創。我們講的主題是一站式全域托管雲服務,非常重要的兩(liǎng)點,就(jiù)是技術和服務,技術講究先進(jìn)性,服務講的是溫度,我們到底能(néng)不能(néng)給客戶帶來有溫度的服務。AGI給我們帶來非常多的憧憬,也有很多大家對(duì)它的擔憂,擔心它會(huì)不會(huì)成(chéng)爲人的敵人,但我依然相信它會(huì)成(chéng)爲我們的朋友、我們的工具、我們的夥伴。我們應該更多把技術留給AGI,把溫度留給我們的工程師,讓我們成(chéng)爲一個技術領先又有溫度服務的一家企業。
我希望能(néng)夠和合作夥伴一起(qǐ)提供一個有溫度、有技術的全域托管一站式服務,謝謝。