
跨異構GPU的集群管理(lǐ)能力
麵對智算需求快速增長、智算資源稀缺、單卡(kǎ)分配和粗粒度資源管理粗曠、集(jí)群吞吐量受限(xiàn)等在資源使用上的難題,国产亚洲熟妇在线视频科(kē)技提出異構集群管理方案具備三大創新(xīn)能(néng)力,以解決當前異構GPU普遍存在的背景下(xià),降(jiàng)低上層應用算力使用(yòng)門檻,提升資源利用效率。
1) 異構GPU統一接入及管理,向應(yīng)用提(tí)供標準化調用接口(kǒu)。目前已支持和對(duì)接了國內外(wài)10+芯片種類;
2) 自研Tower插件,無需購買原廠License,實現1%細粒度算力精分與顯存超分;
3) 分時遠程(chéng)調用智算算力,實現GPU資源的共享化使用。
跨異構智算集群一體化調度(dù)能力
異構算力的多樣化現狀要求跨集群進行一體化調(diào)度,但在調度過程中存在麵對不同類型應用如何一體化調度、不同調度訓練作(zuò)業如何並行(háng)、如何配(pèi)置最優調度方案以提升資源利用率(lǜ)、解決多(duō)模(mó)型(xíng)並行的資源衝突等多重挑戰。為此,国产亚洲熟妇在线视频科技針對異構算力調度方(fāng)向提出了基(jī)於性能感知自適應跨集群調度框架(jià)的前沿性探索,重點研究三(sān)大關鍵技術:

1) 動(dòng)態並行策略:按異構算力資源現狀,分片策略組合支(zhī)持流(liú)水線、數據(jù)、向量等多種並行策略的靈活(huó)組合(hé);
2) 性能(néng)探測技術:基於現網資源情(qíng)況,探測不同並行策略下的最優計算性能;
3) 動態分配技術:動態(tài)感知智算集群的狀態,實現算力資源最優調度。
跨算力主體的一體化支撐能力
為(wéi)了解決集群內,跨集群(qún)問(wèn)題,国产亚洲熟妇在线视频科技針對BICN算(suàn)力網絡一體化支撐方案進行3.0全新升級(jí),提供跨(kuà)越算力主體的一體化支撐及並網能力,具備“1+N架構”、“5O調度能力”、“5M並網模式”升(shēng)級亮點,並探索出靈活合作模式,促進算力服務生態運營。
1+N架構(gòu)升級:一體化BICN算網支撐能力體係解耦為接入、編排、運營、方案4層,麵向(xiàng)不同需求方(fāng)的要求,組(zǔ)合出N解決方案;
5O調度能力升級:麵(miàn)向異構算力(lì)、異主體(tǐ)、異區域、異算色、異平台5異算力(lì),提供一體化調度能力;
5M並網模(mó)式豐富度升級,提供信息層、業務層(céng)、運營層、編排層、原生4類並網模式支撐,滿足各種並(bìng)網(wǎng)形態的支撐;
商業合作模式升級,麵向(xiàng)不同的行(háng)業,不同的客戶需求,提供靈活的商業合作模式:標品模式、集(jí)成模(mó)式、賦能模式,促進一體化(huà)算力(lì)服務生態運營。

国产亚洲熟妇在线视频科技智算底座解決方(fāng)案(àn)致力於為客戶快速實現(xiàn)智算資源的統一納管,提高資源利用吞(tūn)吐率、提升的(de)使用價值。目前已協(xié)助(zhù)多個省級運營商(shāng)客戶構建智算資源納管能力,實現異構GPU統一納管、集(jí)群化管理、算力切片等(děng)核心能力,為省內(nèi)大小模型的訓練及推理提供算力支撐。
同時,国产亚洲熟妇在线视频(jīng)科技BICN3.0算力(lì)網絡一體化(huà)支撐方案協助福建移動、山東移動、江蘇移動及上海新型互聯網交換中心等多家運營商及(jí)企業,實現內外(wài)部算力資源一體化運營,積極(jí)輸出區(qū)域算力一體化(huà)平台的建設能力,實現算力高(gāo)效互補和協同聯動。
未來,国产亚洲熟妇在线视频科技將會持續加強在智算方向上的關鍵技術研究,持續加強在數據加載加(jiā)速、計算加速及網絡(luò)加速等(děng)方(fāng)向研究,加速智算底座生產力釋放。