應用案例

                            經過20多年的發展,寶德持續而深刻地把握市場需求,積累了海量的客戶資源和豐富的服務經驗

                            某大學科研平臺解決方案
                            案例背景

                            某大學某學院擬建設科研人工智能共享共建平臺,面向全院提供計算資源服務,軟件基于K8S架構,可實現計算資源集中管理、靈活分配,支持定制開發,支持多用戶使用等。此次建設需把學院前期購置的一臺GPU服務器,一臺40T容量的服務器納管進來,形成平臺系統,達到:

                            1) 統一平臺管理,由基礎設施層作為整個平臺的支撐,通過云平臺對底層資源進行靈活的調度管理,通過系統功能層為用戶端和管理端降低 AI 技術門檻,釋放AI 技術潛力;
                            2) 解決“信息孤島”,實現信息共享,提高信息安全水平,提升科研體驗,提高工作效率;
                            3) 通過新平臺建設降低成本、提升效率、節能減排,滿足學院科研資源充分利用的要求。

                            案例分析

                            寶德HPC解決方案拓撲圖

                            解決方案

                            該方案平臺使用寶德PLStack實現,由管理系統和業務系統組成,將兩者從底層IT資源中分離開來,以提高管理系統的可移植性和業務系統的后期擴展性。集群拓撲設計從浮點計算能力強、GPU卡管理便捷、擴展豐富三個原則出發,將計算資源和管理資源進行分離,同時管理網絡與計算網絡分開,避免管理對計算網絡資源的擠占,集群網絡分為:計算網絡、管理網絡兩個平面:


                            計算網絡:單口100Gb IB匯聚鏈路,用于連接所有GPU計算節點,同時提供塊設備、對象存儲等服務;

                            管理網絡:雙口千兆匯聚鏈路,用于管理人工智能平臺中的所有節點,為管理員提供 Web 控制臺;

                            客戶收益

                            高帶寬、低延遲

                            (1)計算網絡采用了100Gb/s的高帶寬IB網絡,大大提高了各節點之間的通信能力,降低了延遲,并且通過IB交換機實現所有GPU計算節點的全互聯;


                            高擴展性

                            (2)能夠根據用戶需求靈活對現有的計算資源和存儲空間進行擴展,彈性靈活;


                            高性價比

                            (3)新平臺建設將閑置資源進行統一納管并二次利用,為客戶降低成本、提高資源利用率,滿足學院科研資源充分利用的要求;


                            久久综合激激的五月天