正在播放国产第九十二_日韩精品在线官网_欧洲人免费视频网站在线_精品二区自拍偷拍_午夜成本人动漫在线观看_欧美亚洲人成在线观看_欧美激情亚洲一区中文字幕_自拍影视无码少妇_韩日av无码中文字幕_国产成人毛片不卡在线视频

產(chǎn)品+服務(wù)
面臨技術(shù)挑戰(zhàn),容域科技讓您無需等待,無論是數(shù)字新基建的建設(shè),還是以太網(wǎng)絡(luò)的搭建及測試,都能得到積極快速的響應(yīng),專業(yè)的技術(shù)團(tuán)隊(duì)為您的需求提供優(yōu)質(zhì)服務(wù)
了解更多了解更多

人工智能測試解決方案

作者:容域科技 發(fā)布時間:2024-11-18
在當(dāng)今技術(shù)環(huán)境快速發(fā)展的背景下,企業(yè)和數(shù)據(jù)中心網(wǎng)絡(luò)已經(jīng)取得了重大進(jìn)步。隨著人工智能/機(jī)器學(xué)習(xí)(AI/ML)、邊緣計(jì)算與高性能計(jì)算(HPC)系統(tǒng)的廣泛應(yīng)用,現(xiàn)代數(shù)據(jù)中心需要一個能夠提供卓越性能與最小延遲的網(wǎng)絡(luò)。這一網(wǎng)絡(luò)還必須實(shí)現(xiàn)無縫適應(yīng),從而能夠應(yīng)對數(shù)據(jù)密集型及計(jì)算密集型應(yīng)用程序所驅(qū)動的數(shù)據(jù)傳輸需求的激增。

人工智能AI測試解決方案的技術(shù):
1.遠(yuǎn)程直接內(nèi)存訪問技術(shù)(RDMA為AI集群內(nèi)在XPU之間移動數(shù)據(jù)提供了高效、快速 的方法,同時還能夠以更低的延遲、更低的CPU負(fù)載與更高的帶寬實(shí)現(xiàn)網(wǎng)絡(luò)性能與主 機(jī)性能的提升。
2.基于融合以太網(wǎng)的RDMARoCE在現(xiàn)有以太網(wǎng)中提供了RDMA的所有優(yōu)勢,從而 能夠顯著降低資本支出。由于與密集型AI/ML及存儲工作負(fù)載相關(guān)的計(jì)算要求十分 繁重,在為現(xiàn)代數(shù)據(jù)中心提供可靠的端到端傳輸解決方案時,RoCE是必不可少的 組成要素。這一技術(shù)進(jìn)一步增強(qiáng)了搜索、存儲、數(shù)據(jù)庫、金融及高事務(wù)率應(yīng)用程序 的性能。
 
3.基于融合以太網(wǎng)的RDMA version2RoCEv2對RDMA技術(shù)的應(yīng)用范圍實(shí)現(xiàn)了擴(kuò) 展,可在具有多個子網(wǎng)的L2和L3網(wǎng)絡(luò)上使用。該功能可以實(shí)現(xiàn)高效的集群,從而實(shí)現(xiàn)具備彈性及可擴(kuò)展性的部署。
 
自2014年推出以來,RoCEv2已經(jīng)在眾多企業(yè)及組織機(jī)構(gòu)的數(shù)據(jù)中心中得到了部署。然而,在這些大規(guī)模環(huán)境中,錯誤的或未得到優(yōu)化的網(wǎng)絡(luò)設(shè)置可能會導(dǎo)致應(yīng)用程序 性能不佳。因此,驗(yàn)證交換網(wǎng)絡(luò)架構(gòu)性能、優(yōu)化配置并確保擁塞條件下的網(wǎng)絡(luò)穩(wěn)定性是至關(guān)重要的。
由交換機(jī)與NIC所推動的關(guān)鍵擁塞控制機(jī)制包括數(shù)據(jù)中心量化擁塞通知(DCQCN)和優(yōu)先級流量控制(PFC)。雖然使用通過利用真實(shí)服務(wù)器自行開發(fā)的開源測試解決 方案進(jìn)行測試可能具備一定價值,但它們通常無法滿足規(guī)模與效率的要求。我司提供全面的RoCEv2測試解決方案,從而滿足現(xiàn)代數(shù)據(jù)中心對計(jì)算密集和數(shù)據(jù) 密集型應(yīng)用、單個交換機(jī)以及整個數(shù)據(jù)中心交換網(wǎng)絡(luò)架構(gòu)的性能測試需求。
人工智能AI測試解決方案特點(diǎn)與優(yōu)勢綜述:
AI集群內(nèi)的XPU之間通過RoCEv2 的真實(shí)AI流量:在不同擁塞條件下以端口線速率模擬連續(xù)或突發(fā) 數(shù)據(jù)包調(diào)度,并通過PFC和 DCQCN優(yōu)化網(wǎng)絡(luò)中的流量控制
降低擁有成本:取代測試床中的 真實(shí)服務(wù)器與XPU機(jī)架,從而節(jié)省庫存成本、降低復(fù)雜性、減少 維護(hù)成本
加快上市時間:在AI環(huán)境中驗(yàn)證交換機(jī)和網(wǎng)絡(luò),從而將產(chǎn)品更快 推向市場 •
保護(hù)投資:通過下列多種方式利用A1/FX3/MX3高密度、多速度測 試模塊:
通過獲得許可證的方式,將現(xiàn)有A1/FX3/MX3高密度測試模塊升級到RoCEv2測試
重復(fù)使用測試模塊進(jìn)行常規(guī)的L2-7測試
利用額外獲得的速度進(jìn)行 RoCEv2測試
集成的集合通信庫:通過基于 GUI的向?qū)啥喾NAI流量模型。
 
集合通信庫
在人工智能數(shù)據(jù)中心的XPU之間存在大量數(shù)據(jù)通信,而這些數(shù)據(jù)無法由單個XPU處理,因此必須將其分布在不同的XPU上?;陂_放MPI構(gòu)建的CCL可以在AI數(shù)據(jù)中心實(shí)現(xiàn)高性能計(jì)算和并行處理。CCL庫支持最流行的CCL流量模式,例如:NCCL的AlltoAll。通過向?qū)Э梢暂p松生成人工智能流量模式。當(dāng)發(fā)生網(wǎng)絡(luò)擁塞時,人工智能測試解決方案能夠支持DCQCN和PFC流量控制,從而實(shí)現(xiàn)對于真實(shí)AI網(wǎng)絡(luò)的鏡像。在測試結(jié)束后會顯示任務(wù)完成時間(JCT),這將有助于對AI數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的性能進(jìn)行評估。
 
 
人工智能測試解決方案提供了高密度、多速度的測試環(huán)境,經(jīng)濟(jì)高效且易于部署。它建立在開放、透明的架構(gòu)之上,從而確保結(jié)果具備一致性和可重復(fù)性。通過CCL,這一解決方案可以在線速率下生成真實(shí)的AI流量模式,同時還可以支持擁塞控制。用戶可以測量關(guān)鍵網(wǎng)絡(luò)的KPI,其中包括:JCT、吞吐量、延遲、丟包、亂序的數(shù)據(jù)包計(jì)數(shù)、遲到的數(shù)據(jù)包計(jì)數(shù)和測量、擁塞條件和鏈路抖動情況下的網(wǎng)絡(luò)穩(wěn)定性等。
 
它使用戶能夠表征交換網(wǎng)絡(luò)架構(gòu)的性能并優(yōu)化相關(guān)網(wǎng)絡(luò)配置,包括緩沖區(qū)大小、ECN、負(fù)載平衡算法和QoS設(shè)置等。作為一項(xiàng)創(chuàng)新產(chǎn)品,思博倫的人工智能測試解決方案可在現(xiàn)有的
 
四個世界頂級的高密度、多速度以太網(wǎng)測試模塊上運(yùn)行。A1-400-QD-16是業(yè)界當(dāng)前密度最高的400GE平臺,能夠?yàn)锳I工作負(fù)載仿真提供支持;多用途的A1設(shè)備能夠同時測試人工智能及路由/交換用例;FX3-QSFP28-6提供3個100G端口或扇出至12個25G端口;此外,MX3-QSFP28-4和FX3-QSFP28-4均能提供2個100G端口或扇出至8個25G端口,因此非常適合進(jìn)行RoCEv2測試。
 
通過按端口預(yù)留用戶可以提供多用戶支持,從而能夠在單個或多個并發(fā)測試會話中使用單個測試設(shè)備/模塊的端口。與此同時, 在RoCEv2配置文件之外,這些測試設(shè)備/模塊還可用于400/200/100/50/40/25/10G速度的常規(guī)L2-7層測試。
  
 
特性
•通過有損和無損網(wǎng)絡(luò)的RoCEv2流量,利用ECN和PFC機(jī)制進(jìn)行基于硬件的擁塞控制
•任務(wù)完成時間(JCT)報(bào)告
•模擬隊(duì)列對(QP)之間的一對一數(shù)據(jù)傳輸
•通過簡潔易用的向?qū)CL流量模型進(jìn)行集成
•根據(jù)網(wǎng)絡(luò)需求,對擁塞控制機(jī)制DCQCN和PFC的優(yōu)化進(jìn)行配置
•仿真背景流量仿真引發(fā)擁塞
•通過使用不同的流量調(diào)度機(jī)制與拓?fù)浞绞綄PU和存儲數(shù) 據(jù)傳輸進(jìn)行模擬
•每個端口進(jìn)行多個XPU及RoCEv2服務(wù)器模擬并具備高規(guī)模 的數(shù)千個隊(duì)列對
•L2(VLAN)和L3(DSCP)模式的QoS設(shè)置
•每個QP/Flow的擁塞控制支持
•模擬XPU進(jìn)行大規(guī)模測試,通過RoCEv2和CCL向?qū)Ш喕?nbsp;量模型的復(fù)雜配置
•在測試床中模擬服務(wù)器,從而顯著降低設(shè)備成本及維護(hù)成本
•通過輕松配置具備真實(shí)性的測試拓?fù)鋪砜s短測試時間
•通過使用向?qū)?,只需點(diǎn)擊幾下即可輕松擴(kuò)展數(shù)千個隊(duì)列對
•使用TestCenter IQ收集關(guān)鍵統(tǒng)計(jì)數(shù)據(jù)并生成直觀的報(bào)告