RDMA(Remote Direct Memory Access)允許應(yīng)用與網(wǎng)卡之間的直接數(shù)據(jù)讀寫,將服務(wù)器內(nèi)的數(shù)據(jù)傳輸時(shí)延降低到接近1us。同時(shí),RDMA允許接收端直接從發(fā)送端的內(nèi)存讀取數(shù)據(jù),極大減少了CPU的負(fù)擔(dān)。
同時(shí)滿足0丟包、低時(shí)延、高吞吐,背后的核心技術(shù)是擁塞控制算法。通用的無損網(wǎng)絡(luò)的擁塞控制算法DCQCN(Data Center Quantized Congestion Notification),需要網(wǎng)卡和網(wǎng)絡(luò)進(jìn)行協(xié)作,每個(gè)節(jié)點(diǎn)需要配置數(shù)十個(gè)參數(shù),全網(wǎng)的參數(shù)組合達(dá)到幾十萬;為了簡化配置,只能采用通用的配置,導(dǎo)致針對(duì)不同的流量模型,常常無法同時(shí)滿足這三個(gè)核心指標(biāo)。
數(shù)據(jù)中心投資中網(wǎng)絡(luò)占比僅10%左右,相對(duì)服務(wù)器/存儲(chǔ)的投資(占比85%),有10倍的杠桿效應(yīng),撬動(dòng)服務(wù)器和存儲(chǔ)投資的大幅降低;華為超融合數(shù)據(jù)中心網(wǎng)絡(luò)可以帶來25%的存儲(chǔ)性能提升,40%的計(jì)算效率提升,將帶來數(shù)十倍的ROI(Return On Investment)能力。
上文提到,使用以太網(wǎng)來承載RDMA流量,目前使用的協(xié)議為RoCE(RDMA over Converged Ethernet)v2。華為超融合數(shù)據(jù)中心網(wǎng)絡(luò),使用iLossless智能無損算法構(gòu)建無損以太網(wǎng)絡(luò),是一系列技術(shù)的合集,通過以下三個(gè)方面技術(shù)的相互配合,真正解決傳統(tǒng)以太網(wǎng)絡(luò)擁塞丟包的問題,為RoCEv2流量提供“無丟包、低時(shí)延、高吞吐”的網(wǎng)絡(luò)環(huán)境,滿足RoCEv2應(yīng)用的高性能需求。