Nvidia se može pohvaliti AI RAN-om za 5G i 6G, ali je zaglavljen u prvoj brzini

Kožna jakna zaštitnog znaka, u kombinaciji s naočalama i urednom sijedom kosom, daje Jensenu Huangu izgled profesorskog bajkera. Bez obzira da li je slika namjerna, utisak je da Nvidijin šef od 32 godine nije samo proročište umjetne inteligencije (AI) već praktični mehaničar koji rješava svakodnevne probleme. On je već uvjerio vlasnike najmoćnijih svjetskih podatkovnih centara da su njegove grafičke procesorske jedinice (GPU) esencijalni ključevi i bušilice umjetne inteligencije, što je izazvalo hiperskalerski stampedo za Nvidijine čipove. Ali uvjeravanje dionika telekoma da ih kupe pokazalo se mnogo težim.

Zašto bi? Od početka prošle godine, Huang i njegov tim u Nvidiji energično promoviraju koncept AI RAN-a. RAN je skraćenica za radio pristupnu mrežu, a ideja je da bi RAN operater mogao ostvariti višestruke prednosti ako bi prihvatio AI na Nvidijin način. Otkriveno na ovonedeljnom Nvidia GTC-u, događaju koji se održava svake godine u San Joseu za programere i izvršitelje AI-a, najnovije vijesti uključuju planove za izgradnju “AI-native” 6G, sljedeće generacije mobilne tehnologije.

Uključuje T-Mobile, najuspješnijeg mobilnog operatera u SAD-u, zajedno sa Ciscom, velikim provajderom Internet rutera i prekidača, plus Booz Allen, konsultantsku firmu za menadžment, i O-RAN Development Company, američki programer RAN softvera. Mitre, vojni think-tank, također je imenovan kao partner. Usred razgovora o osjećaju kao ključnoj osobini 6G-a, uključenost te kompanije može potaknuti zlokobne misli o AI kao nevidljivoj ruci na bojnom polju, koja osjeća neprijateljske pozicije.

Povezani:T-Mobile slijedi velike zamjene spektra sa AT&T-om i Verizonom

6G inicijativa, čije su vijesti pratile više tehničkih ažuriranja, čini dio Nvidijinih širih napora da probije telekom sektor. Ronnie Vasishta, koji je na čelu Nvidijinog telekom poslovanja, kaže da je proizvođač čipova već angažiran sa oko 150 operatera širom svijeta, uključujući 90% od 50 najboljih. Njegova visina uključuje nekoliko elemenata koji se preklapaju. AI za RAN nastoji poboljšati performanse mreže zamjenom konvencionalnih, ljudski autorskih RAN algoritama sa AI tehnologijama. AI na RAN je o pružanju podrške za AI aplikacije u telekomunikacijskim, a ne hiperskalerskim objektima. Sa AI i RAN, AI aplikacije i RAN radna opterećenja su hostirani na istoj hardverskoj platformi – to jest, Nvidijinim GPU-ima.

Podizanje Lazara rubnog računarstva

Nvidijin interes prirodno leži u prodaji više čipova, a ne u RAN revoluciji. Operateri se čine dobrom metom nakon hiperskalera jednostavno zato što bi se njihovi vlastiti objekti za telekomunikacijska radna opterećenja mogli udvostručiti kao manji podatkovni centri za “rubno računarstvo”. Fenomen oblaka ima tendenciju da centralizira IT resurse u velikim hiperskaler zgradama, potencijalno stotinama ili hiljadama milja udaljenim od uređaja koji koriste te aplikacije. Sa rubnim računarstvom, resursi bi bili više raspršeni, udaljenosti bi bile kraće, a latencija – mjera u milisekundama vremena putovanja za mrežni signal – bi pala. AI sutrašnjice će morati biti smješten u ovim rubnim objektima, mnogo bliže krajnjem korisniku. Ili barem tako Nvidia kaže.

Povezani:Brzina nije glavna briga za bežične pretplatnike – Opensignal

Otuda njegov slučaj da operater sa GPU-ima na rubu mreže može zaraditi novac od prodaje inference-as-a-service, kapaciteta na AI čipovima za aplikacije koje koriste prednosti potpuno obučenih velikih jezičkih modela (LLM). Argument koji gura SoftBank, Nvidijin klijent u Japanu, je da operater može ostvariti povrat od 5 dolara tokom petogodišnjeg perioda za svaki 1 dolar koji uloži u AI RAN.

Vrlo malo ih je uvjereno. Za početak, relativno mali broj podatkovnih centara, a ne stotine ili čak hiljade, do sada su bili dovoljni da garantuju latenciju potrebnu za edge computing aplikacije. Kroz uslugu zvanu Wavelength, AWS je radio u partnerstvu sa telekomunikacijskim kompanijama kao što su Verizon i Vodafone kako bi podržao ove usluge rubnog računarstva. Ali Wavelength nije pružio vidljiv porast prihoda od telekomunikacija. Zašto će AI aplikacije nužno biti osjetljivije na latenciju, ili bi dovele do drugačijeg ishoda za telekomunikacijske kompanije, trenutno nije jasno.

Povezani:Huawei bi konačno mogao imati kineski popravak za high-end čipove

Neki analitičari su također otkrili da su brojevi povrata ulaganja SoftBank-a smiješni, ističući da bi spot cijene za zaključivanje brzo pale ako bi ga svaki telekom upakirao u AI RAN. Drugi vide fundamentalne probleme sa argumentom da telekomunikacijski operateri moraju igrati ovu vrstu uloge ako AI RAN ekonomija ima smisla. “Izazov za AI RAN je da, kako bi ga učinili zaista atraktivnim, morate prodati AI zaključivanje-kao-usluga”, rekao je Simon Stanley, osnivač i glavni konsultant Earlswood Marketinga. “Mislim da pružatelji usluga moraju promijeniti svoj način razmišljanja kako bi to uspješno učinili.”

Ulazak na ovo tržište bi također stavio telekomunikacijske kompanije u direktnu konkurenciju sa igračima u podatkovnim centrima kao što su Digital Realty, Equinix, Nscale i HPE, da spomenemo samo neke. Antonio Neri, HPE-ov izvršni direktor, ohrabruje telekomunikacijske kompanije da potraže negdje drugdje. “Da sam to ja, više bih se fokusirao na to kako izgraditi više računarske snage kroz samu mrežu, a ne da budem domaćin GPU-a koji zahtijevaju više kapitalnih ulaganja”, rekao je Light Reading na ovogodišnjem MWC Barcelona. “To je težak, brutalan posao i ima mnogo ljudi koji to mogu učiniti s više stručnosti.”

Neki također sumnjaju da su GPU-ovi potrebni za AI zaključivanje, za razliku od AI treninga. Nvidia je prošle godine izvijestila o bruto marži od 75%, što je znak visokih cijena za svoje proizvode. Ako jeftiniji čipovi mogu jednako dobro podnijeti potrebe za zaključivanjem, GPU bi mogao biti skupo gubljenje kapaciteta, kao što je rezervacija cijelog londonskog hotela Savoy za domaćinstvo porodičnog okupljanja. I Intel insistira na tome da su njegove centralne procesorske jedinice (CPU), već raspoređene u telekomunikacijskim mrežama, dorasle poslu zaključivanja. “Možete uraditi sve zaključke koje želite da uradite u RAN-u sa CPU-om,” rekla je Cristina Rodriguez, šefica Intelove grupe za komunikacijska rješenja. “Ne treba vam GPU.”

Neuronske mreže preuzimaju ljude

Ali osim ako AI na RAN dolazi do ostvarenja, telekomi bi se borili da opravdaju instaliranje GPU-a u mrežu, kao što je i sama Nvidia ranije priznala. Njegova umjetna inteligencija za RAN pitch je općenito da bi zamjena neuronskih mreža za konvencionalne algoritme za obradu signala mogla dovesti do velikih poboljšanja u spektralnoj efikasnosti. U simuliranom okruženju za procjenu kanala, koje otkriva uslove kao što su šum i smetnje, kao i očekivani kvalitet signala, Nvidia tvrdi da je vidjela 40% dobitka kada je neuronska mreža bila uključena. Ali te neuronske mreže vjerovatno mogu biti podržane na drugim hardverskim platformama, i ne vjeruju svi da bi napravile tako veliku razliku.

“AI je fantastičan alat kada nemate algoritam za rješavanje problema, ali u bežičnoj mreži Qualcomm ga je usavršio tokom 40-godišnje historije,” rekao je Joel Brand, viši direktor u Marvell Technology. Prilagođeni silicij proizvođača čipova koristi Nokia, jedan od najvećih svjetskih dobavljača RAN-a, za Layer 1, dio RAN softvera koji pokriva procjenu kanala i mnoge od računarski najzahtjevnijih zadataka. Podrška za neuronsku obradu je već pečena, kaže Brand. “Pravo rješenje je da se Layer 1 obrada poveća sa nečim, a to mora biti nešto vrlo malo”, rekao je. “To ne može biti GPU od 6.000 dolara.”

Gerardo Giaretta, koji vodi 5G RAN poslovanje za Qualcomm, zvuči jednako sumnjivo kada ga pitaju da li AI za RAN bi uživao u povećanju od GPU-a za razliku od drugih vrsta silicija. “To nam nije jasno u ovom trenutku”, rekao je. “Rekao bih da možemo učiniti puno stvari na našoj platformi.” Slično kao i Marvell, Qualcomm pruža prilagođeni silicij za Layer 1 obradu. Za razliku od svog rivala, on također doprinosi Layer 1 softveru koji radi na ovom silicijumu. Istraživanje unutar kompanije o korištenju umjetne inteligencije za procjenu i predviđanje kanala traje “zauvijek”, primjećuje Giaretta.

Ako Nvidia ima prednost, to je da njeni GPU-ovi sada čine temelj mnogo većeg softverskog ekosistema nego što se Marvell ili drugi programeri prilagođenog silicija mogu nadati da će angažirati. Ali u RAN svijetu, tu vrstu prednosti drže Intel i njegovi procesori mnogo duže. “Industriji je potrebno nešto što je dostupno i skalabilno i agilno, i što je više od Xeona,” rekao je Intelov Rodriguez, ispuštajući ime brenda za liniju procesora proizvođača čipova. “Svi znaju kako programirati taj čip – cijeli ekosistem OEM-a i ODM-a.”

Uprkos tome, Intelovi procesori opće namjene nisu uspjeli da izbace prilagođeni silicij kao podrazumevanu opciju za Layer 1 obradu u RAN-u. Stručnost u RAN tehnologiji ostaje koncentrisana unutar nekoliko velikih kompanija, sa Huawei, Ericssonom, Nokiom, ZTE-om i Samsungom koji čine sve osim 4,9% globalnog tržišta za RAN proizvode do 2023. godine, prema podacima Omdia, sestrinske kompanije Light Reading. Svi se i dalje oslanjaju na prilagođeni RAN silicij. Ipak, Ericsson i Samsung sada imaju odvojeni “virtual RAN” (ili cloud RAN) softver dizajniran da radi na Intelovoj x86 arhitekturi.

Zraku su potrebna krila

Geopolitička realnost isključuje bilo kakav angažman sa kineskim dobavljačima. Kada je u pitanju AI i RAN, to znači da je veliki izazov za Nvidiju uvjeravanje Ericssona i Samsunga da ulože resurse u shrina trećem kolosijeku zasnovanom na svojoj platformi Compute Unified Device Architecture (CUDA). Upućuje sličnu molbu Nokiji, koja je do sada držala cijeli svoj Layer 1 na Marvellovim čipovima. Ipak, nijedan od dobavljača RAN-a nije ugrizao.

Zašto bi ih Nvidia trebala? Kao dio svoje RAN kampanje, razgovarali su o internom naporu pod nazivom Aerial. U početku, ovo je opisano kao potpuno implementabilni Layer 1 koji će biti hostovan na GPU-ima koje Nvidia prodaje pod brendovima Hopper i Blackwell. Prošle godine, Nvidia je tvrdila da je proširila Aerial u viši sloj RAN softvera koji će podržavati preko Grace-a, interno razvijenog CPU-a baziranog na Arm-u, arhitektonskoj alternativi x86.

Ali za druge, Aerial je Nvidijina verzija FlexRAN-a, referentni dizajn za x86-bazirani Layer 1, razvijen od strane Intela kao neka vrsta RAN kostura koji je trebao malo mesa na kostima. “Sličan je FlexRAN-u u smislu da je to okvir za ljude s kojim se mogu igrati”, rekao je Giaretta iz Qualcomma. “Kada razvijate iz komercijalnih razloga, to je druga igra.” Zračni ima vrijednost, ali uglavnom iz perspektive istraživanja, misli on.

Ono što je zanimljivo je da su SoftBank-ovi AI RAN testovi, koji pokrivaju samo 20 ćelija, izbacili Aerial u slojeve 2 i 3 i zamijenili ga CPU softverom iz Fujitsua. Čini se da je japanski operater također petljao sa Nvidijinim slojem 1. Izvor blizak tom pitanju, koji je govorio pod uslovom anonimnosti, prošle godine povjerio je sumnje u Nvidijin nivo RAN stručnosti i sposobnosti da se takmiči sa Ericssonom i Nokiom.

Nvidia negira da je Aerial samo referentni dizajn, insistirajući da je “komercijalni razred” i da se dokazao u dijelu žive mreže kojom upravlja NTT Docomo, konkurent SoftBank-a u Japanu. U isto vrijeme, međutim, odbacuje priče o Nvidiji kao dobavljaču softvera za distribuiranu jedinicu (DU), RAN komponentu odgovornu za Layer 1 obradu.

“Naša namjera nije da budemo komercijalni DU. Mi pružamo izvorni kod partnerima kao što su Ericsson, Nokia, ko god želi da ga pogleda,” rekao je Soma Velayutham, generalni direktor u Nvidijinom AI i telekom biznisu, tokom razgovora sa Light Readingom krajem 2024. godine. “Želimo da izgrade svoju platformu i da se osjećaju ugodno da imaju potpunu kontrolu nad intelektualnim vlasništvom i domenom.”

Nema virtualnog ponavljanja RAN-a, molim

Iskustva virtualnog RAN-a mogu djelimično objasniti zašto dobavljači RAN-a izgledaju oprezno pri dodjeljivanju resursa CUDA-i. Prilagođeni silicij je nastavio pobjeđivati procesore opće namjene po mjerama performansi i energetske efikasnosti, kažu većina nepristrasnih stručnjaka. Vjerovatno će postojati slična zabrinutost oko Nvidijinih GPU-a s obzirom na njihovu reputaciju – bilo da su u potpunosti zasluženi ili ne – kao moćne svinje.

Intelov efektivni monopol na malom virtualnom RAN tržištu također izgleda daleko od idealnog usred pitanja o budućnosti kompanije, koja je prošle godine zabilježila neto gubitak od 19,2 milijarde dolara. Nvidijina kondicija danas ne garantira da će uvijek biti u dobrom zdravlju. A ako bi svi veliki dobavljači pružili svoj Layer 1 na istoj hardverskoj platformi, potencijalni izvor diferencijacije bi bio izgubljen.

Tommi Uitto, predsjednik Nokijine poslovne grupe za mobilne mreže, otporan je na kodiranje sloja 1 za Nvidijine GPU-ove dok još uvijek ne postoji dokazani poslovni slučaj za AI zaključivanje na rubu telekomunikacija. “Pravljenje AI RAN-a sa prilično skupim GPU-ovima, samo da bi se poboljšale performanse mreže, možda neće imati tehno-ekonomskog smisla”, rekao je. To bi se vjerovatno promijenilo, međutim, ako bi AI na RAN je poletio.

“U tom slučaju, većina računarstva se koristi za radna opterećenja osim sloja 1 i onda korištenje akceleratora za sloj 1 nije velika stvar”, objasnio je. “Na kraju, onda bismo željeli da imamo Layer 1 i u GPU-ima.” U međuvremenu, Nokia se pojavila u SoftBank-ovim AI RAN planovima kao potencijalna alternativa Aerial i Fujitsu. Korištenje njegovog akceleratora – Layer 1 Marvell čipa koji se nalazi na PCIe kartici koja se može spojiti na bilo koji kompatibilni server – značilo bi da GPU u mreži nema ulogu specifičnu za RAN.

Iako je pronašao AI RAN smještaj kod Nokije, SoftBank izgleda odlučan da natjera finskog dobavljača da se prebaci na GPU za Layer 1. Odgovarajući na pitanja koja je Light Reading postavio na nedavnom pozivu s novinarima, Ryuji Wakikawa, šef istraživanja u SoftBank-u, rekao je: “Nadamo se da će raditi s nama na komercijalizaciji i usvojiti GPU kao akcelerator u budućnosti.” Ali Nokijini ključni zapadni rivali ne izgledaju drugačije.

‘Veliki upitnik je poslovni slučaj’

Najnoviji dokaz za to došao je u Samsungovoj najavi prije nekoliko dana. Između ostalog, južnokorejski dobavljač je tvrdio da je integrisao svoj virtualni RAN DU sa Nvidijinim akceleratorima. Ipak, predstavnici kompanije su naknadno priznalie “dokaz koncepta” je bio baziran na x86, a posebno na Intelovim Xeon čipovima. Čini se da nije bilo implementacije Nvidijinih Grace, Hopper ili Blackwell proizvoda za podršku Samsungovom RAN softveru.

Ericsson je bio još tiši. Član je AI-RAN Alliance, grupe koju su Nvidia i drugi okupili prošle godine, a pojavio se na posebnoj listi T-Mobile partnera – zajedno sa Nokiom i Nvidijom – kada je američki operater prošle godine počeo istraživati svoje AI RAN opcije. U bijela knjiga izdana uoči MWC-a, Ericsson je priznao “potrebu za jedinstvenim kodom za namjenski izgrađeni RAN i RAN u oblaku.” Ali švedski dobavljač izgleda želi izbjeći dodatne softverske tragove.

Ericssonov očigledni cilj je, dakle, da osigura da njegov virtualni ili cloud RAN softver nije zavisan od hardvera, omogućavajući mu da se premjesti sa jedne procesorske platforme na drugu bez promjena. To bi moglo biti izvedivo kroz neku vrstu apstrakcijskog sloja. Na MWC-u, Arm je pokazao rad koji je uradio na apstrakcijskom sloju za x86 AVX i vlastiti SVE, različite tehnologije vektorske obrade koje se koriste u Layer 1.

Ako apstrakcija radi i može se naknadno proširiti da pokrije Nvidijinu tehnologiju, to bi moglo pružiti rješenje koje Ericsson želi. Ali to je veliko ako. Danas, uprkos mnogim pričama o Arm-u i AMD-u (još jedan x86 proizvođač čipova) kao virtualnim RAN alternativama, Ericsson ostaje u potpunosti ovisan o Intelu.

Dobavljači će, naravno, biti vođeni onim što njihovi kupci rade i traže, a nijedan telekom se ne kreće brzo. SoftBank, koji se smatra pionirom AI RAN-a, očigledno ne očekuje da će GPU-ovi uskoro figurirati u široko dostupnoj komercijalnoj mreži. “Cilj nam je da rasporedimo mali broj lokacija možda u narednoj godini – ove godine ili možda početkom sljedeće godine”, rekao je Wakikawa na nedavnom pozivu za štampu SoftBank-a. “Posluživanje stvarnog komercijalnog prometa je drugačije. Drugačiji nivo kvaliteta i funkcija je neophodan.”

U međuvremenu, drugi gledaju da vide šta će se desiti u SoftBanku, a potencijalno i u T-Mobileu. “Veliki upitnik je poslovni slučaj”, rekao je Laurent Leboucher, glavni tehnološki direktor francuske Orange. “Jasno, dovođenje GPU-a na sve radio lokacije ili sve rubne lokacije za mene nema smisla, barem danas. Mislim da nema dovoljno poslovnih razloga da se to uradi. Ali vidjet ćemo.” Dok on i drugi ne budu uvjereni, Nvidijina AI RAN vizija može biti u velikoj mjeri ograničena na slideware.

Pregledi: 437