DeepSeek înregistrează costuri reduse pentru inteligența artificială, stârnind îngrijorare în SUA
Compania chineză DeepSeek, specializată în inteligență artificială, a revelat că a investit doar 294.000 de dolari în dezvoltarea modelului său R1, un cost semnificativ mai mic comparativ cu sumele anunțate de competitorii din SUA. Această informație, publicată recent de revista academică Nature, ar putea provoca un nou val de discuții despre rolul Chinei în competiția globală în domeniul IA.
Informația, provenită dintr-un articol revizuit al revistei Nature, este prima evaluare specifică a cheltuielilor de antrenare a modelului R1, fiind un aspect pe care DeepSeek nu l-a detaliat anterior. Această discuție a fost amplificată de lansarea de către DeepSeek a sistemelor sale de IA cu costuri reduse, care a dus la scăderea acțiunilor în sectorul tehnologic care se temeau de impactul acestor noi modele asupra jucătorilor consacrați, precum Nvidia.
În ciuda acestui impact inițial, DeepSeek și fondatorul său, Liang Wenfeng, au fost relativ tăcuți în spațiul public, dezvăluind doar câteva informații despre produsele noi. Modelul R1 utilizează 512 cipuri Nvidia H800 și a fost antrenat timp de 80 de ore, o performanță care pune sub semnul întrebării costurile ridicate invocate de alte companii.
Costuri și comparații
La polul opus, Sam Altman, CEO-ul OpenAI, a dezvăluit că antrenarea modelelor sale a costat „mult mai mult” de 100 de milioane de dolari, însă fără a oferi cifre exacte pentru fiecare proiect. Declarațiile lui au fost, însă, contestate de analiști și oficiali din SUA care ridică semne de întrebare vizavi de legitimitatea afirmațiilor făcute de DeepSeek.
Cipurile H800, utilizate de DeepSeek, sunt destinate pieței chineze, având în vedere interdicțiile americane asupra exporturilor de cipuri AI mai avansate. În acest context, au apărut suspiciuni că DeepSeek ar avea acces la cipuri H100, ceea ce a condus la întrebări privind influența asupra dezvoltării sale.
Tehnici de învățare și controverse
DeepSeek a fost acuzată de „distilarea” modelelor OpenAI, un proces prin care un sistem de inteligență artificială învață din experiențele altuia. Această tehnică, deși controversată, este apărată de DeepSeek ca fiind benefică pentru performanța modelelor sale. Compania a explicat că această abordare permite o antrenare mai eficientă și mai accesibilă pentru utilizatori.
Aceste afirmații au fost consolidate de datele de antrenare utilizate pentru modelul V3, care se bazează pe răspunsuri generate de modelul OpenAI. DeepSeek a asigurat că, deși anumite informații au fost integrate accidental, nu a fost o intenție deliberată de a folosi cunoștințele altor modele.
Strategiile adoptate de DeepSeek subliniază angajamentul Chinei de a avansa în domeniul inteligenței artificiale, dar și provocările etice și legale care apar în această competiție globală, făcând ca acest subiect să fie unul de interes și dezbatere pentru viitorul tehnologic al lumii.