2025-02-06 14:44

Dirbtinio intelekto istorijoje – „Sputniko momentas“?

Daronas Acemoglu, 2024 m. ekonomikos Nobelio premijos laureatas, MIT ekonomikos profesorius. AFP/„Scanpix“ nuotr.
Daronas Acemoglu, 2024 m. ekonomikos Nobelio premijos laureatas, MIT ekonomikos profesorius. AFP/„Scanpix“ nuotr.
Sausio 20 d. pasirodžius „DeepSeek-R1“ modeliui, lustų gamintojos „Nvidia“ akcijų kaina staigiai krito, taip pat smarkiai sumažėjo ir kitų technologijų bendrovių vertinimas. Kai kurie įvykį pavadino „Sputniko momentu“ Kinijos ir Amerikos dirbtinio intelekto (DI) varžybose. Galbūt Amerikos DI pramonei reikėjo tokio spyrio, bet nutikimas išryškina kelis sudėtingus klausimus.

JAV technologijų pramonė masiškai investuoja į DI. „Goldman Sachs“ skaičiuoja, kad „didžiosios technologijų įmonės, korporacijos ir komunalinių paslaugų įmonės ketina skirti apie 1 trln. USD kapitalo sąnaudų dirbtiniam intelektui“. Tačiau daug apžvalgininkų, tarp jų ir aš, jau seniai abejojame, ar Jungtinėse Amerikos Valstijose DI plėtojamas ir į jį investuojama tinkamai.

Didžiausioms bendrovėms laikantis tos pačios formulės (tiesa, „Meta“ šiek tiek išsiskiria plėtodama iš dalies atviro kodo modelį), DI pramonė, regis, viską stato ant vienos kortos. Visos iki vienos JAV technologijų bendrovės temato mastą. Remdamosi kol kas neįrodytais „masto dėsniais“, jos mano, kad, norint pasiekti dar geresnių galimybių, modeliams tereikia dar daugiau duomenų ir skaičiavimo galios. Kai kurios netgi tvirtina, kad „viskas, ko reikia, yra mastas“.

Iki sausio 20 d. JAV bendrovės nenorėjo svarstyti alternatyvų baziniams modeliams, didžiuliais duomenų rinkiniais apmokytiems nuspėti kitą žodį sekoje. Laikydamosi prioritetų, jos kone išimtinai susitelkė į difuzinius modelius ir pokalbių robotus, skirtus žmonių (ar tokio pobūdžio kaip žmonių) užduotims atlikti. Nors „DeepSeek“ metodika iš esmės tokia pati, atrodo, kad ji labiau taikė skatinamąjį mokymąsi, ekspertinių tinklų derinimą (daug mažesnius, bet veiksmingesnius modelius), žinių distiliavimą ir ištobulintą nuoseklų samprotavimą. Tokia strategija tariamai padėjo pagaminti konkurencingą modelį kur kas pigiau.

Nors iki galo nesutariama, ar „DeepSeek“ ko nors nenuslėpė, ši situacija atskleidė JAV DI pramonės konformistinio grupinio mąstymo spragas. Būtent tokį aklumą kitokiems, pigesniems, daugiau žadantiems metodams ir visa supantį šaršalą su Simonu Johnsonu išpranašavome knygoje „Power and Progress“ (liet. „Galia ir pažanga“), kurią parašėme prieš pat kuriančiojo DI eros pradžią. Dabar svarbu išsiaiškinti, ar JAV pramonė turi kitų, dar pavojingesnių, silpnybių. Pavyzdžiui, ar pagrindinės JAV technologijų bendrovės pražiopso progą pakreipti savo modelius žmonėms palankesne linkme? Manau, kad taip, bet tik laikas parodys.

Dar kyla klausimas, ar Kinija pažanga peršoka JAV. Jei taip, ar tai reiškia, kad autoritarinės, „iš viršaus į apačią“ orientuotos struktūros (kurias su Jamesu A. Robinsonu vadiname „ištraukiamosiomis“ institucijomis) gali prilygti „iš apačios į viršų“ orientuotoms struktūroms ar netgi jas pralenkti, skatindamos inovacijas?

Esu linkęs manyti, kad kontrolė „iš viršaus į apačią“ trukdo kurti inovacijas, tą su J. A. Robinsonu bandėme įrodyti knygoje „Why Nations Fail“ (liet. „Kodėl žlunga tautos“). Atrodytų, kad „DeepSeek“ sėkmė griauna mano teiginį, bet ji toli gražu nėra galutinis įrodymas, kad inovacijų kūrimas, veikiant „ištraukiamosioms“ institucijoms, gali būti toks pat veiksmingas arba tvarus kaip veikiant įtraukiosioms institucijoms. Juk „DeepSeek“ remiasi ilgais metais pažangos JAV (ir šiek tiek Europoje). Visi jos pamatiniai metodai pirmiausia išbandyti JAV. Ekspertinių tinklų derinimo metodika ir skatinamasis mokymasis buvo sukurti akademinėse tyrimų įstaigose prieš dešimtmečius, o transformacinius modelius, nuoseklų samprotavimą ir žinių distiliavimą pradėjo taikyti didžiosios JAV technologijų bendrovės.

O štai „DeepSeek“ sekasi su inžinerija – jai pavyko suderinti tuos pačius metodus efektyviau nei JAV bendrovėms. Dar pamatysime, ar Kinijos įmonės ir tyrimų centrai gali žengti tolesnį žingsnį ir patys sugalvoti perversminių technikų, gaminių ar metodų.

Be to, „DeepSeek“ neatrodo panaši į daugelį kitų Kinijos DI įmonių, paprastai technologijas gaminančių vyriausybei arba vyriausybės lėšomis. Jei bendrovė (susikūrusi iš rizikos draudimo fondo) veikė nepastebėta, ar dabar, kai atsidūrė dėmesio centre, išliks tokia pat kūrybiška ir dinamiška? Kad ir kas nutiktų, vienos bendrovės pasiekimai negali būti įtikinamas įrodymas, kad Kinija pajėgi įveikti atviresnes visuomenes inovacijų srityje.

Kitas klausimas susijęs su geopolitika. Ar „DeepSeek“ saga reiškia, kad JAV eksporto kontrolės ir kitos priemonės, taikytos DI tyrimams Kinijoje sulaikyti, nesuveikė? Ir vėl atsakymas neaiškus. Naujausius modelius (V3 ir R1) „DeepSeek“ mokė naudodama senesnius, ne tokius galingus lustus, tačiau jai vis tiek gali reikėti pačių galingiausių lustų toliau vystyti technologiją ir didinti veiklos mastą.

Kad ir kaip ten būtų, akivaizdu, kad Amerikos antagonistinis lošimas buvo nepraktiškas ir neišmintingas. Tokios strategijos verta laikytis tik tikint, kad judame bendrojo dirbtinio intelekto (modelių, galinčių atlikti bet kokią kognityvinę užduotį kaip žmogus) link ir kad tas, kas sukurs jį pirmas, įgis didžiulį geopolitinį pranašumą. Laikydamiesi įsikibę šių prielaidų (kurios nebūtinai pagrįstos), užkirtome kelią vaisingam bendradarbiavimui su Kinija įvairiose srityse. Pavyzdžiui, jei viena šalis pagamintų modelius, galinčius padidinti darbo našumą arba padėti geriau reguliuoti energiją, tokia naujovė, juolab plačiai naudojama, būtų naudinga abiem šalims.

„DeepSeek“, kaip ir kolegės Amerikoje, siekia sukurti bendrąjį DI, tad kur kas pigiau apmokomas modelis galėtų situaciją iš esmės pakeisti. Vis dėlto, sėkmingai sumažinę technologijos tobulinimo sąnaudas žinomais metodais, stebuklingai bendrojo DI per artimiausius kelerius metus dar nesukurtume. Neaišku, ar bendrąjį DI apskritai įmanoma sukurti kada nors greitai (ir juo labiau ginčytina, ar to pageidautume).

Net nežinant visų smulkmenų, kaip „DeepSeek“ sukūrė savo modelius, ar ką šis pasiekimas reiškia DI pramonės ateičiai, regis, aišku viena: Kinijos naujokė išsklaidė technologijų pramonės susižavėjimą mastu ir gal net pabudino ją, užsiliūliavusią savo šaunumu.

 

Komentaro autorius – Daronas Acemoglu, 2024 m. ekonomikos Nobelio premijos laureatas ir  MIT ekonomikos profesorius 

Autorių teisės: „Project Syndicate“, 2025 m.

52795
130817
52791