„DeepSeek“ kėsinasi suvalgyti „Nvidios“ pietus
Kinijos startuolis teigia itin pigiai sukūręs galingą dirbtinio intelekto modelį

„DeepSeek“ generatyvinio dirbtinio intelekto (DI) pasaulį pribloškė dėl bent kelių priežasčių.
Pirma – šio modelio, sukurto nedidelėje DI laboratorijoje Kinijoje, Huangdžou mieste, parametrai yra lygintini su geriausiais JAV technologijų milžinų modeliais.
Pavyzdžiui, „DeepSeek-R1“ geriau arba ne blogiau pasirodo pagal kelis etaloninius (angl. benchmark) testus: „AIME 2024“, skirtą pademonstruoti, kaip gerai modelis sprendžia matematines užduotis, MMLU bendrųjų žinių benchmark’ą ir „AlpacaEval 2.0“, kuris parodo gebėjimą atsakyti į klausimus, rašo „Bloomberg“. Anot kūrėjų, jo „DeepSeek-R1“ gebėjimas rašyti programinį kodą yra lygintinas su „OpenAI“ modeliais.
Antra – sąnaudos, kuriomis buvo sukurtas „DeepSeek-R1“ modelis. Skelbiama, kad jis galėjo būti ištreniruotas už vos 5–6 mln. USD. Kadangi tikslus biudžetas nėra atskleidžiamas, tiek šį, tiek kitus skambius „DeepSeek“ pareiškimus kol kas vertėtų traktuoti su sveiko skepsio doze.
Visgi jeigu šiuose pranešimuose yra bent kiek tiesos, tai būtų kone juokinga suma, palyginti su tuo, kokias investicijas jau yra realizavusios ir ateičiai suplanavusios tokios kompanijos kaip „OpenAI“, „Meta“ ar „Google“. Pavyzdžiui, Dario Amodei, „Amazon“ ir kitų technologijų milžinų finansuojamo DI startuolio „Anthropic“ vadovas ir vienas įkūrėjų, neseniai teigė, kad jau 2026 m. bendros DI modelių treniravimo išlaidos viršys 10 mlrd. USD, o ateityje ne riba bus ir 100 mlrd. USD.
Vien praėjusią savaitę paskelbtam „Stargate“ DI infrastruktūros projektui įsipareigota investuoti iki 500 mlrd. USD.
Trečia – migla ir mistika, supanti pačią kompaniją ir jos įkūrėją. „DeepSeek“ 2023 m. Huangdžou mieste įkūrė Liang Wenfengas, DI mokslininkas ir vienas investicijų bendrovės „High-Flyer“ įkūrėjų, kone pernakt tapęs didžiausia Kinijos technologijų pasaulio žvaigžde.
O Amerikoje jau ne pirmą kartą kyla nerimas dėl Kinijos technologijų sektoriaus pažangos, nepaisant sankcijų, skirtų šią pažangą apriboti. Panašus aliarmas buvo kilęs prieš pusantrų metų, kai „Huawei“ išleido išmanųjį telefoną su pažangiu, Kinijoje pagamintu procesoriumi.
Patyrusių neieškojo
Liang Wengfengas bendrovę, tapusią „DeepSeek“, iš pradžių įkūrė pavadinimu „Fire-Flyer“ – ji veikė kaip „High-Flyer“ DI tyrimų laboratorija. 2021 m., dar prieš prasidedant generatyvinio DI bumui, jis dideliais kiekiais pradėjo pirkti bendrovės „Nvidia“ grafikos procesorius savo DI projektui, kurį pradėjo vystyti šalia pagrindinio darbo.
Kaip rašo „Financial Times“, tuo metu su DI dirbę žmonės Liang Wengfengą laikė paprasčiausiai naujo hobio ieškančiu ekscentrišku milijardieriumi. Visgi DI srityje jis toli gražu nebuvo naujokas – pasitelkęs šią technologiją ir algoritmus, jis susikrovė turtus iš akcijų prekybos. 2023 m. verslininkas šiuos pinigus nusprendė nukreipti į „DeepSeek“, kuri išsikėlė tokį patį tikslą kaip „OpenAI“ – sukurti bendrąjį DI (angl. artificial general intelligence).
Liang Wengfengas Kinijos žiniasklaidai teigė, kad į „DeepSeek“ tyrimų komandą neieškojo patyrusių inžinierių, kurie sukurtų į klientą orientuotą produktą, – vietoj to jis samdė save įrodyti norėjusius prestižinių Kinijos universitetų absolventus. Portalui „36Kr“ jis pernai teigė, kad šioje komandoje daugiausia dirba žmonės, universitetą baigę „per pastaruosius porą metų“.
Įsibėgėjus DI lenktynėms, JAV „Nvidiai“ uždraudė į Kiniją eksportuoti pažangiausius lustus, todėl šios šalies kompanijoms teko ieškoti būdų, kaip dirbti su tuo, ką turi. „DeepSeek“ turėjo 10.000 „Nvidios“ lustų, tačiau, norint konkuruoti su milžinais iš JAV, reikėjo daugiau. Liang Wengfengas buvo sakęs, kad didžiausias iššūkis bendrovei yra ne pinigai, o būtent JAV lustų eksporto kontrolė.

„Jie sugebėjo optimizuoti savo DI modelių architektūrą, – technologijų publikacijai „Wired“ sako Wendy Chang, Mercatoro Kinijos studijų instituto politikos analitikė. – Pritaikyti komunikacijos tarp lustų, inovatyvūs modelių mišiniai (angl. model mixture – VŽ). Dauguma šių metodų nėra naujos idėjos, bet jas sujungti į vieną ir sukurti technologiškai pažangiausią modelį yra įspūdinga.“
Ritwikas Gupta, DI politikos tyrėjas iš Kalifornijos Berklio universiteto, teigia, kad Kinijoje esti gerokai daugiau sistemų inžinierių, kurie moka efektyviai naudoti turimus pajėgumus.
Kaip su „Nvidia“?
„DeepSeek“ šūvis į stratosferą pirmadienį tapo pagrindine naujiena abiejose JAV pakrantėse – tiek Volstrite, tiek Silicio slėnyje.
Niujorko vertybinių popierių biržose „DeepSeek“ pasėjo paniką dėl kaip ant mielių per generatyvinio DI bumą augusių technologijų akcijų. Po didinamuoju stiklu atsidūrė 2023 ir 2024 m. pasakiškai augusi ir 3 trln. USD kapitalizacijos kartelę pramušusi „Nvidia“, kuri faktiškai yra DI skirtų lustų monopolininkė.
Po to, kai „Nvidia“ iš grafikos procesorių žaidimų kompiuteriams kūrėjos tapo DI lustų monopolininke, jos verslo modelis buvo pastatytas ant pritrenkiamos šių lustų pasiūlos – „Nvidia“, net ir augdama šimtais procentų per metus, vis tiek nebuvo pajėgi patenkinti milžiniško savo klientų poreikio technologiškai pažangiems lustams.
„DeepSeek“ tyrėjai teigia, kad savo modeliui treniruoti panaudojo vos 2.048 „Nvidia H800“ lustus – gerokai mažesnės galios procesorius, nei tuos, kuriuos „Nvidia“ parduoda „OpenAI“ ir kitiems JAV DI milžinams.
Nors kai kurie „DeepSeek“ teiginiai tebėra kvestionuojami, faktas, kad kažkas sukūrė itin pažangų DI modelį už gerokai mažesnę kainą, ne juokais išgąsdino Volstritą, nes tai potencialiai kerta per pagrindinę „Nvidios“ verslo tezę, kad DI plėtrai reikia – ir dar reikės – vis daugiau itin brangių, galingų ir vis sparčiai tobulėjančių lustų.
Vienas įdomiausių aspektų yra tai, kad „DeepSeek“ modelis yra visiškai nemokamas. Atviras kodas yra prieinamas bet kam, techninės dokumentacijos paaiškina, kaip kinai su gerokai mažiau padarė gerokai daugiau, – nėra jokių paslapčių.
Tai reiškia, kad šiuos metodus savo veikloje gali pritaikyti ir bet kuri kita DI kompanija. „DeepSeek“, modelį ištreniravusi už vos 5 mln. USD, neabejotinai turėjo sujudinti ir „OpenAI“, kurios vadovas Samas Altmanas anksčiau yra sakęs, kad ištreniruoti „GPT-4o“ modelį kainavo apie 100 mln. USD.
„Meta“ vadovas ir įkūrėjas Markas Zuckerbergas praėjusią savaitę pareiškė, kad kompanija į DI infrastruktūros plėtrą planuojama vien šiemet investuoti net 65 mlrd. USD – ketinama padidinti darbuotojų samdą ir investuoti į daugiau nei 2 gigavatų pajėgumo duomenų centrą.
Xi – už ribų
„DeepSeek“ išpopuliarėjo žaibo greičiu.
Marcas Andreessenas, vienas iš rizikos kapitalo bendrovės „Andreessen Horowitz“ įkūrėjų, savo socialinio tinklo „X“ paskyroje „DeepSeek“ išleidimą pavadino „DI „Sputniko“ akimirka“, turėdamas omenyje 1957 m. Sovietų Sąjungos į kosmosą paleistą pirmą dirbtinį Žemės palydovą.
„Reuters“ naujienų agentūra pirmadienį rašė, kad kinų bendrovės DI asistentas tarp nemokamų programėlių pagal atsisiuntimus pralenkė „ChatGPT“ ir tapo dažniausiai per „App Store“ programėlių parduotuvę atsisiunčiama programėle Amerikoje.
Visgi „DeepSeek“ įtemptame geopolitiniame kontekste kelia klausimų dėl to, kad yra kilusi iš Kinijos.
Kadangi Pekino valdžia griežtai kontroliuoja savo technologijų įmones, platus „DeepSeek“ taikymas gali būti problemiškas Vakaruose, kur saviraiškos laisvė vertinama labiau nei autoritarinėje Kinijoje.
Pavyzdžiui, šį modelį išbandę žurnalistai pastebėjo, kad modelis, paklaustas apie Kinijai jautrius klausimus, pavyzdžiui, 1989 m. žudynes Tiananmeno aikštėje, uigūrų situaciją Kinijoje ar Taivano demokratinį judėjimą, atsakymus pateikti atsisako.
„Bloomberg“ pastebėjo, kad pokalbių robotas mielai atsako į užklausas apie kitų šalių vadovus, tačiau ne apie Kinijos lyderį Xi Jinpingą.
Be to, sparčiai išaugęs „DeepSeek“ populiarumas, tikėtina, taps išbandymu ir jos debesų architektūrai. Didėjant srautui, pirmadienį net porą kartų buvo skelbta apie „DeepSeek“ programėlės sutrikimus.
Tik iki rugsėjo 30 d.
fiziniams asmenims nuo 18 Eur/mėn.
- Esminių naujienų santrauka kasdien
- Podkastai - patogu keliaujant, sportuojant ar tiesiog norint išnaudoti laiką produktyviau
- Manopinigai.lt - praktiški patarimai apie investavimą, realūs dienoraščiai