VERSLO TRIBŪNA

RĖMIMAS
2024-04-26 13:02

Jei dirbtiniam intelektui duosi šiukšles, šiukšles jis tau ir grąžins, arba kokie išpūsti lūkesčiai apie DI šiandien nėra teisingi?

Giedrius Karauskas, „Tilde IT“ technologijų skyriaus vadovas
Giedrius Karauskas, „Tilde IT“ technologijų skyriaus vadovas
Pernai rugpjūtį „Gartner“ savo atsirandančių technologijų ciklų analizėje fiksavo generatyvinį dirbtinį intelektą esant išpūstų lūkesčių pike ir sakė, kad realų transformacijos poveikį tam, kaip gyvename, ši technologija turėtų pasiekti per 2-5 metus. Šiandien galime sakyti, kad jau matome lūkesčių leidimąsi į realybę, bet vis dar egzistuoja labai nepamatuoto įsivaizdavimo, ką generatyvinis DI iš tiesų gali ir ko – dar ne visai.

Bet pradėkime nuo pradžių. Lūkesčius dėl generatyvinio DI nežmoniškai iškėlė didžiųjų kalbos modelių (angl. Large Language Models, LLM), o kalbant tiksliau – „ChatGPT“ atsiradimas. Šis burbulas išsipūtė ne be reikalo: „ChatGPT“ iš tiesų padarė didelį proveržį ir tame, kaip veikia generatyvinis DI, ir kaip jis yra suprantamas plačiosios visuomenės. Tuomet DI tapo tema iš didžiosios T, lydima įsitikinimo, kad DI išspręs visas mūsų problemas akimirksniu. Suvokimo klaida, kuri tuo metu buvo padaryta gana plačiai, buvo tai, kad tikėtasi (ir iš dalies vis dar tikimasi), jog atsiradus „ChatGPT“, nieko nedarant patiems, tik imant ir naudojantis technologija, gausime daug kartų geresnius rezultatus nei iki „ChatGPT“. Mūsų galvose įsišaknijo suvokimas, kad generatyvinis DI yra mąstanti būtybė, kuriai ką beužduosi, tą ji išmąstys. Kai iš tiesų tai yra programa, kuri, pavyzdžiui, pokalbių robotų atveju, generuoja žodį po žodžio.

Ką tai iš tiesų reiškia? Generatyvinis DI yra įspūdinga technologija ir neįtikėtinas technologinis proveržis. Jau šiandien jis yra plačiai naudojamas įmonių, pokalbių robotai dirba itin kokybiškai, įmonės svarsto juos naudoti ne tik išorinei veiklai, bet ir vidinei. Vis dėlto tai dar nėra visų problemų sprendėjas, nes norint tai pasiekti, pasikeisti ir pasitempti turime patys. Juk ir pasikinkę elektrą, kuri iš esmės pakeitė gyvenimo būdą, patys turėjome padaryti ne vieną žingsnį, kad galėtume ją naudoti (keisti tai, kaip statome namus, sukurti elektra varomus prietaisus ir pan.). Taip ir su generatyviniu DI: juo naudotis turime mokytis ir tam ruoštis. 

Vis dėlto vis dar gajus manymas, kad įdiegus pokalbių robotą su LLM (didžiaisiais kalbos modeliais), įdavus jam visus, pavyzdžiui, įmonės dokumentus, jis gebės juos suprasti ir tiksliai atsakyti į bet kokį užduotą klausimą. Tai nėra tiesa: jei pokalbių robotui duosime, pavyzdžiui, krūvą skirtingu metu rengtų įmonės vidinės tvarkos aprašų, kurių vieni nebegalioja, kiti galioja, treti yra juodraštiniai, nebaigti failai, negalime tikėtis jokio teisingo atsakymo klausdami roboto konkretaus klausimo apie kokį nors vidinės tvarkos aspektą. Gavęs netvarkingą informaciją, netvarkingai DI ją ir atiduos: tikėtina, kad gausite dalį atsakymo iš seno tvarkos aprašo, dalį – iš naujo, kas jums nepadės išspręsti jokios problemos, turbūt ją tik sukurs. LLM vis dar nesugeba suprasti, kas yra pasenęs dokumentas, kuris dokumentas keičia kurį, kuriuo naudotis, nesupranta konteksto, kokiame turi veikti ta tvarka. Tai šiandien yra per sudėtingos užduotys, nes LLM vis dar gali analizuoti duomenis, o ne išmąstyti, ką jie reiškia ir kaip jie sąveikauja tarpusavyje. 

Būtent tai yra didžiausia suvokimo apie generatyvinį DI klaida šiandien: manymas, kad DI galima sumaitinti krūvą neapdorotos ir nesutvarkytos informacijos, o DI pats sugebės ją suprasti, suvokti ryšius, kontekstus ir atsakyti į bet kokius su ja susijusius klausimus. Norint pilnai naudoti DI, reikia įdėti nemažai darbo: parengti visus dokumentus DI skaitomu formatu, užtikrinti, kad juose yra tik aktuali, ne pasenusi informacija. 

Negana to, informacijos kiekis, kuriuo disponuoja organizacijos, nuolat auga ir jų tvarkymas tam, kad būtų galima pilnai išnaudoti DI, manoma, taps atskira specialybe ir profesija  – duomenų valdytojo (angl. data owners). Tikėtina, kad didelėms organizacijoms tokių žmonių reikės net ne po vieną tam, kad duomenys būtų tvarkomi tinkamai siekiant didžiausios naudos. Duomenų valdytojai būtų atsakingi už duomenų tvarkymą, užtikrinimą, kad jie aktualūs, įvertinimą, ar jie turi pakankamai meta duomenų, ar iš jų galima formuoti kažkokias įžvalgas. Ir tai tik ledkalnio viršūnė kalbant apie tai, ką turime padaryti, kad generatyvinis DI pakeistų pasaulį taip, kaip jį pakeitė, pavyzdžiui, minėta elektra.

Vis dėlto svarbu suprasti, kad technologija vystosi, atsiranda vis daugiau naujų jos modelių, ir nors kiekvienu atveju vis dar atsiremiame į ribotumus, pavyzdžiui generatyvinio DI įrankių vaizdų generatorius nupiešia aštuonis, o ne penkis pirštus, progresas yra milžiniškas. Šiandien organizacijoms yra svarbiausi keli dalykai: pirma, suvokti realias DI panaudojimo galimybes, antra, dirbti tvarkant turimus duomenis, ir trečia, nebijoti eksperimentuoti, kurti tęstinius pokalbių robotus ir vertinti, ar jie jau pakankamai protingi norimiems iššūkiams spręsti. 

KUO SKIRIASI POKALBIŲ ROBOTAS SU DIDŽIAISIAIS KALBOS MODELIAIS (LLM) IR BE?

Kas yra LLM?

Tai yra didieji kalbos modeliai (angl. Large Language Models, LLM), dirbtinio intelekto modelio tipas, skirtas suprasti ir generuoti žmogiško pavidalo natūralią kalbą. Šie modeliai yra mokomi iš didelių teksto duomenų rinkinių, tokių kaip knygos, dokumentai, straipsniai, svetainės ir susirašinėjimai, leidžiančių jiems išmokti kalbos modelių ir struktūrų.

Supratimas ir natūralios kalbos generavimas

Be LLM: gali remtis paprastesniais natūralios kalbos supratimo metodais. Šie pokalbių robotai dažnai turi iš anksto apibrėžtus scenarijus ir atsakymus.

Su LLM: gali suprasti ir generuoti žmogiško pavidalo natūralios kalbos atsakymus. Jie yra mokomi iš didelių duomenų rinkinių ir gali generuoti kontekstiškai aktualius atsakymus. Vis dėlto klaidų dar daro ir reikalauja labai atsakingo mokymo.

Lankstumas ir prisitaikymas

Be LLM: prisitaiko ribotai. Jie paprastai gerai veikia savo iš anksto apibrėžtame mastelyje, atsako į žinomus klausimus, bet gali turėti sunkumų atsakant į netikėtas ar sudėtingas užklausas.

Su LLM: gali prisitaikyti prie įvairių temų ir pokalbių stilių. 

Atsakymų kokybė

Be LLM: gali pateikti žmogaus jam sukurtus atsakymus, nes yra riboti iš anksto apibrėžtais scenarijais, tai daro taikliai ir teisingai.

Su LLM: gali atsakyti į įvairesnius klausimus ir dinamiškai generuoti išsamesnius atsakymus, bet vis dar daro daug klaidų, sukuria vieną atsakymą iš kelių nebūtinai susijusių šaltinių ir pan.

52795
130817
52791