2024-11-18 20:07

Įsivaizduoti neįsivaizduojama: DI vs. Žmogus

Kritinis mąstymas ir kūrybiškumas bus vertingiausi įgūdžiai ateityje

Vilmo Narečionio piešinys.
Vilmo Narečionio piešinys.
Istoriškai taip susiklostė, kad pažangūs kompiuteriniai algoritmai buvo pavadinti dirbtiniu intelektu (DI). Ar šis terminas yra tikrai teisingas ir atitinka intelekto kriterijus, yra vienas pagrindinių DI sampratos klausimų, kurį paliksime nuošalyje. Tačiau didžiąją šio klausimo dalį užima kūrybiškumo problema – ar gali DI, kaip ir žmogus, būti kūrybingas?

O čia jau kyla ne tik DI apibrėžties problema, bet ir filosofinis galvosūkis, kur glūdi kūrybiškumo šaknys, kitaip tariant, kas yra tas kūrybiškumas ir, svarbiausia, ar DI vadinama technologija gali jį replikuoti ar netgi pranokti. 

Vos pasirodžiusi generatyvinio DI technologija greitai tapo alternatyva paieškų sistemoms ir enciklopedijoms. Nuo pat pradžių vartotojai lyg viktorinoje klausinėjo „ChatGPT“ ir kitų DI įrankių apie istoriją, politiką, matematiką ir plakė už kiekvieną neteisingą atsakymą.  

Visgi, išlaisvinti kūrybiškumą, o ne tikslumą nuo pat pradžių žadėjo didžioji dalis generatyvinio DI kūrėjų. Vos pasirodęs „OpenAI“ kūrinys „ChatGPT“ sudrebino technologijų pasaulį. Kol DI generavo šūsnį klaidingos informacijos, ekspertai diskutavo, kad DI galima pasitelkti automatizuojant daugybę darbų – akivaizdžiausios tos sritys, kurios susijusios su kūrybiniu darbu, ypač rašymu. 

„Įkraukite savo idėjas. Padidinkite kūrybiškumą ir produktyvumą“, – taip savo DI įrankį „Gemini“ apibūdina „Google“. 

Kaip skelbia „Financial Times“, „Google“ dar 2023 m. pradžioje pasipuikavo dviem eksperimentinėmis sistemomis, kurių viena geba pagal paprastą komandą sukurti vaizdo įrašą, o kita – spręsti matematikos užduotis. Vėliau „Stability AI“ pritaikė šią metodiką muzikai rašyti. 

Tokių sistemų išvestys gali „atverti protą“ visiems, kam prireikia naujų idėjų darbe, teigė „Google“ vyresnysis viceprezidentas Jamesas Manyika, vertindamas technologijos poveikį visuomenei. Pasak jo, įdiegtos į kasdienes programinės įrangos priemones, tokios sistemos galėtų siūlyti idėjas, tikrinti darbą ar net kurti didelės apimties turinį. 

Taip ir pasipylė visa gausa įvairiausių bendrovių DI asistentų, bandančių rasti savo nišą ir pasiūlyti savitą sprendimą vis kitai problemai, ar tai būtų infogramų braižymo ypatumai, ar pasiruošimas prezentacijai. Taip atsirado skirtingos šios srities šakos, tarp jų – atvaizdų generavimas tokiomis sistemomis kaip DALL-E, „Stable Diffusion“, „Artbreeder“ ir „Midjourney“. 

Kaip apibūdina technologijų naujienų portalas „Wired“, tokie vaizdo generatoriai kaip DALL-E, tapo „vau“ efekto varikliu. Šie DI įrankiai gali generuoti originalius paveiksliukus, remdamiesi žmogaus pateiktomis užklausomis, kurios gali būti tokios paprastos kaip „traukinio paveikslėlis“. 

„Mūsų mašinos peržengė ribą. Visą gyvenimą buvome įtikinėjami, kad kompiuteriai negali būti išties kūrybingi. Tačiau staiga milijonai žmonių, naudodamiesi naujos rūšies DI, kuria nuostabius, dar niekada nematytus paveikslus. Dauguma šių vartotojų nėra profesionalūs menininkai, ir tai yra esmė: jie neprivalo tokie būti. Ne kiekvienas gali parašyti, režisuoti ir sumontuoti tokį „Oskaro“ laureatą kaip „Žaislų istorija 3“ ar „Coco“, bet kiekvienas gali įsijungti DI paveikslėlių generatorių ir užrašyti idėją. Tai, kas atsiranda ekrane, stebina savo tikroviškumu ir detalumu“, – naujausias DI galimybes giria Kevinas Kelly , „Wired“ apžvalgininkas. 

Vaizduotės matmuo 

„Imagine...“ (angl. įsivaizduok) – taip reikia kreiptis į DI įrankį „Midjourney“, lyg jis turėtų tą neišmatuojamą žmogaus savybę – vaizduotę, kuri paprastai apibūdinama kaip gebėjimas iš atmintyje turimų vaizdinių sudaryti naujus. Moksle nusistovėjusi teorija, kad vaizduotę turi tik žmogus, net gyvūnams ji nebūdinga. Tokia logika sekant, pagaminta mašina, egzistuojanti tik dėl algoritmų, vaizduotės irgi negali turėti.  

Tačiau kažkokią sintetinę vaizduotę DI visgi turi. Geba tam tikru lygiu imituoti visus žmogaus intelekto procesus. Pasitelkdamas klodus duomenų, DI generuoja, imituoja, maišo tarpusavyje realius ir fiktyvius elementus, taip sukurdamas naujus vaizdinius ar žodžių derinius, labai panašiai kaip ir žmogus. 

Mokslininkai jau yra sukūrę naują DI mokymo techniką, kurią pavadino nulinio kadro sinteze (angl. Zero-Shot Synthesis). Šiuo atveju DI, pasitelkdamas panašius į žmogaus gebėjimus, gali įsivaizduoti niekada anksčiau nematytą objektą skirtingomis savybėmis. Šis DI yra įkvėptas žmogaus vaizdinių apibendrinimo įgūdžių – paprastai mes galime atskirti išmoktas žinias pagal požymius, pavyzdžiui, formą, padėtį, spalvą, ir jas jungti tarpusavyje, kad įsivaizduotume naują objektą, o mokslininkai bando imituoti šį procesą naudodami dirbtinį neuroninį tinklą. 

Grupei mokslininkų, tarp kurių – ir tyrėjai, dirbantys JAV technologijų milžinėje „Nvidia“, pavyko sukurti raudono automobilio vaizdą naudojant du atskirus raudonos valties ir mėlyno automobilio vaizdus. Tokį rezultatą jie pasiekė ekstrapoliacijos metodu pritaikę didžiulį duomenų fondą, o technologijoje naudojami išmaniųjų klastočių generavimo metodai, kad DI būtų pasiektas vizualizavimas, panašus į žmogaus gebėjimus. Algoritmas sukuria semantinius ryšius tarp skirtingų duomenų, kad būtų galima nustatyti objektų panašumus ir taip generuoti naujus vaizdus. 

Nenuostabu, kad tokias DI galimybes mokslininkai apibūdina dirbtinės vaizduotės terminu. Kai kurios iš savybių ar sričių, kurias tyrėjai tikisi imituoti, yra kūrybiškumas, regėjimas, skaitmeninis menas, humoras ir satyra. 

Tačiau esminis žodis čia yra „dirbtinė“. Tai vis tiek nėra tapatu žmogaus vaizduotei. Kas daro šį žmogaus gebėjimą tokį ypatingą? Nesutariama. Tai gali būti ir sąmonės turėjimas, gebėjimas suprasti, kas yra įsivaizdavimas, gebėjimas atskirti, kas yra tikra, o kas – fikcija, o galbūt tai, kad žmogaus vaizduotė kliaujasi jutimine atmintimi.  

Padeda pažiūrėti kitu kampu 

Nors ir neturi DI žmogiškosios vaizduotės, tam tikrą impulsą kūrybai nenuneigiamai duoda – leidžia pažiūrėti outside the box (angl. netradiciškai, už nusistovėjusių rėmų). Kaip įvairios grafikos programos leidžia sukurti 3D vaizdą, jį visaip vartyti ir žiūrėti skirtingais rakursais, taip ir DI suteikia galimybę pamatyti, ko plika akimi nematai.

Pavyzdžiui, „Google“ inžinieriaus sukurta programa „Deepdream“ analizuoja vaizdus, naudodama matematinius algoritmus. Kaip VK pasakoja dr. Kęstutis Zaleckis, Kauno technologijos universiteto profesorius, ši programa taip randa ir išryškina vaizde esančius raštus, kad sukuria psichodelinį sapno vaizdą, nuo kurio sunku atitraukti akis. 

Dr. Kęstutis Zaleckis, Kauno technologijos universiteto profesorius. Asmeninio archyvo nuotr.
Dr. Kęstutis Zaleckis, Kauno technologijos universiteto profesorius. Asmeninio archyvo nuotr.

„Šios programos veikimo principas primena psichologinį žmogaus testą, kai jam rodomi abstraktūs paveiksliukai, klausiant, ką juose mato. Programa vaizdą skenuoja daugybę kartų – jį tai didina, tai mažina. Taip gaunami psichologiškai paveikūs vaizdai, detalūs, nenuobodūs žmogaus dėmesiui“, – nurodo K. Zaleckis. 

Profesorius priduria, kad „Deepdream“ – labai įdomi savęs pažinimo priemonė: „Tokiu būdu galima kūrybingai pažvelgti į savo vidų, išsiaiškinti vidinę būseną. Mus supančią realybę mes kuriame patys, viskas gimsta mūsų galvose. Tačiau tokios programos parodo kitokį realybės vaizdą, leidžia pažvelgti iš netikėtos perspektyvos.“ 

„Tačiau klausimas, kiek DI vizijos vertingos, kiek tai validu. Menininkas kūrinyje perteikia savo emocijas, vizijas, o be emocinio ryšio gali nukeliauti į kičą“, – svarsto jis.  

Galimybė žvelgti iš naujų perspektyvų – itin aktuali kūrėjams, bandantiems sukurti ką nors inovatyvaus. 

„Apsiginklavęs DI generatoriumi, dizaineris gali tapti ambicingesnis, – dėsto Stanfordo universiteto kompiuterijos mokslų docentas Percy Liangas. – Užuot kūręs pavienius atvaizdus, gali kurti visą vaizdo medžiagą arba ištisas naujas kolekcijas.“ 

„Harvard Business Review“ taip pat nurodo, kad generatyvinio DI pateikti netipiniai dizainai gali įkvėpti kūrėjus mąstyti plačiau, ypač ankstyvuosiuose naujų produktų kūrimo etapuose. Taip užkertamas kelias išankstiniam nusiteikimui ir vaizduotės apribojimams, iš anksto svarstant, kas yra įmanoma ar pageidautina gaminio formos ir funkcijos atžvilgiu. 

Taikant DI galima rasti sprendimus, kurių žmonės niekada nebūtų įsivaizdavę, jei būtų taikę tradicinį mąstymą, kai pirmiausia nustatomos funkcijos, o paskui projektuojama forma, kuri jas atitiktų. Ankstesnės žmonių patirtys ir žinios neretai gali trukdyti sugalvoti ką nors naujo, tad DI, neturintis tokių ribojimų, išlaisvina.  

Perdirba turinį 

Besižavėdami šiomis DI galimybėmis ir dar žadamu potencialu, atrodo, jau tuoj galėsime konstatuoti meno mirtį. Gal, tiksliau, žmogaus kuriamo meno baigtinę ribą. Juk kas gali konkuruoti su mašinų greičiu, pigumu ir netikėtumu? 

Tačiau tenka prisiminti technologinius pagrindus – DI dažniausiai remiasi mašininio mokymosi aspektais.  

„Jis tiesiog turi daugybę įvairiausių duomenų, pavyzdžiui, jį galima apmokyti su 1000 paveiksliukų, vaizduojančių kates ir šunis, kaskart paaiškinant, kas atvaizduota. Tada, kai jau duodi nuotrauką, jis daro savo spėjimą, naudodamas stochastinį mechanizmą (pagal tikimybes – VK). Ilgainiui jis atpažįsta vis daugiau niuansų. Skirtumas, palyginti su žmogumi, tas, kad gali mašiną išmokyti pažinti šunų veisles, tačiau ji vis tiek nežinos, kas yra tas šuo“, – VK paaiškina Adomas Šulcas, Vilniaus universiteto Filosofijos fakulteto doktorantas.  

Adomas Šulcas, VU Filosofijos fakulteto doktorantas ir rinkodaros agentūros „Growth Bite“ bendrasavininkas. Juditos Grigelytės (VŽ) nuotr.
Adomas Šulcas, VU Filosofijos fakulteto doktorantas ir rinkodaros agentūros „Growth Bite“ bendrasavininkas. Juditos Grigelytės (VŽ) nuotr.

Anot jo, DI negali būti kūrybingas: „Jis tik perdirba iš naujo tą turinį, kurį jau turi.“ 

Kaip nurodo „Wired“, šiandien pasiektas DI proceso lengvumas jau yra daugybės metų žmogaus darbo rezultatas: „Ši naujoji galia yra labai ilgų žmonių ir mašinų pokalbių rezultatas. Kiekvieno atvaizdo pažanga pasiekiama dėl didžiulių pastangų, bandymų, grįžimo atgal valandų, o kartais ir dienų, komandinio darbo.“ 

Mėgdžiojantis įrankis 

Mokant „OpenAI“ neuroninius tinklus, buvo naudojami menininkų darbai. Tad, užduodant chrestomatinį kiaušinio ir vištos klausimą: „Kas buvo pirmiau?“, atsakymas kaip ir aiškus. Be menininkų darbų nebūtų DI ištreniruotas. Taigi, DI yra tik mėgdžiotojas, jis pats negali įsivaizduoti.  

„DI įsimena tik tą vienintelį pokalbį; jis negali tavęs pažinti ir neturi supratimo, ką tie žodžiai, kuriais bendrauja, reiškia realiame pasaulyje“, – „Financial Times“ teigia Santa Fė instituto profesorė Melanie Mitchell.  

Jai pritaria ir Rebecca Finlay, DI pritaikymą tyrinėjančios technologijų pramonės grupės „Partnership on AI“ vadovė, sakydama, kad sistemos neturi realaus „supratimo“ apie tai, ką jos sako, nors gali ir skambėti įtikinamai. 

Tačiau DI padarys mus kūrybingesnius ir žmogiškesnius. Taip sako Peteris Dengas, „OpenAI“ Produktų vartotojams departamento viceprezidentas Anot jo, generatyvinis DI gali sužadinti smalsumą ir leisti žmonėms gilintis į juos jaudinančias arba bauginančias temas. 

„Tokie įrankiai kaip „ChatGPT“ gali padėti vartotojams suprasti Williamo Shakespeareʼo pjeses ir nepagražintai įvertinti menininkų kūrinius, todėl galiausiai galime tapti žmogiškesni“, – sakė P. Dengas konferencijos „South by Southwest“ scenoje. 

Jis papasakojo, kad pats „ChatGPT“ naudoja kaip „minčių partnerį“, kad galėtų aptarti ir patobulinti idėjas: „ChatGPT“ yra neišsenkantis pašnekovas, kitaip nei tėvai, kuriems atsibosta, kai vaikas vis klausia „kodėl?“, arba partneris, kuris mieliau eina miegoti, nei aptaria jūsų vidurnakčio apmąstymus.“ 

Kartu, anot P. Dengo, šios priemonės taip pat atlaisvina laiko aukštesnio lygio mąstymui, nes pagreitina informacijos paiešką ar duomenų analizę. 

Nepakeičiamieji 

Visgi, technologijų žadamas (ir realus) procesų palengvinimas ir efektyvumas gerokai išgąsdino darbuotojus, dirbančius su tekstais ar vizualais. Atrodo, iškart ir girdi tokį klausimą: „Kam man mokėti dizaineriui kelis šimtus eurų, jeigu galiu paprašyti, kad įrašą socialiniams tinklams sumaketuotų programa „Canva“?“ 

Akivaizdu, kad rizika gresia tiems darbams, kurie yra iš esmės susiję su dizainu arba rašymu. Praėjusios vasaros pabaigoje pasirodžius „Stable Diffusion“, nuo jos pažado akimirksniu pateikti atvaizdą pagal bet kokią komandą komercinio meno ir dizaino pasaulį nukrėtė šiurpas, rašo „Financial Times“. 

Tokios perspektyvos ir ypač numanomas greitumas bei produktyvumas išties baugina bet kokio turinio kūrėjus, kurie taip gali prarasti savo pragyvenimo šaltinį. Juk šiame kapitalistiniame pasaulyje laikas – pinigai. Tad šiuo atžvilgiu su DI konkuruoti sunku.  

Pasak kai kurių darbuotojų, kuriems gresia pavojus būti pakeistiems mašinomis, ant kortos pastatyta daugiau nei atlyginimas, pažymi „Financial Times“. Išgirdęs dainas, kurias parašė „ChatGPT“ ir kurios skamba kaip jo paties kūriniai, dainininkas ir tekstų autorius Nickas Cave’as liko priblokštas: „Dainos atsiranda iš kančios; tai sakydamas, turiu galvoje, kad jos paremtos sudėtinga vidine žmogaus kūrybine kova. Kiek žinau, algoritmai neturi jausmų, – rašė jis internete. – Duomenys nepatiria kančios.“ 

Žmonės jau seniai kaltina technologinius išradimus dėl savo kultūrinio nuosmukio, pradedant Sokrato prieštaravimu rašymui, nes tai sugadins mūsų atmintį. Tačiau dažniausiai technologijos automatizuoja tam tikras užduotis ir veiklą, todėl žmonės gali kurti naujus dalykus, įskaitant kitas technologijas. 

Matyt, panašią mintį turėjo omeny ir „OpenAI“ vyriausioji technologijų pareigūnė Mira Murati teigdama portalui „Futurism“, kad menininkai, kurie dėl DI praranda darbą, tikriausiai to nusipelnė. 

Prisimenant medijų filosofo Marshallo McLuhano idėją, technologijos pratęsia žmogaus fizines galimybes. Taigi, DI ne pakeičia žmogų, o jį papildo, galbūt net paverčia kiborgu tam tikra dalimi. Puikus pavyzdys yra JAV menininkas Refikas Anadolis. Jis naudoja DI savo kūryboje kaip pagrindinį teptuką inovatyviems skaitmeniniams vaizdams kurti ir tai jį jau iškėlė į reikšmingiausių šių laikų menininkų sąrašą. 

R. Anadolio su DI sukurtas darbas „Machine Hallucinations Nature Dreams“. A. Venckutės nuotr.
R. Anadolio su DI sukurtas darbas „Machine Hallucinations Nature Dreams“. A. Venckutės nuotr.

Svarstydamas šį įgūdžių klausimą, ar atims DI kūrybiškumą, pats „OpenAI“ generalinis direktorius Samas Altmanas Howardo universitete sakė, kad būtent kritinis mąstymas ir kūrybiškumas bus vertingiausi įgūdžiai ateityje.  

„Pasaulyje, kuriame kiekvienas mūsų ir kiekviena bendrovė turi DI asistentus, kurie už mus atlieka užduotis, kad padėtų išpildyti viziją ir kurti ką nors naujo žmonėms, svarbiausia yra idėjų kokybė ir jų kuravimas. DI gali prigeneruoti daugybę puikių idėjų, tačiau jam vis tiek reikia žmogaus, kuris pasakytų, ko žmonės nori. Kitas dalykas – žmogui labiau rūpi kūrinio autorius-žmogus. Jeigu skaitau patinkančią knygą, pirmiausia noriu sužinoti apie jos autorių. Jeigu knygą parašė DI, aš mažiau su juo susitapatinsiu. Lygiai tas pats, kai žiūriu į puikų meno kūrinį, naudojuosi kokios nors bendrovės produktu, – noriu žinoti apie žmones, kurie tai sukūrė. Todėl gebėjimas sugalvoti naujas idėjas ir išsirinkti geriausias iš DI pateiktų galimybių bus labai vertingas“, – mano „OpenAI“ vadovas. 

52795
130817
52791