2024-04-10 14:16

„Techprizmė“. Technologijų gigančių neviltis bandant užsitikrinti duomenų tiekimą

DALL-E sugeneruota nuotr.
DALL-E sugeneruota nuotr.
Kad dirbtinio intelekto (DI) sistemos taptų dar galingesnės, technologijų bendrovėms reikia dar daugiau internetinių duomenų, kuriais galėtų „maitinti“ savo technologiją. Jau kurį laiką reguliuotojams rūpinantis autorių teisėmis ir mūsų privatumu, nemažai duomenų kraniukų yra užsukta. Tačiau DI sistemų kūrėjos atranda vis naujų landų ir tai daro nebūtinai teisiškai ar etiškai. Apie tai ir kitas naujienas – VŽ technologijų savaitės apžvalgoje „Techprizmė“.

Šeštadienį paskelbtame „The New York Times“ tyrime žurnalistai nustatė, kad duomenimis mokydamos savo DI technologijas JAV technologijų bendrovės „OpenAI“, „Google“ ir „Meta“ kūrė įvairias schemas, kaip gauti daugiau duomenų, išvengiant įvairių licencijavimo ar autorių teisių mokesčių mokėjimo.

Žinoma, jei susimokėtų už kiekvieną turinio vienetą, bendrovėms susidarytų milžiniškos sumos. Vien „OpenAI“ produktas „ChatGPT“ buvo apmokytas naudojant 570 Gb teksto duomenų arba apie 300 mlrd. žodžių. O tobulinant sistemą, šis duomenų kiekis didėja kartais. 

52795
130817
52791