2024-12-25 12:48

Harvardas išleidžia milžinišką nemokamą DI mokymo duomenų rinkinį

Projektą, kuriuo siekiama „sulyginti sąlygas“ DI industrijoje, finansavo aktyviai DI technologijas kuriančios JAV bendrovės „OpenAI“ ir „Microsoft“.

Vieno iš Harvardo pastatų fragmentas. Nicholaso Pfosi („Reuters“/„Scanpix“) nuotr.
Vieno iš Harvardo pastatų fragmentas. Nicholaso Pfosi („Reuters“/„Scanpix“) nuotr.
Harvardo universitetas paskelbė išleidžiantis beveik 1 mln. viešojo domeno knygų duomenų rinkinį, kuris galės būti naudojamas dideliems kalbos modeliams ir kitiems dirbtinio intelekto (DI) įrankiams mokyti.

Duomenų rinkinys, kurį sukūrė Harvardo Institucinė duomenų iniciatyva (angl. Institutional Data Initiative), yra finansuojamas „Microsoft“ ir „OpenAI“, skelbia technologijų naujienų portalas „The Wired“.

Šį rinkinį sudaro per „Google Books“ projektą nuskenuotos knygos, kurios nebėra saugomos autorių teisių.

52795
130817
52791