Què és la Intel·ligència Artificial Generativa?

La intel·ligència artificial generativa és un camp d’aprenentatge profund que dóna a les màquines la capacitat de generar contingut (imatge, vídeo, text,…) a partir de dades creades manualment.

Intel·ligència Artificial Generativa

La intel·ligència artificial generativa és un camp d’aprenentatge profund que dóna a les màquines la capacitat de generar contingut (imatge, vídeo, text,…) a partir de dades creades manualment.

Després de les deep fakes la generació de cares o cotxes, els últims models dissenyats són capaços de generar textos o imatges molt realistes.

Expliquem què és la intel·ligència artificial generativa, presentem com funcionen aquests models, les seves aplicacions i parlem de l’aspecte ètic.

Quines són les aplicacions de la Intel·ligència Artificial Generativa?

La IA generativa té un nombre infinit d’aplicacions. Presentem les que són més impressionants i que comencen a ser més democràtiques.

Generar imatges amb IA generativa

L’aplicació que ha provocat més reacció recentment és la capacitat dels models per generar imatges a partir de textos senzills.

Les imatges obtingudes en sortida són realment impressionants, i cal recordar que només estem al començament d’aquesta tecnologia.

Crear text

A més de crear imatges, les IA generatives són cada cop més bones per escriure text. A més de poder liderar una discussió a nivell humà sobre la majoria de temes, els millors models actuals poden generar paràgrafs, articles, fins i tot llibres sencers.

Per exemple, aquest llibre electrònic en venda a Amazon s’ha generat gràcies a GPT-3.

Escriure codi d’ordinador

Projectes com el copilot de GitHub han portat la generació de codi d’intel·ligència artificial a nous àmbits.

Com funcionen els models d’intel·ligència artificial generativa?

Els mètodes més utilitzats avui en dia són els GAN, els VAE i els transformadors.

GAN, o xarxes generatives adversàries

Les GAN són xarxes neuronals generatives introduïdes per produir contingut realista a partir de dades d’entrada. El seu enginyós funcionament va ser considerat per Yann LeCun com la idea més important en l’aprenentatge automàtic dels darrers 10 anys.

Els GAN inclouen un generador i un discriminant que entrenen en competició. El generador genera el contingut i el classificador ha de determinar si el contingut generat és real o no. Gràcies a aquesta competició, tots dos models milloren simultàniament a mesura que avança l’entrenament.

VAE o codificadors automàtics variacionals

Els VAE són una variant dels codificadors automàtics.

Tenen una arquitectura de xarxa neuronal d’embut. La primera part de l’embut, anomenada codificador, pretén codificar les dades d’entrada en un petit vector.

La segona part, anomenada descodificador, permet reconstruir les dades d’entrada a partir de la seva codificació.

L’interès d’aquest enfocament és construir un espai latent en el qual les codificacions de totes les dades d’entrada s’emmagatzemen de manera que siguin possibles operacions senzilles.

Amb aquest mètode, podem generar noves dades que semblaran espai latent.

Recentment, s’entrenen models d’intel·ligència artificial generativa mitjançant enfocaments com Transformers que utilitzen mecanismes d’atenció, enfocaments d’aprenentatge de reforç, o fins i tot models més tradicionals i menys cobdiciosos com les cadenes de Markov ocultes.

Alguns exemples de l’ús de la intel·ligència artificial generativa

Concretament, aquí teniu 3 exemples de models que utilitzen les tècniques vistes a l’apartat anterior per fer la generació automatitzada de continguts.

Stable Diffusion

Stable Diffusion és un model de codi obert, finançat per Stability AI. Permet generar imatges a partir de textos. És una versió de codi obert, més fiable i més ràpida de DALL-E 2, el model proposat per OpenAI el 2022.

ChatGPT, el cim de la intel·ligència artificial generativa

ChatGPT és un model de processament del llenguatge desenvolupat per OpenAI. Utilitza la transferència de coneixement per produir respostes a preguntes utilitzant una gran quantitat de dades textuals vistes prèviament.

ChatGPT és capaç d’entendre i generar text en diversos camps, que van des de converses casuals fins a temes més complexos com la ciència i la tecnologia.

Make-A-Video

A més de text i imatges, els últims avenços ens permeten plantejar-nos els avenços en el camp de text2video. És a dir, la generació de vídeos a partir de text.

Meta va presentar un article el 2022, anomenat Make-A-Video, que ajuda a generar vídeos curts a partir de text.

Què passa amb l’aspecte ètic?

Els models d’intel·ligència artificial generativa estan progressant enormement en el vessant tècnic. En molts casos, el contingut generat és gairebé tan bo com el contingut humà.

No obstant això, per garantir aquests models, queda molt per fer i diverses qüestions ètiques queden sense resposta.

L’impacte ambiental de la formació de models d’intel·ligència artificial generativa

La majoria de les vegades, els models recents proposats no mostren grans avenços des del punt de vista algorítmic.

Simplement consisteixen en reutilitzar els models ja disponibles, però amb centenars de milers de milions de paràmetres i quantitats astronòmiques de dades.

He parlat del problema del monopoli en articles anteriors. Vaig explicar que només les empreses molt grans podien entrenar aquest tipus de models d’intel·ligència artificial generativa, i vaig proposar la descentralització com un dels enfocaments viables.

L’altre problema d’aquesta carrera per les dades i una sèrie de paràmetres que ja no tenen gaire sentit, és fins i tot el principal problema, és l’impacte sobre el medi ambient.

Centres de dades cada cop més grans, que requereixen cada cop més energia per funcionar, i un desastre cada cop menys controlable ecològicament.

Intel·ligència Artificial Generativa – Conclusió

Quina millor manera de concloure que deixar que un model d’IA generativa generi la conclusió?

La IA generativa és un camp d’aprenentatge profund que permet a les màquines generar contingut a partir de dades manuals. Els últims models poden generar imatges i text molt realistes.

Hi ha infinitat d’aplicacions per a IA generativa, com ara generar imatges, escriure text i fins i tot codi.

Els mètodes més utilitzats són els GAN, els VAE i els transformadors. Els GAN utilitzen un generador i un discriminador per produir contingut realista, mentre que els VAE utilitzen la codificació per construir un espai latent per generar noves dades.

Les aplicacions d’IA generativa són prometedores, però també plantegen qüestions ètiques importants sobre la fiabilitat i la responsabilitat d’aquestes tecnologies.

Llegit a:

La revue IA