Vés al contingut

Tema de Viquipèdia:La taverna/Propostes

Ús de Craiyon (DALL-E mini) a Commons?

15
Cataleirxs (discussiócontribucions)

Potser he perdut el cap o potser he tingut una revelació, he dormit poc i no ho tinc clar. Començo: Ahir vaig llegir aquest fil de twitter on expliquen com Cosmopolitan ha publicat la primera portada generada amb Intel·ligència artificial, emprant el programa Dall-e. És un programari de codi obert, però les imatges que genera són non-commercial. En canvi, la versió mini (ara dita Craiyon) diu això:

Free Commercial License: You may use the Site or the Images for academic or research purposes or for educating or entertaining on various social media platforms. If you are an individual or an entity with less than 1 million United States dollars in annual revenue, you are permitted to use Images generated by the Service for the purpose of pursuing financial gain, provided that (1) a royalty of 20% is due on any revenues attributable to any blockchain transaction (such as selling NFT's), and (2) we may revoke your right to use the Site or the Images at any time. Free commercial use requires you to attribute images to Craiyon.

He pensat que podem fer servir aquesta eina per il·lustrar articles no biogràfics amb conceptes una mica difusos o que, directament, no tenen una imatge útil a Commons. Per exemple, per l'article Immigració portuguesa a Andorra que vaig crear fa uns dies, he generat aquestes imatges.

Llavors:

  1. La llicència és compatible amb els requisits de Commons?
  2. Cas que sí, què us sembla la idea?
Pere prlpz (discussiócontribucions)

Aquesta llicència té uns quants problemes, però a Commons les imatges de Dall-e estan marcades amb c:template:PD-Algorithm i es considera que una imatge generada automàticament no té autor ni creativitat al darrera i per tant no atrau drets d'autor. Hi ha una proposta d'esborrat interessant sobre el tema a c:Commons:Deletion requests/File:DALL-E sample.png que va acabant conservant la imatge. I si això pot canviar en el futur quan les imatges automàtiques no siguin una raresa i la legislació s'hi adapti, és una incògnita: c:Commons:Village_pump/Copyright/Archive/2022/06#PD-algorithm_and_the_state_of_AI_copyrights.

Un altre tema és si la imatge pot incloure elements que no siguin lliures. A l'exemple de les imatges d'Andorra algú podria argumentar que el fons pot ser una fotografia no lliure d'un edifici andorrà.

I una qüestió que no té a veure amb drets d'autor és si aquestes imatges són útils als articles. Alguna podria ser-ho, però s'ha de deixar ben clar que és una il·lustració idealitzada que no reprodueix una situació concreta. En el cas dels portuguesos a Andorra, si no hi ha hagut balls portuguesos amb vestits tradicionals com aquests en aquests llocs que surten a les imatges, jo no les faria servir.

Xavier Dengra (discussiócontribucions)

Més enllà de la casuística de les llicències, jo sí que veig moltíssima oportunitat de generar imatges vàlides. Sense anar més lluny, personatges mitològics o conceptes abstractes sobre dret, psicologia i d'altres, que són conceptes en què una recreació generalista pot anar bé.

Pere prlpz (discussiócontribucions)

Serà qüestió de veure-ho cas per cas. Jo fa estona que hi estic jugant (gràcies @Cataleirxs per l'enllaç) i la veritat és que els únics temes pels que trobo resultats bons són els temes pels que ja en tenim una pila d'al·legories o representacions fetes per artistes famosos (com ara justícia o nereida). Quan vaig a coses més concretes surt força pitjor.

Ara bé, si algú aconsegueix trobar una imatge útil per algun article, endavant.

I cal reconèixer que segons què demanes el resultat és divertit. Demanant Gaudí trobes com seria la barreja entre la Pedrera i la Sagrada Família en un sol edifici, i demanant pintura renaixentista (o barroca, o romànica, o el que sigui) pots jugar a endevinar quins quadres està barrejant.

Cataleirxs (discussiócontribucions)

Bon vespre. M'he llençat a la piscina i he carregat la primera imatge creada amb Craiyon. La podeu veure a la infotaula de Malês. Salut

Pere prlpz (discussiócontribucions)

Cal reconèixer que és decorativa (i l'article interessant) però jo miraria de reduir la llegenda. Potser alguna cosa així com "Imatge idealitzada" (o alguna cosa semblant) seria suficient. La descripció de la imatge a Commons sí que pot ser així de detallada o més.

Xavier Dengra (discussiócontribucions)

Com us vaig dir, l'aplicació de tot això en articles sobre mitologia nostrada és brutal. N'he creat categories a Commons amb diverses recreacions i il·lustrat els articles del rosegacebes, el Puigmal, la pesanta, el Peix Nicolau i el fameliar.

Cataleirxs (discussiócontribucions)

El Fameliar és brutal, enhorabona.

Leptictidium (discussiócontribucions)

Com ho feu perquè us surtin imatges així de bé? Quan jo li faig propostes al Craiyon em surten horrors trets d'un malson psicodèlic.

Xavier Dengra (discussiócontribucions)

Seguint el consell de la saviesa tuitaire, ahir a la nit vaig provar amb una IA molt més refinada, el Midjourney. Tot i que té un límit de 10 proves abans de demanar pagament, va ser suficient per il·lustrar 4 entrades noves: el simiot, la Vella Brígia, el Pare llop i el Trucafort. Deu n'hi do amb la diferència, em sembla brutal el que és capaç de fer i em sembla un pas qualitatiu prou important.

@Leptictidium: la clau està en refinar el "prompt", és a dir, que quan introdueixes quelcom i no t'agrada prova de mantenir-hi allò que sí i separa-hi amb comes al final aspectes del dibuix com ara "colorful", "old illustration", "magic", "cartoon", etc. També cal prioritzar-hi quins adjectius són els més destacats perquè si en poses massa no els agafa.

Leptictidium (discussiócontribucions)

Em podries passar l'enllaç del Midjourney, si et plau?

Xavier Dengra (discussiócontribucions)
  1. Descarrega el programari Discord (és el mateix que es fa servir per fer retransmissions en directe de Twitch)
  2. Ves a https://www.midjourney.com/home/
  3. Fes clic al "Join the Beta"
  4. Se t'obrirà el canal de comunitat de Discord de Midjourney al programari
  5. A l'interior, pots escollir d'entre diversos canals de bots creadors (semblant als subcanals del nostre IRC)
  6. Un cop a dins, introdueix el codi /imagine i el teu "prompt". El sistema et generarà 4 imatges i de cadascuna pots polir-ne la resolució (U) o demanar-ne 4 variants més (V).
  7. Tens 10 oportunitats abans que et salti l'avís d'esgotament del període de prova. Sigues exigent amb el que demanes i afegeix-hi els mots "4k", "cinematic" o "hyper realist" per resultats òptims.
  8. Un cop tens la imatge que vols, pots fer clic a l'opció "Upscale to max" i quan te l'hagi acabat de generar, fas clic al botó dret per a desar-la. Paciència perquè hi ha altra gent fent-lo servir, de manera que la pantalla corre ràpid amb les creacions d'altres participants.
Leptictidium (discussiócontribucions)

Ara, mirant les condicions del Midjourney, he llegit que «If you are not a Paid Member, Midjourney grants you a license to the Assets under the Creative Commons Noncommercial 4.0 Attribution International License (the “Asset License”).».

És correcta, doncs, la meva interpretació que les imatges creades sense pagar no es podrien carregar a Commons?

Xavier Dengra (discussiócontribucions)

A banda que és impossible destriar si un resultat és fet en la versió de prova o de pagament, cosa que converteix els termes i condicions en molt precaris, el que preval és la legislació estatunidenca, que és on s'ubiquen els servidors de la WMF i que consideren les creacions fetes per intel·ligència artificial i algoritmes com a domini públic.

És una mica com qui torna a posar copyright i marques d'aigua a fotos amb els drets d'autor expirats o els museus que no permeten fer fotos a quadres de fa més de 200 anys.

Pere prlpz (discussiócontribucions)

Força d'acord amb en Xavier. Donat que és improbable que el suposat titular dels drets d'autor reclami a qui carrega la imatge, el que ens limita és la política que tingui Commons i de moment la política de Commons és considerar lliures les imatges generades per una intel·ligència artificial.

Resposta a «Ús de Craiyon (DALL-E mini) a Commons?»