En los primeros compases del año 2023, la IA Generativa (IAG) nos explotó en la cara amenazando con arrebatarnos (a los humanos) la exclusividad de la “autoría”. Una de las muchas cuestiones que ello suscitó fue si no deberíamos compensar a los autores cuyas obras eran utilizadas por la IAG1. Sospechamos que el origen de esta pregunta estuvo más cerca de ser un arancel proteccionista de la creatividad que de la aplicación rigurosa de la ley. Sin embargo, vale la pena abordarlo.
A pesar de no establecer un derecho de remuneración a favor de los artistas cuyas obras hayan sido integradas en datasets de entrenamiento de un modelo de IAG, el actual artículo 53 de la versión final del AI Act sí establece lo siguiente:
“Artículo 53: Los proveedores de modelos de IA de uso general
d) elaborarán y pondrán a disposición del público un resumen suficientemente detallado del contenido utilizado para el entrenamiento del modelo de IA de uso general, con arreglo al modelo facilitado por la Oficina de IA.
Parece razonable, por tanto, que exista algún motivo para que en el AI Act se solicite a los proveedores de IA’s de uso general un resumen de sus datasets, y este motivo puede perfectamente ser la futura creación de un derecho de remuneración como el descrito anteriormente2.
¿Cómo podríamos articular este derecho de remuneración?
Algunas voces autorizadas solicitan aplicar mutatis mutandis3 la mecánica actual de las Entidades de Gestión Colectiva. Otras, sin ser tan contundentes, sí solicitan un mínimo reconocimiento de las obras utilizadas por IAG. Citando una entre muchas tenemos la “A.I. : Open Letter”, suscrita por numerosas organizaciones que representan los intereses de los autores o artistas, entre las que se encuentra la SCAPR, la federación internacional que representa a las Organizaciones de Gestión Colectiva de Intérpretes.
El punto cuarto de dicha carta es el siguiente:
“4. Los créditos deben ser reconocidos
Los creadores e intérpretes deben tener derecho a obtener reconocimiento y créditos cuando se haya explotado sus obras por sistemas de IA.”
La pregunta es inmediata: ¿Cuando hablamos de reconocer moralmente al autor de la obra “utilizada” por el modelo de IA como si se trata de retribuirle por dicho uso, de qué uso hablamos? Veámoslo con un poco más de detalle.
El uso de obras para el entrenamiento de modelos de IAG
Para responder a esta pregunta resulta imprescindible analizar, desde un punto de vista técnico y con la mayor abstracción posible, cuál es exactamente el uso [y propósito de ese uso] que se ha hecho de las obras [y lo que no son obras] para entrenar a los modelos de IAG subyacentes que han desatado la discusión que aquí examinamos.
Tal y como ya avanzamos en este artículo, el entrenamiento de modelos de IAG implica, a grandes rasgos, proporcionar a un algoritmo de Machine Learning (ML) una cantidad astronómica de representaciones de la realidad, entre las que se incluyen, de forma no limitativa, obras protegidas por derechos de propiedad intelectual. Lo que sucede sobre los materiales de entrada a partir de ahí, es que el algoritmo identifica (generalmente de manera no supervisada) los patrones subyacentes de esas representaciones de la realidad. Dichos patrones subyacentes son incorporados al algoritmo (eso de que la máquina “aprende”) en una formulación matemática, para posteriormente, y a través de dicha fórmula, que el modelo sea capaz de generar nuevo contenido. Una vez el modelo ha sido entrenado, los materiales de entrada dejan de ser útiles (y, en consecuencia, podrían eliminarse).
Por tanto, a los efectos que aquí interesan, ¿qué es lo que ha aprendido (y, por tanto, usado) el algoritmo de ML para dotar al modelo de IAG, permitídnoslo, de capacidad creativa? Pues precisamente todo lo que no es objeto de protección por parte de los derechos de PI, es decir, los patrones subyacentes de decenas de millones de representaciones de la realidad, ya sea en formato texto para modelos enfocados a la generación de texto (véase GPT-4, de OpenAI), imagen (véase Midjourney Model v6, de Midjourney), o vídeo (véase el nuevísimo Sora, también de OpenAI).
Y la siguiente pregunta lógica que debemos hacernos es, ¿de qué hablamos exactamente cuándo nos referimos a los patrones subyacentes de los materiales? En el caso del texto, de los innumerables patrones probabilísticos que surgen de cientos de millones de concatenaciones de palabras (es decir, textos); o, en el caso de las imágenes, de ese mismo tipo de patrones hallados en cientos de millones de composiciones distintas de píxeles (es decir, imágenes). En cualquier caso, esos patrones son los que el algoritmo de ML es capaz de identificar desde un punto de vista probabilístico-matemático, pero en ningún caso desde la conciencia, las emociones y el entendimiento profundo, que es como expresamos las ideas, supuestamente, los seres humanos. Por esta razón, Sam Altman, CEO de OpenAI, en cuanto se le ha preguntado en numerosas ocasiones por el riesgo de alucinación de los modelos de IAG (eso de que las IA’s se inventan cosas), dice, con cierta gracia, que en realidad, los modelos de IAG están siempre alucinando, pues no existe el concepto de “verdad” o “cierto” en este campo, sólo aproximaciones con un alto grado de probabilidad de ser correctas en cuanto a estándares humanos se refiere. De ahí, que por mucho que a este campo le llamemos Inteligencia Artificial, de “Inteligencia”, en el sentido humano de la palabra, tiene prácticamente nada. Que pensemos que existe inteligencia es sólo una ilusión.
Un ejemplo de patrón: la gramática. Pero no cómo la entiendes tú, lector, sino desde una perspectiva matemática. Es decir, mientras que tú sabes que “Ártificial” no se acentúa porque es una palabra aguda, ChatGPT simplemente lo considera poco probable, porque (esperemos) nunca ha visto el término “Ártificial”.
Volvemos al supuesto derecho de remuneración por el uso de obras para el entrenamiento de modelos de IAG
Por lo tanto, esta remuneración no parece la mejor opción de solventar el desafío que supone la IAG, ya que:
- Tan solo sucede una vez, y ni siquiera en conexión directa con un acto con significación económica (como la generación de contenido), y;
- Por la ingente cantidad de datos utilizada es imposible asignar al uso de una obra concreta un valor económico que no sea ridículamente irrisorio.
Pero, desgraciadamente, tampoco podemos decantarnos por remunerar la generación de obras, ya que el proceso técnico subyacente a la generación no lo permite, ya que el propio modelo no sabe qué obras han sido más determinantes para el entrenamiento que le ha sido útil para la generación del contenido.
Para generar contenido la IAG parte de una fórmula matemática, alcanzada a través del aprendizaje gracias a obras que, una vez utilizadas, pueden eliminarse por innecesarias. El contenido generado no tiene una relación directa con el contenido del entrenamiento. De forma sucinta, podríamos decir que la IA no cita fuentes, porque básicamente no tiene fuentes (en el sentido de las consideradas como tal de forma individual, y como las concebimos los humanos).
Por lo tanto, una vez pasada la fase del entrenamiento, habiéndose eliminado las obras preexistentes, no se producen más actos de explotación de las mismas. La generación de contenido sería el acto que intuitivamente querríamos utilizar como referencia para remunerar a los artistas, ya que es donde aparentemente existe una mayor conexión entre la explotación de las obras preexistentes y la generación de las nuevas, especialmente si, insistimos, aparentemente, podemos adivinar una conexión entre unas y otras. Lo cierto, es que a nivel técnico no existe tal conexión.
Otro caso totalmente distinto son aquellos casos en los que la IAG plagia imágenes protegidas por copyright.
Nota: El prompt entero del Sr. Southen era: “the last of us 2 ellie with guitar in front of tree –v 6.0 –ar 16:9.” The prompt specifies Midjourney’s version number (6.0) and an aspect ratio (16:9).
No hace falta citar la ley ni ninguna monografía sobre el concepto del plagio para advertir que las decisiones tomadas por la IAG, no incluidas en el prompt (como por ejemplo la forma en la que se cruzan las piernas de la protagonista, lo que no se puede extraer de las instrucciones de ningún modo), tienen como origen la imagen original.
Esto que acabas de leer es falso.
Sí, lo siento, sonaba genial, pero es falso. Lo que es cierto es que la imagen generada por IA, objetivamente, reproduce de forma no accesoria los elementos originales de la obra preexistente, pero, y aquí está la parte contraintuitiva, no hace una copia subjetiva. El proceso de creación, en realidad, sí es independiente.
Para entender qué sucede en este caso necesitamos volver a los fundamentos del proceso técnico que hemos examinado anteriormente. Y, efectivamente, por muy contraintuitivo que suene, lo que ha aprendido el modelo de IAG no es la disposición de las piernas cruzadas como tal, sino los miles de patrones subyacentes a la combinación de píxeles de esta y otros cientos de millones de imágenes que de como resultado una imagen que, desde un punto de vista estrictamente probabilístico-matemático, se ajuste a lo peticionado por el usuario.
Y lo realmente fascinante del momento del estado del arte en el que nos encontramos, consiste en que, a través de prompts cada vez más y más simples, podemos dar como resultado un nivel de detalle que prácticamente reproduce lo que tenemos en mente. Pero, insistimos, el hecho de que la imagen se parezca tanto (muchos estaríamos de acuerdo en decir que es idéntica) a la original, no es sino una suerte de ilusión a nuestros ojos, que refleja un espectacular resultado del progreso realizado en este campo, y que específicamente en este caso, se brinda de un modo que, en este contexto, invita mucho a pensar que se trata de un plagio, pero desde un punto de vista técnico, no es así.
Por lo tanto, en la minoría de casos en los que la IA efectivamente plagie (jurídicamente) e invada el monopolio de los derechos de explotación de una obra preexistente, como en el caso anterior, quizás su autor podrá llegar a reclamar una compensación4, cuestión que merece la pena que abordemos de manera individualizada en otro artículo.
Y, por otro lado, en la inmensa mayoría de casos no podremos establecer un derecho de remuneración a los autores de las obras preexistentes utilizadas para generar el contenido, ya que técnicamente ni se han utilizado dichas obras preexistentes de forma directa ni es posible individualizar su contribución a la fórmula matemática usada por los modelos de IAG.
¿Y qué hacemos, entonces?
Tanto este artículo como el hipotético derecho de remuneración de los autores de obras preexistentes parten de la premisa que la IA es susceptible de, en gran medida, sustituir a los artistas. ¿El motivo? Porque la IA, al igual que los artistas, produce contenido.
¿Esto es realmente lo que hacen los artistas? ¿Producir contenido? ¿Tiene sentido analizar el trabajo de Keith Haring o de Hoke desde una perspectiva exclusivamente patrimonial? Los principios del derecho de autor europeo nos dicen que no. Los derechos patrimoniales son consecuencia de los derechos morales, que a su vez se generan por la originalidad, no por el mero esfuerzo. La decisión de proteger el contenido original, y no el contenido generado con esmero, no es casual. El derecho de autor tiene vocación de proteger la plasmación del espíritu humano y la materialización de la creatividad personal, no los resultados intangibles del trabajo y el esfuerzo.
La clave, a nuestro parecer, está en que lo que la IA “aprende” de las obras que engulle son factores estrictamente técnicos. Por lo tanto, ni entiende ni se aprovecha de la dimensión que queremos proteger, que es la expresión del espíritu humano.
¿Puede conmocionarnos una obra generada por IA? Claro que sí. Podemos emocionarnos con las cosas más banales, dándoles un significado que en realidad no tienen de forma intrínseca. Pero que una obra generada por IA nos aturda o nos embelese no nos debe hacer olvidar su origen matemático.
Llegados a este punto, a nuestro parecer, vemos cómo la respuesta a una pregunta que en 2018 hubiese parecido de ciencia ficción la encontramos en los principios del derecho. Las dificultades para establecer un canon en beneficio de los autores de obras utilizadas por la IAG quizás nos indican que dicho canon, en realidad, no debería existir.
Quizás gracias a la comodificación de la generación de contenidos vamos a empezar a diferenciar entre lo que supone “producir” un contenido susceptible de ser explotado y lo que significa expresar la personalidad del autor. Quizás el error de nuestra intuición es la premisa errónea de que la aportación de valor del artista reside tan solo en su capacidad de generar contenido susceptible de ser explotado económicamente.
Al igual que la irrupción de la fotografía cambió la pintura, la IAG cambiará el arte. Está por ver si estamos descendiendo a los infiernos de un mundo que dejará de valorar el arte, o si, por el contrario, avanzamos hacia una sociedad que conceda valor a que un artista retenga el monopolio de su discurso estético.
Footnotes
- Por citar una de las muchas voces: Transparecy obligations are essential elements of the AI Act: "Transparency shall apply at the level of ingestion of copyright-protected works by AI systems. Collective authorisation/licensing shall identify the works used for the authors’ information and for them to receive their associated remuneration. In addition, a summary of the training data protected under copyright law shall be published by the AI companies for the users’ information".
- Como cualquier abogado mercantilista sabrá, el derecho de información del socio debe cumplir una finalidad instrumental del derecho a voto. No decimos que estos casos que hemos comparado estén legalmente vinculados, decimos que el razonamiento subyacente es el mismo. Si se pide esa información será por algo.
- Nos preguntamos hasta qué punto tiene sentido utilizar estos latinajos. Cuando releemos lo escrito suena a un hipercultismo innecesario que aleja el artículo del lector. Pero, por otro lado, sustituirlo por “Cambiando lo que se deba cambiar” o fórmulas similares, además de menos estético, le sustrae a la expresión las connotaciones que los juristas atribuimos a mutatis muntandis. En fin.
- Probablemente utilizando una herramienta de detección automatizada de imágenes infractoras en internet.
Deja una respuesta