Creadores europeos contra el uso no autorizado de sus obras en la Inteligencia Artificial Generativa (2)

Library Genesis (LibGen), un sitio pirata de origen ruso, creado hacia el 2009-10, permite el acceso a millones de obras pirateadas: novelas, cómics, artículos científicos… Library Genesis funciona como una biblioteca paralela. Está bloqueada en varios países, pero sigue accesible para cualquiera con un buscador.

Trabajadores de los autómatas numéricos ChatGPT (OpenAI) y Llama (de Meta) han reconocido en varios procesos judiciales en Estados Unidos que ambas compañías han recurrido a estos contenidos piratas para el entrenamiento de sus modelos de autómatas algorítmicos. Estas plataformas no han llegado a acuerdos ni con los autores pirateados ni con las entidades que gestionan sus derechos.

La infracción penalizable que cometen estas empresas es doble, por usar sin autorización obras protegidas por derechos de autor y por acceder a ellas de forma ilegal e indiscriminada.

Lo mismo que CEDRO en España, denuncia DANISH RIGHTS ALLIANCE, la organización que defiende los derechos de autor en Dinamarca: que las empresas de modelos de autómatas numéricos creativos (IAG) han recurrido a conjuntos de datos obtenidos de sitios pirata como LibGen, Anna’s Archive, Books3, Watchseries o Commom Crawl, este último sin ser pirata aloja grandes cantidades de material protegido sin autorización.

Sólo en el repositorio LibGen la entidad de derechos de autor CEDRO ha identificado tres grandes bases de datos con millones de archivos: libros de ficción, de no ficción y libros y artículos científicos. En los dos primeros, por ejemplo, hay 49.461 títulos que se corresponden con obras publicadas en España, lo que afecta directamente a escritores y traductores: Almudena Grandes, Camilo José Cela, Arturo Pérez-Reverte, Javier Cercas, Fernando Aramburu, Julia Navarro, Rosa Montero, Mario Vargas Llosa, Antonio Muñoz Molina, Luis García Montero, etc., con una nómina periódicamente actualizada en esta base de datos pirata. Las editoriales afectadas son Planeta, Anaya, Acantilado, Libros del Asteroide, Edhasa, Alba, y el número de editoriales llega a 1.100 afectadas.

Sin embargo, LibGen sigue operativo y accesible desde cualquier país, aunque su bloqueo haya sido ordenado judicialmente en Estados Unidos, Reino Unido, Francia, Alemania, Grecia o Italia. Para evitar las restricciones los delincuentes abren constantemente webs espejo, a las que recurren las hipócritas grandes empresas de autómatas numéricos para sortear la legislación sobre propiedad intelectual. Por norma general, no se pueden explotar obras protegidas sin autorización previa de sus autores o de las entidades que gestionan su propiedad intelectual, las cuales pueden exigir ser remunerados.

CEDRO alerta que los autores y los traductores se enfrentan a un panorama desolador: con la piratería clásica los lectores accedían a sus libros gratis; ahora hay máquinas, los autómatas numéricos, que compiten con ellos pirateando su esfuerzo creativo. Esto puede hacer que la actividad de los autores se vuelva insostenible.

Este informe de CEDRO afecta también a la Administración pública española, que está desarrollando un modelo propio de autómata numérico generativo (IAG), llamado ALIA, que se entrena de repositorios como el de Common Crawl, que extrae contenidos de medios de comunicación. El Ejecutivo ha evitado aclarar si, durante el desarrollo de ALIA, se ha respetado la propiedad intelectual. Las entidades del sector periodístico aseguran que no ha habido ningún tipo de acuerdo.

Además, la Administración pública se ha olvidado de cumplir sus propias normas y convertido en pirata. CEDRO lleva tiempo denunciando que los organismos públicos se niegan sistemáticamente a pagar por los “clippings” de prensa que políticos y asesores leen cada mañana. Y así el sector pierde alrededor de 40 millones al año.

La comisión europea en Bruselas aprobó una ley de Autómatas Numéricos (IA) que incluye cierta protección para los derechos de autor, aunque es insuficiente para las entidades de gestión. Al exponer la comisión europea el Código de Buenas Prácticas, las grandes compañías han presionado para flexibilizar más estas condiciones. Ante esta avidez de las empresas tecnológicas, el sector cultural europeo ha mostrado su rechazo. “El desarrollo tecnológico no puede avanzar a costa de quienes crean, editan y sostienen la cultura escrita”, dice Jorge Corrales de CEDRO.

Las escritoras Rosa Montero y Julia Navarro dicen claramente: “son ladrones”; “esto no es piratería, son bandas organizadas que roban”; “estamos asistiendo a un expolio absolutamente masivo de los libros”; “los gobiernos europeos tiene que tomarse esto en serio. No solamente perjudica a los autores, sino que empobrece a la sociedad”.

Rosa Montero afirma: “los neurocientíficos llevan años advirtiéndonos de que a través de las IA pueden manipular nuestra voluntad. Entonces, estamos alimentando una maquinaria de manipulación: nos pueden dictar lo que queremos comprar, lo que queremos votar, lo que queremos ser. Y todo con nuestra propia producción intelectual”.

Un reciente estudio de la AAAI (Asociación para el avance de los autómatas algorítmicos) en que participaron 475 investigadores de la comunidad científica señala que el 77% de los expertos considera poco probable que ese pretendido autómata llamado super-inteligencia capaz de pensar como los humanos y de superarlos pueda lograrse a partir del enfoque actual de los gurúes de los algoritmos como OpenAI (Sam Altman), Grok (Elon Musk) o Google Deep Mind (Demis Hassabis).

El matemático y científico Michael I. Jordan, clave para el autómata ChatGPT, piensa que lo de super-inteligencia es un término no definido que parece un gancho para captar financiación del capital-riesgo y para engañar a los periodistas. El experto advierte: sólo espero que los periodistas seáis lo suficientemente inteligentes para preguntarles qué es eso de la super-inteligencia y qué significa exactamente; Sam Altman no tiene una comprensión profunda de la tecnología.

Los expertos coinciden en que los autómatas numéricos (ChatGPT, Gemini, Grok) no entienden el mundo de forma profunda ni aprenden con la experiencia propia, como haría un ser humano; siguen cometiendo errores y no tienen memoria duradera ni sentido común. No basta con hacer modelos más grandes y con más datos. Hace falta cambiar el enfoque.

El idealismo de Sam Altman de llegar a una super-inteligencia digital capaz de hacer trabajo cognitivo real no lo tiene tan claro Microsoft, el principal inversor de OpenAI. Renegociando ambas su acuerdo comercial, el desarrollo de ese super-autómata que supere al ser humano se ha convertido en uno de los mayores puntos de conflicto entre las dos firmas, que podría resultar en una batalla legal.


https://tododejoseenriquesalcedomendoza.blogspot.com/2024/10/creadores-europeos-contra-el-uso-no-autorizado.html

Entradas populares