El Desafío de los Datos en la Inteligencia Artificial
Tras el acuerdo de derechos de autor de $1.5 mil millones de Anthropic, la industria de la IA enfrenta un problema crítico con sus datos de entrenamiento. Existen alrededor de 40 casos pendientes que buscan compensación por el uso no licenciado de información, incluido uno contra Midjourney por generar imágenes de Superman.
Sin un sistema de licencias adecuado, las empresas de IA podrían verse inundadas de demandas que, según algunos, podrían retrasar permanentemente el avance del sector.

¿Qué es el Sistema RSL?
Un grupo de tecnólogos y editores web ha lanzado el Real Simple Licensing (RSL), un sistema diseñado para permitir la licencia de datos a gran escala. Ya cuenta con el respaldo de importantes actores como Reddit, Quora y Yahoo.
Según Eckart Walther, cofundador de RSL y creador del estándar RSS, el objetivo es establecer acuerdos de licencia legibles por máquinas para internet. «Eso es lo que RSL resuelve», afirmó.
Infraestructura Técnica y Legal
El RSL Protocol define términos de licencia que los editores pueden establecer para su contenido, integrados en archivos «robots.txt» en un formato preestablecido. Esto facilita identificar qué datos están bajo qué condiciones.
En el aspecto legal, el RSL Collective actúa como una organización de licencias colectivas, negociando términos y recaudando regalías, similar a ASCAP en la música o MPLC en el cine.
Editores que ya Participan
- Yahoo
- Reddit (con un acuerdo estimado de $60 millones anuales con Google)
- Medium
- O’Reilly Media
- Ziff Davis (propietario de Mashable y Cnet)
- Internet Brands (propietario de WebMD)
Desafíos y Futuro
Uno de los mayores retos es rastrear cuándo se utilizan datos específicos en modelos de IA, especialmente si el entrenamiento no se registra. Sin embargo, Doug Leeds, cofundador de RSL, cree que es posible: «No tiene que ser perfecto, solo lo suficientemente bueno para que la gente reciba pagos».
La pregunta clave es si las empresas de IA adoptarán RSL, dado que históricamente han dependido de datos web gratuitos. Leeds señala que líderes como Sundar Pichai han pedido un sistema como este.
«Necesitamos un protocolo. Necesitamos un sistema» — Doug Leeds, cofundador de RSL.