arXiv endurece políticas: prohibición de un año por uso descuidado de IA en artículos científicos

arXiv toma medidas contra la mala calidad de papers generados por IA

El repositorio de preprints arXiv, una de las plataformas más utilizadas para la difusión de investigaciones antes de la revisión por pares, ha anunciado nuevas políticas para frenar el uso irresponsable de modelos de lenguaje de gran escala (LLM) en artículos científicos. La decisión, comunicada por Thomas Dietterich, presidente de la sección de ciencias de la computación de arXiv, establece sanciones severas para los autores que no verifiquen los resultados generados por IA.

¿Qué es arXiv y por qué es importante?

Concebido como un archivo abierto para la publicación de preprints, arXiv se ha convertido en un pilar en campos como la informática y las matemáticas. Su popularidad lo ha convertido también en una fuente de datos sobre tendencias científicas, lo que hace crucial mantener la calidad de su contenido. Ante el incremento de trabajos de baja calidad generados con inteligencia artificial, arXiv ya había implementado barreras como la exigencia de un respaldo de un autor establecido para nuevos usuarios. Ahora, la organización —en proceso de convertirse en una entidad independiente sin fines de lucro— refuerza su postura.

Nueva regla: «una sola oportunidad»

Dietterich publicó el jueves (fecha del anuncio) que «si una sumisión contiene evidencia incontrovertible de que los autores no revisaron los resultados generados por un LLM, significa que no podemos confiar en nada del artículo». Entre las pruebas mencionadas se incluyen referencias alucinadas y comentarios dirigidos al modelo de lenguaje. En tales casos, los autores enfrentarán una prohibición de un año en arXiv, seguida del requisito de que sus futuras sumisiones sean aceptadas primero en una revista revisada por pares de prestigio.

Es importante señalar que la política no prohíbe el uso de LLM, sino que exige que los autores asuman plena responsabilidad del contenido, sin importar cómo se genere. Esto implica que cualquier «lenguaje inapropiado, contenido plagiado, sesgado, errores, referencias incorrectas o contenido engañoso» copiado directamente de un LLM es responsabilidad del autor.

Visualización futurista de políticas de arXiv sobre IA
Las nuevas reglas buscan garantizar la confiabilidad de los papers publicados en arXiv.

Proceso de aplicación y apelación

Según explicó Dietterich al medio 404 Media, se trata de una regla de «una sola falta» (one-strike rule). Sin embargo, antes de aplicar la sanción, los moderadores deben señalar el problema y los presidentes de sección confirmar la evidencia. Los autores tendrán derecho a apelar la decisión.

La medida responde a investigaciones recientes que han detectado un aumento de citas falsas en la investigación biomédica, probablemente debido al uso de LLM. Cabe destacar que los científicos no son los únicos que han sido sorprendidos usando referencias inventadas por la IA.

Tabla de distribución de publicaciones por áreas de investigación
La producción científica en diversas áreas ha crecido; la calidad de los papers es ahora una prioridad en arXiv.

Implicaciones para la comunidad científica

La decisión de arXiv marca un precedente importante en la lucha contra la contaminación de la literatura científica con contenido generado por IA sin supervisión. Al exigir una verificación rigurosa, se espera que los investigadores empleen estas herramientas de manera ética y responsable, preservando la credibilidad del conocimiento difundido a través de la plataforma.

Comparte este artículo

Otras notas de tu interés:

Economia

El boom de la IA en Silicon Valley: una brecha de riqueza y empleo que divide a la industria

Negocios

Cierre del restaurante Blue Collar en Miami: historia y despedida de un ícono de la comida casera

Politica

Sean Cairncross y el liderazgo en el control de la IA avanzada: nuevas preocupaciones cibernéticas

Bienestar y Salud Mental

Feminicidio de mujeres negras en el sur de Florida: una llamada a la conciencia sobre la violencia doméstica

Economia

El auge de los centros de datos AI en South Florida: crecimiento y polémica vecinal

Negocios

Greg Brockman asume el control de la estrategia de producto en OpenAI

Politica Internacional

Estados Unidos ordena a viajeros en Air Force One desechar regalos y teléfonos tras viaje a China

Economia

Crecimiento de centros de datos para IA en South Florida: ¿Progreso tecnológico o peligro ambiental y comunitario?

Bienestar y Salud Mental

Femicidio de Mujeres Negras en el Sur de Florida: La Silenciosa Epidemia de Abuso Doméstico

Economia

Colapso de negociaciones en LIRR: Huelga amenaza el transporte en Nueva York