Cloudflare vs Perplexity: Guerra por el Scraping Web que Divide a la Industria

Acusaciones de Evasión de Bloqueos en el Scraping Web

Cloudflare acusó públicamente al motor de búsqueda IA Perplexity de acceder a sitios web ignorando los métodos de bloqueo específicos. La empresa de seguridad web demostró mediante un caso de prueba que Perplexity utilizó «un navegador genérico que imita Google Chrome en macOS» cuando sus bots de rastreo fueron bloqueados explícitamente en el archivo robots.txt.

Interfaz de motor de búsqueda WEBCRAWLER
Motores de búsqueda en el centro de la controversia

La Defensa de Perplexity

Perplexity negó las acusaciones en un comunicado oficial, calificando las declaraciones de Cloudflare como «un argumento de ventas». La compañía de IA argumentó que existe una diferencia fundamental entre el rastreo automatizado y la recuperación impulsada por usuarios:

«Esta controversia revela que los sistemas de Cloudflare son fundamentalmente inadecuados para distinguir entre asistentes de IA legítimos y amenazas reales»

Datos Clave del Conflicto

  • Método de Evasión: Perplexity usó identificación falsa de navegador cuando fue bloqueado
  • Comparación Polémica: CEO de Cloudflare Matthew Prince comparó a Perplexity con «hackers norcoreanos»
  • Terceros Involucrados: Perplexity atribuyó el comportamiento a un servicio externo

Debate Comunitario: ¿Bots o Agentes Humanos?

La controversia generó divisiones en plataformas como X y Hacker News. Defensores de Perplexity argumentan que si un usuario solicita contenido específico, el agente de IA debería acceder como lo haría un navegador humano: «¿Por qué el acceso de la IA estaría en una categoría legal diferente a mi Firefox?». Críticos contraargumentan que los propietarios de sitios pierden tráfico y ingresos publicitarios.

Motor de búsqueda WebCrawler
WebCrawler: ejemplo histórico de scraping

Impacto en el Ecosistema Web

Según datos recientes, el tráfico de bots supera por primera vez la actividad humana en internet, representando más del 50% del total. Los bots maliciosos constituyen el 37% de todo el tráfico web, incluyendo scraping persistente. Analistas predicen que el volumen de motores de búsqueda tradicionales disminuirá un 25% para 2026 debido al auge de agentes de IA.

El Dilema Futuro

La industria enfrenta un desafío crítico: si los agentes de IA realizan reservas, compras y gestiones por usuarios, ¿bloquearlos perjudicaría los negocios web? Un usuario resumió el conflicto: «Quiero que Perplexity acceda a contenido público en mi nombre», mientras otro contraargumentó: «Los propietarios quieren que visites directamente para generar ingresos».

Comparte este artículo

Otras notas de tu interés:

Economia

Análisis de las Pérdidas Judiciales de los Demócratas en la Redistribución de Distritos

Economia

Demanda Colectiva Contra Spirit Airlines por Cierre Súbito que Afectó a 17,000 Empleados en Florida

Sociedad y Cultura

Campbell Brown y Forum AI: La lucha por la verdad en la era de la inteligencia artificial

Economia

Clio Alcanza $500M en ARR: La IA Impulsa el Crecimiento del Sector Legal Tech

Economia

Exdirector de hacking de L3Harris pagará $10 millones por vender herramientas a un broker ruso

Economia

Amazon Lanza ‘Amazon Now’: Entregas en 30 Minutos en Estados Unidos

Tecnologia

Google lanza ‘Create My Widget’: personaliza tu Android con inteligencia artificial

Tecnologia

Google I/O: Nuevas funciones de IA Gemini transforman Android con widgets, navegación y asistencia inteligente

Negocios

Anthropic lanza nuevas herramientas de IA para el sector legal en medio de una intensa competencia

Negocios

Google lanza Rambler: la función de dictado con IA para Gboard que desafía a las startups