“Sempre que um desses rastreadores puxa do meu alcabarinho, seus recursos que eles consumiram e terão que pagar dinheiro duro”, explicou Aaron ao ARS. “Ele aumenta efetivamente seus custos. E vendo como nenhum deles ainda teve lucro, esse é um grande problema para eles”.
Na sexta -feira, Cloudflare anunciado “Ai Labyrinth”, uma abordagem semelhante, mas mais polida comercial. Ao contrário dos Nepenthes, projetados como uma arma ofensiva contra as empresas de IA, a CloudFlare posiciona sua ferramenta como um recurso de segurança legítimo para proteger os proprietários de sites contra raspagem não autorizada, como relatamos na época.
“Quando detectamos rastejamento não autorizado, em vez de bloquear o pedido, vincularemos a uma série de páginas geradas pela IA que são convincentes o suficiente para atrair um rastreador a atravessá-las”, explicou Cloudflare em seu anúncio. A empresa informou que os rastreadores de IA geram mais de 50 bilhões de solicitações à sua rede diariamente, representando quase 1 % de todo o tráfego da Web que processa.
A comunidade também está desenvolvendo ferramentas colaborativas para ajudar a proteger contra esses rastreadores. O “ai.robots.txt“O Project oferece uma lista aberta de rastreadores da Web associados às empresas de IA e fornece arquivos pré -fabricados robots.txt que implementam o protocolo de exclusão de robôs, bem como arquivos .htaccess que retornam páginas de erro ao detectar solicitações de rastreamento de IA.
Como está atualmente, tanto o rápido crescimento do conteúdo gerado pela IA muito pesado Espaços on-line e práticas agressivas de rastreamento na web por empresas de IA ameaçam a sustentabilidade dos recursos on-line essenciais. A abordagem atual adotada por algumas grandes empresas de IA –extração Vastas quantidades de dados de projetos de código aberto sem consentimento ou compensação clara-prejudica severamente o ecossistema digital do qual dependem esses modelos de IA.
A coleta de dados responsável pode ser alcançável se as empresas de IA colaborarem diretamente com as comunidades afetadas. No entanto, participantes proeminentes do setor demonstraram pouco incentivo para adotar práticas mais cooperativas. Sem regulamentação ou autoconfiança significativa pelas empresas de IA, a corrida armamentista entre os bots famintos de dados e aqueles que tentam defender a infraestrutura de código aberto parece provável que aumente ainda mais, potencialmente aprofundando a crise para o ecossistema digital que sustenta a Internet moderna.