Reddit processa Perplexity e outras empresas de scraping por uso indevido de dados para inteligência artificial. A ação judicial evidencia o conflito entre direitos autorais e o acesso aberto ao conhecimento, enquanto a Perplexity argumenta a favor de um uso responsável baseado em dados públicos.
O Reddit processou a Perplexity e outras três empresas de coleta de dados, SerpApi, Oxylabs e AWMProxy, por suposta captação não autorizada de conteúdos em escala industrial para treinar modelos de inteligência artificial.
Acusações contra Perplexity e empresas de scraping
O Reddit entrou com um processo contra a Perplexity e três empresas de data scraping, acusando-as de violar proteções de dados em escala industrial.
As empresas envolvidas incluem SerpApi, Oxylabs e AWMProxy, que o Reddit compara a ladrões de banco, alegando que, ao não conseguir acessar o cofre diretamente, elas recorrem a métodos alternativos para obter o conteúdo protegido.
De acordo com a denúncia, a Perplexity é cliente de pelo menos uma dessas empresas de scraping, utilizando dados do Reddit para alimentar seu mecanismo de respostas sem firmar um acordo oficial com a plataforma, diferentemente de outros concorrentes que optaram por negociações formais.
O Reddit alega que, mesmo após enviar uma carta de cessar e desistir à Perplexity em maio de 2024, a empresa continuou a aumentar o volume de citações ao Reddit, desrespeitando as diretrizes de exclusão de dados estabelecidas.
Impacto do uso de dados do Reddit na IA
O uso de dados do Reddit tem um impacto significativo no desenvolvimento de modelos de inteligência artificial, devido à riqueza e diversidade de informações contidas nas discussões da plataforma.
Esses dados são valiosos para treinar algoritmos de IA, pois abrangem uma ampla gama de tópicos e refletem interações humanas autênticas.
No entanto, o Reddit argumenta que a utilização não autorizada de seus dados por empresas como a Perplexity representa um desrespeito aos direitos autorais e à proteção de dados.
A empresa busca proteger seu conteúdo, que considera essencial para o treinamento ético e legal de IA, e garantir que suas contribuições sejam devidamente compensadas.
As mudanças nas políticas de API do Reddit, que causaram protestos em 2023, visam justamente monetizar o acesso a esses dados, buscando acordos mais vantajosos com empresas de IA.
O processo contra a Perplexity ressalta a importância de proteger a integridade dos dados na era digital e de estabelecer diretrizes claras para seu uso.
