A predominância do inglês americano em sistemas de IA ignora a diversidade linguística global, resultando em exclusões e desigualdades. É essencial desenvolver tecnologias que respeitem as variações linguísticas para promover justiça e inclusão nas interações com IA, focando na adaptação da tecnologia à diversidade em vez de padronizar os falantes.
A predominância do inglês americano em sistemas de IA levanta questões sobre a diversidade linguística. Enquanto o inglês é uma língua global, a versão americana domina a tecnologia, apagando variações e excluindo vozes minoritárias. Esse cenário reforça dinâmicas de poder desiguais e demanda uma reflexão sobre justiça linguística.
A Hegemonia do Inglês Americano
A hegemonia do inglês americano nos sistemas de inteligência artificial (IA) é resultado de uma combinação de fatores históricos, econômicos e tecnológicos.
Os Estados Unidos desempenharam um papel predominante no desenvolvimento da internet e na criação de conteúdo digital, além de serem a sede de gigantes da tecnologia como Google, Meta, Microsoft e OpenAI.
Esses fatores contribuíram para que o inglês americano se tornasse a norma linguística nos produtos dessas empresas.
Essa predominância não é acidental. A infraestrutura digital da internet e as prioridades corporativas do Vale do Silício estão profundamente enraizadas no inglês americano.
Isso se reflete nos conjuntos de dados que alimentam desde corretores automáticos até textos sintéticos gerados por IA.
Como consequência, os modelos de IA produzem uma versão monolítica do inglês que apaga variações e exclui vozes minoritárias e regionais.
Um estudo recente revelou que falantes de inglês não convencional expressaram frustração com a “homogeneidade dos sotaques de IA” em tecnologias de clonagem de voz e geração de fala.
A predominância dos sotaques americanos mainstream nas vozes disponíveis demonstra que essas tecnologias foram construídas “tendo em mente outras pessoas”.
Essa situação perpetua a ideia de que o inglês convencional é a norma a ser seguida, ignorando as ricas variações linguísticas existentes.
Consequências da Uniformidade Linguística
A uniformidade linguística nos sistemas de inteligência artificial (IA) tem consequências significativas, especialmente quando essas tecnologias são utilizadas em escala global.
A predominância do inglês americano nos modelos de IA pode levar a uma série de problemas, desde a exclusão de construções linguísticas regionais até a marginalização de vozes minoritárias.
Essas questões são cada vez mais relevantes à medida que governos, instituições educacionais e corporações adotam tecnologias de IA em larga escala.
A falta de reconhecimento e respeito pelas variações linguísticas pode resultar em decisões injustas e discriminação, reforçando desigualdades sociais e culturais.
Portanto, é fundamental que o desenvolvimento de IA considere a diversidade linguística como um aspecto essencial para garantir resultados justos e inclusivos.
Rumo à Justiça Linguística na IA
Alcançar a justiça linguística nos sistemas de inteligência artificial (IA) requer uma mudança de mentalidade, passando de uma abordagem que prescreve uma “linguagem correta” para uma que inclua uma variedade de formas linguísticas.
O objetivo é criar sistemas que acomodem a variação linguística em vez de a suprimir. Para isso, é essencial apoiar esforços liderados por comunidades para documentar e digitalizar variedades linguísticas em seus próprios termos.
A colaboração entre disciplinas é essencial, envolvendo linguistas, tecnólogos, educadores e líderes comunitários para garantir que o desenvolvimento de IA esteja fundamentado em princípios de justiça linguística.
A meta não é “corrigir” a linguagem, mas criar tecnologia que produza resultados justos. O foco deve estar em mudar a tecnologia, não o falante.
Isso significa que os sistemas de IA devem ser desenvolvidos para reconhecer e respeitar uma gama diversificada de formas de inglês, refletindo a riqueza e a diversidade das comunidades que o falam.
Ao abraçar essa diversidade, a tecnologia pode se tornar uma ferramenta poderosa para inclusão e equidade linguística.
Fonte: The Conversation
