Início entretenimento Solução para o curioso mistério de por que a IA continua inventando...

Solução para o curioso mistério de por que a IA continua inventando os mesmos nomes falsos repetidamente

11
0

No artigo de hoje, fornecerei a solução para um mistério curioso que alguns observaram sobre o uso da inteligência artificial generativa e de grandes modelos de linguagem no que diz respeito à produção de histórias fictícias pela IA. A essência está na criação de nomes falsos.

Aqui está o negócio. Se você pedir à IA para inventar um nome para um personagem fictício, é provável que o nome falso seja um que a IA tenha inventado anteriormente. Em outras palavras, embora você certamente tenha assumido que a IA geraria um nome novo e totalmente único, na verdade ela usa um nome falso que já havia criado antes.

As perguntas são muitas. A IA está sendo preguiçosa e apenas desenterrando um nome falso anterior? A IA, por algum motivo, prefere um nome falso específico? Talvez haja uma grande conspiração em curso. A IA pode ter sido moldada para se concentrar na geração de nomes falsos de maneiras específicas. Isso pode ser uma astuta artimanha dos fabricantes de IA ou malfeitores. Nunca se sabe que maldade espreita nos corações dos desenvolvedores de IA e é transportada para a IA.

Bem, a boa notícia é que não se trata de uma grande conspiração, e nem o mistério é um enigma insolúvel. Vou guiá-lo pelos fatos disponíveis, nomeadamente que a IA generativa é construída para produzir respostas estatisticamente prováveis, incluindo nomes falsos, e o jogo no pano verde da mesa de apostas já está viciado. Para aqueles que desejam obter nomes falsos mais convincentes e menos repetitivos, não se preocupe, pois fornecemos sugestões que ajudarão você a fazer isso.

Vamos falar sobre isso.

Em um estudo de pesquisa recentemente publicado intitulado “O Casal Fantasma: Padrões Correlacionados de Nomes de LLMs e Sua Assombração na Web e Publicação Acadêmica” por Michał Brzozowski e Neo Christopher Chung, arXiv, 1 de junho de 2026, foram feitos os seguintes pontos (trechos):

  • “Quando solicitado a gerar especialistas fictícios, pesquisadores ou protagonistas sem instruções explícitas de nome, os grandes modelos de linguagem tendem a um pequeno conjunto de nomes de alta probabilidade.”
  • “Demonstramos que eles são correlacionados (os modelos geram conjuntos preferenciais de personagens, não desenhos independentes) e específicos da versão do modelo, mudando nos limites de lançamento.”
  • “Essas informações anteriores são específicas para a família de modelos (Claude: Elena Vasquez + Marcus Chen + Amara Okafor; Gemini: Aris Thorne + Lena Petrova; GPT: Elara Voss sem parceiro fixo), específica da versão e suprimida ativamente nos limites de lançamento do modelo, deixando impressões digitais comportamentais datáveis no conteúdo que produzem.”
  • “Elena Vasquez e Marcus Chen apareceram como especialistas em vulcões, astronautas, protagonistas de thrillers, anfitriões de podcasts e coautores acadêmicos em centenas de documentos gerados de forma independente por IA, nunca tendo vivido.”
  • “Devido ao volume enorme de conteúdo web gerado usando LLMs sem anular esses padrões padrão, os conjuntos de nomes característicos de cada versão do modelo acabam incorporados no conteúdo que produzem. A web é um arquivo acidental de impressões comportamentais de LLMs.”

Como já discuti anteriormente, as preocupações globais sobre as trapalhadas da IA são um tema importante; veja minha análise no link aqui. O ciclo é o seguinte. A IA produz uma saída e essa saída é postada na Internet. Mais tarde, uma IA que está sendo treinada com dados escaneia esses dados. A IA se baseia nos dados que alguma IA anterior produziu como saída. A IA que está fazendo a modelagem não percebe que os dados são baseados na geração da IA em vez de ser feita manualmente.

Após inúmeros ciclos desse tipo, a Internet inevitavelmente será poluída com dados feitos por IA. As pessoas que usam a web não perceberão que estão olhando para saídas geradas pela IA. Enquanto isso, as pessoas que usam a IA não perceberão que a IA foi treinada em outras saídas da IA. Uma espiral descendente do que lemos e consumimos já está em nosso horizonte.

No final, esses nomes falsos gerados pela IA vão vazar na Internet e em futuras iterações da IA e serem interpretados como nomes reais. Você não terá facilidade em identificar se Elena Vasquez ou Marcus Chen eram pessoas reais que realizaram coisas incríveis ou se eram nomes fictícios que continuaram sendo espalhados. Angustiante. Perturbador.

Confúcio fez o seguinte comentário: “Se os nomes não estiverem corretos, a linguagem não estará de acordo com a verdade das coisas.” Estamos nos encaminhando nessa direção indesejável. Eu sei que Shakespeare afirmaria que uma rosa com outro nome ainda cheiraria tão doce, mas do ponto de vista dos nomes falsos da IA, a questão está criando um odor terrível.