Uma pesquisa recente conduzida pela Microsoft revelou uma preocupante falha nas inteligências artificiais (IAs) modernas: a capacidade de corromper uma parcela significativa dos documentos que processam. O estudo indica que esses sistemas, mesmo os mais avançados, modificam ou eliminam conteúdo sem qualquer tipo de aviso, lançando dúvidas sobre a prontidão da IA para substituir grande parte do trabalho intelectual, como é frequentemente prometido pelo marketing das empresas do setor.
Três pesquisadores da Microsoft submeteram 19 algoritmos de IA de ponta, incluindo modelos como Gemini 3.1 Pro (do Google), Claude 4.6 Opus (da Anthropic) e GPT 5.4 (da OpenAI, amplamente utilizada pela própria Microsoft), a um rigoroso teste. As IAs foram encarregadas de trabalhar em documentos de 52 profissões variadas, desde o desenvolvimento de software até a biologia. Os resultados foram alarmantes: os algoritmos mais modernos corromperam, em média, pelo menos 25% do conteúdo dos documentos. Considerando todas as IAs testadas, a taxa média de corrupção atingiu um índice preocupante de 50% do conteúdo dos arquivos, com alterações ou eliminações ocorrendo de forma silenciosa.
Para simular um ambiente de trabalho realista, os pesquisadores forneceram às IAs um documento inicial autêntico, elaborado por profissionais das respectivas áreas, e solicitaram a execução de tarefas específicas. Por exemplo, em uma tarefa de contabilidade, a IA deveria categorizar despesas listadas. Adicionalmente, foram fornecidos outros documentos correlatos que, embora relacionados ao trabalho, não eram estritamente necessários para a execução da tarefa principal. Essa abordagem visava replicar a dinâmica de um escritório, onde emails frequentemente contêm mais arquivos do que o essencial, por distração ou para complementar informações.
A presença desses arquivos correlatos contribuiu para a corrupção do documento principal. Em um segundo teste, onde os pesquisadores permitiram que as IAs operassem no modo “agêntico” – ou seja, utilizando outros softwares para completar as tarefas – os resultados foram ainda piores, com um aumento na quantidade de dados corrompidos. Mesmo ao remover os arquivos correlatos e fornecer às IAs apenas o documento de trabalho, a melhoria foi mínima, com o índice de informações corrompidas diminuindo apenas entre 2% e 8%, dependendo do algoritmo.
A única área em que as IAs apresentaram desempenho consistente e satisfatório foi no desenvolvimento de código de software. Conforme conclui o estudo, “Os modelos de linguagem (LLMs) atuais estão prontos para assumir fluxos de trabalho em algumas áreas, como escrever código na linguagem Python, mas não em outras áreas. Em geral, os usuários ainda precisam monitorar de perto os LLMs enquanto operam e completam tarefas.” Esta ressalva reforça a necessidade de supervisão humana contínua e cautela na integração plena da inteligência artificial em processos de trabalho que envolvem a manipulação de informações críticas.
Fonte: CURIOSIDADES – Super Interessante