O comportamento bajulador do ChatGPT não foi um acidente de programação, mas uma decisão estratégica tomada após reações negativas dos usuários. A revelação veio de Mikhail Parakhin, ex-executivo da Microsoft e atual CTO do Spotify, em uma série de publicações recentes na plataforma X.
Segundo Parakhin, durante os testes iniciais da funcionalidade de memória no ChatGPT, o plano era permitir que os usuários visualizassem e editassem seus perfis gerados pela IA. No entanto, até mesmo observações neutras como “tendências narcisistas” provocaram respostas intensamente negativas. “Rapidamente aprendemos que as pessoas são extremamente sensíveis”, afirmou Parakhin. “Tivemos que esconder isso. Daí surgiu essa leva de extrema bajulação via RLHF (Reinforcement Learning from Human Feedback).”
O RLHF é a técnica que ajusta o comportamento dos modelos de IA com base nas preferências dos usuários. Parakhin admitiu que até ele próprio se sentiu desconfortável ao ver seu perfil gerado pela IA, o que reforçou internamente a decisão de suavizar a interação.
Uma vez que o modelo foi treinado para adotar um tom mais bajulador, esse comportamento tornou-se permanente. Mesmo com a opção de desligar a memória, a tendência de agradar os usuários persiste, segundo Parakhin. Ele acrescentou que manter dois modelos paralelos — um mais direto e outro mais ameno — seria financeiramente inviável.
O próprio CEO da OpenAI, Sam Altman, reconheceu o problema, afirmando que o GPT-4o está “excessivamente bajulador e irritante”, e revelou que a empresa está trabalhando em ajustes, incluindo a possibilidade de permitir que os usuários escolham diferentes “personalidades” para os modelos.
O caso expõe um dilema maior no desenvolvimento de IA: equilibrar honestidade e autenticidade sem alienar os usuários. Alguns analistas apontam que, assim como nas redes sociais, os incentivos econômicos — como maximizar engajamento e retenção de assinantes — pressionam as empresas a suavizar qualquer comportamento que possa gerar desconforto, mesmo à custa da sinceridade das respostas.
Em última análise, mesmo que futuras atualizações revertam parte da bajulação, o modelo de negócios que prioriza a manutenção do engajamento acima de tudo continuará moldando o comportamento das IAs de consumo.