Sam Altman anunciou Uma atualização misteriosa do chatgpt Para o modelo GPT-4O padrão na sexta-feira, sem revelar muitos detalhes sobre ele. “Atualizamos o GPT-4O hoje!” Altman disse em X. “melhorou a inteligência e a personalidade”, brincou. Em uso real, Chatgpt Acabou sendo mais bajuloso do que nunca, usuários irritantes no processo.
O fim de semana nem acabou quando Atman reconheceu os problemas com a personalidade de ChatGPT. Ele disse Openai implantará correções no domingo e na semana seguinte. Mais importante, o CEO disse que o OpenAI compartilhará seus aprendizados com esse acidente. “Tem sido interessante”, ele brincou.
Outras 48 horas depois, o OpenAI reverteu a personalidade do chatgpt para todos os usuários gratuitos, com Altman ditado Contas pagas também receberiam a versão anterior da personalidade. Mais interessante é o OpenAI mais detalhado Postagem do blog Sobre o assunto que começa a explicar o que deu errado com a mais recente atualização de melhoria da personalidade do ChatGPT que fez a IA se tornar muito agradável e com sicófão.
O Openai explicou as atualizações de personalidade que planejava para a atualização do ChatGPT da semana passada. A empresa queria tornar a personalidade do ChatGPT padrão “mais intuitiva e eficaz em uma variedade de tarefas”.
O resultado foi um chatbot de IA que procurava agradar o usuário, o que foi bastante perturbador. Talvez eu não tenha recebido essas respostas em minhas breves interações com o ChatGPT no fim de semana, mas certamente notei as que outras pessoas compartilharam on -line.
Por que isso aconteceu? O Openai diz que usa instruções em sua especificação de modelo ao moldar o comportamento do modelo. “Também ensinamos nossos modelos a aplicar esses princípios, incorporando sinais de usuário, como o feedback dos polegares / polegares sobre as respostas do chatgpt”.
É aqui que o Openai estragou, aparentemente. “Nesta atualização, nos concentramos demais no feedback de curto prazo e não explicamos completamente como as interações dos usuários com o ChatGPT evoluem com o tempo”, diz Openai. “Como resultado, o GPT -4O distorceu as respostas que eram excessivamente favoráveis, mas falsas.”
O Openai explica que a personalidade padrão do ChatGPT deve refletir sua missão. Deve ser “útil, solidário e respeitoso com diferentes valores e experiência”. Mas “efeitos colaterais não intencionais” podem aparecer ao procurar tornar a IA útil e favorável. Além disso, o OpenAI diz que um único padrão de chatgpt não pode atender às necessidades de uma enorme base de usuários. Cerca de 500 milhões de pessoas usam ChatGPT toda semana, de acordo com o blog.
O Openai não está apenas revertendo a personalidade do chatgpt para o estado anterior. Também está procurando realinhar o modelo para evitar a bajulação no futuro, aplicando o seguinte:
O OpenAI também observou que os usuários do ChatGPT deveriam ter mais controle sobre a personalidade da IA e fazer ajustes. Isso é possível agora com instruções personalizadas, mas o OpenAI quer criar maneiras mais fáceis de os usuários ajustarem a personalidade. O Openai diz que os usuários poderão “fornecer feedback em tempo real para influenciar diretamente suas interações e escolher entre várias personalidades padrão”.
Não está claro quando isso acontecerá ou como o feedback em tempo real aparecerá. Os usuários do ChatGPT já têm a chance de enviar feedback sobre como a IA lida com respostas. Você verá rotineiramente o ChatGPT oferece dois tipos de respostas, pedindo que você escolha o seu favorito. Isso diz respeito à maneira como o ChatGPT apresenta informações em resposta a avisos. Mas testes futuros de feedback também podem se concentrar na personalidade.
Estou especulando aqui porque não está claro como o OpenAI planeja permitir que os usuários alterem a personalidade do chatgpt em tempo real no futuro. Presumivelmente, esse trabalho está apenas começando, e demorará um pouco para ver resultados palpáveis.
Esse trabalho de personalidade da IA pode não parecer um grande negócio para algumas pessoas, com certeza. Mas isso não se trata apenas de bajulação. Trata -se de desenvolver IA segura, e isso envolve acertar sua personalidade.
Enquanto isso, estou feliz que a bajulação esteja se afastando do Chatgpt, no entanto, novamente, eu não experimentei isso sozinho.