A OpenAI, criadora do chatbot viral ChatGPT, revelou um novo modelo de IA que pode interagir com o mundo por meio de áudio, visão e texto em tempo real.
O GPT-4o é o mais recente produto carro-chefe da empresa apoiada pela Microsoft, com o objetivo de oferecer aos usuários uma “interação humano-computador mais natural”.
Em uma apresentação na segunda-feira, a OpenAI disse que sua mais recente IA poderia responder a perguntas em menos de um terço de segundo – semelhante ao tempo de resposta humana em uma conversa.
Usando a câmera e o microfone de um smartphone, o GPT-4o é capaz de compreender entradas de áudio e visuais, enquanto utiliza os alto-falantes para responder com uma voz natural.
Diferentemente de seus outros modelos avançados de IA, a OpenAI disse que disponibilizaria o GPT-4o gratuitamente, disponibilizando-o nas próximas semanas.
Em um esforço para evitar o uso indevido ou danos potenciais, a OpenAI disse que realizou testes extensivos que cobriram tudo, desde segurança cibernética até psicologia.
“Testamos as versões pré-mitigação de segurança e pós-mitigação de segurança do modelo, usando ajustes e prompts personalizados, para obter melhores recursos do modelo”, explicou a empresa em um comunicado. postagem no blog apresentando o produto.
“O GPT-4o também passou por uma extensa equipe vermelha externa com mais de 70 especialistas externos em domínios como psicologia social, preconceito e justiça, e desinformação para identificar riscos que são introduzidos ou amplificados pelas modalidades recentemente adicionadas… Continuaremos a mitigar novos riscos à medida que são descobertos.”
A OpenAI reconheceu que seu mais recente modelo de IA tem várias limitações que espera superar com versões futuras.
Vídeos da IA cometendo erros mostraram o GPT-4o alternando entre idiomas sem ser avisado, cometendo erros na tradução do idioma e pronunciando incorretamente o nome de alguém como “Nacho”.
O anúncio ocorre apenas um dia antes do Google I/O, o maior evento do ano da gigante da tecnologia, que deverá ter um forte foco em inteligência artificial.
“Todos os olhos estarão voltados para como a IA se tornará mais integrada aos dispositivos conectados, especialmente aos smartphones, dada a enorme escala da oportunidade”, disse Leo Gebbie, analista principal da CSS Insight. O Independente antes do evento.
“O Google precisa articular claramente os benefícios da IA para evitar que os consumidores sucumbam à fadiga da IA.”