A OpenAI, fabricante do ChatGPT, está entrando no mercado de assistentes de voz e apresentando uma nova tecnologia que pode clonar a voz de uma pessoa, mas afirmou que ainda não irá disponibilizá-la publicamente devido a questões de segurança.
A empresa de inteligência artificial revelou sua nova tecnologia Voice Engine na sexta-feira, pouco mais de uma semana após registrar um pedido de marca registrada para o nome. A OpenAI afirma que é capaz de recriar a voz de uma pessoa com apenas 15 segundos de gravação dessa pessoa falando.
A OpenAI planeja compartilhar a tecnologia com os primeiros testadores, mas não pretender lançá-la amplamente neste momento devido aos perigos de possíveis usos indevidos. “Reconhecemos que criar um discurso que se assemelhe às vozes reais apresenta sérios riscos, especialmente em um ano eleitoral”, afirmou a empresa de São Francisco em um comunicado.
Em New Hampshire, autoridades estão investigando chamadas automáticas enviadas a milhares de eleitores pouco antes das primárias presidenciais, que apresentavam uma voz gerada por IA imitando o presidente Joe Biden.
Diversas empresas iniciantes já comercializam tecnologia de clonagem de voz, algumas acessíveis ao público ou destinadas a clientes empresariais selecionados, como estúdios de entretenimento.
A OpenAI informou que os primeiros testadores do Voice Engine concordaram em não se passar por outra pessoa sem seu consentimento e em divulgar que as vozes são geradas por IA. A empresa, mais conhecida por seu chatbot e gerador de imagens DALL-E, adotou uma abordagem semelhante ao anunciar, mas não divulgar amplamente, seu gerador de vídeo Sora.
No entanto, um pedido de marca registrada em 19 de março sugere que a OpenAI provavelmente pretende ingressar no mercado de reconhecimento de fala e assistentes de voz digitais. Melhorar essa tecnologia poderia ajudar a OpenAI a competir com outros produtos de voz, como o Alexa da Amazon.
——
A Associated Press e a OpenAI têm um acordo de licenciamento e tecnologia que permite à OpenAI acessar parte dos arquivos de texto da AP.