Basicamente, a ferramenta dispensa totalmente as interações por texto. O recurso torna a interação mais natural, prática e útil para o dia a dia.
Em uma demonstração divulgada no X, a OpenAI mostrou como o chatbot responde ao ser questionada sobre quantas pizzas pedir para cerca de 800 pessoas. A resposta ponderou o tamanho de cada fatia e a quantidade de pedaços por convidado e concluiu que seriam necessárias 195 pizzas.
Neste primeiro momento, a ferramenta é exclusiva do aplicativo para celular (Android ou iOS). O recurso pode ser acessado a partir do atalho ilustrado com ícone de fones de ouvido e a gravação pode acontecer de forma manual, com o toque sobre a tela, ou automática.
Dentro do ChatGPT, usuários podem escolher entre cinco vozes: Breeze, Cove, Sky, Ember e Juniper. As vozes foram geradas a partir da colaboração com profissionais e é alimentado pelo Whisper, um sistema de reconhecimento de fala de código aberto da OpenAI.
Recurso do ChatGPT está em fase de teste desde setembro
As interações por voz do ChatGPT estão em experimentação desde setembro deste ano. A ferramenta foi inaugurada com usuários pagantes, mas agora pode ser utilizada por qualquer pessoa com acesso ao app.
Vale ressaltar que a ferramenta não é o mesmo que a entrada de comandos de texto por voz (também disponível no app). Essa outra ferramenta permite inserir texto a partir do reconhecimento de voz, mas as respostas são impressas na tela.