Agora basta fazer um POST para a API da OpenAI com o arquivo de áudio e o modelo de transcrição que você deseja usar. No exemplo abaixo, estou usando o modelo whisper-1, que é o modelo de transcrição de voz em ambiente silencioso.
[1] Comentário enviado por removido em 04/03/2023 - 08:38h
Cara, excelente dica! Não sabia que tinha esse recurso no próprio OpenAI!
Eu estava usando o Assembly AI para fazer a mesma coisa em um projeto, só que a transcrição em PT-BR deles é ruim e já estava migrando para outra API (Deepgram)!
Sabe me dizer se dá para fazer o oposto também (texto para áudio)?
[2] Comentário enviado por SamL em 04/03/2023 - 14:06h
Porra, Fábio foi ligeiro, eu tava criando um artigo sobre o tal VALL-E para justamente criar voz sintetizada via texto.
Achei uma versão free do sintetizador no github e tava estudando ele como colocar pra gerar vozes a partir de uma amostra de áudio.
[4] Comentário enviado por fabio em 06/03/2023 - 03:20h
[1] Comentário enviado por ru4n em 04/03/2023 - 08:38h
Cara, excelente dica! Não sabia que tinha esse recurso no próprio OpenAI!
Eu estava usando o Assembly AI para fazer a mesma coisa em um projeto, só que a transcrição em PT-BR deles é ruim e já estava migrando para outra API (Deepgram)!
Sabe me dizer se dá para fazer o oposto também (texto para áudio)?
[5] Comentário enviado por fabio em 06/03/2023 - 03:21h
[2] Comentário enviado por SamL em 04/03/2023 - 14:06h
Porra, Fábio foi ligeiro, eu tava criando um artigo sobre o tal VALL-E para justamente criar voz sintetizada via texto.
Achei uma versão free do sintetizador no github e tava estudando ele como colocar pra gerar vozes a partir de uma amostra de áudio.
[7] Comentário enviado por fabio em 14/03/2023 - 12:23h
transformar áudio em texto usando open-ai dá pra usar isso no c++?
Não programo em C++, mas teoricamente é possível fazer isso em qualquer linguagem. Basta pegar os parâmetros passados pelo comando curl e adaptá-los a uma HTTP Request em C++ e depois tratar a resposta. Você basicamente usará a API da OpenAI em seu código.
[8] Comentário enviado por maurixnovatrento em 18/03/2023 - 16:59h
[7] Comentário enviado por fabio em 14/03/2023 - 12:23h
transformar áudio em texto usando open-ai dá pra usar isso no c++?
Não programo em C++, mas teoricamente é possível fazer isso em qualquer linguagem. Basta pegar os parâmetros passados pelo comando curl e adaptá-los a uma HTTP Request em C++ e depois tratar a resposta. Você basicamente usará a API da OpenAI em seu código.
Pode ser. Mas se tiver uma biblioteca para o c/c++, pra mim seria melhor.