Transcrição com o cliente Delphi OpenAI (3 / 5)

· Features

Transcrever áudio em texto (também conhecido como Speech to Text) é muito fácil usando a API OpenAI: basta enviar um arquivo de áudio em um dos seguintes formatos: mp3, mp4, mpeg, mpga, m4a, wav ou webm. A API retornará o texto.

Exemplo de transcrição em Delphi

O OpenAI exige que você construa uma requisição onde passa o arquivo de áudio, o modelo, a temperatura (para obter uma saída mais ou menos aleatória)... veja abaixo a lista dos parâmetros disponíveis.

- Filename: (Obrigatório) O arquivo de áudio a transcrever, em um destes formatos: mp3, mp4, mpeg, mpga, m4a, wav ou webm.
- Model: (Obrigatório) ID do modelo a usar. Apenas whisper-1 está disponível atualmente.
- Prompt: Texto opcional para guiar o estilo do modelo ou continuar um segmento de áudio anterior. O prompt deve estar no mesmo idioma do áudio.
- ResponseFormat: O formato da saída da transcrição: json, text, srt, verbose_json ou vtt.
- Temperature: A temperatura de amostragem, entre 0 e 1. Valores mais altos como 0,8 tornam a saída mais aleatória; valores mais baixos como 0,2 tornam mais focada e determinística. Se definido como 0, o modelo usará log de probabilidade para aumentar automaticamente a temperatura até atingir certos limites.
- Language: O idioma do áudio de entrada. Fornecer o idioma no formato ISO-639-1 melhora a precisão e a latência.


Veja abaixo um exemplo simples de transcrição de arquivo de áudio usando whisper-1

procedure DoFileTranscription(const aFilename: string);
var
  oRequest: TsgcOpenAIClass_Request_Transcription;
  oResponse: TsgcOpenAIClass_Response_Transcription;
begin
  oRequest := TsgcOpenAIClass_Request_Transcription.Create;
  Try
    oRequest.Filename := aFilename;
    oRequest.Model := 'whisper-1';
    oResponse := OpenAI.CreateTranscriptionFromFile(oRequest);
    Try
      DoLog(oResponse.Text);
    Finally
      oResponse.Free;
    End;
  Finally
    oRequest.Free;
  End;
end; 

Veja abaixo o demo compilado para Windows usando a biblioteca sgcWebSockets OpenAI Delphi.