OpenAI Realtime API

Converse com o modelo Realtime da OpenAI em milissegundos — áudio e texto bidirecionais em uma única sessão WebSocket, acionado a partir do Delphi/C++Builder.

TsgcWSAPI_OpenAI

Cliente WebSocket para a OpenAI Realtime API — ciclo de vida completo da sessão, ferramentas de função, streaming de frames de áudio e eventos de transcrição.

Classe do componente

TsgcWSAPI_OpenAI

Plataformas

Windows, macOS, Linux, iOS, Android

Edição

Standard / Professional / Enterprise

Solte o componente, defina a chave de API, converse

Combine com TsgcWebSocketClient, defina OpenAI.ApiKey e OpenAI.Model, depois envie áudio ou texto e escute os eventos de resposta.

uses
  sgcWebSocket, sgcWebSocket_API_OpenAI;

var
  WSClient: TsgcWebSocketClient;
  OpenAI: TsgcWSAPI_OpenAI;
begin
  WSClient := TsgcWebSocketClient.Create(nil);

  OpenAI := TsgcWSAPI_OpenAI.Create(nil);
  OpenAI.Client := WSClient;
  OpenAI.OpenAI.ApiKey := 'sk-...';
  OpenAI.OpenAI.Model  := 'gpt-realtime';

  WSClient.Active := True;

  // send a text turn
  OpenAI.ConversationCreateMessageText('Hello', 'user');
  OpenAI.ResponseCreate;
end;
// uses: sgcWebSocket, sgcWebSocket_API_OpenAI
TsgcWebSocketClient *WSClient = new TsgcWebSocketClient(this);
TsgcWSAPI_OpenAI *OpenAI = new TsgcWSAPI_OpenAI(this);
OpenAI->Client = WSClient;
OpenAI->OpenAI->ApiKey = "sk-...";
OpenAI->OpenAI->Model  = "gpt-realtime";

WSClient->Active = true;
OpenAI->ConversationCreateMessageText("Hello", "user");
OpenAI->ResponseCreate();

O que tem por dentro

Encapsula o gateway WebSocket Realtime da OpenAI como um componente Delphi tipado com helpers de sessão, conversa e áudio.

Ciclo de vida da sessão

SessionUpdate aplica modalidades, voz, instruções, input_audio_format, output_audio_format e configurações de turn_detection à sessão Realtime ativa.

Itens de conversa

ConversationCreateMessageText e ConversationCreateMessageAudio enviam conteúdo do usuário/sistema; ConversationItemDelete e ConversationItemTruncate reorganizam o histórico em execução.

Streaming de áudio

InputAudioBufferAppend envia frames PCM (codificados em base64), InputAudioBufferCommit encerra um turno do usuário. O áudio de saída chega como eventos response.audio.delta.

Chamada de funções

Declare ferramentas em SessionUpdate; os argumentos chegam como eventos response.function_call_arguments.delta, os resultados retornam via ConversationCreateFunctionCallOutput.

Detecção de atividade de voz

VAD do lado do servidor (turn_detection: {type: server_vad}) detecta automaticamente o fim da fala — o componente entrega cada fase como seu próprio evento.

Cabeçalhos de autenticação

O componente injeta os cabeçalhos Authorization e OpenAI-Beta: realtime=v1 no handshake WebSocket. Combine com TsgcWebSocketClient_WinHTTP no Windows para TLS gerenciado pelo SO.

Especificações e referências

Fontes autoritativas das APIs que este componente implementa.

Documentação e demos

Acesse direto a referência do componente, baixe o projeto de demonstração pronto para rodar e baixe a versão de avaliação.

Ajuda online — API_OpenAI Referência completa de propriedades, métodos e eventos deste componente.
Versão de avaliação gratuita — sgcWebSockets Baixe o pacote de avaliação e comece a transmitir áudio e texto Realtime nas suas aplicações Delphi.
Documento técnico (PDF) Recursos, início rápido, exemplos de código para Delphi & C++ Builder e referências de fontes primárias — somente este componente.
Manual do usuário (PDF) Manual abrangente cobrindo todos os componentes da biblioteca.

Pronto para transmitir com a OpenAI Realtime?

Baixe a versão de avaliação gratuita e adicione áudio e texto de IA em tempo real às suas aplicações Delphi.