API Realtime de OpenAI

Habla con el modelo Realtime de OpenAI en milisegundos — audio y texto bidireccionales sobre una única sesión WebSocket, controlado desde Delphi/C++Builder.

TsgcWSAPI_OpenAI

Cliente WebSocket para la API Realtime de OpenAI — ciclo de vida completo de la sesión, function tools, streaming de frames de audio y eventos de transcripción.

Clase del componente

TsgcWSAPI_OpenAI

Plataformas

Windows, macOS, Linux, iOS, Android

Edición

Standard / Professional / Enterprise

Suelta el componente, configura la clave API, habla

Empareja con TsgcWebSocketClient, establece OpenAI.ApiKey y OpenAI.Model, y luego envía audio o texto y escucha los eventos de respuesta.

uses
  sgcWebSocket, sgcWebSocket_API_OpenAI;

var
  WSClient: TsgcWebSocketClient;
  OpenAI: TsgcWSAPI_OpenAI;
begin
  WSClient := TsgcWebSocketClient.Create(nil);

  OpenAI := TsgcWSAPI_OpenAI.Create(nil);
  OpenAI.Client := WSClient;
  OpenAI.OpenAI.ApiKey := 'sk-...';
  OpenAI.OpenAI.Model  := 'gpt-realtime';

  WSClient.Active := True;

  // send a text turn
  OpenAI.ConversationCreateMessageText('Hello', 'user');
  OpenAI.ResponseCreate;
end;
// uses: sgcWebSocket, sgcWebSocket_API_OpenAI
TsgcWebSocketClient *WSClient = new TsgcWebSocketClient(this);
TsgcWSAPI_OpenAI *OpenAI = new TsgcWSAPI_OpenAI(this);
OpenAI->Client = WSClient;
OpenAI->OpenAI->ApiKey = "sk-...";
OpenAI->OpenAI->Model  = "gpt-realtime";

WSClient->Active = true;
OpenAI->ConversationCreateMessageText("Hello", "user");
OpenAI->ResponseCreate();

Qué incluye

Envuelve el gateway WebSocket Realtime de OpenAI como un componente Delphi tipado con helpers de sesión, conversación y audio.

Ciclo de vida de la sesión

SessionUpdate aplica modalities, voice, instructions, input_audio_format, output_audio_format y los ajustes de turn_detection a la sesión Realtime activa.

Conversation items

ConversationCreateMessageText y ConversationCreateMessageAudio insertan contenido de user/system; ConversationItemDelete y ConversationItemTruncate remodelan el historial en curso.

Streaming de audio

InputAudioBufferAppend envía frames PCM (codificados en base64), InputAudioBufferCommit cierra un turno de usuario. El audio de salida llega como eventos response.audio.delta.

Function calling

Declara las herramientas en SessionUpdate; los argumentos llegan como eventos response.function_call_arguments.delta y los resultados se devuelven mediante ConversationCreateFunctionCallOutput.

Detección de actividad de voz

El VAD del lado del servidor (turn_detection: {type: server_vad}) detecta automáticamente el final del habla — el componente entrega cada fase en su propio evento.

Cabeceras de auth

El componente inyecta las cabeceras Authorization y OpenAI-Beta: realtime=v1 en el handshake WebSocket. Empareja con TsgcWebSocketClient_WinHTTP en Windows para TLS gestionado por el sistema operativo.

Especificaciones y referencias

Fuentes oficiales de las APIs que este componente implementa.

Documentación y Demos

Enlace directo a la referencia del componente, descarga el proyecto demo listo para ejecutar y consigue la prueba gratuita.

Ayuda en línea — API_OpenAI Referencia completa de propiedades, métodos y eventos de este componente.
Prueba gratuita — sgcWebSockets Descarga el paquete de prueba y empieza a transmitir audio y texto Realtime a tus aplicaciones Delphi.
Documento técnico (PDF) Características, inicio rápido, ejemplos de código para Delphi y C++ Builder y referencias a fuentes primarias Features, quick start, code samples for Delphi & C++ Builder and primary-source references — this component only.mdash; solo de este componente.
Manual de usuario (PDF) Manual completo que cubre todos los componentes de la librería.

¿Listo para transmitir OpenAI Realtime?

Descarga la prueba gratuita y añade audio y texto IA en directo a tus aplicaciones Delphi.