OpenAI Realtime-API

Praat in milliseconden met het OpenAI Realtime-model — bidirectionele audio en tekst over één WebSocket-sessie, aangestuurd vanuit Delphi/C++ Builder.

TsgcWSAPI_OpenAI

WebSocket-client voor de OpenAI Realtime-API — volledige sessielevenscyclus, function tools, streaming van audio-frames en transcriptie-events.

Componentklasse

TsgcWSAPI_OpenAI

Platforms

Windows, macOS, Linux, iOS, Android

Editie

Standard / Professional / Enterprise

Plaats het component, stel de API-sleutel in en praat

Combineer met TsgcWebSocketClient, stel OpenAI.ApiKey en OpenAI.Model in en push dan audio of tekst en luister naar response-events.

uses
  sgcWebSocket, sgcWebSocket_API_OpenAI;

var
  WSClient: TsgcWebSocketClient;
  OpenAI: TsgcWSAPI_OpenAI;
begin
  WSClient := TsgcWebSocketClient.Create(nil);

  OpenAI := TsgcWSAPI_OpenAI.Create(nil);
  OpenAI.Client := WSClient;
  OpenAI.OpenAI.ApiKey := 'sk-...';
  OpenAI.OpenAI.Model  := 'gpt-realtime';

  WSClient.Active := True;

  // verstuur een tekstbeurt
  OpenAI.ConversationCreateMessageText('Hello', 'user');
  OpenAI.ResponseCreate;
end;
// uses: sgcWebSocket, sgcWebSocket_API_OpenAI
TsgcWebSocketClient *WSClient = new TsgcWebSocketClient(this);
TsgcWSAPI_OpenAI *OpenAI = new TsgcWSAPI_OpenAI(this);
OpenAI->Client = WSClient;
OpenAI->OpenAI->ApiKey = "sk-...";
OpenAI->OpenAI->Model  = "gpt-realtime";

WSClient->Active = true;
OpenAI->ConversationCreateMessageText("Hello", "user");
OpenAI->ResponseCreate();

Wat zit erin

Omsluit de OpenAI Realtime-WebSocket-gateway als een getypeerd Delphi-component met helpers voor session, conversation en audio.

Sessielevenscyclus

SessionUpdate past modalities, voice, instructions, input_audio_format, output_audio_format en turn_detection-instellingen toe op de actieve Realtime-sessie.

Conversation items

ConversationCreateMessageText en ConversationCreateMessageAudio pushen user-/system-content; ConversationItemDelete en ConversationItemTruncate herstructureren de lopende geschiedenis.

Audio-streaming

InputAudioBufferAppend pusht PCM-frames (base64-gecodeerd), InputAudioBufferCommit beëindigt een user-beurt. Uitvoer-audio arriveert als response.audio.delta-events.

Function calling

Declareer tools in SessionUpdate; argumenten arriveren als response.function_call_arguments.delta-events, resultaten gaan terug via ConversationCreateFunctionCallOutput.

Voice activity detection

Server-side VAD (turn_detection: {type: server_vad}) detecteert automatisch het einde van spraak — het component levert elke fase als een eigen event.

Auth-headers

Het component injecteert de Authorization- en OpenAI-Beta: realtime=v1-headers in de WebSocket-handshake. Combineer met TsgcWebSocketClient_WinHTTP op Windows voor TLS beheerd door het OS.

Specificaties & referenties

Gezaghebbende bronnen voor de API's die dit component implementeert.

Documentatie & demo's

Diepe link naar de componentreferentie, pak het kant-en-klare demoproject en download de proefversie.

Online help — API_OpenAI Volledige referentie van eigenschappen, methoden en events voor dit component.
Gratis proefversie — sgcWebSockets Download het proefversie-package en begin met het streamen van Realtime-audio en -tekst naar je Delphi-toepassingen.
Technisch document (PDF) Functies, snelstart, codevoorbeelden voor Delphi & C++ Builder en primaire bronreferenties — alleen dit component.
Gebruikershandleiding (PDF) Uitgebreide handleiding die alle componenten in de bibliotheek behandelt.

Klaar om OpenAI Realtime te streamen?

Download de gratis proefversie en voeg live AI-audio en -tekst toe aan je Delphi-toepassingen.