OpenAI Realtime API

OpenAI Realtime モデルとミリ秒単位で音声会話 — Delphi/C++Builder から単一の WebSocket セッション上で双方向の音声とテキストを送受信します。

TsgcWSAPI_OpenAI

OpenAI Realtime API 向け WebSocket クライアント — セッションのライフサイクル全体、関数ツール、音声フレームストリーミング、文字起こしイベントに対応。

コンポーネントクラス

TsgcWSAPI_OpenAI

プロトコル

OpenAI Realtime API

プラットフォーム

Windows, macOS, Linux, iOS, Android

エディション

Standard / Professional / Enterprise

コンポーネントを配置して API キーを設定し、話しかける

TsgcWebSocketClient とペアリングし、OpenAI.ApiKey と OpenAI.Model を設定したら、音声またはテキストを送信してレスポンスイベントを待ち受けます。

uses
  sgcWebSocket, sgcWebSocket_API_OpenAI;

var
  WSClient: TsgcWebSocketClient;
  OpenAI: TsgcWSAPI_OpenAI;
begin
  WSClient := TsgcWebSocketClient.Create(nil);

  OpenAI := TsgcWSAPI_OpenAI.Create(nil);
  OpenAI.Client := WSClient;
  OpenAI.OpenAI.ApiKey := 'sk-...';
  OpenAI.OpenAI.Model  := 'gpt-realtime';

  WSClient.Active := True;

  // send a text turn
  OpenAI.ConversationCreateMessageText('Hello', 'user');
  OpenAI.ResponseCreate;
end;
// uses: sgcWebSocket, sgcWebSocket_API_OpenAI
TsgcWebSocketClient *WSClient = new TsgcWebSocketClient(this);
TsgcWSAPI_OpenAI *OpenAI = new TsgcWSAPI_OpenAI(this);
OpenAI->Client = WSClient;
OpenAI->OpenAI->ApiKey = "sk-...";
OpenAI->OpenAI->Model  = "gpt-realtime";

WSClient->Active = true;
OpenAI->ConversationCreateMessageText("Hello", "user");
OpenAI->ResponseCreate();

主な機能

OpenAI Realtime WebSocket ゲートウェイを、セッション・会話・音声ヘルパーを備えた型付き Delphi コンポーネントとしてラップします。

セッションライフサイクル

SessionUpdate は、モダリティ、音声、指示、input_audio_format、output_audio_format、turn_detection の設定をアクティブな Realtime セッションに適用します。

会話アイテム

ConversationCreateMessageTextConversationCreateMessageAudio でユーザー/システムコンテンツを送信。ConversationItemDeleteConversationItemTruncate で履歴を編集できます。

音声ストリーミング

InputAudioBufferAppend で PCM フレーム(base64 エンコード)を送信し、InputAudioBufferCommit でユーザーターンを終了します。出力音声は response.audio.delta イベントとして届きます。

関数呼び出し

SessionUpdate でツールを宣言します。引数は response.function_call_arguments.delta イベントとして届き、結果は ConversationCreateFunctionCallOutput で返します。

音声アクティビティ検出

サーバーサイド VAD(turn_detection: {type: server_vad})が発話終了を自動検出。コンポーネントは各フェーズを独自のイベントとして通知します。

認証ヘッダー

WebSocket ハンドシェイク時に AuthorizationOpenAI-Beta: realtime=v1 ヘッダーを自動注入します。Windows では OS 管理の TLS を使用するため TsgcWebSocketClient_WinHTTP と組み合わせてください。

仕様とリファレンス

このコンポーネントが実装する API の一次資料です。

ドキュメントとデモ

コンポーネントリファレンスへのディープリンク、すぐに実行できるデモプロジェクト、体験版のダウンロードをご利用ください。

オンラインヘルプ — API_OpenAI 本コンポーネントのプロパティ、メソッド、イベントの完全なリファレンスです。
体験版 — sgcWebSockets 体験版パッケージをダウンロードして、Delphi アプリケーションへの Realtime 音声・テキストのストリーミングを始めましょう。
技術ドキュメント (PDF) 機能、クイックスタート、Delphi および C++ Builder のコードサンプルと一次情報源リファレンス — 本コンポーネントのみ。
ユーザーマニュアル (PDF) ライブラリ内のすべてのコンポーネントを網羅した包括的なマニュアルです。

OpenAI Realtime のストリーミングを始める準備はできましたか?

体験版をダウンロードして、Delphi アプリケーションにリアルタイム AI 音声・テキストを追加しましょう。