Ollama Local LLM

Führe quelloffene große Sprachmodelle lokal aus deinen Delphi-, C++ Builder- und .NET-Anwendungen aus. Die Inferenz bleibt privat, offline und on-premise und läuft auf deiner eigenen Hardware, ohne dass eine Cloud-API erforderlich ist.

TsgcHTTP_API_Ollama

Ollama-REST-API-Client für lokale Chat-Completions, Embeddings und Modellverwaltung.

Komponentenklasse

TsgcHTTP_API_Ollama

Protokoll

Ollama REST API über HTTP

Plattformen

Windows, macOS, Linux, iOS, Android

Edition

Enterprise (KI-Add-on)

Komponente platzieren, auf localhost zeigen, los geht's

Ollama läuft lokal und benötigt keinen API-Key. Setze OllamaOptions.BaseUrl auf deinen lokalen Server (Standard http://localhost:11434/api) und rufe dann _CreateMessage auf oder baue eine TsgcOllamaClass_Request_ChatCompletion und rufe CreateMessage auf.

uses
  sgcHTTP_API_Ollama;

var
  Ollama: TsgcHTTP_API_Ollama;
begin
  Ollama := TsgcHTTP_API_Ollama.Create(nil);
  // Local server, no API key needed
  Ollama.OllamaOptions.BaseUrl := 'http://localhost:11434/api';

  // Simple one-shot message
  Memo1.Lines.Text := Ollama._CreateMessage(
    'llama3',
    'What are the benefits of WebSockets?');

  // Streaming — handle OnHTTPAPISSE per chunk
  Ollama.OnHTTPAPISSE := HandleSSE;
  Ollama._CreateMessageStream(
    'llama3',
    'Summarise RFC 6455');
end;

procedure TForm1.HandleSSE(Sender: TObject;
  const aEvent, aData: string;
  var Cancel: Boolean);
begin
  Memo1.Lines.Add(aEvent + ': ' + aData);
end;
// uses: sgcHTTP_API_Ollama
TsgcHTTP_API_Ollama *Ollama = new TsgcHTTP_API_Ollama(this);
// Local server, no API key needed
Ollama->OllamaOptions->BaseUrl = "http://localhost:11434/api";

// Simple one-shot message
Memo1->Lines->Text = Ollama->_CreateMessage(
  "llama3",
  "What are the benefits of WebSockets?");

// Streaming — OnHTTPAPISSE fires per chunk
Ollama->OnHTTPAPISSE = HandleSSE;
Ollama->_CreateMessageStream(
  "llama3",
  "Summarise RFC 6455");
using esegece.sgcWebSockets;

var ollama = new TsgcHTTPAPI_Ollama();
// Local server, no API key needed
ollama.OllamaOptions.BaseUrl = "http://localhost:11434/api";

// Simple one-shot message
Console.WriteLine(ollama._CreateMessage(
  "llama3",
  "What are the benefits of WebSockets?"));

// Streaming via Server-Sent Events
ollama.OnHTTPAPISSE += (sender, ev, data, cancel) => Console.Write(data);
ollama._CreateMessageStream(
  "llama3",
  "Summarise RFC 6455");

Was steckt drin

Typisierte Request-/Response-Klassen für Chat-Completions und Embeddings, dazu Modellverwaltung und Streaming über Server-Sent Events.

Messages & Chat

CreateMessage sendet eine typisierte TsgcOllamaClass_Request_ChatCompletion und gibt eine geparste Antwort zurück. _CreateMessage, _CreateMessageWithSystem und _CreateMessageStream sind String-Kurzformen, wobei Streaming-Deltas über OnHTTPAPISSE geliefert werden.

Embeddings

CreateEmbeddings wandelt Eingabetext mit einem lokal abgerufenen Embedding-Modell wie nomic-embed-text oder mxbai-embed-large in einen dichten Vektor um und gibt eine TsgcOllamaClass_Response_Embeddings zurück.

Modelle

Verwalte die Modelle auf deinem Rechner: _GetModels und _GetTags listen auf, was verfügbar ist, _ShowModel liest Modelldetails, _PullModel lädt aus der Ollama-Bibliothek herunter und _DeleteModel entfernt ein lokales Modell.

Lokal & privat

Jede Anfrage richtet sich an einen lokalen Ollama-Server (Standard http://localhost:11434/api), sodass keine Daten dein Netzwerk verlassen und kein API-Key erforderlich ist. Richte OllamaOptions.BaseUrl bei Bedarf auf eine entfernte oder containerisierte Instanz.

Zuverlässigkeit & Diagnose

CircuitBreaker kürzt Anfragen ab, wenn der Server ungesund ist; ReadTimeout und TLSOptions justieren die HTTP-/HTTPS-Schicht; OnHTTPAPIException meldet Fehler; OnHTTPAPISSE streamt Server-Sent Events.

Spezifikationen & Referenzen

Maßgebliche Quellen für die Protokolle, die diese Komponente implementiert.

Dokumentation & Demos

Springe direkt zur Komponentenreferenz, hole dir das sofort lauffähige Demo-Projekt und lade die Testversion herunter.

Online-Hilfe — Ollama Vollständige Referenz zu Eigenschaften, Methoden und Ereignissen dieser Komponente.
Demo-Projekt — Demos\AI\Ollama Sofort lauffähiges Beispielprojekt. Wird im sgcWebSockets-Paket mitgeliefert — lade unten die Testversion herunter.
Benutzerhandbuch (PDF) Umfassendes Handbuch, das jede Komponente der Bibliothek abdeckt.

Bereit, lokale LLMs mit Ollama auszuführen?

Lade die kostenlose Testversion herunter und beginne in wenigen Minuten zu entwickeln.