Ollama Local LLM

Uruchamiaj lokalnie otwartoźródłowe duże modele językowe z aplikacji Delphi, C++ Builder i .NET. Inferencja pozostaje prywatna, offline i on-premise, wykonując się na Twoim własnym sprzęcie bez konieczności korzystania z chmurowego API.

TsgcHTTP_API_Ollama

Klient Ollama REST API do lokalnego uzupełniania czatu, embeddingów i zarządzania modelami.

Klasa komponentu

TsgcHTTP_API_Ollama

Protokół

Ollama REST API przez HTTP

Platformy

Windows, macOS, Linux, iOS, Android

Edycja

Enterprise (dodatek AI)

Upuść komponent, skieruj go na localhost, gotowe

Ollama działa lokalnie i nie wymaga klucza API. Ustaw OllamaOptions.BaseUrl na swój lokalny serwer (domyślnie http://localhost:11434/api), a następnie wywołaj _CreateMessage albo zbuduj TsgcOllamaClass_Request_ChatCompletion i wywołaj CreateMessage.

uses
  sgcHTTP_API_Ollama;

var
  Ollama: TsgcHTTP_API_Ollama;
begin
  Ollama := TsgcHTTP_API_Ollama.Create(nil);
  // Local server, no API key needed
  Ollama.OllamaOptions.BaseUrl := 'http://localhost:11434/api';

  // Simple one-shot message
  Memo1.Lines.Text := Ollama._CreateMessage(
    'llama3',
    'What are the benefits of WebSockets?');

  // Streaming — handle OnHTTPAPISSE per chunk
  Ollama.OnHTTPAPISSE := HandleSSE;
  Ollama._CreateMessageStream(
    'llama3',
    'Summarise RFC 6455');
end;

procedure TForm1.HandleSSE(Sender: TObject;
  const aEvent, aData: string;
  var Cancel: Boolean);
begin
  Memo1.Lines.Add(aEvent + ': ' + aData);
end;
// uses: sgcHTTP_API_Ollama
TsgcHTTP_API_Ollama *Ollama = new TsgcHTTP_API_Ollama(this);
// Local server, no API key needed
Ollama->OllamaOptions->BaseUrl = "http://localhost:11434/api";

// Simple one-shot message
Memo1->Lines->Text = Ollama->_CreateMessage(
  "llama3",
  "What are the benefits of WebSockets?");

// Streaming — OnHTTPAPISSE fires per chunk
Ollama->OnHTTPAPISSE = HandleSSE;
Ollama->_CreateMessageStream(
  "llama3",
  "Summarise RFC 6455");
using esegece.sgcWebSockets;

var ollama = new TsgcHTTPAPI_Ollama();
// Local server, no API key needed
ollama.OllamaOptions.BaseUrl = "http://localhost:11434/api";

// Simple one-shot message
Console.WriteLine(ollama._CreateMessage(
  "llama3",
  "What are the benefits of WebSockets?"));

// Streaming via Server-Sent Events
ollama.OnHTTPAPISSE += (sender, ev, data, cancel) => Console.Write(data);
ollama._CreateMessageStream(
  "llama3",
  "Summarise RFC 6455");

Co jest w środku

Typowane klasy żądania / odpowiedzi dla uzupełniania czatu i embeddingów, a także zarządzanie modelami i strumieniowanie przez Server-Sent Events.

Wiadomości i czat

CreateMessage wysyła typowane TsgcOllamaClass_Request_ChatCompletion i zwraca sparsowaną odpowiedź. _CreateMessage, _CreateMessageWithSystem i _CreateMessageStream to skróty na łańcuchach, z deltami strumieniowymi dostarczanymi przez OnHTTPAPISSE.

Embeddings

CreateEmbeddings zamienia tekst wejściowy w gęsty wektor przy użyciu lokalnie pobranego modelu embeddingowego, takiego jak nomic-embed-text lub mxbai-embed-large, zwracając TsgcOllamaClass_Response_Embeddings.

Modele

Zarządzaj modelami na swojej maszynie: _GetModels i _GetTags wymieniają to, co jest dostępne, _ShowModel odczytuje szczegóły modelu, _PullModel pobiera z biblioteki Ollama, a _DeleteModel usuwa lokalny model.

Lokalnie i prywatnie

Każde żądanie kierowane jest do lokalnego serwera Ollama (domyślnie http://localhost:11434/api), dzięki czemu żadne dane nie opuszczają Twojej sieci i nie jest wymagany klucz API. Skieruj OllamaOptions.BaseUrl na zdalną lub skonteneryzowaną instancję, gdy zajdzie taka potrzeba.

Niezawodność i diagnostyka

CircuitBreaker krótkozwiera żądania, gdy serwer jest niesprawny; ReadTimeout i TLSOptions dostrajają warstwę HTTP/HTTPS; OnHTTPAPIException ujawnia błędy; OnHTTPAPISSE strumieniuje zdarzenia Server-Sent Events.

Specyfikacje i źródła

Autorytatywne źródła protokołów implementowanych przez ten komponent.

Dokumentacja i wersje demo

Deep-link do dokumentacji komponentu, gotowy do uruchomienia projekt demonstracyjny i pobranie wersji próbnej.

Pomoc online — Ollama Pełna dokumentacja właściwości, metod i zdarzeń tego komponentu.
Projekt demonstracyjny — Demos\AI\Ollama Gotowy do uruchomienia projekt przykładowy. Dostarczany wewnątrz pakietu sgcWebSockets — pobierz wersję próbną poniżej.
Podręcznik użytkownika (PDF) Kompleksowy podręcznik obejmujący każdy komponent biblioteki.

Gotowy uruchamiać lokalne LLM z Ollama?

Pobierz bezpłatną wersję próbną i zacznij budować w kilka minut.