概要 - Ollama API (日本語)

POST /api/chat

提供されたモデルを使用して、チャットの次のメッセージを生成します。これはストリーミングエンドポイントであるため、一連のレスポンスが返されます。 "stream": false を使用してストリーミングを無効にできます。最終的なレスポンスオブジェクトには、リクエストからの統計と追加データが含まれます。

パラメータ

model: (必須) モデル名

messages: チャットのメッセージ。チャットのメモリを保持するために使用できます。

tools: モデルがサポートしている場合にモデルが使用するJSON形式のツールのリスト

message オブジェクトには、次のフィールドがあります。

role: メッセージのロール。system、user、assistant、または tool のいずれか

content: メッセージのコンテンツ

images (オプション): メッセージに含める画像のリスト（llavaなどのマルチモーダルモデルの場合）

tool_calls (オプション): モデルが使用したいJSON形式のツールのリスト

高度なパラメータ（オプション）：

format: レスポンスを返す形式。形式は json または JSON スキーマにすることができます。

options: Modelfile のドキュメントにリストされている追加のモデルパラメータ（temperatureなど）

stream: false の場合、レスポンスはオブジェクトのストリームではなく、単一のレスポンスオブジェクトとして返されます。

keep_alive: リクエスト後、モデルがメモリにロードされた状態を維持する時間を制御します (デフォルト: 5m)

構造化された出力

構造化された出力は、format パラメータに JSON スキーマを提供することでサポートされます。モデルは、スキーマに一致するレスポンスを生成します。下記のチャットリクエスト (構造化された出力) の例を参照してください。

概要

パラメータ#

構造化された出力#

パラメータ

構造化された出力