概要 - Ollama API (日本語)

POST /api/generate

指定されたモデルを使用して、与えられたプロンプトに対する応答を生成します。これはストリーミングエンドポイントであるため、一連の応答が返されます。最終的な応答オブジェクトには、リクエストからの統計と追加データが含まれます。

model: (必須) モデル名

prompt: 応答を生成するプロンプト

suffix: モデルの応答後のテキスト

images: (オプション) base64エンコードされた画像のリスト (例：llavaのようなマルチモーダルモデルの場合)

高度なパラメータ (オプション):

format: 応答を返す形式。 json または JSON schema を指定できます。

options: Modelfile のドキュメントに記載されている追加のモデルパラメータ (例：temperature)

system: システムメッセージ (Modelfile で定義されたものを上書きします)

template: 使用するプロンプトテンプレート (Modelfile で定義されたものを上書きします)

stream: false の場合、応答はオブジェクトのストリームではなく、単一の応答オブジェクトとして返されます

raw: true の場合、プロンプトにフォーマットは適用されません。 API へのリクエストで完全にテンプレート化されたプロンプトを指定する場合は、raw パラメータを使用できます。

keep_alive: リクエスト後、モデルがメモリにロードされた状態を維持する時間を制御します (デフォルト: 5m)

context (非推奨): /generate への以前のリクエストから返された context パラメータ。短い会話の記憶を保持するために使用できます。

構造化された出力は、format パラメータで JSON schema を提供することでサポートされます。モデルは、schema に一致する応答を生成します。以下の構造化された出力の例を参照してください。

format パラメータを json に設定して、JSON モードを有効にします。これにより、応答が有効な JSON オブジェクトとして構造化されます。 JSON モードの例を以下に示します。

重要

prompt で JSON を使用するようにモデルに指示することが重要です。そうしないと、モデルが大量の空白を生成する可能性があります。

概要