概要
POST /api/generate
パラメータ
model
: (必須) モデル名prompt
: 応答を生成するプロンプトsuffix
: モデルの応答後のテキストimages
: (オプション) base64エンコードされた画像のリスト (例:llava
のようなマルチモーダルモデルの場合)format
: 応答を返す形式。 json
または JSON schema を指定できます。options
: Modelfile のドキュメントに記載されている追加のモデルパラメータ (例:temperature
)system
: システムメッセージ (Modelfile で定義されたものを上書きします)template
: 使用するプロンプトテンプレート (Modelfile で定義されたものを上書きします)stream
: false
の場合、応答はオブジェクトのストリームではなく、単一の応答オブジェクトとして返されますraw
: true
の場合、プロンプトにフォーマットは適用されません。 API へのリクエストで完全にテンプレート化されたプロンプトを指定する場合は、raw
パラメータを使用できます。keep_alive
: リクエスト後、モデルがメモリにロードされた状態を維持する時間を制御します (デフォルト: 5m
)context
(非推奨): /generate
への以前のリクエストから返された context パラメータ。短い会話の記憶を保持するために使用できます。構造化された出力
format
パラメータで JSON schema を提供することでサポートされます。 モデルは、schema に一致する応答を生成します。 以下の 構造化された出力 の例を参照してください。JSON モード
format
パラメータを json
に設定して、JSON モードを有効にします。 これにより、応答が有効な JSON オブジェクトとして構造化されます。 JSON モードの例を以下に示します。prompt
で JSON を使用するようにモデルに指示することが重要です。 そうしないと、モデルが大量の空白を生成する可能性があります。