Google CloudのImagenでプロンプト書き換えツールを利用する 🔗
tl;dr 🔗
- Imagenにプロンプトの書き換え機能が存在しているが日本語だと70文字弱くらいまでのプロンプトなら良いように書き換えてくれそう
- プロンプト強化機能でアウトプットされる画像はプロンプトが日本語だと全く関係のない画像が返ってくる(Imagen3しか確認していない)
- プロンプト強化機能は、作りたいものを短めなプロンプトとして入力して、強化された戻り値を確認して画像生成に必要な要素を抽出するという程度の使い方が今のところベスト
code 🔗
Cloudshellで実行してしまうのが楽かなということで、ざっくり以下のような感じで投げつけ、アウトプットをresponse.jsonファイルに保存。そのファイルをダウンロードして閲覧した。
理由はレスポンスに書き換えられたプロンプトで作成した画像のバイナリデータがくっついてくるためコンソール上ではパッと確認出来ないこともあるので。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d '{
"instances": [
{
"prompt": "適当なプロンプト"
}
],
"parameters": {
"sampleCount": 1,
"enhancePrompt": true
}
}' \
"https://{{LOCATION}}-aiplatform.googleapis.com/v1/projects/{{PROJECT_ID}}/locations/{{LOCATION}}/publishers/google/models/{{MODEL_VERSION}}:predict"
-o response.json
|
参考 🔗