0%

gen_image

gen_image

gen_image 是一個結合語言模型與圖像生成的工具。可根據使用者的提示詞(prompt)生成圖片,或根據現有圖片進行編輯。支援 OpenAI、Azure OpenAI 及 Gemini 圖像模型,並可自訂圖片品質、尺寸與儲存路徑。

目前僅支援 openai/azure openai 及 gemini(如 model=”gemini:gemini-2.0-flash-preview-image-generation”)

  • 若使用 openai 受保護模型(如 “gpt-image-1”),帳號需經過驗證。
  • 若使用 azure openai,請確保 .env 檔案中的 AZURE_API_VERSION 設為 "2025-04-01-preview"

gen_image 功能

  1. 圖片生成:根據提示詞生成圖片,支援多種模型與格式。
  2. 圖片編輯:可根據提示詞對現有圖片進行編輯,支援單張或多張圖片。
  3. 自訂參數:可設定圖片品質(high/medium/low)、尺寸(如 256x256, 512x512, 1024x1024)、儲存路徑等。
  4. 日誌保存:可選擇是否顯示詳細過程與結果。

gen_image 範例

生成圖片

1
2
3
4
5
6
7
8
9
import akasha

# 生成圖片,可選擇模型、品質、尺寸與儲存路徑
save_path = akasha.gen_image(
prompt="一隻可愛的絨毛娃娃,是北海道的長尾山雀,坐在白雪的樹枝上唱歌",
model="gemini:gemini-2.0-flash-preview-image-generation",
save_path="長尾山雀.png",
env_file=".env3",
)

編輯圖片

1
2
3
4
5
6
7
8
9
10
import akasha

# 編輯現有圖片,可為單張或多張
save_path = akasha.edit_image(
model="openai:gpt-image-1",
prompt="增加一隻可愛的鯊魚娃娃在旁邊",
images="長尾山雀.png",
save_path="鯊鯊.png",
env_file=".env3",
)

gen_image 參數

gen_image 初始化參數

prompt: str

生成圖片的提示詞。

save_path: str

圖片儲存路徑,可為 .png、.jpeg、.webp 等格式,預設為 “./image.png”。

model: str

使用的圖像生成模型,例如 "openai:gpt-image-1""gemini:gemini-2.0-flash-preview-image-generation"

size: str

圖片尺寸(如 “256x256”、”512x512”、”1024x1024”),預設為 “auto”。

quality: str

圖片品質,可選 “high”、”medium”、”low”,預設為 “auto”。

verbose: bool

是否顯示詳細過程,預設為 False。

env_file: str

指定 .env 環境設定檔的路徑。


edit_image 初始化參數

prompt: str

編輯圖片的提示詞。

images: list[str] | str | Path

要編輯的圖片路徑,可為單張或多張。

save_path: str

編輯後圖片儲存路徑,預設為 “./image.png”。

model: str

使用的圖像生成模型,預設為 "openai:gpt-image-1"

size: str

圖片尺寸,預設為 “auto”。

quality: str

圖片品質,預設為 “auto”。

verbose: bool

是否顯示詳細過程,預設為 False。

env_file: str

指定 .env 環境設定檔的路徑。


日誌與結果

  • 生成或編輯過程與結果可選擇顯示於終端機。
  • 圖片將儲存於指定路徑。

相關連結