gen_image
gen_image
是一個結合語言模型與圖像生成的工具。可根據使用者的提示詞(prompt)生成圖片,或根據現有圖片進行編輯。支援 OpenAI、Azure OpenAI 及 Gemini 圖像模型,並可自訂圖片品質、尺寸與儲存路徑。
目前僅支援 openai/azure openai 及 gemini(如 model=”gemini:gemini-2.0-flash-preview-image-generation”)
- 若使用 openai 受保護模型(如 “gpt-image-1”),帳號需經過驗證。
- 若使用 azure openai,請確保
.env
檔案中的AZURE_API_VERSION
設為"2025-04-01-preview"
。
gen_image 功能
- 圖片生成:根據提示詞生成圖片,支援多種模型與格式。
- 圖片編輯:可根據提示詞對現有圖片進行編輯,支援單張或多張圖片。
- 自訂參數:可設定圖片品質(high/medium/low)、尺寸(如 256x256, 512x512, 1024x1024)、儲存路徑等。
- 日誌保存:可選擇是否顯示詳細過程與結果。
gen_image 範例
生成圖片
1 | import akasha |
編輯圖片
1 | import akasha |
gen_image 參數
gen_image 初始化參數
prompt: str
生成圖片的提示詞。
save_path: str
圖片儲存路徑,可為 .png、.jpeg、.webp 等格式,預設為 “./image.png”。
model: str
使用的圖像生成模型,例如 "openai:gpt-image-1"
或 "gemini:gemini-2.0-flash-preview-image-generation"
。
size: str
圖片尺寸(如 “256x256”、”512x512”、”1024x1024”),預設為 “auto”。
quality: str
圖片品質,可選 “high”、”medium”、”low”,預設為 “auto”。
verbose: bool
是否顯示詳細過程,預設為 False。
env_file: str
指定 .env
環境設定檔的路徑。
edit_image 初始化參數
prompt: str
編輯圖片的提示詞。
images: list[str] | str | Path
要編輯的圖片路徑,可為單張或多張。
save_path: str
編輯後圖片儲存路徑,預設為 “./image.png”。
model: str
使用的圖像生成模型,預設為 "openai:gpt-image-1"
。
size: str
圖片尺寸,預設為 “auto”。
quality: str
圖片品質,預設為 “auto”。
verbose: bool
是否顯示詳細過程,預設為 False。
env_file: str
指定 .env
環境設定檔的路徑。
日誌與結果
- 生成或編輯過程與結果可選擇顯示於終端機。
- 圖片將儲存於指定路徑。