画像メタ情報解析
概要
画像インスペクターは現在、PNGとJPG形式をサポートしています。Stable Diffusionで生成された画像(注:SD生成画像である必要があります)からプロンプトとComfyUIワークフローを読み取ることができます。
JPGファイル形式
JPG形式の画像は複雑なマーカーシステムで構成されており、以下を含みます:
- SOI (Start of Image) と EOI (End of Image):画像の開始と終了を示します。
- DQT (Define Quantization Table):量子化テーブルを定義し、画像圧縮に重要です。
- SOF (Start of Frame):画像の基本的な属性(幅、高さ、色など)を記述します。
- DHT (Define Huffman Table):データエンコーディング用のハフマン符号化テーブルを定義します。
- SOS (Start of Scan):画像またはその構成要素のスキャン開始を示します。
- APP1:このマーカーは通常、EXIF(Exchangeable Image File Format)情報を格納するために使用され、撮影時刻、カメラ設定、サムネイル、その他のメタデータが含まれます。
PNGファイル形式
PNG形式の画像は8バイトのシグネチャで始まり、その後に複数のデータチャンクが続きます:
- IHDR:画像ヘッダーチャンク、画像の基本情報(幅、高さ、ビット深度、カラータイプなど)を含みます。
- PLTE:パレットチャンク、インデックスカラー画像に使用されます。
- IDAT:画像データチャンク、実際の画像データを含みます。
- IEND:画像終了チャンク、ファイルの終わりを示します。
さらに、PNG形式はメタデータ用のテキストチャンクをサポートしています:
- tEXt:ISO/IEC 8859-1エンコーディングの非圧縮テキスト情報を格納します。
- zEXt:tEXtと同様ですが、内容が圧縮されています。
- iTXt:UTF-8エンコーディングの国際化テキストチャンクをサポートし、圧縮または非圧縮テキストを含み、言語と翻訳を指定できます。
Stable Diffusion WebUI と ComfyUI で画像を生成する際、prompt
情報は画像のメタデータに格納されます。JPEG画像ではこの情報はEXIFセグメントに、PNG形式ではiTXt、tEXt、またはzEXtチャンクに格納されます。
😉 腾讯云产品特惠热卖,戳我领取!