画像メタ情報解析

概要

画像インスペクターは現在、PNGとJPG形式をサポートしています。Stable Diffusionで生成された画像(注:SD生成画像である必要があります)からプロンプトとComfyUIワークフローを読み取ることができます。

JPGファイル形式

JPG形式の画像は複雑なマーカーシステムで構成されており、以下を含みます:

  • SOI (Start of Image)EOI (End of Image):画像の開始と終了を示します。
  • DQT (Define Quantization Table):量子化テーブルを定義し、画像圧縮に重要です。
  • SOF (Start of Frame):画像の基本的な属性(幅、高さ、色など)を記述します。
  • DHT (Define Huffman Table):データエンコーディング用のハフマン符号化テーブルを定義します。
  • SOS (Start of Scan):画像またはその構成要素のスキャン開始を示します。
  • APP1:このマーカーは通常、EXIF(Exchangeable Image File Format)情報を格納するために使用され、撮影時刻、カメラ設定、サムネイル、その他のメタデータが含まれます。

PNGファイル形式

PNG形式の画像は8バイトのシグネチャで始まり、その後に複数のデータチャンクが続きます:

  • IHDR:画像ヘッダーチャンク、画像の基本情報(幅、高さ、ビット深度、カラータイプなど)を含みます。
  • PLTE:パレットチャンク、インデックスカラー画像に使用されます。
  • IDAT:画像データチャンク、実際の画像データを含みます。
  • IEND:画像終了チャンク、ファイルの終わりを示します。

さらに、PNG形式はメタデータ用のテキストチャンクをサポートしています:

  • tEXt:ISO/IEC 8859-1エンコーディングの非圧縮テキスト情報を格納します。
  • zEXt:tEXtと同様ですが、内容が圧縮されています。
  • iTXt:UTF-8エンコーディングの国際化テキストチャンクをサポートし、圧縮または非圧縮テキストを含み、言語と翻訳を指定できます。

Stable Diffusion WebUIComfyUI で画像を生成する際、prompt情報は画像のメタデータに格納されます。JPEG画像ではこの情報はEXIFセグメントに、PNG形式ではiTXt、tEXt、またはzEXtチャンクに格納されます。

😉 腾讯云产品特惠热卖,戳我领取

评论

ホーム - Wiki
Copyright © 2011-2025 iteam. Current version is 2.142.0. UTC+08:00, 2025-02-28 20:18
浙ICP备14020137号-1 $お客様$