Visor de Metadatos de Imágenes

Introducción

El Inspector de Imágenes actualmente soporta formatos PNG y JPG. Puede leer prompts y flujos de trabajo de ComfyUI desde imágenes generadas por Stable Diffusion (nota: deben ser imágenes generadas por SD).

Formato de archivo JPG

Las imágenes en formato JPG están compuestas por un sistema complejo de marcadores, incluyendo:

  • SOI (Start of Image) y EOI (End of Image): Marcan el inicio y fin de la imagen.
  • DQT (Define Quantization Table): Define tablas de cuantificación, cruciales para la compresión de imagen.
  • SOF (Start of Frame): Describe propiedades básicas de la imagen (ancho, alto, color, etc.).
  • DHT (Define Huffman Table): Define tablas de codificación Huffman para la codificación de datos.
  • SOS (Start of Scan): Marca el inicio del escaneo de la imagen o componentes de la imagen.
  • APP1: Este marcador se usa típicamente para almacenar información EXIF (Exchangeable Image File Format), incluyendo tiempo de captura, configuración de cámara, miniaturas y otros metadatos.

Formato de archivo PNG

Las imágenes en formato PNG comienzan con una firma de 8 bytes seguida de múltiples bloques de datos:

  • IHDR: Bloque de encabezado de imagen, contiene información básica (ancho, alto, profundidad de bits, tipo de color, etc.).
  • PLTE: Bloque de paleta, usado para imágenes de color indexado.
  • IDAT: Bloque de datos de imagen, contiene los datos reales de la imagen.
  • IEND: Bloque de fin de imagen, marca el final del archivo.

Además, el formato PNG soporta bloques de texto para metadatos:

  • tEXt: Almacena información de texto sin comprimir en codificación ISO/IEC 8859-1.
  • zEXt: Similar a tEXt, pero con contenido comprimido.
  • iTXt: Soporta bloques de texto internacionalizados en codificación UTF-8, puede contener texto comprimido o sin comprimir, y puede especificar idioma y traducción.

Al generar imágenes a través de Stable Diffusion WebUI y ComfyUI, la información del prompt se almacena en los metadatos de la imagen. En imágenes JPEG, esta información se encuentra en el segmento EXIF, mientras que en formato PNG se almacena en bloques iTXt, tEXt o zEXt.

😉 腾讯云产品特惠热卖,戳我领取

评论

inicio - Wiki
Copyright © 2011-2025 iteam. Current version is 2.142.0. UTC+08:00, 2025-02-22 02:18
浙ICP备14020137号-1 $mapa de visitantes$