Parti Generator de Google se basa en 20 mil millones de entradas para crear imágenes fotorrealistas

Parti Generator de Google se basa en 20 mil millones de entradas para crear imágenes fotorrealistas
Parti Generator de Google se basa en 20 mil millones de entradas para crear imágenes fotorrealistas

Google presentó el jueves su modelo de computadora de texto a imagen Parti, que genera imágenes hiperrealistas al estudiar decenas de miles de millones de entradas.

Pathways Autoregressive Text-to-Image, o Parti, estudia conjuntos de imágenes, que Google llama “tokens de imagen”, usándolos para construir nuevas imágenes, dijo el gigante de las búsquedas en un sitio web de investigación. Las imágenes de Parti se vuelven más realistas cuando tiene más parámetros (fichas y otro material de capacitación) para revisar. El modelo estudia 20 mil millones de parámetros antes de generar una imagen final.

Parti difiere de Imagen, un generador de texto a imagen que Google diseñó para utilizar el aprendizaje por difusión. El proceso entrena modelos de computadora agregando “ruido” a una imagen para que se oscurezca, como si estuviera estática en una pantalla de televisión. Luego, el modelo aprende a decodificar la estática para recrear la imagen original. A medida que el modelo mejora, puede convertir lo que parece una serie de puntos aleatorios en una imagen.

Google no está lanzando Parti o Imagen al público porque los conjuntos de datos de IA conllevan el riesgo de sesgo. Debido a que los conjuntos de datos son creados por seres humanos, sin darse cuenta pueden apoyarse en estereotipos o tergiversar ciertos grupos. Google dice que tanto Parti como Imagen tienen un sesgo hacia los estereotipos occidentales.

Google se refirió a una publicación de blog de la empresa cuando se le pidió que comentara esta historia.

El gigante de las búsquedas ha invertido mucho en inteligencia artificial como una forma de mejorar sus servicios y desarrollar la computación ambiental, una forma de tecnología tan intuitiva que se convierte en parte de un segundo plano. En su conferencia de desarrolladores de I/O en mayo, el CEO Sundar Pichai dijo que la IA se está utilizando para ayudar a Google Translate a agregar idiomas, crear imágenes 3D en Maps y condensar documentos en resúmenes rápidos.

Parti e Imagen no son los únicos modelos de texto a imagen que existen. Los modelos Dall-E, VQ-GAN+CLIP y Latent Diffusion son otros modelos de texto a imagen que no pertenecen a Google y que han aparecido recientemente en los titulares. Dall-E Mini es una IA de texto a imagen de código abierto que está disponible para el público, pero está entrenada en conjuntos de datos más pequeños.

The article is in English

Tags: Parti Generator Google basa mil millones entradas para crear imágenes fotorrealistas

.

PREV Obtenga la actualización de junio de 2022 de EMUI 12 para Huawei P40 Pro
NEXT AMD empuja FSR 2.0 a los desarrolladores de Xbox, los desarrolladores de PS5 están en la oscuridad