Apple presenta STARFlow: nueva IA para generación eficiente de imágenes

Apple presenta STARFlow: nueva IA para generación eficiente de imágenes
Créditos de la imagen Bitsdeeric hecho con Copilot

Apple ha presentado un avance significativo en inteligencia artificial con el desarrollo de STARFlow, una tecnología para la generación de imágenes a alta resolución.

Según un informe técnico publicado hace poco tiempo por investigadores académicos y miembros del equipo de aprendizaje automático (ML) de Apple, este sistema combina flujos normalizantes con transformadores autoregresivos para lograr rendimiento competitivo en comparación con los modelos difusores basados en redes generativas adversarias (GANs), como DALL-E y Midjourney.

El trabajo demuestra que STARFlow es capaz de funcionar efectivamente a gran escala, lo cual era un desafío clave para la aplicación de flujos normalizantes con imágenes altamente detalladas. Los investigadores destacan: "Este trabajo representa el primer éxito documentado en operar eficacemente flujos normalizantes a esta magnitud y resolución."

La tecnología STARFlow introduce una arquitectura de diseño profundo-shallow, donde un bloque transformador profundo captura la mayor parte de las capacidades representativas del modelo. Esta innovación se complementa con pocos bloques transformadores más superficiales que son eficientes computacionalmente pero ofrecen beneficios significativos.

Además, STARFlow opera en el espacio latente de codificadores autoconducidos (autoencoders) previamente entrenados. Esta estrategia se ha demostrado más efectiva que modelar directamente los datos a nivel de píxeles, permitiendo una mayor eficiencia.

El sistema mantiene las propiedades matemáticas inherentes de los flujos normalizantes, lo que permite un entrenamiento exacto del máximo log-likelihood en espacios continuos sin necesidad de discretización. Esta característica podría ser ventajosa para ciertas aplicaciones.

La investigación también refleja la estrategia de Apple a través de colaboraciones académicas con instituciones como Georgia Tech y The University of California, Berkeley, así como con investigadores reconocidos en el campo (por ejemplo, Laurent Dinh). Esta cooperación busca desarrollar capacidades AI distintivas.

El equipo del proyecto incluye a Jiatao Gu, Joshua M. Susskind y Shuangfei Zhai de Apple ML Research, junto con Tianrong Chen (doctorando en Georgia Tech) y Ruixiang Zhang (Departamento de Matemáticas de U.C. Berkeley).

Aunque STARFlow representa un notable avance técnico para la generación de imágenes a gran escala mediante flujos normalizantes, el verdadero desafío será si Apple puede integrar estas capacidades en sus productos principales y competir efectivamente con otras empresas destacadas.

📌 Fuente: VentureBeat