Saltar para o conteúdo

Uni-1: Que nova IA é esta que desafia a Nano Banana da Google na criação de imagens?

Pessoa a trabalhar em design gráfico num computador com tablet e headphones numa mesa branca junto a uma janela.

A Luma apresentou uma nova IA de geração de imagem que, segundo um benchmark, supera as capacidades do Nano Banana 2.

Uni-1 da Luma: um novo candidato a referência para profissionais de geradores de imagem

Poderá o Uni-1 tornar-se a próxima ferramenta de eleição para profissionais que recorrem a geradores de imagens? Esta IA - ainda pouco conhecida fora de círculos especializados - foi recentemente divulgada pela Luma, uma empresa que disponibiliza soluções de inteligência artificial orientadas para tarefas criativas no contexto empresarial. O Uni-1 é o primeiro modelo da Luma a combinar compreensão e geração num único sistema.

Segundo a empresa:

“A inteligência geral exige a capacidade de raciocinar e imaginar, de manipular símbolos e de simular mundos. Nos humanos, estas competências são muitas vezes descritas como funções do hemisfério esquerdo e do hemisfério direito do cérebro, abrangendo desde a linguagem e a lógica até à percepção espacial e à criatividade. Os sistemas de IA actuais - desde LLM a geradores de imagem e simuladores de mundos - dominaram algumas destas capacidades, mas de forma isolada.”

Uma abordagem unificada: raciocinar antes e durante a geração de imagem

Com esta estratégia, a Luma diz querer unificar num só sistema capacidades que, até aqui, tendem a existir separadamente. No Uni-1, o raciocínio acontece antes e também durante a criação da imagem, o que, de acordo com a empresa, permite:

  • Gerar imagens altamente realistas;
  • Seguir um raciocínio espacial com maior consistência;
  • Ser fácil de orientar e controlar, por exemplo através de uma imagem de referência;
  • Aplicar estilos específicos preservando a identidade de um objecto, algo que a Luma descreve como um modelo mais “culto” (no sentido de compreender e manter características visuais ao longo das variações).

Na prática, esta combinação de compreensão e geração pode ser particularmente relevante em fluxos de trabalho profissionais, onde não basta “obter algo bonito”: é frequente ser necessário respeitar composição, geometria, continuidade visual, e ainda manter elementos de marca (como produto, embalagem, logótipo ou cenário) com consistência.

Uni-1 ultrapassa Nano Banana 2 no benchmark RISEBench

Além de detalhar a sua nova abordagem, a Luma partilhou resultados de avaliação do Uni-1 no RISEBench, um benchmark que mede a capacidade dos modelos em montagem visual iluminada pelo raciocínio (RISE). De acordo com os dados divulgados pela empresa, o Uni-1 obteve uma pontuação média superior à de Nano Banana 2, Nano Banana Pro (Google) e GPT Image 1.5.

Embora benchmarks como o RISEBench sejam úteis para comparar tendências de desempenho em tarefas específicas, o valor real para equipas criativas e de produto costuma depender de factores adicionais: controlabilidade por prompt, consistência entre iterações, fidelidade a referências, e integração no pipeline (por exemplo, com ferramentas de edição, DAM e revisão).

Para além de imagens estáticas: vídeo, agentes de voz e modelos do mundo

A Luma afirma também que não pretende limitar o seu modelo unificado à geração de imagens estáticas. A empresa diz querer aplicar a mesma abordagem à geração de vídeo, a agentes de IA com voz e até à criação de modelos do mundo.

Num cenário empresarial, esta evolução pode significar experiências mais completas: desde conteúdos audiovisuais com coerência narrativa e visual, até assistentes que compreendem contexto multimodal (texto, imagem e áudio) e actuam de forma mais consistente em tarefas criativas e operacionais.

Implicações práticas: qualidade, controlo e responsabilidade

Se a proposta de unificação do Uni-1 se traduzir em resultados previsíveis em produção, pode trazer ganhos claros para áreas como publicidade, e-commerce e design: menos tentativas até chegar ao resultado certo, maior respeito por regras de composição e, potencialmente, menos retrabalho em pós-produção.

Ao mesmo tempo, a adopção de modelos de geração de imagem em ambientes profissionais continua a exigir atenção a temas como direitos de utilização de conteúdos, gestão de dados de referência e governança interna (por exemplo, quem aprova variações, como se audita o processo criativo e como se garante consistência de marca).

Comentários

Ainda não há comentários. Seja o primeiro!

Deixar um comentário