O Melhor Fluxo de Trabalho de Design com Gemini 3

AAI LABS
컴퓨터/소프트웨어마케팅/광고AI/미래기술

Transcript

00:00:00com o quão poderosa a IA generativa se tornou.
00:00:02Novas ferramentas estão surgindo constantemente e,
00:00:04dentre todas,
00:00:04o Google realmente elevou o nível desde que o Gemini 3 foi lançado.
00:00:07Por causa disso,
00:00:08você provavelmente viu pessoas no X criando essas landing pages incríveis de uma só vez e dizendo que o modelo é revolucionário.
00:00:14Mas elas estão mentindo.
00:00:15A verdade é que elas precisam usar várias ferramentas para construir esses sites.
00:00:18E o Google tem lançado muitas ferramentas experimentais,
00:00:20que são alimentadas pelo Gemini 3 e Nano Banana.
00:00:23Mas o Google não oferece uma maneira de usá-las todas juntas.
00:00:26Então você vai precisar de um fluxo de trabalho completo que combine todas essas ferramentas.
00:00:29Temos muito o que falar hoje,
00:00:30pois eu realmente não esperava que elas funcionassem tão bem juntas.
00:00:34As animações que você vê nesses sites são apenas uma série de frames.
00:00:37Mas se você usar ferramentas de IA para gerar esses frames,
00:00:39não obtém resultados consistentes.
00:00:41O Google resolve isso lançando uma ferramenta experimental chamada WISC,
00:00:44que é especialmente projetada para geração de recursos.
00:00:47Ela é alimentada pelo Nano Banana para geração de imagens.
00:00:49Eu frequentemente uso o WISC para gerar sequências de imagens para seções hero.
00:00:53Eu forneço prompts com palavras simples,
00:00:55atualizo os detalhes passo a passo para cada sequência e depois uso as imagens resultantes nas seções hero.
00:01:01Usando todo esse processo,
00:01:02criei esta landing page e consegui implementar esse efeito animado legal com a câmera.
00:01:07Para começar,
00:01:07vamos gerar apenas o primeiro e o último frames de uma sequência e depois criar uma animação usando esses dois keyframes para a seção hero.
00:01:14Mas se você começar a criar prompts sem nenhuma estrutura,
00:01:17os keyframes que você quer não terão a mesma continuidade estrutural.
00:01:20Para isso,
00:01:21você precisa definir claramente o assunto,
00:01:23a intenção visual e o nível de detalhe que deseja na imagem.
00:01:26O WISC usa uma estrutura de assunto,
00:01:28cena e estilo para orientar a geração de imagens,
00:01:30permitindo que você os combine em um único novo visual.
00:01:33Por isso incluí todos os detalhes sobre o tipo de câmera que eu queria,
00:01:36como eu queria que os reflexos na lente ficassem,
00:01:39a resolução e a profundidade da imagem,
00:01:41e ele criou o visual exatamente como o prompt descreveu.
00:01:44A imagem gerada nem sempre atenderá às suas expectativas.
00:01:47Nesse caso,
00:01:48você só precisa mencionar a mudança com palavras simples,
00:01:50e ele incorpora as alterações em um novo visual.
00:01:53O que eu mais gosto no WISC é que você não precisa escrever prompts longos e detalhados para obter ótimos resultados.
00:01:58Isso acontece porque ele usa o Gemini 3 como uma camada intermediária,
00:02:01que escreve o prompt detalhado em cima das suas palavras simples,
00:02:04resultando em visuais sólidos.
00:02:05Agora surge a questão de por que escolhi o WISC.
00:02:08Enquanto o Nano Banana requer prompts de texto extensos,
00:02:10e o Mix Board do Google é projetado para mood boards,
00:02:13nenhum dos dois é otimizado para remixagem de imagens rápida e controlada.
00:02:16A grande vantagem do WISC está em combinar imagens de referência,
00:02:19permitindo que você gere imagens com melhor controle.
00:02:21Assim que tive meu primeiro frame,
00:02:23eu queria que meu último frame fosse um ângulo lateral da câmera,
00:02:26com a lente desmontada para mostrar os componentes.
00:02:28Então pedi para ele gerar uma vista técnica explodida,
00:02:30especificando como deveria dispor as lentes internas em camadas e como o fundo deveria aparecer.
00:02:35Não acertou de primeira.
00:02:37Ele também desmontou a parte interna dos circuitos,
00:02:38o que eu não queria que mostrasse.
00:02:40Como eu disse antes,
00:02:41você apenas menciona a mudança que precisa fazer.
00:02:42Então instruí para mostrar apenas as camadas das lentes,
00:02:45depois do que ele gerou com sucesso a imagem sem mostrar os circuitos internos.
00:02:49Agora, o WISC também suporta animações usando o modelo VIO.
00:02:53Mas as animações do WISC focam em animar uma imagem,
00:02:55em vez de conseguir conectar vários keyframes juntos.
00:02:58Por isso usei outra ferramenta chamada Google Flow.
00:03:01O Flow usa o Gemini para planejar a história,
00:03:02os modelos de imagem do Google para projetar personagens consistentes,
00:03:05e o VIO para criar conteúdo de vídeo.
00:03:07Eu já tinha criado meus frames inicial e final para a animação da câmera,
00:03:10e agora queria criar uma transição entre eles.
00:03:13Então usei a opção de frame para vídeo e forneci meus frames.
00:03:16Para garantir uma transição suave,
00:03:18você precisa mencionar no prompt como o quadro inicial leva ao final,
00:03:21pois isso fornece ao modelo um caminho lógico.
00:03:24Seu prompt deve incluir como você quer que a animação flua,
00:03:26como o quadro inicial deve transitar para o quadro final e o estilo de animação,
00:03:30pois esses detalhes garantem que o movimento seja intencional.
00:03:33Às vezes esses modelos tendem a cometer erros com tarefas complexas,
00:03:36então ele não acertou minha animação na primeira tentativa.
00:03:38O vídeo gerado errou completamente tanto a direção da rotação quanto o quadro final,
00:03:43tornando a transição estranha.
00:03:44A solução foi simplesmente refazer o prompt com algumas mudanças necessárias para garantir que a animação estivesse correta,
00:03:50assim como eu pedi para mudar a direção da rotação da câmera para uma transição mais suave,
00:03:54após o que ele produziu uma versão que eu queria e que baixei para usar no meu projeto.
00:03:58Agora,
00:03:58a geração de vídeos não está disponível ilimitadamente no plano gratuito porque os modelos de geração de vídeo são caros.
00:04:04Ele fornece apenas 180 créditos mensais dependendo da região.
00:04:08Como cada geração de vídeo com VIO 3.1 usa 20 créditos,
00:04:11você tem direito a até 9 vídeos por mês.
00:04:14Como os vídeos gerados pelo Flow estão em formato MP4 e não podem ser usados diretamente em seções Hero porque são mais difíceis de mapear em animações de rolagem,
00:04:22por esse motivo eu os converti para WebP usando um conversor online gratuito.
00:04:26Eu fiz o upload do vídeo MP4,
00:04:28defini as configurações de conversão para produzir o WebP animado da melhor qualidade e ele foi convertido para o formato WebP,
00:04:33que baixei para usar no meu projeto.
00:04:35Escolher WebP é importante porque,
00:04:37com isso,
00:04:37fica mais fácil mapear interações de rolagem,
00:04:40já que na web esse formato é tratado como uma imagem que não requer um wrapper de reprodutor de mídia como outros formatos exigem.
00:04:46Esses arquivos são mais compactos e oferecem desempenho aprimorado,
00:04:49tornando-os ideais para conteúdo animado de curta duração..
00:04:52Adicionei o arquivo WebP convertido ao diretório público do meu projeto Next.js recém-inicializado porque é onde todos os recursos residem no projeto.
00:05:00Agora,
00:05:01uma vez que tínhamos nossa animação pronta,
00:05:02eu queria adicioná-la à seção Hero na minha landing page.
00:05:05Geralmente faço prompts para o Claude em formato XML porque os modelos deles são otimizados para entender XML,
00:05:10permitindo que analisem a intenção estruturada de forma mais confiável e raciocinem sobre cada seção independentemente.
00:05:15O prompt que dei ao Claude para adicionar a animação incluía o contexto sobre o que eu queria construir,
00:05:20onde os recursos para a animação estavam localizados e como a animação de rolagem deveria funcionar e nosso objetivo na tag de contexto.
00:05:26Incluí todos os requisitos nas tags de requisitos,
00:05:28descrevi como a animação deveria se comportar nas tags de comportamento de animação e especifiquei os detalhes de implementação,
00:05:34restrições e saída necessária diretamente no prompt dentro de suas respectivas tags.
00:05:38Quando dei esse prompt ao Claude,
00:05:40ele implementou automaticamente a animação exatamente como eu queria.
00:05:43Embora nossa seção Hero estivesse com boa aparência,
00:05:45o restante dos componentes parecia com os sites genéricos habituais que a IA tende a gerar.
00:05:50Isso ocorre porque estávamos esperando resultados de alta qualidade a partir de CSS puro em vez de confiar em bibliotecas de componentes bonitas já existentes..
00:05:57Existem várias bibliotecas de UI,
00:05:59cada uma com seu próprio estilo especializado e temas de design,
00:06:02mas você precisa escolher a biblioteca que melhor se adapta ao estilo do seu projeto.
00:06:06Para minha landing page de câmera,
00:06:07eu estava buscando uma UI no estilo Apple e a biblioteca mais próxima dessa ideia é a Hero UI.
00:06:12Ela é construída sobre o Tailwind CSS e depende do Framer Motion para dar vida aos seus componentes em todo o site..
00:06:17A biblioteca suporta os frameworks mais comumente usados,
00:06:20como Next.js,
00:06:21Vite e Laravel.
00:06:21Então,
00:06:22usá-la com minha configuração existente do Next.js foi fácil.
00:06:25Existem dois métodos de instalação.
00:06:26Ou você instala em todo o projeto com todos os componentes disponíveis através do comando de instalação,
00:06:31ou instala componentes individuais conforme necessário,
00:06:34que foi o que fiz com o Claude.
00:06:35Pedi ao Claude para substituir os componentes existentes por componentes Hero UI e o site melhorou significativamente,
00:06:41dando ao site uma aparência e sensação muito mais profissional.
00:06:44Os usuários decidem se permanecem em uma página de destino em poucos segundos,
00:06:48observando o quão envolvente a interface é.
00:06:50Movimento ajuda a guiar a atenção do visitante para os recursos que queremos que eles notem,
00:06:54garantindo maior retenção de usuários.
00:06:56Implementar animações do zero usando JavaScript puro pode ser desafiador,
00:06:59então confio em bibliotecas existentes para simplificar o processo.
00:07:02Para este projeto,
00:07:03usei o Motion.dev,
00:07:04uma biblioteca gratuita e de código aberto que oferece uma ampla variedade de animações prontas para uso.
00:07:09Normalmente,
00:07:10as animações exigiriam sincronizar manualmente as atualizações do DOM com os tempos de animação.
00:07:14No entanto,
00:07:15o Motion.dev abstrai essa lógica lidando com as atualizações do DOM internamente.
00:07:18Ele atualiza automaticamente os componentes conforme o usuário rola a página,
00:07:22para que as animações sejam reproduzidas suavemente sem a necessidade de rastrear manualmente as posições de rolagem.
00:07:27Esta biblioteca usa componentes de movimento em vez dos padrão.
00:07:30Esses componentes têm estados inicial e final definidos nas propriedades,
00:07:34e a biblioteca lida com a lógica de transição entre eles automaticamente.
00:07:37Para nossa página de destino,
00:07:39pedi ao Claude para implementar animações de paralaxe e rolagem usando a biblioteca.
00:07:43Como resultado,
00:07:43a experiência do usuário melhorou ao guiar a atenção para as seções principais da página.
00:07:48Descrever como as seções de uma página devem parecer é um processo tedioso.
00:07:51É melhor obter inspiração de galerias existentes onde as pessoas publicam suas criações.
00:07:55Usei o 21st.dev,
00:07:56uma plataforma que oferece inspiração para uma variedade de componentes de interface construídos por vários designers.
00:08:02Os componentes são construídos sobre bibliotecas de interface populares como Aceternity UI,
00:08:06Prism UI,
00:08:06Coconut UI,
00:08:07Magic UI e muitas outras.
00:08:08Ao procurar ideias,
00:08:09encontrei esta seção de chamada para ação que ficaria ótima na minha página de destino.
00:08:13A parte que mais gosto no 21st.dev é que,
00:08:15para qualquer componente que eu queira usar,
00:08:17posso simplesmente copiar um prompt especificamente adaptado para agentes de codificação de IA.
00:08:22Não preciso guiar o Claude eu mesmo.
00:08:23O prompt é extensamente estruturado,
00:08:25incluindo requisitos do projeto,
00:08:26como suporte para ShadCN e TypeScript.
00:08:28Ele fornece código com instruções para o agente de codificação colar diretamente no diretório de componentes.
00:08:33Inclui todo o código de dependência necessário e os caminhos onde deve ser adicionado,
00:08:37e lista os pacotes NPM necessários para instalar.
00:08:40Também inclui um guia de implementação para seu agente de IA,
00:08:43detalhando todas as etapas necessárias para integrar o componente diretamente em sua aplicação e como o agente deve adaptá-lo às necessidades específicas do projeto.
00:08:50Dei este prompt ao Claude e ele integrou exatamente a mesma seção de chamada para ação para a qual eu havia copiado o prompt.
00:08:56Ele também adicionou movimento da biblioteca de movimento que havíamos instalado,
00:09:00mesmo que eu não tenha mencionado explicitamente adicionar movimento em lugar algum.
00:09:04Também obtive o rodapé do 21st.dev,
00:09:06embora o rodapé de demonstração incluísse ícones para GitHub e Twitter..
00:09:11Quando dei ao Claude o prompt copiado,
00:09:13ele omitiu o ícone do GitHub,
00:09:14já que não era relevante para o nosso projeto.
00:09:16Ele personalizou o rodapé para incluir apenas os ícones relacionados ao site do produto de câmera,
00:09:21criando um rodapé que se encaixou perfeitamente na nossa página de destino.
00:09:24Isso nos leva ao fim deste vídeo..
00:09:25Se você quiser apoiar o canal e nos ajudar a continuar fazendo vídeos como este,
00:09:29pode fazê-lo usando o botão super obrigado abaixo.
00:09:32Como sempre, obrigado por assistir e te vejo no próximo..

Key Takeaway

Este vídeo apresenta um fluxo de trabalho completo para criar landing pages profissionais combinando ferramentas experimentais do Google (WISC, Flow) com bibliotecas de UI modernas (Hero UI, Motion.dev) e assistentes de IA como Claude.

Highlights

O Google lançou ferramentas experimentais poderosas baseadas no Gemini 3 e Nano Banana, mas não oferece uma forma integrada de usá-las em conjunto

WISC é uma ferramenta experimental do Google especialmente projetada para geração consistente de recursos visuais, usando Gemini 3 como camada intermediária

Google Flow combina Gemini para planejamento, modelos de imagem para personagens consistentes e VIO para criar transições de vídeo entre keyframes

Converter vídeos MP4 para formato WebP facilita o mapeamento de animações de rolagem e melhora o desempenho em landing pages

Hero UI é uma biblioteca de componentes com estilo Apple construída sobre Tailwind CSS e Framer Motion, ideal para interfaces modernas

Motion.dev é uma biblioteca gratuita que abstrai a lógica de animação, atualizando automaticamente componentes durante a rolagem

21st.dev oferece prompts pré-estruturados para agentes de IA que incluem código, dependências e instruções completas de implementação

Timeline

Introdução ao Problema e Solução com Gemini 3

O vídeo começa discutindo como a IA generativa se tornou poderosa, destacando que o Google elevou o nível com o lançamento do Gemini 3. O apresentador revela que pessoas no X (Twitter) estão mentindo ao afirmar que criam landing pages incríveis instantaneamente, pois na verdade precisam usar múltiplas ferramentas. O Google lançou várias ferramentas experimentais alimentadas pelo Gemini 3 e Nano Banana, mas não oferece uma maneira integrada de usá-las em conjunto. Esta seção estabelece a necessidade de um fluxo de trabalho completo que combine todas essas ferramentas de forma eficiente.

WISC: Ferramenta para Geração Consistente de Frames

O apresentador explica que animações em sites são séries de frames, mas ferramentas de IA tradicionais não geram resultados consistentes. O Google resolve isso com WISC, uma ferramenta experimental projetada especificamente para geração de recursos, alimentada pelo Nano Banana. WISC usa uma estrutura de assunto, cena e estilo, permitindo criar sequências de imagens com continuidade estrutural. A grande vantagem do WISC é usar o Gemini 3 como camada intermediária que converte palavras simples em prompts detalhados, gerando visuais sólidos sem necessidade de descrições longas. O apresentador demonstra como gerou frames de uma câmera com detalhes específicos sobre tipo de câmera, reflexos de lente e profundidade.

Criação de Keyframes e Ajustes Iterativos

Esta seção demonstra o processo de criação do primeiro e último frame para uma animação de câmera. O apresentador escolheu WISC porque, ao contrário do Nano Banana que requer prompts extensos e do Mix Board que é otimizado para mood boards, o WISC permite remixagem rápida e controlada de imagens. Para o último frame, foi solicitada uma vista técnica explodida mostrando a câmera de ângulo lateral com lentes desmontadas. O processo não acertou na primeira tentativa, mostrando também circuitos internos indesejados. O apresentador enfatiza que basta mencionar mudanças necessárias com palavras simples para obter ajustes precisos, conseguindo finalmente a imagem desejada mostrando apenas as camadas de lentes.

Google Flow: Animação Entre Keyframes

O apresentador explica que, embora WISC suporte animações com o modelo VIO, ele foca em animar uma única imagem em vez de conectar múltiplos keyframes. Por isso, introduz o Google Flow, que usa Gemini para planejamento, modelos de imagem do Google para personagens consistentes e VIO para criar vídeos. Usando a opção frame-para-vídeo, o apresentador forneceu os frames inicial e final da câmera. O prompt deve incluir como o quadro inicial transita para o final, a direção do movimento e o estilo de animação para garantir fluidez. Na primeira tentativa, o modelo errou a direção de rotação e o quadro final, mas após refazer o prompt com ajustes específicos, produziu a animação desejada. O vídeo menciona que a geração tem limites: 180 créditos mensais, com cada vídeo VIO 3.1 custando 20 créditos, totalizando até 9 vídeos por mês no plano gratuito.

Conversão para WebP e Configuração do Projeto

Os vídeos gerados pelo Flow estão em formato MP4, que é difícil de mapear em animações de rolagem em seções Hero. A solução é converter para WebP usando um conversor online gratuito, ajustando configurações para produzir WebP animado de melhor qualidade. Escolher WebP é crucial porque na web ele é tratado como imagem, não requerendo wrapper de reprodutor de mídia como outros formatos, facilitando o mapeamento de interações de rolagem. Além disso, arquivos WebP são mais compactos e oferecem desempenho aprimorado, tornando-os ideais para conteúdo animado curto. O apresentador então adicionou o arquivo WebP convertido ao diretório público do projeto Next.js recém-inicializado, onde todos os recursos do projeto residem.

Implementação com Claude Usando Prompts XML

Com a animação pronta, o apresentador queria adicioná-la à seção Hero da landing page usando o Claude. Ele explica que faz prompts em formato XML porque os modelos do Claude são otimizados para entender XML, permitindo análise mais confiável da intenção estruturada e raciocínio independente sobre cada seção. O prompt incluiu contexto sobre o objetivo, localização dos recursos, comportamento da animação de rolagem nas tags apropriadas (contexto, requisitos, comportamento de animação). Também especificou detalhes de implementação, restrições e saída necessária dentro de suas respectivas tags XML. Quando esse prompt estruturado foi dado ao Claude, ele implementou automaticamente a animação exatamente como desejado, demonstrando a eficácia da estruturação XML para comunicação com IA.

Hero UI: Biblioteca de Componentes Estilo Apple

Embora a seção Hero estivesse boa, os demais componentes pareciam sites genéricos típicos de IA porque estavam usando CSS puro em vez de bibliotecas de componentes existentes. O apresentador explica que existem várias bibliotecas de UI, cada uma com estilo e temas próprios, mas é preciso escolher a que melhor se adapta ao projeto. Para a landing page de câmera, ele buscava uma UI estilo Apple e escolheu Hero UI. Esta biblioteca é construída sobre Tailwind CSS e depende do Framer Motion para animações. Hero UI suporta frameworks comuns como Next.js, Vite e Laravel, facilitando a integração. O apresentador pediu ao Claude para substituir componentes existentes por componentes Hero UI, melhorando significativamente a aparência do site e dando uma sensação muito mais profissional.

Motion.dev: Biblioteca de Animações

O apresentador argumenta que usuários decidem permanecer em uma landing page em segundos, observando quão envolvente é a interface. Movimento ajuda a guiar a atenção para recursos importantes, garantindo maior retenção. Implementar animações do zero com JavaScript puro é desafiador, então ele confia em bibliotecas existentes. Para este projeto, usou Motion.dev, biblioteca gratuita e de código aberto com ampla variedade de animações prontas. Normalmente animações exigiriam sincronizar manualmente atualizações do DOM com tempos de animação, mas Motion.dev abstrai essa lógica, atualizando componentes automaticamente conforme o usuário rola. A biblioteca usa componentes de movimento com estados inicial e final definidos em propriedades, lidando automaticamente com transições. O Claude implementou animações de paralaxe e rolagem usando a biblioteca, melhorando a experiência ao guiar atenção para seções principais.

21st.dev: Inspiração e Prompts Pré-Estruturados

O apresentador explica que descrever como seções de uma página devem parecer é tedioso, sendo melhor buscar inspiração em galerias onde pessoas publicam criações. Ele usou 21st.dev, uma plataforma com inspiração para componentes de interface construídos por diversos designers, baseados em bibliotecas populares como Aceternity UI, Prism UI, Coconut UI e Magic UI. A parte favorita do apresentador é que para qualquer componente, pode-se copiar um prompt especificamente adaptado para agentes de codificação de IA. O prompt é extensamente estruturado, incluindo requisitos do projeto, código com instruções, dependências, caminhos, pacotes NPM necessários e guia de implementação completo. Ele copiou prompts para uma seção de chamada para ação e um rodapé, e o Claude integrou ambos perfeitamente, até adicionando movimento da biblioteca Motion.dev sem menção explícita e personalizando o rodapé para incluir apenas ícones relevantes ao projeto de câmera.

Encerramento e Agradecimentos

O apresentador encerra o vídeo convidando os espectadores a apoiarem o canal usando o botão 'super obrigado' para ajudar a continuar produzindo vídeos similares. Ele agradece pela audiência e se despede, marcando o fim do tutorial sobre o fluxo de trabalho de design com Gemini 3. Esta seção serve como conclusão padrão do conteúdo, incentivando engajamento da comunidade e apoio financeiro ao criador de conteúdo.

Community Posts

View all posts