Segundo informações divulgadas pelo 9to5Google, o conglomerado Google trabalha em uma reformulação na experiência de uso do Gemini, incluindo a criação de um novo plano intermediário de assinatura, chamado Google AI Ultra Lite. A empresa prepara a implementação de limites explícitos de uso e de um painel inédito de orçamento de tokens, que permitirá aos usuários acompanhar o consumo da plataforma.
Continua depois da publicidade
Indícios da mudança foram encontrados no código do aplicativo do Gemini para macOS, sinalizando que a novidade ainda está em fase de testes internos e não foi disponibilizada oficialmente ao público. Ainda assim, o vazamento indica que o Google pretende abandonar gradualmente a ideia de uma IA com uso “ilimitado”, migrando para um modelo baseado em cotas e pacotes de consumo.
A estratégia acompanha um movimento já observado no mercado de inteligência artificial
Plataformas como ChatGPT e Claude também vêm revisando limites de utilização, valores de assinatura e acesso a modelos mais avançados. O motivo está no alto custo operacional dessas ferramentas, especialmente em tarefas complexas, como programação e agentes autônomos de IA, que exigem grande capacidade de processamento, infraestrutura robusta, elevado consumo de energia e manutenção constante de clusters de GPUs para gerar respostas em tempo real.
O crescimento acelerado dessa demanda também estaria ligado a um movimento interno dentro do Google. Segundo informações divulgadas, o cofundador Sergey Brin estaria liderando uma força-tarefa voltada para ampliar significativamente a capacidade do Gemini em tarefas de programação. Caso o projeto avance, a expectativa é de um aumento expressivo no consumo de tokens por desenvolvedores, o que tornaria necessária a criação de novos níveis de assinatura e mecanismos mais rígidos de controle de uso.
Continua depois da publicidade
Nesse cenário, a tendência é que a inteligência artificial deixe de ser encarada como um serviço de conversas ilimitadas. Os usuários poderão recorrer aos prompts de forma mais estratégica, reservando solicitações mais complexas para tarefas realmente relevantes. O movimento lembra o que ocorreu com plataformas de streaming, que inicialmente ofereciam acesso amplo e flexível, mas posteriormente passaram a endurecer regras e reajustar preços para manter o modelo de negócio sustentável.
Mudança radical no Gemini?
A palavra é reformulação, baseada em três pilares: novo plano de assinatura, monitoramento detalhado de consumo e limites mais claros para uso de modelos avançados.
Primeiro pilar: a criação do plano AI Ultra Lite, desenvolvido para ocupar a faixa intermediária entre o Gemini Pro — atualmente disponível por US$ 20 mensais — e o plano Ultra, que custa US$ 250 por mês. A proposta é oferecer maior capacidade de uso e acesso ampliado a ferramentas avançadas sem exigir o investimento elevado da versão mais cara.
Continua depois da publicidade
Nos bastidores, o novo serviço aparece identificado pelo codinome “Neon” e deve ser lançado na faixa de US$ 100 mensais, valor semelhante ao já praticado por concorrentes como OpenAI e Anthropic em ofertas equivalentes.
Segundo pilar: envolve a implementação de um sistema de monitoramento baseado em tokens. O Google estaria desenvolvendo uma página específica, possivelmente hospedada em gemini.google.com/usage, na qual assinantes poderão acompanhar o consumo da plataforma em tempo real.
A proposta inclui diferentes tipos de limitação, como cotas válidas por períodos determinados — por exemplo, a cada cinco horas — além de limites semanais. O sistema também deve oferecer a possibilidade de adquirir “créditos extras”, permitindo que o usuário continue utilizando os recursos da IA mesmo após atingir a cota padrão estabelecida.
Continua depois da publicidade
Terceiro pilar: é o estudo que envolve a forma como o Gemini deverá reagir quando o usuário estiver próximo do limite de uso. Nesse cenário, a plataforma pode passar a reduzir automaticamente o desempenho, oferecendo respostas mais curtas, lentas ou até migrando para modelos menos avançados, em uma lógica que lembra as franquias de internet.
Os limites também poderão variar de acordo com o tipo de recurso utilizado. Ferramentas mais avançadas e funções específicas, como o Deep Research, devem consumir mais tokens, permitindo que o sistema adapte o nível de uso conforme o perfil e a demanda do usuário.
Jean Lindemute
Continua depois da publicidade


