Segundo informações divulgadas pelo 9to5Google, o conglomerado Google trabalha em uma reformulação na experiência de uso do Gemini, incluindo a criação de um novo plano intermediário de assinatura, chamado Google AI Ultra Lite. A empresa prepara a implementação de limites explícitos de uso e de um painel inédito de orçamento de tokens, que permitirá aos usuários acompanhar o consumo da plataforma.

Continua depois da publicidade

Indícios da mudança foram encontrados no código do aplicativo do Gemini para macOS, sinalizando que a novidade ainda está em fase de testes internos e não foi disponibilizada oficialmente ao público. Ainda assim, o vazamento indica que o Google pretende abandonar gradualmente a ideia de uma IA com uso “ilimitado”, migrando para um modelo baseado em cotas e pacotes de consumo.

A estratégia acompanha um movimento já observado no mercado de inteligência artificial

Plataformas como ChatGPT e Claude também vêm revisando limites de utilização, valores de assinatura e acesso a modelos mais avançados. O motivo está no alto custo operacional dessas ferramentas, especialmente em tarefas complexas, como programação e agentes autônomos de IA, que exigem grande capacidade de processamento, infraestrutura robusta, elevado consumo de energia e manutenção constante de clusters de GPUs para gerar respostas em tempo real.

O crescimento acelerado dessa demanda também estaria ligado a um movimento interno dentro do Google. Segundo informações divulgadas, o cofundador Sergey Brin estaria liderando uma força-tarefa voltada para ampliar significativamente a capacidade do Gemini em tarefas de programação. Caso o projeto avance, a expectativa é de um aumento expressivo no consumo de tokens por desenvolvedores, o que tornaria necessária a criação de novos níveis de assinatura e mecanismos mais rígidos de controle de uso.

Continua depois da publicidade

Nesse cenário, a tendência é que a inteligência artificial deixe de ser encarada como um serviço de conversas ilimitadas. Os usuários poderão recorrer aos prompts de forma mais estratégica, reservando solicitações mais complexas para tarefas realmente relevantes. O movimento lembra o que ocorreu com plataformas de streaming, que inicialmente ofereciam acesso amplo e flexível, mas posteriormente passaram a endurecer regras e reajustar preços para manter o modelo de negócio sustentável.

Mudança radical no Gemini?

A palavra é reformulação, baseada em três pilares: novo plano de assinatura, monitoramento detalhado de consumo e limites mais claros para uso de modelos avançados.

Primeiro pilar: a criação do plano AI Ultra Lite, desenvolvido para ocupar a faixa intermediária entre o Gemini Pro — atualmente disponível por US$ 20 mensais — e o plano Ultra, que custa US$ 250 por mês. A proposta é oferecer maior capacidade de uso e acesso ampliado a ferramentas avançadas sem exigir o investimento elevado da versão mais cara.

Continua depois da publicidade

Nos bastidores, o novo serviço aparece identificado pelo codinome “Neon” e deve ser lançado na faixa de US$ 100 mensais, valor semelhante ao já praticado por concorrentes como OpenAI e Anthropic em ofertas equivalentes.

Segundo pilar: envolve a implementação de um sistema de monitoramento baseado em tokens. O Google estaria desenvolvendo uma página específica, possivelmente hospedada em gemini.google.com/usage, na qual assinantes poderão acompanhar o consumo da plataforma em tempo real.

A proposta inclui diferentes tipos de limitação, como cotas válidas por períodos determinados — por exemplo, a cada cinco horas — além de limites semanais. O sistema também deve oferecer a possibilidade de adquirir “créditos extras”, permitindo que o usuário continue utilizando os recursos da IA mesmo após atingir a cota padrão estabelecida.

Continua depois da publicidade

Terceiro pilar: é o estudo que envolve a forma como o Gemini deverá reagir quando o usuário estiver próximo do limite de uso. Nesse cenário, a plataforma pode passar a reduzir automaticamente o desempenho, oferecendo respostas mais curtas, lentas ou até migrando para modelos menos avançados, em uma lógica que lembra as franquias de internet.

Os limites também poderão variar de acordo com o tipo de recurso utilizado. Ferramentas mais avançadas e funções específicas, como o Deep Research, devem consumir mais tokens, permitindo que o sistema adapte o nível de uso conforme o perfil e a demanda do usuário.

Jean Lindemute

Continua depois da publicidade