Компания Google приняла решение изменить систему распределения квот для своего искусственного интеллекта Gemini. Обновления призваны оптимизировать обработку сложных запросов и тяжелых файлов, а также сделать расход лимитов более прозрачным.
Основные изменения в работе лимитов
- Введено ограничение на максимальный объем вычислительных ресурсов, который может занять один сложный запрос.
- Неудачные запросы и системные ошибки больше не будут списываться из доступного лимита пользователя.
- В интерфейс добавят детальную статистику использования квоты для лучшего понимания расходов.
Почему старая система вызвала недовольство
Ранее разработчики представили новую модель распределения ресурсов. Вместо фиксированного количества сообщений была внедрена система, основанная на затрачиваемой вычислительной мощности. Использование Gemini стало ограничиваться скользящими пятичасовыми интервалами и общим недельным лимитом.
Однако пользователи в Reddit и социальной сети X* начали массово жаловаться на слишком быстрое исчерпание доступного лимита. В некоторых случаях один сложный запрос забирал существенную часть квоты, а при попытке сгенерировать видео через мультимодальную систему Gemini Omni лимиты заканчивались еще до того, как процесс обработки завершался.
Оптимизация распределения ресурсов и новые функции
Руководитель проекта Gemini Джош Вудворд подтвердил, что компания оптимизирует алгоритмы. Теперь затраты на один запрос будут жестко ограничены сверху, чтобы пользователи флагманской версии Pro могли дольше работать с моделью в рамках своих лимитов. Вудворд также уточнил, что любые сбои и ошибки генерации перестанут расходовать квоту — списываться будут только успешно завершенные операции.
Для ресурсоемких задач, таких как инструмент глубокого анализа Deep Research (проведение комплексных исследований по запросу), требующих значительно больше вычислительной мощности, Google внедрит детальные уведомления. Это поможет точнее планировать работу с искусственным интеллектом.
Кроме того, Gemini теперь будет запоминать выбранную пользователем языковую модель между сессиями. Система продолжит использовать выбранную версию по умолчанию, пока пользователь не переключит ее вручную или не исчерпает лимит вычислительной мощности, после чего ИИ автоматически перейдет на более легкую базовую модель.
* — доступ к ресурсу ограничен на территории РФ.