Техногиганты признают, что продавать ИИ массам можно только дёшево

ИИ-мания, охватившая Кремниевую долину за последние годы, столкнулась с жесткой экономической реальностью. Крупные технологические корпорации одна за другой признают, что расходы на токены, базовую единицу измерения использования ИИ, вышли из-под контроля.

Amazon была вынуждена закрыть внутренний конкурс по максимальному использованию токенов на рабочем месте, передав сотрудникам сообщение:

Пожалуйста, не используйте ИИ просто ради того, чтобы использовать ИИ.

Uber ограничила расходы сотрудников на токены суммой 1500 долларов в месяц после того, как компания исчерпала годовой ИИ-бюджет еще в начале года.

Еще показательнее то, что и сами разработчики крупных моделей осознали проблему. На недавнем мероприятии OpenAI глава компании Сэм Альтман признал, что потребление токенов стало "огромной проблемой" для бизнеса, которому обещали серьезный рост продуктивности от внедрения ИИ.

Это резкий разворот по сравнению с риторикой всего несколько месяцев назад, когда индустрия продвигала идею: чем больше сотрудники используют ИИ, тем лучше для них и их работодателей. Так называемый "токенмаксинг" стал мемом и фактически синонимом "защиты от будущего". Логика была проста, не каждую работу заменит ИИ, но сотрудников без ИИ заменят те, кто им пользуется.

Однако ИИ всегда был дорогим, а затраты на обучение и инференс новых моделей только растут. Параллельно индустрия активно продвигает агентов, ИИ-системы, способные работать без присмотра человека продолжительное время, что привело к взрывному росту потребления токенов. Согласно одному препринту, опубликованному в апреле, агенты потребляют в 1000 раз больше токенов, чем обычные ИИ-системы.

Все эти расходы ложатся на компании и пользователей. А GitHub на этой неделе объявил о переходе на тарификацию по количеству израсходованных токенов, и судя по первым отзывам, нововведение принимают плохо.

Техногигантам срочно нужно найти новый способ продать людям будущее ИИ без заоблачных затрат на токены. Иначе бизнес и пользователи просто перейдут на открытые модели, которыми можно пользоваться бесплатно.

Рост стоимости использования ИИ буквально вытолкнул некоторые корпорации на неожиданные меры. Microsoft и Google недавно представили новые ИИ-продукты, Gemma 4 12B и ноутбук RTX Spark соответственно, построенные на принципе edge computing. Это когда модель работает за счет вычислительных ресурсов конкретного гаджета, а не облака, то есть прожорливых дата-центров.

Естественно, модель уровня Claude Opus 4.8 или GPT-5 не запустить напрямую на ноутбуке. Это все равно что пытаться обеспечить энергией запуск ракеты Falcon 9, подключив велотренажер к генератору. Но логика новых продуктов Microsoft и Google в том, что большинству пользователей в большинстве случаев не нужны самые свежие и прожорливые модели прямо на их повседневных девайсах. Меньшая и более легкая модель отлично справится, а заодно сэкономит всем деньги на токенах.

Однако инвестиции Microsoft и Google в edge-вычисления ничтожны по сравнению с тратами на дата-центры, облачные вычисления остаются основой бизнес-моделей обеих компаний. Но в их обращении к edge computing видно признание, что цена огромных ИИ-моделей просто не оправдывает давления, которое они оказывают на большинство потребителей.

В конечном счете, выживание или стагнация ИИ будет полностью зависеть от того, как дорого будет он обходиться для рядового пользователя. Если конечная цена окажется слишком высокой, то не проще ли использовать человеческий труд?

Больше статей на Shazoo
Тэги:
Источники:

Об авторе

Эксперт по Fallout
Главный редактор
Более 16 лет в индустрии освещения видеоигр, кино, сериалов, науки и техники. Особенно разбираюсь в серии Fallout, ценитель The Elder Scrolls. Поклонник Arcanum и Fallout Tactics. Больше всего играю в Civilization, Old World и градостроители. Изучаю ИИ и загадки космоса.