Goldman Sachs прогнозирует рост спроса на ИИ-токены в 24 раза – Uber и Microsoft уже считают убытки

Крупные технологические корпорации всё сильнее ощущают давление растущих расходов на ИИ. Даже такие гиганты, как Microsoft и Uber, пересматривают подходы к использованию нейросетей, так как счета за токены превращаются в серьёзную статью затрат.

Недавний пост технического директора Uber Правина Неппалли Наги облетел сеть, в нём говорилось, что компания израсходовала весь свой бюджет на ИИ до 2026 года всего за несколько месяцев.

Операционный директор Uber Эндрю Макдональд в интервью Business Insider добавил, что прямой корреляции между объёмом потребляемых токенов и полезными для пользователей функциями обнаружить так и не удалось.

По словам Макдональда, общение со старшими инженерами не выявило связи между ростом расхода токенов и пропорциональным увеличением числа функций с реальной пользой для клиентов. Он признал, что объём написанного кода вырос, однако "провести черту" между этим фактом и реальными улучшениями ПО оказалось крайне сложно.

Microsoft в начале месяца начала отзывать у своих разработчиков доступ к программному ассистенту Claude Code, планируя перевести их на внутренний инструмент Copilot CLI до 30 июня. Официально это подаётся как консолидация команд вокруг собственных продуктов, но совпадение с завершением финансового года намекает на стремление урезать расходы перед стартом нового периода.

Ранее Microsoft также перевела Copilot на GitHub на оплату по токенам, так как стоимость работы сервиса резко выросла в этом году. Главная причина роста расходов это взрывное распространение агентного ИИ, который способен потреблять более чем в 1000 раз больше токенов, чем обычный чат-бот.

Goldman Sachs в свежем отчёте прогнозирует, что в ближайшие годы расход токенов на агентный ИИ может вырасти более чем в 24 раза. Между тем, что компаниям нужно от ИИ, что они хотели бы получить, и тем, что они реально могут себе позволить, образуется всё более заметный разрыв.

Глава Airbnb ранее с гордостью сообщил инвесторам, что 60% кода компании теперь генерируется ИИ. Chime в начале года заявила о 84% ИИ-кода, а Google говорит о 50%, хотя весь такой код проверяется живым инженером.

Похожие цифры назвал и Uber, у которого свыше 80% инженеров используют агентный ИИ, а более 60% кода создаётся нейросетями. При этом, по оценке самой компании, эффект не окупает затрат.

Стоимость может стать экстремальной, если убрать ограничители. Создатель OpenClaw и ныне сотрудник OpenAI Питер Штайнбергер недавно сообщил, что его команда из трёх человек потратила более 1,3 миллиона долларов на токены всего за один месяц, используя набор агентных ИИ-инструментов.

Это подкрепляет тезис о том, что стоимость ИИ растёт быстрее, чем зарплаты сотрудников, которых он якобы должен заменять. Из-за этого многие сокращения, объясняемые повышением эффективности благодаря ИИ, выглядят всё менее обоснованными, если только компании не устроили гонку ко дну.

Или гонку за новым железом. Goldman Sachs указывает, что массовый прирост эффективности от чипов нового поколения для инференса должен сделать ИИ настолько дешевле, что инвестиции продолжатся без замедления, а прибыль придёт следом за стремительным ростом доходов от ИИ-агентов.

Правда, откуда будет идти прибыль, если миллионы людей останутся без работы – никто объяснить толком не может.

Nvidia будет активно продвигать платформу Vera Rubin на Computex и официально запустит её позже в этом году. Платформа в несколько раз быстрее предшественников, использует новый техпроцесс и, по данным компании, обеспечивает до 10 раз большую производительность на ватт.

Такие приросты дадут компаниям, которые первыми развернут новые ускорители, огромное преимущество над теми, кто остался на Blackwell, не говоря уже о более старой архитектуре Hopper. Однако более 50% анонсированных дата-центров на базе Blackwell были отменены или отложены, и неясно, насколько охотно операторы будут менять GPU, едва успев их запустить.

В конце 2025 года Google, Oracle и Microsoft скорректировали свои планы в противоположном направлении, заявив, что планируют эксплуатировать оборудование шесть лет до замены. Совместить это с амбициозными ИИ-планами и ежегодными аппаратными скачками выглядит практически невозможно.

Реальность такова, что даже при падении стоимости отдельных токенов взрывной рост числа запросов от агентного ИИ невозможно компенсировать приростом эффективности железа, до массового внедрения которого ещё несколько лет. В краткосрочной перспективе даже Microsoft и Uber вынуждены перестраивать свою работу с ИИ, чтобы продолжать использовать его в масштабе и не уничтожить бюджеты.

Если такие корпорации не могут позволить себе текущие темпы, остальным компаниям будет ещё сложнее. А если использование начнёт снижаться из-за роста цен, ИИ-компании рискуют так и не получить краткосрочной прибыли, необходимой для оправдания многомиллиардных инфраструктурных вложений.

Больше статей на Shazoo
Тэги:
Источники:

Об авторе

Эксперт по Fallout
Главный редактор
Более 16 лет в индустрии освещения видеоигр, кино, сериалов, науки и техники. Особенно разбираюсь в серии Fallout, ценитель The Elder Scrolls. Поклонник Arcanum и Fallout Tactics. Больше всего играю в Civilization, Old World и градостроители. Изучаю ИИ и загадки космоса.