Подписки на ИИ становятся менее привлекательными

MMaximilian Schwarzmüller
Computing/SoftwareSmall Business/StartupsBusiness News

Transcript

00:00:00Сегодня утром я увидел этот пост на X, в котором упоминается, что Anthropic, по-видимому, убрала
00:00:09плагин Cloud Code из плана Pro, так что теперь вам требуются более дорогие
00:00:17подписки, чтобы иметь возможность использовать Cloud Code или свою подписку в Cloud Code.
00:00:22Что ж, Anthropic быстро прокомментировала это, отметив, что это всего лишь небольшой
00:00:27тест, который они проводят только на 2% новых подписчиков уровня prosumer.
00:00:32Я нахожу странным проведение такого теста, и я также думаю, что Anthropic могла бы
00:00:40предвидеть реакцию, запуская подобный тест, и понять, какой эффект это окажет
00:00:47на их имидж и что люди будут думать, потому что, конечно, это явно вписывается в ту
00:00:53тенденцию, которую мы уже наблюдаем: мы получаем меньше пользы от наших подписок, мы видим
00:00:59более жесткие ограничения, мы видим снижение производительности моделей, поскольку кажется, что все эти
00:01:08вещи происходили в последние пару недель. Я имею в виду, что Anthropic агрессивно ограничила
00:01:14использование своей подписки вне Cloud Code. Если вы хотели использовать ее, например, с Open Cloud,
00:01:21они пресекли это, так что всё это даёт нам ясную, более широкую картину.
00:01:28И в эту картину или повествование вписывается новостная статья, опубликованная GitHub пару
00:01:37дней назад, где они ясно дали понять, что приостановят новые подписки на GitHub Copilot Pro,
00:01:43Pro Plus и Student, и что они ужесточают лимиты использования для индивидуальных планов,
00:01:49и, что самое важное, что модели Opus больше не доступны в планах Pro, и всё это,
00:01:56конечно, имеет смысл, но мы должны немного глубже погрузиться в экономику происходящего,
00:02:02чтобы понять, почему это происходит и, что самое важное, что это означает для нас также в
00:02:07будущем. Это явно означает, что дни безлимитного использования и огромных субсидий прошли, и чтобы понять это,
00:02:17мы должны разобраться в экономике этих подписок и использования токенов, можно сказать,
00:02:25или потребления токенов, потому что, конечно, эти модели подписки, предлагаемые Anthropic,
00:02:34OpenAI, GitHub, действительно работают только в том случае, если большинство пользователей не используют на самом деле весь
00:02:43доступный им лимит использования. Это практически так для любого предложения подписки,
00:02:49не только для этих ИИ-подписок. Если у вас есть подписка на Netflix и вы 24/7 смотрите
00:02:56Netflix, вы, вероятно, скорее всего, не будете супер прибыльным клиентом для них, но большинство людей
00:03:02этого не делают, и именно так эти компании могут получать прибыль. Это верно для всех подписок,
00:03:10очевидно. Теперь мы можем увидеть истинную цену, или цену, которая ближе к истинной цене наших ИИ-запросов,
00:03:19если мы взглянем на страницы ценообразования API этих компаний. Например, мы можем увидеть,
00:03:26что новейшая модель от Anthropic, Claude Opus 4.7, имеет цену входных токенов пять долларов за
00:03:35миллион токенов и цену выходных токенов 25 долларов за миллион токенов, и мы можем соотнести это
00:03:42с другими моделями, которые у них есть, мы можем, конечно, также соотнести это с тем, что OpenAI может
00:03:47предложить, например. Там мы видим, что GPT-4o, которую большинство пользователей кодеков, вероятно, используют прямо сейчас, имеет
00:03:54цену входных токенов два доллара пятьдесят центов за миллион токенов, то есть только половину от того, что было у Opus 4.7,
00:04:03и цену выходных токенов 22 доллара 50 центов, так что немного меньше, чем мы видели для Opus. Теперь,
00:04:11вероятно, справедливо предположить, что эти цены на API — это цены, которые оставляют эти компании
00:04:20на уровне безубыточности или небольшой прибыли в отношении их валовой маржи, так что если мы просто посмотрим на
00:04:29стоимость вывода в частности, мы можем, вероятно, предположить, что они получат прибыль, если вы используете их
00:04:36API. Теперь, конечно, для этого важно понимать, что стоимость запуска ИИ-моделей
00:04:43в конечном итоге зависит от двух основных факторов: это обучение ИИ-моделей, которое стоит денег, и
00:04:53это вывод, конечно, так что у нас есть эти два фактора, которые вступают в игру для этих
00:04:59ИИ-компаний. Теперь, конечно, стоимость обучения — это разовая вещь, верно? Так что вы обучаете модель один раз,
00:05:06и это очень дорого, но очевидно, что это разовая вещь. Конечно, эти компании затем
00:05:12обучают всё больше и больше моделей, и это новый разовый расход для каждой модели, но как только модель была обучена,
00:05:18она больше не несет никаких затрат на обучение, за исключением, может быть, дальнейших прогонов тонкой настройки или производных
00:05:25моделей от этой базовой модели, но да, большая часть затрат возникает только один раз. Теперь для вывода
00:05:33естественно, это иначе, это текущие расходы, это в конечном итоге за запрос, потому что, конечно,
00:05:41вывод — это процесс создания конкретного результата для вашего промпта, для вашей задачи, которую вы отправляете
00:05:48провайдеру модели, и вывод — это, конечно, то, что происходит всё время, когда вы используете
00:05:53Claude Code, когда вы используете кодеки, но также, конечно, когда вы отправляете промпт в ChatGPT или в
00:05:58любом другом месте. Теперь это, конечно, то, где вы хотите, по крайней мере, выйти в ноль с ценообразованием вашего API,
00:06:07потому что иначе это означает, что вы теряете деньги на каждом полученном запросе, и хотя вы могли бы,
00:06:13конечно, делать это, чтобы увеличить свою долю рынка, и хотя я бы не исключал, что компании
00:06:19иногда делают это, делать это в долгосрочной перспективе, конечно, не будет жизнеспособно, потому что вы обанкротитесь.
00:06:25Теперь естественно, вам также нужно заработать на ваши затраты на обучение в какой-то момент, так что в идеале
00:06:34эти входящие запросы, которые отправляют вам ваши пользователи, дают вам достаточную валовую маржу от ваших
00:06:41затрат на вывод, так что эта маржа также покрывает ваши затраты на обучение, ваши расходы на персонал и так далее. Так что,
00:06:48конечно, такова экономика того, как вы можете запускать и использовать эти ИИ-модели. Теперь, как упоминалось, стоимость API
00:06:57— это, вероятно, та часть, где эти компании не теряют огромные суммы
00:07:02денег, но, конечно, как потребитель, как клиент, вы теряете, если бы вы питались Claude Code этими
00:07:10ценами Opus по требованию, вы бы платили намного, намного больше, чем если бы вы использовали их подписки,
00:07:18потому что, конечно, с подпиской Max, например, всего за 200 баксов вы получаете
00:07:26много использования из этого плана, вы получите много миллионов токенов из этого плана, и если вы
00:07:34взглянете на то, что обычно стоят выходные токены за миллион токенов, вы можете увидеть, что
00:07:39обычно, если вы игнорируете входные токены, чего вы не должны делать, но если вы игнорируете их для этих двух
00:07:44сот долларов здесь, мы не должны даже получить 10 миллионов выходных токенов, верно? Потому что один миллион
00:07:51стоит нам 25 долларов, так что мы должны получить только восемь миллионов выходных токенов, а затем, если вы учтете
00:07:56входные токены, это было бы меньше, чем это, и ясно, что если у вас были какие-либо долгосрочные сессии, если вы
00:08:02использовали Claude Code, например, в течение недели, и вы отслеживаете использование своих токенов, вы увидите, что вы
00:08:08можете выйти за пределы этого лимита, и вы определенно могли в прошлом, и это делает очевидным, почему эти
00:08:14компании как бы пытаются ограничить то, сколько использования вы можете получить из своих подписок,
00:08:19и почему я думаю, что мы увидим более высокие цены на подписку определенно в будущем, может быть, уже
00:08:25в ближайшем будущем. Теперь, конечно, не очень легко этим компаниям повышать свои цены,
00:08:30однако, потому что доля рынка, очевидно, все эти компании хотят агрессивно захватить долю рынка,
00:08:37причина в том, что если вы основная компания, которая утвердилась как провайдер ИИ-агентов по кодингу в
00:08:45многих предприятиях, в многих компаниях, они, вероятно, будут платить более высокие цены за подписку
00:08:51в будущем, так что вы не хотите начинать повышать свои цены слишком рано, потому что это может
00:08:57оттолкнуть некоторых ваших клиентов к конкурентам, чего вы, конечно, не хотите. С другой стороны,
00:09:02вы не хотите обанкротиться. Я имею в виду, например, OpenAI недавно привлекла 122 миллиарда долларов,
00:09:09чтобы ускорить следующую фазу ИИ, и вы могли бы прочитать это так, что это даст им только
00:09:17около 18 месяцев резервов, так что 18 месяцев до того, как им нужно будет снова привлекать средства, так что ясно, вы не можете
00:09:26продолжать субсидировать всё это использование вечно, потому что если вы обанкротитесь, то все ваши клиенты
00:09:32всё равно уйдут к вашим конкурентам, так что здесь есть компромисс, и это, конечно, именно та
00:09:39сложная ситуация, с которой сейчас сталкиваются эти компании, такова экономика здесь. Теперь, конечно, как вы
00:09:44вероятно, читали, а также чувствовали, если вы геймер, например, мы находимся в моменте времени, когда из-за
00:09:52всех этих ИИ-вещей, которые происходят, мы сталкиваемся с большим дефицитом вычислительных мощностей и кризисом, а также высокими ценами на
00:10:01память и всё, что связано с тем, что нужно этим ИИ-моделям и этим ИИ-центрам обработки данных, так что
00:10:08память дорогая, потому что для вывода нужно много памяти, если вы пробовали запускать модели
00:10:13локально на своей системе, вы знаете, что вам нужно много памяти для этого, так что цены на память выросли,
00:10:19но это не только память, это также сетевое оборудование, потому что, конечно, вы запускаете как обучение,
00:10:25так и вывод, не на одном чипе, а на огромных стойках и кластерах чипов, и все эти
00:10:31кластеры нуждаются в соединениях между кластерами, между чипами, чтобы вы могли строить супер
00:10:36GPU, так сказать, и это сетевое оборудование пользуется большим спросом и поэтому дорогое, и тогда, конечно,
00:10:43у нас также есть энергия и центры обработки данных, нам нужно и то, и другое, нам нужны центры обработки данных, чтобы поместить туда эти чипы, и именно поэтому
00:10:52много строительства происходит там, но затем эти центры обработки данных, им нужна энергия, верно? И вы
00:10:58слышали об этом тоже, энергия — это еще одна большая проблема, вы не можете получить ее из сети, она просто не
00:11:05построена для этого, там недостаточно доступной энергии, именно поэтому все эти новые центры обработки данных
00:11:12переезжают на автономные решения, где энергия производится рядом с центром обработки данных с помощью газовых турбин
00:11:21или ядерной энергии, но это, конечно, всё требует времени, и это также требует компонентов, и нет
00:11:28бесконечного количества компаний, которые могут построить эти электростанции, нет бесконечного количества
00:11:35компонентов, которые нужны для строительства этих электростанций, так что это всё ограничивает количество
00:11:42вычислительных мощностей, которые могут быть введены в строй, чего, в свою очередь, не хватает для вывода и, конечно, также для
00:11:48обучения. Теперь исторически, и под этим я имею в виду только год или два назад, стимул для
00:11:54этих компаний заключался в том, чтобы посвятить много вычислительных ресурсов обучению, потому что это дает вам
00:12:00лучшие модели, что позволяет вам оставаться впереди или выйти вперед в гонке ИИ, и этот стимул всё еще существует, но
00:12:07конечно, в наши дни также есть больший стимул и более высокая важность здесь, в части вывода,
00:12:14потому что именно часть вывода дает вам клиентов, дает вам видимость на рынке,
00:12:19потому что если никто не может использовать ваши модели, то это здорово, что у вас хорошие модели, но вы
00:12:25не получаете никакой доли рынка, так что вам нужен вывод, который стал намного важнее, так что компаниям приходится
00:12:30делить скудные вычислительные ресурсы и мощности центров обработки данных между этими двумя целями, и конечно,
00:12:38особенно с начала этого года мы также видим изменившееся поведение использования клиентами.
00:12:45Они, новостная статья GitHub здесь на самом деле довольно открыта об этом, агентские рабочие процессы
00:12:51фундаментально изменили требования к вычислительным мощностям Copilot, долгосрочные параллельные сессии теперь регулярно
00:12:57потребляют намного больше ресурсов, чем оригинальная структура плана была создана для поддержки, и это то же самое,
00:13:04конечно, для Anthropic и OpenAI в прошлом, и опять же, это означает только год назад или около того,
00:13:10эти компании не в первую очередь, но в огромной степени действительно фокусировались только на случайных сессиях чата, а
00:13:20пользователь, клиент время от времени заходил и задавал ChatGPT или Claude вопрос, и конечно, это
00:13:27могло быть несколько раз в день, но это было всего лишь пара вопросов, просто пара ответов,
00:13:33пара последующих вопросов, конечно, намного меньше токенов, чем все эти долгосрочные агентские
00:13:39рабочие процессы и кодинговые сессии имеют. В тех кодинговых сессиях или в любых агентских рабочих процессах, которые вы
00:13:44запускаете, вы сжигаете сотни тысяч и миллионы токенов быстро, очень быстро, намного
00:13:51быстрее, чем вы могли бы со случайной сессией чата. Теперь, учитывая тот факт, что все эти
00:13:58современные модели, с которыми мы имеем дело, — это мыслящие модели, обычно количество токенов также стало
00:14:05выше по сравнению с годом или двумя назад, потому что ответ просто занимает больше токенов из-за этого
00:14:12мыслительного процесса, которые, конечно, всё еще являются токенами, даже если вы не видите их в конечном результате,
00:14:17может быть, поэтому количество потребляемых токенов стало намного, намного больше сейчас, чем год или два
00:14:24назад, снова приводя нас к тому, что вывод становится более важным, потому что вам нужно намного
00:14:29больше вывода, чтобы обработать всю эту генерацию токенов, которая происходит, и это причина, почему все
00:14:37эти новые модели довольно дорогие при использовании через API, но даже более важно, почему
00:14:43эти подписки настолько сложны для этих компаний прямо сейчас. Они представили те
00:14:49подписки в прошлом, когда потреблялось намного меньше токенов, а сейчас они в точке,
00:14:56где за ту же цену подписки люди теперь используют намного больше токенов, вот в чем сложность.
00:15:03Теперь, особенно для Anthropic, например, я мог бы представить, что они чувствуют боль немного больше,
00:15:09чем OpenAI, не только потому, что их модели, кажется, дороже в работе, если вы просто взглянете
00:15:16на ценообразование API, но также, конечно, потому что исторически, даже год назад, у Anthropic
00:15:22было больше корпоративных и бизнес-клиентов, что хорошо для них, в какой-то степени это стабильная
00:15:29база доходов, а ChatGPT или OpenAI были больше ориентированы на потребителей, у них было больше нормальных людей, обычных
00:15:38потребителей в качестве клиентов, и сейчас они также движутся больше к бизнесу, но исторически, потому что у них
00:15:43был момент ChatGPT, у них было больше нормальных людей в качестве клиентов. Недостаток для Anthropic сейчас,
00:15:50конечно, в том, что эти бизнес-клиенты — это именно те клиенты, которые запускают эти агентские
00:15:55рабочие процессы или которые склонны запускать эти агентские рабочие процессы. Я имею в виду, ваши мама и папа, если они
00:16:00платят за ChatGPT вообще, чего они, вероятно, не делают, они не запускают агентские рабочие процессы,
00:16:06но вы — да, ваша компания — да, и это, конечно, делает подписку еще более сложной для
00:16:11Anthropic, я бы представил, чем для OpenAI, где всё еще есть множество «нормисов» в подписке,
00:16:18я бы предположил, что они определенно чувствуют боль, и что всё это означает сейчас? Что
00:16:24изменения вроде этого или изменения вроде того поста на X, где Anthropic проводит тесты, чтобы убрать Claude Code
00:16:32из более дешевых планов, что всё это означает для нас? Я думаю, это довольно очевидно, мы увидим еще
00:16:38более строгие лимиты в будущем, и поэтому мы, конечно, можем достичь точки, когда подписки
00:16:42больше не будут казаться того стоящими, и я думаю, это будет момент, когда мы увидим
00:16:48более высокие цены. Это не неразумно, я думаю, верить, что эти кодинговые подписки или в целом
00:16:55эти подписки на агентское использование будут стоить много тысяч долларов в месяц в какой-то момент, не в этом
00:17:03году, скорее всего, но в какой-то момент, потому что, конечно, компании могут начать сравнивать стоимость
00:17:10этих подписок со стоимостью сотрудников, да, и это, конечно, не отличные новости, и это
00:17:17может быть совершенно неправильно, но это определенно то, что, я думаю, произойдет, и, конечно, когда вы делаете
00:17:23это сравнение, есть много возможностей для того, чтобы эти подписки стали намного, намного дороже,
00:17:30очевидно. Подписки тогда уже не будут для нормальных людей, так что я думаю, мы также увидим
00:17:35новые предложения подписки для них, которые просто имеют намного более строгие лимиты использования, которые достаточны
00:17:41для ChatGPT, но недостаточны для агентских рабочих процессов, но для профессионального использования, для агентских
00:17:47рабочих процессов, мы увидим более строгие лимиты и более высокие цены. Я не уверен когда, потому что вы знаете, доля рынка,
00:17:52верно? Так что то, что я упоминал раньше, но в конечном итоге мы увидим это, потому что в конечном счете,
00:17:58как упоминалось, у OpenAI есть около 18 месяцев резервов, они, вероятно, хотят остаться в бизнесе,
00:18:03то же самое для Anthropic, и поэтому это то, что, я думаю, мы увидим здесь через год или около того, я не знаю.

Key Takeaway

Эпоха безлимитного использования ИИ-подписок завершается из-за резкого роста потребления токенов агентскими рабочими процессами и высокой себестоимости вычислительных мощностей, что неизбежно приведет к повышению цен и введению строгих лимитов.

Highlights

Anthropic тестирует ограничение доступа к плагину Claude Code для 2% новых подписчиков Pro.

GitHub прекращает оформление новых подписок на Copilot Pro, Pro Plus и Student, а также ограничивает доступ к модели Opus.

API модели Claude Opus 4.7 стоит 5 долларов за миллион входных токенов и 25 долларов за миллион выходных токенов.

Стоимость входных токенов GPT-4o составляет 2,5 доллара за миллион, что вдвое дешевле Claude Opus 4.7.

Современные агентские рабочие процессы и кодинговые сессии потребляют значительно больше токенов, чем случайные чат-запросы.

Компании ИИ-индустрии стремятся избежать банкротства, так как текущие резервы, например у OpenAI, оцениваются примерно в 18 месяцев работы.

Timeline

Сокращение доступности и ужесточение лимитов

  • Anthropic начала тестирование по ограничению доступа к Claude Code для части новых пользователей.
  • GitHub приостановил новые подписки на планы Pro и исключил модель Opus из Pro-версии.
  • Пользователи получают меньше выгоды при сохранении или росте стоимости ИИ-подписок.

ИИ-компании внедряют более жесткие ограничения, чтобы сократить издержки на использование моделей вне рамок чат-интерфейсов. Эти изменения происходят на фоне агрессивного ограничения использования подписок в сторонних сервисах, таких как Open Cloud. Данная ситуация отражает общую тенденцию перехода от субсидируемого безлимитного доступа к модели ограниченного потребления.

Экономика токенов и себестоимость вывода

  • Бизнес-модель подписок основана на предположении, что большинство пользователей не используют весь доступный лимит.
  • Цена API-запросов отражает порог безубыточности для провайдеров моделей.
  • Затраты на вывод стали текущими расходами, которые необходимо покрывать валовой маржой от пользователей.

Прибыль компаний зависит от разницы между стоимостью подписки и реальным потреблением токенов. Цена API показывает истинные затраты на генерацию: например, один миллион выходных токенов Opus обходится в 25 долларов. Текущие подписки за 200 долларов становятся убыточными для компаний, если пользователи активно задействуют агентские возможности и превышают лимиты в миллионы токенов.

Дефицит ресурсов и изменение паттернов использования

  • Индустрия ИИ столкнулась с нехваткой оперативной памяти и сетевого оборудования для кластеров GPU.
  • Энергообеспечение центров обработки данных требует строительства автономных станций, что замедляет масштабирование.
  • Агентские рабочие процессы сжигают токены в сотни раз быстрее, чем обычные сессии чата.

Рост цен и ограничения вызваны физическим дефицитом ресурсов, необходимых для работы моделей. Энергетические ограничения заставляют компании строить автономные объекты с газовыми турбинами или ядерными реакторами. Одновременно с этим переход от редких чат-запросов к непрерывным сессиям кодинга драматически увеличил нагрузку на вычислительные мощности.

Будущее ценообразования и корпоративное использование

  • Корпоративные клиенты, использующие агентские рабочие процессы, создают наибольшую финансовую нагрузку на провайдеров.
  • Подписки в будущем могут стоить тысячи долларов в месяц при сравнении со стоимостью человеческого труда.
  • Рынок будет сегментироваться на дешевые планы для обычных пользователей и дорогие профессиональные тарифы.

Компании, такие как Anthropic, испытывают большее давление, так как их база клиентов исторически ориентирована на бизнес-задачи. В ближайшем будущем ожидается разделение рынков: простые пользователи сохранят доступ к ограниченным лимитам, тогда как профессиональный сегмент перейдет на дорогостоящие корпоративные тарифы, стоимость которых будет определяться эффективностью замещения труда сотрудников.

Community Posts

View all posts