Подписки на ИИ становятся менее привлекательными

Русскийالعربية Deutsch English Español Français हिन्दी Bahasa Indonesia 日本語 한국어 Português 中文

MMaximilian Schwarzmüller

Computing/SoftwareSmall Business/StartupsBusiness News

Transcript

00:00:00Сегодня утром я увидел этот пост на X, в котором упоминается, что Anthropic, по-видимому, убрала

00:00:09плагин Cloud Code из плана Pro, так что теперь вам требуются более дорогие

00:00:17подписки, чтобы иметь возможность использовать Cloud Code или свою подписку в Cloud Code.

00:00:22Что ж, Anthropic быстро прокомментировала это, отметив, что это всего лишь небольшой

00:00:27тест, который они проводят только на 2% новых подписчиков уровня prosumer.

00:00:32Я нахожу странным проведение такого теста, и я также думаю, что Anthropic могла бы

00:00:40предвидеть реакцию, запуская подобный тест, и понять, какой эффект это окажет

00:00:47на их имидж и что люди будут думать, потому что, конечно, это явно вписывается в ту

00:00:53тенденцию, которую мы уже наблюдаем: мы получаем меньше пользы от наших подписок, мы видим

00:00:59более жесткие ограничения, мы видим снижение производительности моделей, поскольку кажется, что все эти

00:01:08вещи происходили в последние пару недель. Я имею в виду, что Anthropic агрессивно ограничила

00:01:14использование своей подписки вне Cloud Code. Если вы хотели использовать ее, например, с Open Cloud,

00:01:21они пресекли это, так что всё это даёт нам ясную, более широкую картину.

00:01:28И в эту картину или повествование вписывается новостная статья, опубликованная GitHub пару

00:01:37дней назад, где они ясно дали понять, что приостановят новые подписки на GitHub Copilot Pro,

00:01:43Pro Plus и Student, и что они ужесточают лимиты использования для индивидуальных планов,

00:01:49и, что самое важное, что модели Opus больше не доступны в планах Pro, и всё это,

00:01:56конечно, имеет смысл, но мы должны немного глубже погрузиться в экономику происходящего,

00:02:02чтобы понять, почему это происходит и, что самое важное, что это означает для нас также в

00:02:07будущем. Это явно означает, что дни безлимитного использования и огромных субсидий прошли, и чтобы понять это,

00:02:17мы должны разобраться в экономике этих подписок и использования токенов, можно сказать,

00:02:25или потребления токенов, потому что, конечно, эти модели подписки, предлагаемые Anthropic,

00:02:34OpenAI, GitHub, действительно работают только в том случае, если большинство пользователей не используют на самом деле весь

00:02:43доступный им лимит использования. Это практически так для любого предложения подписки,

00:02:49не только для этих ИИ-подписок. Если у вас есть подписка на Netflix и вы 24/7 смотрите

00:02:56Netflix, вы, вероятно, скорее всего, не будете супер прибыльным клиентом для них, но большинство людей

00:03:02этого не делают, и именно так эти компании могут получать прибыль. Это верно для всех подписок,

00:03:10очевидно. Теперь мы можем увидеть истинную цену, или цену, которая ближе к истинной цене наших ИИ-запросов,

00:03:19если мы взглянем на страницы ценообразования API этих компаний. Например, мы можем увидеть,

00:03:26что новейшая модель от Anthropic, Claude Opus 4.7, имеет цену входных токенов пять долларов за

00:03:35миллион токенов и цену выходных токенов 25 долларов за миллион токенов, и мы можем соотнести это

00:03:42с другими моделями, которые у них есть, мы можем, конечно, также соотнести это с тем, что OpenAI может

00:03:47предложить, например. Там мы видим, что GPT-4o, которую большинство пользователей кодеков, вероятно, используют прямо сейчас, имеет

00:03:54цену входных токенов два доллара пятьдесят центов за миллион токенов, то есть только половину от того, что было у Opus 4.7,

00:04:03и цену выходных токенов 22 доллара 50 центов, так что немного меньше, чем мы видели для Opus. Теперь,

00:04:11вероятно, справедливо предположить, что эти цены на API — это цены, которые оставляют эти компании

00:04:20на уровне безубыточности или небольшой прибыли в отношении их валовой маржи, так что если мы просто посмотрим на

00:04:29стоимость вывода в частности, мы можем, вероятно, предположить, что они получат прибыль, если вы используете их

00:04:36API. Теперь, конечно, для этого важно понимать, что стоимость запуска ИИ-моделей

00:04:43в конечном итоге зависит от двух основных факторов: это обучение ИИ-моделей, которое стоит денег, и

00:04:53это вывод, конечно, так что у нас есть эти два фактора, которые вступают в игру для этих

00:04:59ИИ-компаний. Теперь, конечно, стоимость обучения — это разовая вещь, верно? Так что вы обучаете модель один раз,

00:05:06и это очень дорого, но очевидно, что это разовая вещь. Конечно, эти компании затем

00:05:12обучают всё больше и больше моделей, и это новый разовый расход для каждой модели, но как только модель была обучена,

00:05:18она больше не несет никаких затрат на обучение, за исключением, может быть, дальнейших прогонов тонкой настройки или производных

00:05:25моделей от этой базовой модели, но да, большая часть затрат возникает только один раз. Теперь для вывода

00:05:33естественно, это иначе, это текущие расходы, это в конечном итоге за запрос, потому что, конечно,

00:05:41вывод — это процесс создания конкретного результата для вашего промпта, для вашей задачи, которую вы отправляете

00:05:48провайдеру модели, и вывод — это, конечно, то, что происходит всё время, когда вы используете

00:05:53Claude Code, когда вы используете кодеки, но также, конечно, когда вы отправляете промпт в ChatGPT или в

00:05:58любом другом месте. Теперь это, конечно, то, где вы хотите, по крайней мере, выйти в ноль с ценообразованием вашего API,

00:06:07потому что иначе это означает, что вы теряете деньги на каждом полученном запросе, и хотя вы могли бы,

00:06:13конечно, делать это, чтобы увеличить свою долю рынка, и хотя я бы не исключал, что компании

00:06:19иногда делают это, делать это в долгосрочной перспективе, конечно, не будет жизнеспособно, потому что вы обанкротитесь.

00:06:25Теперь естественно, вам также нужно заработать на ваши затраты на обучение в какой-то момент, так что в идеале

00:06:34эти входящие запросы, которые отправляют вам ваши пользователи, дают вам достаточную валовую маржу от ваших

00:06:41затрат на вывод, так что эта маржа также покрывает ваши затраты на обучение, ваши расходы на персонал и так далее. Так что,

00:06:48конечно, такова экономика того, как вы можете запускать и использовать эти ИИ-модели. Теперь, как упоминалось, стоимость API

00:06:57— это, вероятно, та часть, где эти компании не теряют огромные суммы

00:07:02денег, но, конечно, как потребитель, как клиент, вы теряете, если бы вы питались Claude Code этими

00:07:10ценами Opus по требованию, вы бы платили намного, намного больше, чем если бы вы использовали их подписки,

00:07:18потому что, конечно, с подпиской Max, например, всего за 200 баксов вы получаете

00:07:26много использования из этого плана, вы получите много миллионов токенов из этого плана, и если вы

00:07:34взглянете на то, что обычно стоят выходные токены за миллион токенов, вы можете увидеть, что

00:07:39обычно, если вы игнорируете входные токены, чего вы не должны делать, но если вы игнорируете их для этих двух

00:07:44сот долларов здесь, мы не должны даже получить 10 миллионов выходных токенов, верно? Потому что один миллион

00:07:51стоит нам 25 долларов, так что мы должны получить только восемь миллионов выходных токенов, а затем, если вы учтете

00:07:56входные токены, это было бы меньше, чем это, и ясно, что если у вас были какие-либо долгосрочные сессии, если вы

00:08:02использовали Claude Code, например, в течение недели, и вы отслеживаете использование своих токенов, вы увидите, что вы

00:08:08можете выйти за пределы этого лимита, и вы определенно могли в прошлом, и это делает очевидным, почему эти

00:08:14компании как бы пытаются ограничить то, сколько использования вы можете получить из своих подписок,

00:08:19и почему я думаю, что мы увидим более высокие цены на подписку определенно в будущем, может быть, уже

00:08:25в ближайшем будущем. Теперь, конечно, не очень легко этим компаниям повышать свои цены,

00:08:30однако, потому что доля рынка, очевидно, все эти компании хотят агрессивно захватить долю рынка,

00:08:37причина в том, что если вы основная компания, которая утвердилась как провайдер ИИ-агентов по кодингу в

00:08:45многих предприятиях, в многих компаниях, они, вероятно, будут платить более высокие цены за подписку

00:08:51в будущем, так что вы не хотите начинать повышать свои цены слишком рано, потому что это может

00:08:57оттолкнуть некоторых ваших клиентов к конкурентам, чего вы, конечно, не хотите. С другой стороны,

00:09:02вы не хотите обанкротиться. Я имею в виду, например, OpenAI недавно привлекла 122 миллиарда долларов,

00:09:09чтобы ускорить следующую фазу ИИ, и вы могли бы прочитать это так, что это даст им только

00:09:17около 18 месяцев резервов, так что 18 месяцев до того, как им нужно будет снова привлекать средства, так что ясно, вы не можете

00:09:26продолжать субсидировать всё это использование вечно, потому что если вы обанкротитесь, то все ваши клиенты

00:09:32всё равно уйдут к вашим конкурентам, так что здесь есть компромисс, и это, конечно, именно та

00:09:39сложная ситуация, с которой сейчас сталкиваются эти компании, такова экономика здесь. Теперь, конечно, как вы

00:09:44вероятно, читали, а также чувствовали, если вы геймер, например, мы находимся в моменте времени, когда из-за

00:09:52всех этих ИИ-вещей, которые происходят, мы сталкиваемся с большим дефицитом вычислительных мощностей и кризисом, а также высокими ценами на

00:10:01память и всё, что связано с тем, что нужно этим ИИ-моделям и этим ИИ-центрам обработки данных, так что

00:10:08память дорогая, потому что для вывода нужно много памяти, если вы пробовали запускать модели

00:10:13локально на своей системе, вы знаете, что вам нужно много памяти для этого, так что цены на память выросли,

00:10:19но это не только память, это также сетевое оборудование, потому что, конечно, вы запускаете как обучение,

00:10:25так и вывод, не на одном чипе, а на огромных стойках и кластерах чипов, и все эти

00:10:31кластеры нуждаются в соединениях между кластерами, между чипами, чтобы вы могли строить супер

00:10:36GPU, так сказать, и это сетевое оборудование пользуется большим спросом и поэтому дорогое, и тогда, конечно,

00:10:43у нас также есть энергия и центры обработки данных, нам нужно и то, и другое, нам нужны центры обработки данных, чтобы поместить туда эти чипы, и именно поэтому

00:10:52много строительства происходит там, но затем эти центры обработки данных, им нужна энергия, верно? И вы

00:10:58слышали об этом тоже, энергия — это еще одна большая проблема, вы не можете получить ее из сети, она просто не

00:11:05построена для этого, там недостаточно доступной энергии, именно поэтому все эти новые центры обработки данных

00:11:12переезжают на автономные решения, где энергия производится рядом с центром обработки данных с помощью газовых турбин

00:11:21или ядерной энергии, но это, конечно, всё требует времени, и это также требует компонентов, и нет

00:11:28бесконечного количества компаний, которые могут построить эти электростанции, нет бесконечного количества

00:11:35компонентов, которые нужны для строительства этих электростанций, так что это всё ограничивает количество

00:11:42вычислительных мощностей, которые могут быть введены в строй, чего, в свою очередь, не хватает для вывода и, конечно, также для

00:11:48обучения. Теперь исторически, и под этим я имею в виду только год или два назад, стимул для

00:11:54этих компаний заключался в том, чтобы посвятить много вычислительных ресурсов обучению, потому что это дает вам

00:12:00лучшие модели, что позволяет вам оставаться впереди или выйти вперед в гонке ИИ, и этот стимул всё еще существует, но

00:12:07конечно, в наши дни также есть больший стимул и более высокая важность здесь, в части вывода,

00:12:14потому что именно часть вывода дает вам клиентов, дает вам видимость на рынке,

00:12:19потому что если никто не может использовать ваши модели, то это здорово, что у вас хорошие модели, но вы

00:12:25не получаете никакой доли рынка, так что вам нужен вывод, который стал намного важнее, так что компаниям приходится

00:12:30делить скудные вычислительные ресурсы и мощности центров обработки данных между этими двумя целями, и конечно,

00:12:38особенно с начала этого года мы также видим изменившееся поведение использования клиентами.

00:12:45Они, новостная статья GitHub здесь на самом деле довольно открыта об этом, агентские рабочие процессы

00:12:51фундаментально изменили требования к вычислительным мощностям Copilot, долгосрочные параллельные сессии теперь регулярно

00:12:57потребляют намного больше ресурсов, чем оригинальная структура плана была создана для поддержки, и это то же самое,

00:13:04конечно, для Anthropic и OpenAI в прошлом, и опять же, это означает только год назад или около того,

00:13:10эти компании не в первую очередь, но в огромной степени действительно фокусировались только на случайных сессиях чата, а

00:13:20пользователь, клиент время от времени заходил и задавал ChatGPT или Claude вопрос, и конечно, это

00:13:27могло быть несколько раз в день, но это было всего лишь пара вопросов, просто пара ответов,

00:13:33пара последующих вопросов, конечно, намного меньше токенов, чем все эти долгосрочные агентские

00:13:39рабочие процессы и кодинговые сессии имеют. В тех кодинговых сессиях или в любых агентских рабочих процессах, которые вы

00:13:44запускаете, вы сжигаете сотни тысяч и миллионы токенов быстро, очень быстро, намного

00:13:51быстрее, чем вы могли бы со случайной сессией чата. Теперь, учитывая тот факт, что все эти

00:13:58современные модели, с которыми мы имеем дело, — это мыслящие модели, обычно количество токенов также стало

00:14:05выше по сравнению с годом или двумя назад, потому что ответ просто занимает больше токенов из-за этого

00:14:12мыслительного процесса, которые, конечно, всё еще являются токенами, даже если вы не видите их в конечном результате,

00:14:17может быть, поэтому количество потребляемых токенов стало намного, намного больше сейчас, чем год или два

00:14:24назад, снова приводя нас к тому, что вывод становится более важным, потому что вам нужно намного

00:14:29больше вывода, чтобы обработать всю эту генерацию токенов, которая происходит, и это причина, почему все

00:14:37эти новые модели довольно дорогие при использовании через API, но даже более важно, почему

00:14:43эти подписки настолько сложны для этих компаний прямо сейчас. Они представили те

00:14:49подписки в прошлом, когда потреблялось намного меньше токенов, а сейчас они в точке,

00:14:56где за ту же цену подписки люди теперь используют намного больше токенов, вот в чем сложность.

00:15:03Теперь, особенно для Anthropic, например, я мог бы представить, что они чувствуют боль немного больше,

00:15:09чем OpenAI, не только потому, что их модели, кажется, дороже в работе, если вы просто взглянете

00:15:16на ценообразование API, но также, конечно, потому что исторически, даже год назад, у Anthropic

00:15:22было больше корпоративных и бизнес-клиентов, что хорошо для них, в какой-то степени это стабильная

00:15:29база доходов, а ChatGPT или OpenAI были больше ориентированы на потребителей, у них было больше нормальных людей, обычных

00:15:38потребителей в качестве клиентов, и сейчас они также движутся больше к бизнесу, но исторически, потому что у них

00:15:43был момент ChatGPT, у них было больше нормальных людей в качестве клиентов. Недостаток для Anthropic сейчас,

00:15:50конечно, в том, что эти бизнес-клиенты — это именно те клиенты, которые запускают эти агентские

00:15:55рабочие процессы или которые склонны запускать эти агентские рабочие процессы. Я имею в виду, ваши мама и папа, если они

00:16:00платят за ChatGPT вообще, чего они, вероятно, не делают, они не запускают агентские рабочие процессы,

00:16:06но вы — да, ваша компания — да, и это, конечно, делает подписку еще более сложной для

00:16:11Anthropic, я бы представил, чем для OpenAI, где всё еще есть множество «нормисов» в подписке,

00:16:18я бы предположил, что они определенно чувствуют боль, и что всё это означает сейчас? Что

00:16:24изменения вроде этого или изменения вроде того поста на X, где Anthropic проводит тесты, чтобы убрать Claude Code

00:16:32из более дешевых планов, что всё это означает для нас? Я думаю, это довольно очевидно, мы увидим еще

00:16:38более строгие лимиты в будущем, и поэтому мы, конечно, можем достичь точки, когда подписки

00:16:42больше не будут казаться того стоящими, и я думаю, это будет момент, когда мы увидим

00:16:48более высокие цены. Это не неразумно, я думаю, верить, что эти кодинговые подписки или в целом

00:16:55эти подписки на агентское использование будут стоить много тысяч долларов в месяц в какой-то момент, не в этом

00:17:03году, скорее всего, но в какой-то момент, потому что, конечно, компании могут начать сравнивать стоимость

00:17:10этих подписок со стоимостью сотрудников, да, и это, конечно, не отличные новости, и это

00:17:17может быть совершенно неправильно, но это определенно то, что, я думаю, произойдет, и, конечно, когда вы делаете

00:17:23это сравнение, есть много возможностей для того, чтобы эти подписки стали намного, намного дороже,

00:17:30очевидно. Подписки тогда уже не будут для нормальных людей, так что я думаю, мы также увидим

00:17:35новые предложения подписки для них, которые просто имеют намного более строгие лимиты использования, которые достаточны

00:17:41для ChatGPT, но недостаточны для агентских рабочих процессов, но для профессионального использования, для агентских

00:17:47рабочих процессов, мы увидим более строгие лимиты и более высокие цены. Я не уверен когда, потому что вы знаете, доля рынка,

00:17:52верно? Так что то, что я упоминал раньше, но в конечном итоге мы увидим это, потому что в конечном счете,

00:17:58как упоминалось, у OpenAI есть около 18 месяцев резервов, они, вероятно, хотят остаться в бизнесе,

00:18:03то же самое для Anthropic, и поэтому это то, что, я думаю, мы увидим здесь через год или около того, я не знаю.

Key Takeaway

Эпоха безлимитного использования ИИ-подписок завершается из-за резкого роста потребления токенов агентскими рабочими процессами и высокой себестоимости вычислительных мощностей, что неизбежно приведет к повышению цен и введению строгих лимитов.

Highlights

Anthropic тестирует ограничение доступа к плагину Claude Code для 2% новых подписчиков Pro.
GitHub прекращает оформление новых подписок на Copilot Pro, Pro Plus и Student, а также ограничивает доступ к модели Opus.
API модели Claude Opus 4.7 стоит 5 долларов за миллион входных токенов и 25 долларов за миллион выходных токенов.
Стоимость входных токенов GPT-4o составляет 2,5 доллара за миллион, что вдвое дешевле Claude Opus 4.7.
Современные агентские рабочие процессы и кодинговые сессии потребляют значительно больше токенов, чем случайные чат-запросы.
Компании ИИ-индустрии стремятся избежать банкротства, так как текущие резервы, например у OpenAI, оцениваются примерно в 18 месяцев работы.

Timeline

Сокращение доступности и ужесточение лимитов

Anthropic начала тестирование по ограничению доступа к Claude Code для части новых пользователей.
GitHub приостановил новые подписки на планы Pro и исключил модель Opus из Pro-версии.
Пользователи получают меньше выгоды при сохранении или росте стоимости ИИ-подписок.

ИИ-компании внедряют более жесткие ограничения, чтобы сократить издержки на использование моделей вне рамок чат-интерфейсов. Эти изменения происходят на фоне агрессивного ограничения использования подписок в сторонних сервисах, таких как Open Cloud. Данная ситуация отражает общую тенденцию перехода от субсидируемого безлимитного доступа к модели ограниченного потребления.

Экономика токенов и себестоимость вывода

Бизнес-модель подписок основана на предположении, что большинство пользователей не используют весь доступный лимит.
Цена API-запросов отражает порог безубыточности для провайдеров моделей.
Затраты на вывод стали текущими расходами, которые необходимо покрывать валовой маржой от пользователей.

Прибыль компаний зависит от разницы между стоимостью подписки и реальным потреблением токенов. Цена API показывает истинные затраты на генерацию: например, один миллион выходных токенов Opus обходится в 25 долларов. Текущие подписки за 200 долларов становятся убыточными для компаний, если пользователи активно задействуют агентские возможности и превышают лимиты в миллионы токенов.

Дефицит ресурсов и изменение паттернов использования

Индустрия ИИ столкнулась с нехваткой оперативной памяти и сетевого оборудования для кластеров GPU.
Энергообеспечение центров обработки данных требует строительства автономных станций, что замедляет масштабирование.
Агентские рабочие процессы сжигают токены в сотни раз быстрее, чем обычные сессии чата.

Рост цен и ограничения вызваны физическим дефицитом ресурсов, необходимых для работы моделей. Энергетические ограничения заставляют компании строить автономные объекты с газовыми турбинами или ядерными реакторами. Одновременно с этим переход от редких чат-запросов к непрерывным сессиям кодинга драматически увеличил нагрузку на вычислительные мощности.

Будущее ценообразования и корпоративное использование

Корпоративные клиенты, использующие агентские рабочие процессы, создают наибольшую финансовую нагрузку на провайдеров.
Подписки в будущем могут стоить тысячи долларов в месяц при сравнении со стоимостью человеческого труда.
Рынок будет сегментироваться на дешевые планы для обычных пользователей и дорогие профессиональные тарифы.

Компании, такие как Anthropic, испытывают большее давление, так как их база клиентов исторически ориентирована на бизнес-задачи. В ближайшем будущем ожидается разделение рынков: простые пользователи сохранят доступ к ограниченным лимитам, тогда как профессиональный сегмент перейдет на дорогостоящие корпоративные тарифы, стоимость которых будет определяться эффективностью замещения труда сотрудников.

Community Posts

Write about this video