«Сколько это стоит и не набежит ли счёт» - первый вопрос, который задаёт владелец бизнеса, когда слышит про ИИ-агента. И ответа «столько-то рублей в месяц» он почти нигде не находит: в выдаче или вилки «от 50 тысяч до 15 миллионов» без разбора, или лендинги, которые называют цену только после заявки.
Разберу стоимость ИИ-агента по-честному и на цифрах. Окупаемость - отдельный разговор. Здесь про другое: сколько вы будете платить каждый месяц и из чего этот счёт складывается.
Сразу главное: подписка за 20 $ на ChatGPT или Claude и счёт за агента - это разные продукты с разными счетами, и путаница между ними рождает страх «набежит». Ниже - что почём на июль 2026 года, где прячутся расходы и как срезать счёт, ничего не теряя в качестве.
По теме нейросетей и автоматизации для бизнеса я регулярно разбираю инструменты, кейсы и цифры. Чтобы новые разборы не проходили мимо - подписка ниже.
Из чего складывается стоимость ИИ-агента?
Начну с карты, чтобы дальше было понятно, о чём речь.
ИИ-агент - это программа, которая сама выполняет задачу: читает заявку, лезет в базу знаний, отвечает клиенту, ставит статус в CRM. Что такое агент и зачем он бизнесу, я разбирал отдельно в материале про ИИ-агента для бизнеса. Здесь - только про деньги.
Стоимость ИИ-агента складывается из пяти статей расхода:
- Обращения к нейросети - плата за токены по API или подписка. Это «мозг» агента.
- Хостинг - где агент работает: облако провайдера или ваш сервер.
- Интеграции - связки с вашими системами: сайт, CRM, телефония, 1С.
- Разработка - разовая сборка под вашу задачу.
- Поддержка - ежемесячное обслуживание, мониторинг, доработки.
Первую статью - токены и подписки - разберу подробно, потому что именно вокруг неё больше всего путаницы. Остальные соберу в разделе про месячный счёт.
Подписка или оплата за токены: за что вы платите?
Это различие путают чаще всего, поэтому объясню на пальцах.
Подписка - фиксированная плата в месяц за то, что человек сидит в чате и общается с нейросетью руками. По сути безлимит с ограничениями по здравому смыслу. Ориентиры на июль 2026 года:
| План | Цена в месяц | Для кого |
|---|---|---|
| Claude Pro | 20 $ (включён Claude Code) | один человек, ежедневная работа |
| Claude Max | 100 $ или 200 $ | тяжёлое использование |
| ChatGPT Plus | 20 $ | один человек, флагманские модели |
| ChatGPT Business | около 25-30 $ за место (от 2 человек) | команда |
Тарифы сверяйте на сайтах Anthropic и OpenAI перед оплатой - они меняются, и точное число сообщений в подписке компании официально не раскрывают, пишут только «лимиты применяются» (Claude - тарифы).
Оплата за токены (API) - вы платите за каждое слово, которое отправили модели и получили обратно. Токен - это кусочек слова, примерно четыре символа; для русского текста токенов на то же сообщение уходит больше, чем для английского. Именно на API работают агенты: программа сама дёргает модель десятки и сотни раз за одну задачу, и подписочный «безлимит для человека» тут не применяется. Как отмечает отраслевое издание IntuitionLabs, API - это отдельный продукт для разработчиков, а подписка - для человека в чате (IntuitionLabs).
Простой ориентир: если вы один и отправляете меньше 80 сообщений в день - выгоднее подписка, она предсказуема. Если работает автоматический поток запросов - это API, и считать надо иначе. Ту же развилку «подписка против оплаты по токенам» я подробно разбирал в сравнении Claude Code и Cursor.
Сколько стоят токены у разных нейросетей?
Цены указывают за 1 миллион токенов (для зарубежных) или за 1000 токенов (для российских). Вот ориентиры на июль 2026 года.
Зарубежные модели (в долларах, за 1 млн токенов):
| Модель | Ввод | Вывод |
|---|---|---|
| Claude Sonnet 5 (промо до 31.08.2026) | 2 $ | 10 $ |
| Claude Sonnet 5 (стандарт с 01.09.2026) | 3 $ | 15 $ |
| Claude Opus 4.8 | 5 $ | 25 $ |
| GPT-5.6 Terra | 2,5 $ | 15 $ |
| GPT-5.6 Sol | 5 $ | 30 $ |
Claude Sonnet 5 вышел 30 июня 2026 года и позиционируется как дешёвый способ гонять агентов - при этом окно контекста в 1 миллион токенов идёт без наценки за длину (Anthropic, разбор Саймона Уиллисона). Цены по GPT и Opus приведены по данным независимых агрегаторов, официальные страницы стоит сверить перед расчётами (Eden AI). Есть и более дорогой топ-тир Anthropic - Fable 5 (около 10 $ / 50 $), но доступ к нему в 2026 году менялся из-за экспортных ограничений, так что для большинства задач это не рабочий вариант.
Российские модели (в рублях, за 1000 токенов):
| Модель | Ввод / вывод за 1000 токенов |
|---|---|
| GigaChat 2 Lite | 0,065 ₽ |
| GigaChat 2 Pro | 0,5 ₽ |
| GigaChat 2 Max | 0,65 ₽ |
| YandexGPT 5 Pro | около 2 / 6 ₽ |
Источник по GigaChat - официальные тарифы Сбера для юрлиц, минимальный платёж 600 ₽ в месяц при любом использовании (GigaChat - тарифы). GigaChat Lite за 0,065 ₽ за 1000 токенов - это 65 ₽ за миллион, в разы дешевле фронтир-моделей, но и класс задач у него проще. Что из российских нейросетей на что годится, я разбирал в материале про российские нейросети для бизнеса.
Две ошибки, на которых теряют деньги при сравнении. Первая: российские модели считают за 1000 токенов, зарубежные - за миллион, разница в 1000 раз, легко перепутать. Вторая: вывод дороже ввода в 5-6 раз, поэтому агент, который генерирует много текста, обходится заметно дороже того, который коротко отвечает по делу.
Собрать под свою задачу рабочего агента вместо перебора моделей наугад помогает автоматизация бизнеса с ИИ от ClaudeLab: подбираем модель под задачу и считаем экономику заранее, чтобы счёт был предсказуемым с первого месяца.
Почему счёт за ИИ-агента бывает непредсказуемым?
Главная причина непредсказуемости - в самой природе агента. Он не работает по схеме «один вопрос - один ответ». Он идёт по задаче шагами: делает шаг, обращается к базе, вызывает инструмент, проверяет результат и переходит к следующему шагу.
Каждое обращение к модели по API не хранит состояние между запросами. Поэтому на каждом шаге агент заново отправляет всю накопленную историю. Чем дальше в задачу, тем больше текста уходит в каждый запрос. По расчётам Augment Code, уже десять шагов такого цикла обходятся примерно в 43 раза дороже одного вызова - контекст растёт на каждом шаге (Augment Code).
К этому добавляется ещё пара источников роста счёта:
- Ретраи инструментов. Если у агента не выставлен лимит попыток, при ошибке он может дёргать один и тот же инструмент по кругу, и расход растёт.
- Размер контекста. Окно в миллион токенов удобно, но каждый проход с забитым контекстом оплачивается по полной: 500 000 токенов на входе по 2 $ за миллион - это доллар за один запрос.
- Русский текст. На тот же смысл по-русски уходит больше токенов, чем по-английски.
Вот почему нельзя заранее назвать точную цену задачи, не прикинув, сколько шагов и контекста она потребует. Хорошая новость: всё это управляемо, и в разделе про экономию я покажу, чем именно.
Сколько ИИ-агент реально стоит в месяц для бизнеса?
Теперь главный вопрос - сколько всё это выходит в месяц. Реальная стоимость ИИ-агента для малого бизнеса укладывается в понятные ориентиры, соберу их по уровням по оценке рынка на vc.ru (vc.ru).
| Уровень | Разовая разработка | Ежемесячно |
|---|---|---|
| Базовый (чат на сайте или в Telegram из базы знаний) | 50 000-200 000 ₽ | 5 000-15 000 ₽ |
| Средний (мультиканал + интеграция с CRM + действия) | 300 000-1 500 000 ₽ | 15 000-80 000 ₽ |
| Корпоративный (голос, аналитика, много компонентов) | 3 000 000-15 000 000 ₽ | от 300 000 ₽ |
Отсюда развилка «сам или подрядчик». Собрать базового агента самому на готовой платформе можно за 20 000-50 000 ₽ разово или почти бесплатно на самообслуживании; готовые решения по подписке идут от 3 000-5 000 ₽ в месяц. Я сам не программист, но за две недели собрал Telegram-бота через Claude Code, а рутину закрываю командой из нескольких ИИ-агентов - и по деньгам это дешевле, чем платить людям за те же задачи. Как переложить рутину на нейросети, я показывал в разборе автоматизации рутины.
Но у самостоятельной сборки есть потолок: как только нужны интеграция с 1С, сложная логика или гарантия, что данные не уйдут наружу, - разумнее заказать разработку у подрядчика. Там счёт выше, но включает то, на чём новичок обычно спотыкается. Разработку ИИ-чат-бота под ключ как раз делает ClaudeLab - от задачи до работающего решения.
Какие расходы забывают заложить в бюджет?
Самая частая ошибка в расчётах - считать только цену сборки. Реальные деньги уходят на то, что идёт после.
- Подготовка данных - 100 000-500 000 ₽ и 2-4 недели. Без порядка в данных агент не заработает, это обязательное условие, а не опция.
- Интеграции с вашими системами. По оценке разборов рынка, большая доля стоимости приходится на связку с CRM, телефонией и учётными системами - это дороже самой модели.
- Переделки после запуска - 20-30% от бюджета проекта. Первый запуск почти всегда требует доработок.
- Мониторинг и поддержка - постоянная строка расхода, а не разовая.
- Цена ошибки агента. Агент с доступом к почте, CRM и клиентской базе может при сбое отправить не то письмо или изменить данные, и без лимитов прав о проблеме вы узнаёте уже от клиента - это одна из типовых ошибок внедрения (kod.ru).
Главные деньги здесь уходят на сопровождение: платить за токены и держать людей на мониторинге придётся постоянно, и это часто выходит дороже самой разработки. Именно недооценка этой части и роняет проекты - почему внедрение ИИ буксует, я разбирал в материале про частые причины провала.
Когда ИИ-агент не окупается?
Честный разговор про деньги - это и про то, когда агента брать не стоит. Признаки, что он не окупится:
- Мало обращений. До 10-15 запросов в день - человек дешевле, разработка и содержание не отобьются.
- Каждая задача уникальна. Сложные переговоры, нетиповые юридические разборы - агент силён на повторяемом и бесполезен на редком.
- Нет оцифрованных данных. Сначала придётся заплатить за оцифровку, и это убивает экономику.
- Расчёт на «поставил и забыл». Агент требует регулярного сопровождения; без него проект забрасывают, а агента отключают.
- Высокая цена ошибки без контроля. Показательна история финтех-компании Klarna: она сделала ставку на ИИ-агента в поддержке, рассчитывая закрыть им около двух третей обращений, но на нестандартных ситуациях качество падало, клиенты оставались недовольны - и часть работы пришлось вернуть людям. Случай широко разбирали в отраслевой прессе.
Что до окупаемости на подходящих задачах: по разным оценкам, типовые решения возвращают вложения за 3-6 месяцев, а базовые - за 1-2. Сколько и как считать окупаемость, я разбирал отдельно в материале про окупаемость ИИ для бизнеса - это companion к этому разбору: там про «вернутся ли деньги», здесь про «сколько платить».
Как снизить стоимость ИИ-агента без потери качества?
Снизить стоимость ИИ-агента можно, не жертвуя качеством. Вот приёмы по убыванию эффекта.
- Кэширование повторяющихся частей. То, что уходит в каждый запрос одинаковым - системная инструкция, база знаний, описание инструментов, - сохраняется в кэш, и повторное чтение стоит только 10% обычной цены. Экономия доходит до 90%, а вместе с пакетной обработкой - до 95% (Anthropic - документация).
- Не всегда топ-модель. Для большинства бизнес-задач хватает средней или дешёвой модели; дорогую подключают только там, где реально нужно сложное рассуждение.
- Российская модель для русского текста. У GigaChat и YandexGPT токенизатор заточен под кириллицу, оплата в рублях, данные остаются в России - для типовых русскоязычных задач это дешевле зарубежных аналогов.
- Лимиты трат. В кабинете провайдера ставится потолок расходов в месяц и лимит попыток для агента - это защита от цикла, который крутится без остановки, и первый способ сделать счёт предсказуемым.
- Начать с малого пилота. Один агент на одной узкой задаче с быстрой отдачей - проверить экономику на реальных цифрах, а потом масштабировать.
Один только пункт про кэширование в связке с выбором модели способен снизить месячный счёт в разы - именно на нём чаще всего экономят те, кто уже гоняет агентов в работе.
С чего начать, чтобы не переплатить?
Сведу всё в короткий план.
- Выберите одну задачу с частыми повторами - обработка типовых заявок, ответы на частые вопросы, первичная квалификация лидов.
- Прикиньте объём - сколько обращений в день. Меньше 10-15 - возможно, агент пока не нужен.
- Запустите пилот на 1-2 недели на дешёвой или средней модели с выставленным лимитом трат.
- Замерьте реальный счёт - токены, хостинг, время на настройку. Это и есть ваша стоимость ИИ-агента, а не цифра из чужой статьи.
- Решайте по цифрам. Окупается - масштабируйте и добавляйте кэширование. Нет - вы потеряли две недели и лимит трат, а не годовой бюджет.
Стоимость ИИ-агента у каждого своя - она зависит от вашей задачи, объёма и того, насколько точно агент настроен. Но порядок цифр теперь у вас есть, и разговор с подрядчиком или проба своими руками пойдут предметно, а не на ощупь.
Источники
- Claude - тарифы подписок
- Anthropic - анонс Claude Sonnet 5 (цены, окно 1M)
- Anthropic - документация по кэшированию промптов
- Саймон Уиллисон - независимый разбор Sonnet 5
- Eden AI - цены и бенчмарки GPT-5.6 Sol
- GigaChat - тарифы API для юрлиц (Сбер)
- IntuitionLabs - подписка против API и оптимизация токенов
- Augment Code - математика расходов агентного цикла
- vc.ru - стоимость ИИ-агента для бизнеса (РФ-ориентиры)
- kod.ru - 5 ошибок при внедрении ИИ-агента
Полную связку по теме - от выбора модели до работающего агента с предсказуемым счётом - можно собрать за один заход. ClaudeLab: продукты и решения на нейросетях для бизнеса, по делу и с результатом, который остаётся у вас.