ClaudeLab

Стоимость ИИ-агента для бизнеса: сколько это на самом деле в месяц

Опубликовано Jul 2, 202614 мин чтенияBeginner
Что вы узнаете
  • Поймёте, из чего складывается стоимость ИИ-агента: подписка, токены, хостинг, интеграции и поддержка - и почему подписка за 20 $ это вообще не про агента
  • Увидите реальные цены на токены у Claude, GPT и российских GigaChat и YandexGPT - и научитесь не путать цену за 1000 и за 1 000 000 токенов
  • Разберётесь, почему счёт бывает непредсказуемым и какие расходы бизнес забывает заложить в бюджет
  • Получите ориентиры «сколько это в месяц» для малого бизнеса в рублях - от 5 000 ₽ до сотен тысяч
  • Заберёте список приёмов, которые режут счёт до 90%, и план старта, чтобы не переплатить на пробах
Применить за 20 мин
Экономит 5 ч
Новичок
1просмотров

«Сколько это стоит и не набежит ли счёт» - первый вопрос, который задаёт владелец бизнеса, когда слышит про ИИ-агента. И ответа «столько-то рублей в месяц» он почти нигде не находит: в выдаче или вилки «от 50 тысяч до 15 миллионов» без разбора, или лендинги, которые называют цену только после заявки.

Разберу стоимость ИИ-агента по-честному и на цифрах. Окупаемость - отдельный разговор. Здесь про другое: сколько вы будете платить каждый месяц и из чего этот счёт складывается.

Сразу главное: подписка за 20 $ на ChatGPT или Claude и счёт за агента - это разные продукты с разными счетами, и путаница между ними рождает страх «набежит». Ниже - что почём на июль 2026 года, где прячутся расходы и как срезать счёт, ничего не теряя в качестве.

По теме нейросетей и автоматизации для бизнеса я регулярно разбираю инструменты, кейсы и цифры. Чтобы новые разборы не проходили мимо - подписка ниже.

Из чего складывается стоимость ИИ-агента?

Начну с карты, чтобы дальше было понятно, о чём речь.

ИИ-агент - это программа, которая сама выполняет задачу: читает заявку, лезет в базу знаний, отвечает клиенту, ставит статус в CRM. Что такое агент и зачем он бизнесу, я разбирал отдельно в материале про ИИ-агента для бизнеса. Здесь - только про деньги.

Стоимость ИИ-агента складывается из пяти статей расхода:

  1. Обращения к нейросети - плата за токены по API или подписка. Это «мозг» агента.
  2. Хостинг - где агент работает: облако провайдера или ваш сервер.
  3. Интеграции - связки с вашими системами: сайт, CRM, телефония, 1С.
  4. Разработка - разовая сборка под вашу задачу.
  5. Поддержка - ежемесячное обслуживание, мониторинг, доработки.

Первую статью - токены и подписки - разберу подробно, потому что именно вокруг неё больше всего путаницы. Остальные соберу в разделе про месячный счёт.

Подписка или оплата за токены: за что вы платите?

Это различие путают чаще всего, поэтому объясню на пальцах.

Подписка - фиксированная плата в месяц за то, что человек сидит в чате и общается с нейросетью руками. По сути безлимит с ограничениями по здравому смыслу. Ориентиры на июль 2026 года:

ПланЦена в месяцДля кого
Claude Pro20 $ (включён Claude Code)один человек, ежедневная работа
Claude Max100 $ или 200 $тяжёлое использование
ChatGPT Plus20 $один человек, флагманские модели
ChatGPT Businessоколо 25-30 $ за место (от 2 человек)команда

Тарифы сверяйте на сайтах Anthropic и OpenAI перед оплатой - они меняются, и точное число сообщений в подписке компании официально не раскрывают, пишут только «лимиты применяются» (Claude - тарифы).

Оплата за токены (API) - вы платите за каждое слово, которое отправили модели и получили обратно. Токен - это кусочек слова, примерно четыре символа; для русского текста токенов на то же сообщение уходит больше, чем для английского. Именно на API работают агенты: программа сама дёргает модель десятки и сотни раз за одну задачу, и подписочный «безлимит для человека» тут не применяется. Как отмечает отраслевое издание IntuitionLabs, API - это отдельный продукт для разработчиков, а подписка - для человека в чате (IntuitionLabs).

Простой ориентир: если вы один и отправляете меньше 80 сообщений в день - выгоднее подписка, она предсказуема. Если работает автоматический поток запросов - это API, и считать надо иначе. Ту же развилку «подписка против оплаты по токенам» я подробно разбирал в сравнении Claude Code и Cursor.

Сколько стоят токены у разных нейросетей?

Цены указывают за 1 миллион токенов (для зарубежных) или за 1000 токенов (для российских). Вот ориентиры на июль 2026 года.

Зарубежные модели (в долларах, за 1 млн токенов):

МодельВводВывод
Claude Sonnet 5 (промо до 31.08.2026)2 $10 $
Claude Sonnet 5 (стандарт с 01.09.2026)3 $15 $
Claude Opus 4.85 $25 $
GPT-5.6 Terra2,5 $15 $
GPT-5.6 Sol5 $30 $

Claude Sonnet 5 вышел 30 июня 2026 года и позиционируется как дешёвый способ гонять агентов - при этом окно контекста в 1 миллион токенов идёт без наценки за длину (Anthropic, разбор Саймона Уиллисона). Цены по GPT и Opus приведены по данным независимых агрегаторов, официальные страницы стоит сверить перед расчётами (Eden AI). Есть и более дорогой топ-тир Anthropic - Fable 5 (около 10 $ / 50 $), но доступ к нему в 2026 году менялся из-за экспортных ограничений, так что для большинства задач это не рабочий вариант.

Российские модели (в рублях, за 1000 токенов):

МодельВвод / вывод за 1000 токенов
GigaChat 2 Lite0,065 ₽
GigaChat 2 Pro0,5 ₽
GigaChat 2 Max0,65 ₽
YandexGPT 5 Proоколо 2 / 6 ₽

Источник по GigaChat - официальные тарифы Сбера для юрлиц, минимальный платёж 600 ₽ в месяц при любом использовании (GigaChat - тарифы). GigaChat Lite за 0,065 ₽ за 1000 токенов - это 65 ₽ за миллион, в разы дешевле фронтир-моделей, но и класс задач у него проще. Что из российских нейросетей на что годится, я разбирал в материале про российские нейросети для бизнеса.

Две ошибки, на которых теряют деньги при сравнении. Первая: российские модели считают за 1000 токенов, зарубежные - за миллион, разница в 1000 раз, легко перепутать. Вторая: вывод дороже ввода в 5-6 раз, поэтому агент, который генерирует много текста, обходится заметно дороже того, который коротко отвечает по делу.

Собрать под свою задачу рабочего агента вместо перебора моделей наугад помогает автоматизация бизнеса с ИИ от ClaudeLab: подбираем модель под задачу и считаем экономику заранее, чтобы счёт был предсказуемым с первого месяца.

Почему счёт за ИИ-агента бывает непредсказуемым?

Главная причина непредсказуемости - в самой природе агента. Он не работает по схеме «один вопрос - один ответ». Он идёт по задаче шагами: делает шаг, обращается к базе, вызывает инструмент, проверяет результат и переходит к следующему шагу.

Каждое обращение к модели по API не хранит состояние между запросами. Поэтому на каждом шаге агент заново отправляет всю накопленную историю. Чем дальше в задачу, тем больше текста уходит в каждый запрос. По расчётам Augment Code, уже десять шагов такого цикла обходятся примерно в 43 раза дороже одного вызова - контекст растёт на каждом шаге (Augment Code).

К этому добавляется ещё пара источников роста счёта:

  • Ретраи инструментов. Если у агента не выставлен лимит попыток, при ошибке он может дёргать один и тот же инструмент по кругу, и расход растёт.
  • Размер контекста. Окно в миллион токенов удобно, но каждый проход с забитым контекстом оплачивается по полной: 500 000 токенов на входе по 2 $ за миллион - это доллар за один запрос.
  • Русский текст. На тот же смысл по-русски уходит больше токенов, чем по-английски.

Вот почему нельзя заранее назвать точную цену задачи, не прикинув, сколько шагов и контекста она потребует. Хорошая новость: всё это управляемо, и в разделе про экономию я покажу, чем именно.

Сколько ИИ-агент реально стоит в месяц для бизнеса?

Теперь главный вопрос - сколько всё это выходит в месяц. Реальная стоимость ИИ-агента для малого бизнеса укладывается в понятные ориентиры, соберу их по уровням по оценке рынка на vc.ru (vc.ru).

УровеньРазовая разработкаЕжемесячно
Базовый (чат на сайте или в Telegram из базы знаний)50 000-200 000 ₽5 000-15 000 ₽
Средний (мультиканал + интеграция с CRM + действия)300 000-1 500 000 ₽15 000-80 000 ₽
Корпоративный (голос, аналитика, много компонентов)3 000 000-15 000 000 ₽от 300 000 ₽

Отсюда развилка «сам или подрядчик». Собрать базового агента самому на готовой платформе можно за 20 000-50 000 ₽ разово или почти бесплатно на самообслуживании; готовые решения по подписке идут от 3 000-5 000 ₽ в месяц. Я сам не программист, но за две недели собрал Telegram-бота через Claude Code, а рутину закрываю командой из нескольких ИИ-агентов - и по деньгам это дешевле, чем платить людям за те же задачи. Как переложить рутину на нейросети, я показывал в разборе автоматизации рутины.

Но у самостоятельной сборки есть потолок: как только нужны интеграция с 1С, сложная логика или гарантия, что данные не уйдут наружу, - разумнее заказать разработку у подрядчика. Там счёт выше, но включает то, на чём новичок обычно спотыкается. Разработку ИИ-чат-бота под ключ как раз делает ClaudeLab - от задачи до работающего решения.

Какие расходы забывают заложить в бюджет?

Самая частая ошибка в расчётах - считать только цену сборки. Реальные деньги уходят на то, что идёт после.

  • Подготовка данных - 100 000-500 000 ₽ и 2-4 недели. Без порядка в данных агент не заработает, это обязательное условие, а не опция.
  • Интеграции с вашими системами. По оценке разборов рынка, большая доля стоимости приходится на связку с CRM, телефонией и учётными системами - это дороже самой модели.
  • Переделки после запуска - 20-30% от бюджета проекта. Первый запуск почти всегда требует доработок.
  • Мониторинг и поддержка - постоянная строка расхода, а не разовая.
  • Цена ошибки агента. Агент с доступом к почте, CRM и клиентской базе может при сбое отправить не то письмо или изменить данные, и без лимитов прав о проблеме вы узнаёте уже от клиента - это одна из типовых ошибок внедрения (kod.ru).

Главные деньги здесь уходят на сопровождение: платить за токены и держать людей на мониторинге придётся постоянно, и это часто выходит дороже самой разработки. Именно недооценка этой части и роняет проекты - почему внедрение ИИ буксует, я разбирал в материале про частые причины провала.

Когда ИИ-агент не окупается?

Честный разговор про деньги - это и про то, когда агента брать не стоит. Признаки, что он не окупится:

  1. Мало обращений. До 10-15 запросов в день - человек дешевле, разработка и содержание не отобьются.
  2. Каждая задача уникальна. Сложные переговоры, нетиповые юридические разборы - агент силён на повторяемом и бесполезен на редком.
  3. Нет оцифрованных данных. Сначала придётся заплатить за оцифровку, и это убивает экономику.
  4. Расчёт на «поставил и забыл». Агент требует регулярного сопровождения; без него проект забрасывают, а агента отключают.
  5. Высокая цена ошибки без контроля. Показательна история финтех-компании Klarna: она сделала ставку на ИИ-агента в поддержке, рассчитывая закрыть им около двух третей обращений, но на нестандартных ситуациях качество падало, клиенты оставались недовольны - и часть работы пришлось вернуть людям. Случай широко разбирали в отраслевой прессе.

Что до окупаемости на подходящих задачах: по разным оценкам, типовые решения возвращают вложения за 3-6 месяцев, а базовые - за 1-2. Сколько и как считать окупаемость, я разбирал отдельно в материале про окупаемость ИИ для бизнеса - это companion к этому разбору: там про «вернутся ли деньги», здесь про «сколько платить».

Как снизить стоимость ИИ-агента без потери качества?

Снизить стоимость ИИ-агента можно, не жертвуя качеством. Вот приёмы по убыванию эффекта.

  1. Кэширование повторяющихся частей. То, что уходит в каждый запрос одинаковым - системная инструкция, база знаний, описание инструментов, - сохраняется в кэш, и повторное чтение стоит только 10% обычной цены. Экономия доходит до 90%, а вместе с пакетной обработкой - до 95% (Anthropic - документация).
  2. Не всегда топ-модель. Для большинства бизнес-задач хватает средней или дешёвой модели; дорогую подключают только там, где реально нужно сложное рассуждение.
  3. Российская модель для русского текста. У GigaChat и YandexGPT токенизатор заточен под кириллицу, оплата в рублях, данные остаются в России - для типовых русскоязычных задач это дешевле зарубежных аналогов.
  4. Лимиты трат. В кабинете провайдера ставится потолок расходов в месяц и лимит попыток для агента - это защита от цикла, который крутится без остановки, и первый способ сделать счёт предсказуемым.
  5. Начать с малого пилота. Один агент на одной узкой задаче с быстрой отдачей - проверить экономику на реальных цифрах, а потом масштабировать.

Один только пункт про кэширование в связке с выбором модели способен снизить месячный счёт в разы - именно на нём чаще всего экономят те, кто уже гоняет агентов в работе.

С чего начать, чтобы не переплатить?

Сведу всё в короткий план.

  1. Выберите одну задачу с частыми повторами - обработка типовых заявок, ответы на частые вопросы, первичная квалификация лидов.
  2. Прикиньте объём - сколько обращений в день. Меньше 10-15 - возможно, агент пока не нужен.
  3. Запустите пилот на 1-2 недели на дешёвой или средней модели с выставленным лимитом трат.
  4. Замерьте реальный счёт - токены, хостинг, время на настройку. Это и есть ваша стоимость ИИ-агента, а не цифра из чужой статьи.
  5. Решайте по цифрам. Окупается - масштабируйте и добавляйте кэширование. Нет - вы потеряли две недели и лимит трат, а не годовой бюджет.

Стоимость ИИ-агента у каждого своя - она зависит от вашей задачи, объёма и того, насколько точно агент настроен. Но порядок цифр теперь у вас есть, и разговор с подрядчиком или проба своими руками пойдут предметно, а не на ощупь.

Источники

Эта статья была полезна?
Максим Самусь
Автор
Максим Самусь
Основатель ClaudeLab

Похожие статьи

Внедрение ИИ в малом бизнесе: 5 причин провала и как его избежать

Большинство компаний пробуют ИИ и бросают: по данным MIT, 95% пилотов не дают эффекта на прибыль. Дело не в самой технологии - дело в том, как её внедряют. Разбираем 5 причин, почему внедрение ИИ в малом бизнесе буксует, и показываем по шагам, как запустить ИИ так, чтобы он окупился.

11 мин

Нейросеть для протокола совещаний: из записи звонка в задачи

Нейросеть для протокола совещаний экономит час после каждого созвона: из записи получается структурированный протокол и список задач с ответственными и сроками. Разбираю простыми словами, какие сервисы выбрать, насколько точно распознаётся русская речь, где она ошибается и с чего начать.

14 мин

Claude Cowork для бизнеса: ИИ-помощник в Excel, Gmail и Slack

Claude Cowork - это ИИ-сотрудник, который сам открывает файлы, собирает отчёты, разбирает почту и готовит презентации. Разбираем простыми словами, чем он отличается от Claude Code, сколько стоит в рублях, как платить из России и что нельзя ему отдавать по 152-ФЗ.

12 мин

Claude для малого бизнеса: 15 готовых ИИ-сценариев без программиста

Claude для малого бизнеса - это пакет из 15 готовых ИИ-сценариев и коннекторов к сервисам, которыми вы уже пользуетесь. Разбираю простыми словами, что Claude делает сам, чем отличается от обычного ChatGPT, сколько стоит в рублях, можно ли пользоваться из России и с чего начать без программиста.

15 мин