Нейросеть для протокола совещаний: из записи в задачи

После часа созвона начинается вторая работа: открыть запись, вспомнить, кто что обещал, выписать договорённости и разослать задачи. На это уходит почти столько же времени, сколько на саму встречу. А через неделю выясняется, что половина задач до исполнителей так и не дошла.

Нейросеть для протокола совещаний закрывает именно этот разрыв. Вы отдаёте ей запись звонка, а получаете готовый протокол: краткие итоги, принятые решения и список задач с ответственными и сроками. Вместо дословной расшифровки на двадцать страниц - короткий документ, который можно сразу разослать.

Разберу по делу: как это устроено, какие сервисы выбрать (российские, зарубежные или локальные), сколько стоит, насколько точно распознаётся русская речь, где нейросеть ошибается и с чего начать, чтобы не бросить после первой же встречи.

По теме нейросетей и автоматизации для бизнеса я регулярно разбираю инструменты, кейсы и ошибки. Чтобы новые разборы не проходили мимо - подписка ниже.

Что такое нейросеть для протокола совещаний и что она реально делает?

Обычная расшифровка даёт вам стену текста: дословно всё, что было сказано, со словами-паразитами и перебиваниями. Читать это дольше, чем послушать запись заново.

Нейросеть для протокола совещаний работает иначе. Она проходит запись до конца и собирает из неё короткий документ по структуре, к которой вы привыкли в деловой переписке:

Итоги встречи - о чём договорились в двух-трёх абзацах.
Решения - что приняли и почему.
Задачи - кто, что и к какому сроку делает.
Тайм-коды - к какой минуте записи относится каждый пункт, чтобы быстро перепроверить.

Главное возражение владельца здесь - «у меня и так всё в голове». Но договорённости из головы исчезают через пару дней, а из протокола - нет. Документ, который ушёл всем участникам сразу после звонка, снимает спор «мы так не договаривались» ещё до того, как он начался.

Как работает путь от записи звонка к задачам?

Нейросеть для протокола совещаний проходит запись в четыре шага, и на каждом возможна своя ошибка. Путь от аудио к готовому протоколу разбит на четыре шага, и каждый делает свою часть.

Распознавание речи. Нейросеть переводит звук в текст - отвечает на вопрос «что было сказано». Это базовый слой, на нём работают движки вроде Whisper, Yandex SpeechKit или SaluteSpeech от Сбера.
Разделение по говорящим. Система определяет, «кто и когда говорил», и расставляет реплики по участникам. Сначала метки обезличенные - «Говорящий 1», «Говорящий 2», а имена подтягиваются из списка участников встречи. В одном из исследований это формулируют так: распознавание отвечает, что было сказано, разделение по говорящим - кто говорил, а вместе они дают, кто что сказал (arXiv).
Сжатие в итоги. Длинный текст режется на смысловые блоки по темам, и каждый блок языковая модель сворачивает в короткие итоги и решения.
Выделение задач. На последнем шаге модель вытаскивает из текста «кто, что и к какому сроку», собирая список задач с ответственными.

Важная деталь, которую стоит держать в голове: итоговый протокол - это не дословная запись, а пересказ, который собрала модель. На последнем шаге она может и поправить ошибку распознавания по смыслу всего разговора, и наоборот - дописать то, чего не было. Поэтому протокол всегда стоит вычитывать, и ниже я покажу, на что смотреть в первую очередь.

Какие сервисы выбрать: российские, зарубежные или локальные?

Выбор нейросети для протокола совещаний сводится к трём группам. У каждой свои плюсы и свои ограничения.

Группа	Примеры	Плюсы	Минусы
Российские облачные	mymeet.ai, НаВстрече, MeetScribe, FollowUP, Таймлист, SaluteSpeech (Сбер), Yandex SpeechKit	русский язык по умолчанию, оплата в рублях, есть бесплатные лимиты	данные всё же уходят в чужое облако
Зарубежные облачные	Otter.ai, Fireflies, Fathom, Granola, Zoom AI Companion, Google Meet с Gemini	часто удобнее и зрелее, щедрые бесплатные тарифы	доступ и оплата из России затруднены, интерфейс на английском
Локальные	Whisper, WhisperX, MacWhisper, Buzz, Spokenly	запись не уходит в облако, нет абонплаты	нужен мощный компьютер, задачи и итоги приходится докручивать

Из российских облачных у новичка обычно меньше всего трений. Например, mymeet.ai даёт около 180 минут в месяц бесплатно и собирает протокол сразу в нескольких форматах. У Сбера есть SaluteSpeech в связке с GigaChat: бесплатный лимит около 100 минут распознавания в месяц, дальше - от 600 ₽ в месяц. Точные тарифы и лимиты меняются, поэтому сверяйте актуальное на сайте сервиса перед оплатой.

Зарубежные сервисы вроде Fathom или Otter.ai заметно удобнее, но из России к ним сложнее подключиться и ещё сложнее оплатить. Брать их имеет смысл, если у вас уже налажен зарубежный способ оплаты.

Локальные инструменты - отдельный разговор про конфиденциальность, он ниже.

Хотите собрать из этого рабочую связку под свой бизнес, а не просто протестировать сервис? То, что в статье, - первый шаг. ClaudeLab помогает выстроить автоматизацию на нейросетях целиком: от записи встреч до задач, которые сами уходят исполнителям.

Облако или свой компьютер: где безопаснее хранить запись?

Это главный вопрос, на котором владельцы спотыкаются. Запись переговоров - это ваша коммерческая конкретика: кто сколько просил, на что согласились, какие условия обсуждали. Отдавать это в чужое облако без понимания, где оно хранится, - риск.

Развилка простая:

Облако - быстро и без настройки, но запись и текст попадают на сервер сервиса. Для рутинных встреч это приемлемо, особенно у российских сервисов с хранением данных в России.
Локально - запись обрабатывается прямо на вашем компьютере и никуда не уходит. Платите вы только мощностью техники и временем на настройку.

Я сам пришёл к локальной обработке, когда перешёл на голосовой ввод вместо печати. Перебрал несколько инструментов транскрипции, и быстрые облачные либо упирались в платную подписку, либо отправляли всё на чужой сервер. В итоге остановился на связке, где модель распознавания работает локально, без облака, - получилось и быстрее, и спокойнее за данные. Тот же подход переносится на протоколы: основа здесь - открытая модель Whisper, на которой построено большинство локальных решений. На Mac её проще всего запустить через приложение вроде MacWhisper, где есть и распознавание говорящих, и итоги.

Минус честный: Whisper сам по себе не разделяет говорящих - для этого нужна отдельная модель, и связку приходится докручивать. Если в команде нет человека, готового в этом разобраться, начните с российского облака, а к локальному решению вернётесь, когда поймёте, что данные требуют этого.

Кстати, протокол - это только одна часть автоматизации рутины. Если хотите увидеть картину целиком, у меня есть отдельный разбор, как переложить рутинные задачи на нейросети.

Сколько это стоит?

Деньги здесь небольшие, и почти везде есть с чего начать без оплаты. Ориентиры на середину 2026 года:

Бесплатные лимиты. mymeet.ai - около 180 минут в месяц. SaluteSpeech от Сбера - около 100 минут распознавания. GigaChat умеет расшифровывать голосовые и файлы до 20 МБ бесплатно через мессенджер. Этого хватает, чтобы попробовать на реальных встречах.
Российское облако. Ориентир - от 600 ₽ в месяц. Yandex SpeechKit считает по факту, примерно 60 копеек за минуту распознавания.
Зарубежное облако. Otter.ai - около 17 $ в месяц, Fathom и Granola - в районе 14-19 $ за пользователя.
Локально. Открытые инструменты вроде Whisper и Buzz бесплатны. У MacWhisper есть бесплатная версия и разовая покупка Pro - цену сверяйте на сайте.

Тарифы и лимиты меняются часто, поэтому конкретные цифры перед оплатой сверяйте на сайте сервиса. Но порядок понятен: это десятки рублей за встречу, а не отдельная статья расходов.

Насколько точно нейросеть распознаёт русскую речь?

Нейросеть для протокола совещаний на русском языке распознаёт речь заметно хуже, чем на английском. Здесь полезно отделить рекламу от реальности. Российские сервисы часто заявляют точность транскрибации 95-98%. Это правда - но только для чистого аудио без шума и наложений.

На реальных встречах цифры скромнее. По разбору точности Whisper, в идеальных условиях модель ошибается примерно в 2,7% слов, но на реальном английском аудио - встречи, звонки, подкасты - доля ошибок поднимается до 8-12%, а при трёх и более участниках доходит до 10-15% (Vexascribe). Русский язык распознаётся стабильно хуже английского - ориентировочно в полтора-два раза больше ошибок.

Что это значит на практике: на каждые сто слов придётся десяток-другой неточностей, и собираются они в самых неудобных местах - имена, фамилии, термины, числа и сроки. Отказываться из-за этого не стоит - просто вычитывайте протокол перед рассылкой. Пять минут проверки экономят день разбирательств из-за неверного срока.

Где нейросеть чаще всего ошибается в протоколе?

Ошибки нейросети в протоколе предсказуемы. Зная их, вы за пару минут проверяете именно те места, где она обычно и ошибается.

Перепутанные говорящие. Разделение по участникам ошибается чаще, чем кажется: в независимых разборах доля таких ошибок - около 11-13%, и этого достаточно, чтобы задача регулярно уходила не тому человеку (Luminix). Лечится тем, что вы заранее загружаете список участников.
Выдуманные детали. В паузах и на тихих участках модель иногда выдаёт текст, которого в разговоре не было. Исследование, представленное на конференции ACM FAccT в 2024 году, зафиксировало, что Whisper дописывает несуществующий контент в тишине (Vexascribe). Гладкий, складный - и неверный.
Потерянные оговорки. Фраза «запустим в среду, если до этого согласует юрист» легко превращается в задачу «запустить в среду» - без условия. А условие здесь важнее всего.
Неверные числа и сроки. Даты, суммы и проценты - первые кандидаты на ошибку. В протоколе, по которому потом сверяют договорённости, это особенно дорого.

Простое правило: всё, что касается денег, сроков и ответственных, перепроверяйте по записи. Тайм-коды для того и нужны - кликнули и проверили спорный пункт за десять секунд.

Как из протокола получить задачи с ответственными и сроками?

Готовый протокол - это половина дела. Если он лежит красивым файлом, а задачи всё равно нужно вручную переносить в трекер и пинговать людей, вы сэкономили десять минут на расшифровке и потеряли их на переносе.

Ценность появляется, когда цепочка доходит до конца:

Задачи в виде списка. Нейросеть для протокола совещаний выдаёт список: задача, ответственный, срок. В таком виде их можно передавать дальше автоматически.
Доставка исполнителю. Задачи уходят туда, где люди работают: в таск-трекер, в почту или в чат. Российскому бизнесу ближе всего Telegram - туда удобно отправлять и сам протокол, и персональные задачи каждому. Как поставить такого бота, я разбирал отдельно: Telegram-бот для бизнеса.
Контроль без напоминаний руками. Связка может сама напомнить о приближающемся сроке, а с вас снять роль «человека, который всех пингует».

Дальше эту логику можно усложнять. Один сервис собирает протокол, второй - раскидывает задачи, третий - следит за сроками. По сути получается небольшая команда исполнителей, где каждый отвечает за свой кусок. Как устроена такая связка из нескольких ролей, я показывал в разборе про команду ИИ-агентов.

Для начала это усложнять не нужно. Но держать в голове конечную точку - «задачи у исполнителей без моего участия» - полезно с первого дня.

Можно ли записывать совещание без согласия участников?

Нейросеть для протокола совещаний работает с записью разговора, а запись участников - чувствительная зона. Тема щекотливая, поэтому без категоричности и с оговоркой: это общие ориентиры, а не юридическая консультация. По конкретной ситуации сверяйтесь с юристом.

Прямого запрета записывать разговор в России нет. Ограничение касается сведений о частной жизни собеседника. При этом судебная практика складывается в пользу записи, которую ведёт один из участников разговора. В материале ГАРАНТ.РУ со ссылкой на судебное дело прямо сказано: запись переговоров их участником или запись разговоров работников с клиентами не является нарушением законодательства (Гарант).

Отсюда практические ориентиры:

Предупреждайте о записи. Короткой фразы в начале встречи достаточно. Это снимает и юридический, и этический вопрос.
Помните о персональных данных. Если в разговоре звучат чужие персональные данные, их обработка по общему правилу требует согласия.
Не подключайте бота тайком. На Западе автоматические нотетейкеры, которые тихо присоединяются к звонку и собирают «голосовые отпечатки», уже стали поводом для исков. Не повторяйте это у себя.

Тему конфиденциальности и безопасности при работе с нейросетями я разбирал шире - в материале про безопасность ИИ-агентов.

С чего начать: маршрут на один вечер

Нейросеть для протокола совещаний проверяется на одной встрече, поэтому не выбирайте инструмент неделю. Проверьте подход на реальном созвоне.

Возьмите запись реального созвона. Подойдёт любая встреча на 30-60 минут, где были договорённости и задачи.
Прогоните через бесплатный сервис. Для старта - российское облако с бесплатным лимитом: mymeet.ai или SaluteSpeech. Загрузите список участников, чтобы имена встали на места.
Вычитайте протокол. Пройдите по задачам, срокам и числам. Спорные места проверьте по тайм-кодам. На это уйдёт пять-десять минут.
Разошлите участникам. Отправьте итоги и задачи всем, кто был на встрече, в тот же день.
Сделайте так трижды. После трёх встреч вы поймёте, где сервис ошибается на ваших темах, и решите, стоит ли платить или переходить на локальную обработку.

Один пройденный цикл стоит десяти статей со сравнениями. Через вечер у вас будет своё мнение, а не чужое.

5 ошибок, которые сводят пользу на ноль

Нейросеть для протокола совещаний приносит пользу только при базовой дисциплине. Эти ошибки повторяются у всех, кто начинает, и их легко обойти, если знать заранее.

Рассылать без вычитки. Протокол - это пересказ модели, а не стенограмма. Неверный срок, ушедший всем участникам, дороже пяти минут проверки.
Молчать про запись. Скрытая запись портит и отношения, и правовую сторону. Предупредить - дело одной фразы.
Плохой звук. На записи с шумом, эхом и наложением голосов точность падает в разы. Хороший микрофон и просьба не перебивать друг друга дают больше, чем смена сервиса.
Не загрузить участников. Без списка имён вы получите «Говорящий 1» и «Говорящий 2», а задачи - без ответственных.
Чувствительные данные в случайное облако. Прежде чем грузить переговоры с цифрами и клиентами, разберитесь, где сервис хранит данные. Для острых случаев - локальная обработка.

Источники

Полную связку по теме - от записи встречи до контроля сроков без ручных напоминаний - можно собрать за один заход. ClaudeLab: продукты и решения на нейросетях для бизнеса, по делу и с результатом, который остаётся у вас.

Собрать решение с ClaudeLab

Нейросеть для протокола совещаний: из записи звонка в задачи