Zonka Feedback: трёхуровневая система анализа обратной связи с помощью ИИ

Схема Feedback Intelligence Framework: три кита анализа обратной связи

Команда Zonka Feedback опубликовала детальное описание системы, которую разрабатывала полтора года на основе интервью с более чем 100 руководителями CX из финансовой сферы, ретейла, SaaS и здравоохранения. Суть системы — три аналитических уровня, которые обрабатывают каждый отзыв одновременно, а не последовательно.

По данным собственного отчёта Zonka, 93% обратной связи не анализируется вовсе. 87% CX-команд по-прежнему вручную читают открытые ответы, чтобы извлечь инсайты. 57% руководителей говорят, что данные об опыте лишены бизнес-контекста — непонятно, какой филиал, какой сотрудник или какой конкурент стоит за падением метрики.

Что такое Feedback Intelligence Framework

Feedback Intelligence Framework — это трёхуровневая аналитическая система, обрабатывающая каждый отзыв через тематический анализ, сигналы клиентского опыта и распознавание сущностей. Все три уровня работают параллельно, а не по очереди.

Обратная связь поступает из четырёх типов каналов: прямые (NPS, CSAT, CES, формы), поддержка (Zendesk, Intercom, чаты), публичные источники (Google Reviews, App Store, соцсети), продуктовые каналы (Jira, звонки с продажами, запросы на функции). Структурированные данные отвечают на вопрос «что»: метрика упала. Неструктурированные отвечают на вопрос «почему»: паттерны языка, упоминание конкурента в тикете, который никто не открывал. Именно этот разрыв закрывает фреймворк — до того как появляется инструмент.

Авторы протестировали систему через ChatGPT, Claude и собственный движок. Результаты сошлись: разные инструменты, одинаковая структура, схожий вывод. По их заключению, фреймворк и есть ключевое IP, а не модель под ним.

Уровень 1: тематический анализ

Тематический анализ отвечает на первый вопрос: о чём говорит этот отзыв?

ИИ читает каждый ответ, выявляет темы и подтемы и организует их в согласованную иерархию, которая обновляется по мере появления новых паттернов. В системах с ручной разметкой категории фиксированы заранее: аналитик создаёт 15–20 тегов, и новые жалобы (например, о функции, которой не существовало в момент создания тегов) либо подтягиваются в существующие категории, либо попадают в «Другое». Со временем «Другое» становится самой большой корзиной, и никто не знает, что в ней.

ИИ-тематический анализ устраняет эту проблему: когда в 40 ответах за неделю появляется паттерн «приложение вылетает при оформлении заказа», система распознаёт его как отдельную подтему и добавляет в таксономию без ручного создания тега.

Вот как это выглядит на реальном отзыве из отельного сектора: «Сара на ресепшн была замечательна, но Wi-Fi ужасный, и выезд занял вечность. Если так повторится, мы просто забронируем Marriott в следующий раз.» Тематический анализ извлекает три темы: «Работа персонала → отличное обслуживание на ресепшн», «Удобства → Wi-Fi не работает», «Процесс выезда → долгое оформление». Это только первый уровень. Следующие два отвечают на вопросы, как клиент себя чувствовал и кто конкретно был вовлечён.

Уровень 2: сигналы опыта

Это самый глубокий уровень, который большинство команд пропускает полностью. Темы говорят, о чём клиент. Сигналы опыта — как он это пережил и что ожидает дальше. Ключевая особенность: оба суб-уровня определяются не только по всему ответу, но и по каждой теме отдельно. Ответ может быть в целом нейтральным, но резко отрицательным по одной конкретной теме.

Качество опыта охватывает пять измерений.

Тональность анализируется по каждой теме, а не в целом. Клиент может быть доволен персоналом и недоволен Wi-Fi в одном предложении. Суммарная тональность назвала бы это «смешанным» и прошла мимо. Подобный подход заставляет команду поддержки тратить часы на «негативный» ответ, в котором негатив касался парковки, а не самого взаимодействия.

Усилие — это паттерны типа «ждал вечно», «пришлось звонить трижды», «не мог разобраться». Они отличаются от сигналов удовлетворённости: клиент может быть доволен результатом и при этом измотан процессом. Исследование CEB (сейчас Gartner), опубликованное в Harvard Business Review, показало, что снижение усилий клиента надёжнее предсказывает лояльность, чем восхищение. Эти сигналы уже есть в обратной связи — их просто не извлекают.

Срочность — это «нужно решить сегодня», «дедлайн завтра». Жалоба на медленное обслуживание имеет разный приоритет, если клиент добавляет «мероприятие в эту субботу» по сравнению с «на будущее для справки». Оба — отрицательная тональность, но только один — срочный.

Риск оттока выявляет условные и явные намерения уйти: «если повторится, перейдём к другим», «рассматриваем альтернативы». Поведенческие модели улавливают снижение активности в продукте. Но они пропускают клиентов, которые говорят прямым текстом, что уходят, до того как поведение изменилось.

Эмоция — не то же самое, что тональность. Тональность классифицирует позитивное/негативное. Эмоция определяет конкретное переживание: растерянность, злость, восторг. Ответ с оценкой 4/5 и комментарием «в целом нормально, но я до сих пор не понимаю, почему это сломалось» — не реальная четвёрка. Клиент растерян и слегка раздражён.

Намерение клиента классифицируется по пяти типам с логикой маршрутизации: адвокатство (→ маркетинг), запрос функции (→ продукт), вопрос (→ поддержка), жалоба (→ операции), эскалация (→ менеджмент). Когда ИИ знает, почему клиент написал, маршрутизация становится автоматической. Отзыв «Уже рекомендовал вас трём коллегам» — это маркетинговый актив, лежащий в очереди поддержки. Без классификации намерения его никто в маркетинге не увидит.

Уровень 3: распознавание сущностей

Третий уровень отвечает на вопрос, который тематический анализ и сигналы опыта не закрывают: кто конкретно и что именно упоминается?

Именно здесь обратная связь перестаёт быть анонимной и становится операционной. Тема говорит: «проблемы с оформлением заказа». Сигналы уточняют: «высокое усилие, риск оттока». Распознавание сущностей добавляет: «это происходит в аэропортовом филиале, сотрудник Б фигурирует в большинстве негативных ответов, и клиенты называют конкурента X как альтернативу».

Четыре стандартных типа сущностей: сотрудники (позволяют различать «удовлетворённость агентом — 3,8 в среднем» и «агент А — 4,6, агент Б — 3,1, и низкие оценки агента Б сосредоточены вокруг одного типа проблем»), конкуренты (упоминание Marriott — это триггер переключения, а не просто тема), продукты и функции, локации.

Авторы протестировали фреймворк на 1 000 000+ ответах в нескольких отраслях и на 8 языках. Средний ответ длиннее 100 символов содержал 4,2 отдельные темы. Треть упоминала конкретные сущности — имена сотрудников, бренды конкурентов, функции продукта. 29% несли смешанную тональность, которую простой классификатор «позитив/негатив» прочитал бы неверно. 23% содержали явные сигналы намерения — запросы, жалобы, призывы к действию, триггеры эскалации. Большинство команд ни один из них не извлекало.

Матрица приоритизации

Три уровня фреймворка создают базу для матрицы «Влияние × Тренд», которая делит все проблемы на четыре категории действий: «Исправить сейчас», «Мониторить», «Следить», «Праздновать». Это заменяет приоритизацию на основе ощущений числовыми оценками.

В статье также рассмотрены ограничения ChatGPT и Claude для анализа обратной связи: они подходят для небольших масштабов (до примерно 50 ответов за сессию), но не имеют памяти между сессиями, не строят тренды и не поддерживают автоматическую маршрутизацию.