User Interviews: состояние синтетических пользователей

Обложка отчёта The State of Synthetic Users от User Interviews

Синтетические пользователи прочно вошли в профессиональную повестку исследовательского сообщества — от споров о терминологии до разговоров о guardrails и управлении рисками. Одни исследователи видят в них способ «повысить отдачу от каждого исследовательского доллара», другие характеризуют синтетические данные как «поверхностные» и «склонные к подхалимству». Но что на самом деле думают исследователи о синтетических пользователях сегодня? Платформа User Interviews провела масштабное исследование, чтобы разобраться в этом вопросе.

Компания опросила 150 исследователей и провела пять углублённых модерируемых интервью с опытными специалистами. Результаты составили отчёт The State of Synthetic Users, который был опубликован 11 июня 2026 года.

Знакомство с синтетическими пользователями: терминология по-прежнему не устоялась

Большинство опрошенных знакомы с концепцией синтетических пользователей хотя бы в общих чертах: 44% сообщили об умеренном или высоком уровне осведомлённости. При этом терминология на рынке остаётся неустоявшейся. Доминирующий термин — synthetic users, который использует 75% респондентов, — однако встречаются и альтернативы: artificial users, digital twins, synthetic respondents, synthetic participants, silicon participants.

Определение, которым пользуются исследователи, достаточно стабильно: синтетические пользователи — это AI-сгенерированные персонажи или профили, симулирующие пользователей на основе реальных данных, демографических характеристик и поведенческих паттернов. Они служат заменой живых участников в исследованиях и тестировании. Подавляющее большинство респондентов (76%) подчёркивают, что речь идёт именно об искусственных симуляциях, а не о реальных людях.

Где синтетические пользователи приносят пользу

Исследователи чаще всего применяют синтетических пользователей для разработки опросников и скринеров (46%), usability testing (34%) и исследований на ранних стадиях продукта (32%). Среди интервьюируемых несколько участников отметили особую ценность синтетических пользователей в условиях ограниченных ресурсов или при необходимости получить обратную связь от труднодоступных аудиторий — например, от руководителей высшего звена.

Ключевое преимущество, которое выделяют опрошенные, — это удобство: возможность быстро собрать обратную связь без логистической сложности рекрутинга участников. При этом исследователи склонны рассматривать синтетических пользователей как дополнительный инструмент, а не замену живым исследованиям.

Вместе с тем 21% респондентов не видят подходящих контекстов для применения синтетических пользователей в принципе. Академическое исследование Эдуарда Курица, Петера Демчака и Матуша Крайчовича, охватившее 182 публикации, подтверждает эту скептическую позицию: LLM — это «предсказатели правдоподобного текста», а не существа с чувственным опытом и личной историей памяти, что порождает задокументированные расхождения между синтетическими и живыми ответами.

Скептицизм и осторожный оптимизм — в равных долях

Почти половина респондентов (47%) описывает свою позицию как скептическую: они «хотят видеть больше доказательств, прежде чем доверять» синтетическим пользователям. Ещё 24% настроены «осторожно оптимистично» и признают ценность инструмента в правильном контексте. На противоположном полюсе находятся 17%, которые в принципе против использования синтетических пользователей в исследовательской практике.

Среди основных опасений, которые называют исследователи:

качество и точность инсайтов (88%);
риск того, что стейкхолдеры будут чрезмерно доверять AI-сгенерированным данным (79%);
усиление предвзятости в отношении слабо представленных групп (79%).

Старший исследователь и основатель AIxUXR Community Калеб Лусбрук выделяет неспособность синтетических пользователей передать живой опыт, эмоциональную подлинность и уникальный рыночный контекст — всё это обусловлено тем, что они обучены на уже существующих данных. Исследователь и основатель UXOutloud Эниола Абиойе опасается, что синтетические пользователи могут создавать «эхо-камеры», воспроизводя паттерны из обучающих данных и упуская нетипичные перспективы.

Старший исследователь из Figma Майк Блайт описывает AI как «ускоритель» для различных задач — рецензирование планов исследований, проверка набора участников на предмет предвзятости, генерация инсайтов из транскриптов интервью, тематический анализ. Лео Хоар, основатель UXR Institute, подчёркивает, что AI необходимо сочетать с качественной методологией:

«AI должен работать в связке с правильной методологией. Это значительно сложнее, чем кажется, потому что вам нужно хорошо разбираться в ней с самого начала. Исследователь должен быть методологическим ориентиром. Если просто загрузить транскрипты и попросить сгенерировать инсайты — ничего не получится. Нужно давать пошаговые инструкции с помощью техник промптинга, чтобы система не перескакивала через этапы. Знание строгих шагов тематического анализа здесь критически важно.»

Один из участников исследования описывает принципиальное преимущество живых участников: люди готовы говорить откровенно — они получают оплату вне зависимости от своих ответов и не имеют стимула говорить то, что хочет услышать исследователь.

Governance: большинство команд работают без чётких правил

Более 62% исследователей сообщают, что в их командах отсутствуют какие-либо инструкции по использованию синтетических пользователей — решения принимаются на усмотрение конкретных специалистов. Это означает, что область governance остаётся практически открытой.

Исследователи видят в этом возможность занять лидирующую позицию. Калеб Лусбрук предлагает конкретную перспективу:

«В моём оптимистичном видении исследователи берут на себя инициативу. В эпоху AI мы хорошо умеем выявлять предвзятость и работать с качественными данными. Мы реально способны помочь командам думать о том, как подходить к таким задачам, как противодействие bias.»

Рекомендации, которые дают старшие исследователи:

учитывать согласие участников и защиту персональных данных, если для обучения синтетических моделей используются реальные данные пользователей;
применять оценку рисков перед использованием: речь идёт о высоких ставках? Результаты затронут маргинализированные группы?
при использовании синтетических пользователей как инструмента обязательно дополнять их реальным тестированием с людьми.

Лео Хоар резюмирует риск ставки только на синтетические данные: «Если окажется, что они не репрезентативны, — единственный способ это проверить, запустить продукт и посмотреть, работает ли он. Это высокорискованный путь.»

Куда движется сфера

Синтетические пользователи привлекательны своим обещанием быстрых и недорогих инсайтов. Однако выводы отчёта показывают: исследователи трезво оценивают границы этих инструментов и понимают, что организациям по-прежнему нужен прямой контакт с реальными клиентами — для формирования «мышечной памяти» и стратегических знаний, которые в дальнейшем могут стать основой для синтетических исследований.

При оценке инструментов для работы с синтетическими пользователями авторы отчёта предлагают задать себе несколько вопросов:

Откуда берутся исходные данные для модели — из первых рук, проверенной панели вендора, открытых источников или демографических датасетов?
Как обрабатываются ваши данные — хранятся, используются для обучения моделей, передаются третьим лицам?
Какие guardrails встроены для обеспечения качества данных и этического использования?

Опрос провела Роберта Домбровски, отчёт подготовил Ник Лиудис. Данные собирались с 11 по 22 мая 2026 года — через социальные сети, еженедельную рассылку Fresh Views, in-product-опрос, а также через сети LinkedIn и Slack, связанные с UX research.