Как провести исследование привлекательности: практическое руководство с AI-промптами
Исследование привлекательности (desirability study) измеряет эмоциональные и эстетические реакции пользователей на дизайн: участников просят выбрать слова из контролируемого словаря, которые лучше всего описывают их впечатления. Метод был предложен Джоуи Бенедеком и Триш Майнер в Microsoft в 2002 году: они создали 118 карточек продуктовых реакций — физических карточек, на каждой из которых напечатано одно прилагательное, — и попросили участников выбрать пять слов, которые наиболее точно отражают их ощущение от продукта. Исследование привлекательности занимает промежуточную позицию между юзабилити-тестированием (которое показывает, работает ли что-то) и брендовым исследованием (которое показывает, ощущается ли что-то правильно), предоставляя структурированные данные о субъективных качествах дизайна.
На какой вопрос отвечает метод?
- Какое эмоциональное впечатление создаёт этот дизайн — ощущается ли он надёжным, захватывающим, запутанным или дешёвым?
- Ассоциируют ли пользователи этот дизайн с атрибутами бренда, которые мы намерены транслировать (например, «профессиональный», «инновационный», «дружелюбный»)?
- Чем различаются эмоциональные реакции на две или более дизайн-альтернативы?
- Вызывает ли визуальный дизайн разные реакции у разных сегментов пользователей (например, новички vs. опытные, младшие vs. старшие)?
- Сместил ли редизайн эмоциональное восприятие продукта в намеченном направлении?
Когда использовать
- После визуального редизайна, чтобы убедиться, что новый дизайн передаёт задуманную индивидуальность бренда и эмоциональный тон до начала разработки.
- При сравнении двух или более дизайн-направлений (например, минималистичное vs. иллюстративное, тёплая палитра vs. холодная палитра) и когда команде нужна структурированная эмоциональная обратная связь, а не расплывчатые мнения.
- Во время концепт-тестирования, наряду с оценкой юзабилити, чтобы охватить как функциональное, так и эмоциональное измерение пользовательского опыта — юзабилити-тестирование показывает, что работает, а исследование привлекательности — как это ощущается.
- Когда стейкхолдеры не согласны относительно «ощущения» от дизайна, и команде нужны данные от участников, чтобы перевести разговор от личных предпочтений к доказательствам.
- Как лонгитюдный бенчмарк: провести исследование привлекательности текущего продукта, а затем повторить после крупного обновления, чтобы отследить, сместилось ли эмоциональное восприятие в желаемую сторону.
Метод не подходит, когда основной вопрос касается функциональности, завершения задач или нахождения информации — для этих целей лучше подойдут юзабилити-тестирование, first-click testing или tree testing. Исследование привлекательности фиксирует реакцию на визуальные и эмпирические качества, а не на механику взаимодействия. Также не подходит как единственный метод оценки: эмоциональная реакция без данных юзабилити может дать дизайн, который выглядит привлекательно, но разочаровывает пользователей на практике. Всегда сочетайте результаты исследования привлекательности с функциональным тестированием.
Что вы получите (результаты)
- Таблица частот слов: ранжированный список наиболее часто выбираемых слов-реакций с процентом участников, выбравших каждое слово, что выявляет доминирующее эмоциональное впечатление.
- Соотношение позитивных и негативных слов: пропорция позитивных, негативных и нейтральных выбранных слов, показывающая общую эмоциональную валентность дизайна.
- Оценка соответствия бренду: сопоставление выбранных слов с целевыми атрибутами бренда, определёнными до исследования, с указанием процента участников, выбравших хотя бы одно слово, соответствующее бренду.
- Сравнительные профили слов: при тестировании нескольких дизайнов — сопоставление, какие слова группируются вокруг каждой альтернативы, делая видимыми эмоциональные компромиссы между вариантами.
- Диаграмма Венна или диаграмма пересечений: визуализация, показывающая, какие слова обе группы пользователей (или оба дизайна) разделяют, а какие уникальны для каждого из них.
- Резюме качественных ответов: если участникам задавали вопрос «Почему вы выбрали эти слова?» — тематическое обобщение аргументации за наиболее выбираемыми словами.
- Рекомендательная презентация: краткая презентация, связывающая данные о словах с дизайн-решениями — какой дизайн лучше соответствует целям бренда, где есть несоответствия и что исправить.
Участники и сроки
- Участники: 20-30 на каждый вариант дизайна для надёжных распределений частот слов. MeasuringU рекомендует не менее 20 участников для стабильных процентных ранжирований. Для модерируемого варианта с последующей дискуссией 8-12 участников обеспечивают достаточную качественную глубину.
- Длительность сессии: Немодерируемые исследования привлекательности занимают 5-10 минут на участника (посмотреть дизайн, прочитать список слов, выбрать 5 слов, по желанию объяснить выбор). Модерируемые сессии с think-aloud и уточняющими вопросами длятся 15-25 минут.
- Время подготовки: 2-4 часа на выбор или адаптацию списка слов, подготовку дизайн-стимула (скриншот, прототип или живой сайт), определение целевых слов бренда и настройку инструмента опроса. Добавьте 30 минут на пилотный тест с 2-3 людьми.
- Время анализа: 1-3 часа для одного дизайна, 3-5 часов для сравнительного исследования с двумя или более вариантами. Табулирование частот слов выполняется быстро; анализ качественных ответов добавляет время.
- Общий срок: 2-5 дней от подготовки до финального отчёта в зависимости от того, является ли исследование модерируемым или немодерируемым и сколько вариантов сравнивается.
Как провести исследование привлекательности (пошагово)
1. Определите исследовательский вопрос и целевые слова бренда
Начните с уточнения того, что вы хотите узнать. Вы проверяете, ощущается ли новый дизайн «надёжным» и «профессиональным»? Сравниваете, какой из двух дизайнов выглядит более «дружелюбным»? Прежде чем выбирать список слов, запишите 3-5 целевых слов бренда, которые представляют эмоциональные качества, которые дизайн должен передавать. Они станут вашим ориентиром при анализе.
2. Выберите и адаптируйте список слов
Оригинальный набор Microsoft содержит 118 слов, что слишком много для большинства удалённых исследований. Сократите список до 20-30 слов на основе вашего исследовательского вопроса. Включите слова, которые напрямую связаны с целевыми атрибутами бренда, слова, представляющие противоположные или нежелательные качества, и нейтральные слова в качестве базы. Стремитесь к тому, чтобы не менее 40% слов были негативными или нейтральными, для предотвращения предвзятости согласия — список из одних позитивных слов даёт бессмысленные результаты. Если у вашего продукта есть специфичные для домена качества (например, финансовому приложению могут понадобиться «безопасный», «прозрачный»), добавьте пользовательские слова. Рандомизируйте порядок предъявления для предотвращения эффекта позиции.
3. Подготовьте дизайн-стимул
Выберите формат, в котором участники увидят дизайн: статичный скриншот, интерактивный прототип или живой продукт. Для чистого визуально-эмоционального измерения достаточно скриншота высокой точности — он избавляет от помех юзабилити-проблем при взаимодействии. Если вы хотите реакции, учитывающие опыт использования продукта, дайте участникам выполнить 2-3 задачи в прототипе перед предъявлением списка слов. Экспортируйте стимул в разрешении и контексте устройства, с которым пользователи реально столкнутся.
4. Настройте исследование в инструменте опроса
Создайте исследование на выбранной платформе (Maze, Lyssna, Google Forms, Typeform, Optimal Workshop или пользовательский опрос). Сначала покажите дизайн-стимул, затем список слов и попросите участников выбрать ровно 5 слов, которые лучше всего описывают дизайн. При сравнении двух дизайнов используйте межгрупповой дизайн (каждый участник видит только один вариант), чтобы предотвратить влияние первого воздействия на ответы ко второму. Добавьте один открытый уточняющий вопрос: «Почему вы выбрали эти слова?» Этот качественный слой добавляет глубину к частотным данным.
5. Проведите пилотный тест
Протестируйте с 2-3 коллегами или знакомыми, чтобы убедиться, что изображение дизайна чёткое и правильного размера, список слов читаем, инструкции однозначны (участники понимают, что нужно выбрать ровно 5 слов) и опрос занимает менее 10 минут. Проверьте, что рандомизация работает и слова не появляются в одном и том же порядке для каждого участника.
6. Наберите участников и запустите исследование
Наберите участников, которые представляют вашу целевую аудиторию. Для немодерируемых исследований распространите ссылку на опрос через вашу панель, рассылку или платформу рекрутинга. Для модерируемых сессий запланируйте звонки с демонстрацией экрана, где вы покажете дизайн, дадите участнику время его рассмотреть (или повзаимодействовать), затем покажете список слов на экране и попросите выбрать и объяснить выбор. Избегайте подсказок: не описывайте задуманное ощущение от дизайна до предъявления списка слов.
7. Подсчитайте частоты слов и рассчитайте ключевые метрики
После завершения сбора данных подсчитайте, сколько участников выбрали каждое слово, и конвертируйте в проценты. Ранжируйте слова от наиболее к наименее выбранным. Рассчитайте соотношение позитивных и негативных слов. Проверьте, сколько участников выбрали хотя бы одно из ваших целевых слов бренда. При сравнении двух дизайнов создайте параллельные таблицы частот и ищите слова, которые сильно ассоциируются с одним дизайном, но не с другим.
8. Проанализируйте паттерны и сформулируйте инсайты
Смотрите дальше отдельных слов — на паттерны. Группируются ли 5 наиболее выбранных слов вокруг единой эмоциональной темы (например, «спокойный», «чистый», «простой» — дизайн воспринимается как минималистичный) или разбросаны по противоречивым эмоциям (например, «профессиональный» + «скучный» — компетентный, но неинтересный)? Сопоставьте результаты с целевыми словами бренда из шага 1: передаёт ли дизайн то, что задумывалось? При тестировании нескольких дизайнов определите тот, чей профиль слов наиболее точно совпадает с целевым брендом. Используйте диаграмму Венна для визуализации общих и уникальных слов между дизайнами или сегментами пользователей.
9. Подготовьте отчёт и рекомендации по дизайну
Напишите отчёт, начинающийся с 5 наиболее выбранных слов и оценки соответствия бренду. Включите полную таблицу частот слов, диаграмму Венна (если применимо) и ключевые цитаты из качественных ответов. Завершите чёткими рекомендациями: какой дизайн продвигать, какие эмоциональные пробелы устранить на следующей итерации и какие корректировки списка слов внести при повторении исследования.
Как AI меняет этот метод
AI-совместимость: частичная — AI может обрабатывать частотный анализ слов, качественное кодирование ответов и генерацию отчётов, но решения по дизайну исследования (выбор целевых слов бренда, адаптация списка слов, интерпретация культурных нюансов в выборе слов) требуют человеческого суждения. Основное взаимодействие с участниками — рассматривание дизайна и выбор слов — должно выполняться реальными пользователями.
Что может AI
- Адаптировать список слов к конкретному домену: получив 118 оригинальных слов Microsoft и описание продукта, LLM может предложить подмножество из 25 слов, адаптированное к категории продукта, указывая на отсутствующие доменно-специфичные термины и обеспечивая баланс позитивных и негативных слов.
- Анализировать открытые ответы: когда участники объясняют, почему выбрали определённые слова, AI может кодировать ответы по темам (например, «связано с цветом», «связано с компоновкой», «связано с типографикой»), кластеризовать похожие объяснения и выявлять наиболее частые паттерны аргументации.
- Генерировать визуализации частот слов: по сырым данным AI может создавать ранжированные столбчатые диаграммы, облака слов, взвешенные по частоте выбора, и диаграммы Венна для сравнения дизайнов или сегментов пользователей.
- Составлять черновик отчёта: по таблице частот и качественным темам AI может подготовить структурированный отчёт с ключевыми метриками, анализом паттернов и рекомендациями по дизайну, который исследователь проверяет и редактирует.
- Переводить список слов для кросс-культурных исследований: AI может перевести слова-реакции на другие языки, указывая на слова, чья эмоциональная коннотация меняется между культурами.
Что требует исследователя-человека
- Выбор целевых слов бренда и адаптация списка слов: эти решения зависят от понимания продуктовой стратегии, конкурентов и эмоциональной территории, которую занимает бренд — контекст, требующий человеческого суждения и разговора со стейкхолдерами.
- Определение того, что видят участники и как: выбор между статичным скриншотом и взаимодействием, подбор правильного уровня детализации и формулирование контекста исследования требуют экспертизы в дизайне исследований.
- Интерпретация выбора слов в культурном контексте: слово «смелый» может быть позитивным для аудитории стартапов и тревожным для банковской аудитории. Понимание того, что конкретная аудитория имеет в виду, выбирая определённое слово, требует культурных и доменных знаний, которые AI не может надёжно обеспечить.
- Модерация уточняющих бесед: в модерируемых исследованиях привлекательности исследователь выясняет, почему участник выбрал то или иное слово, следует за неожиданными поворотами и считывает невербальные сигналы — навыки, требующие присутствия человека в реальном времени.
Рабочий процесс с AI
До появления AI исследователь тратил несколько часов на ручной просмотр сотен открытых ответов, группировку по темам и подсчёт частоты каждой темы. С LLM исследователь вставляет полный набор ответов в промпт, получает тематическую разбивку за минуты и тратит время на уточнение тем и проверку крайних случаев, а не на первичную сортировку. Это сокращает время качественного анализа примерно на 60-70%.
Адаптация списка слов раньше была медленным ручным процессом — чтение всех 118 слов Microsoft, сопоставление с брендовыми гайдлайнами и обсуждение, какие оставить. LLM может предложить первую версию подмножества за секунды, которую исследователь затем корректирует — убирая слова, которые не резонируют в культурном контексте продукта, и добавляя те, что AI пропустил. Роль исследователя смещается от генерации списка к его редактированию и валидации.
Для сравнительных исследований с несколькими дизайнами или сегментами пользователей AI-генерируемые диаграммы Венна и параллельные частотные таблицы делают визуальные различия сразу очевидными, позволяя исследователю сосредоточить отчёт на объяснении того, что означают данные, а не на создании визуализаций.
Инструменты
Платформы для опросов и тестирования:
- Maze — поддерживает исследования привлекательности с предъявлением изображения, выбором из списка слов и встроенной аналитикой.
- Lyssna (ранее UsabilityHub) — предлагает тестирование предпочтений и first-click testing, которые можно адаптировать для исследований привлекательности; включает доступ к панели.
- Optimal Workshop — предоставляет исследовательские инструменты на основе карточек, включая Chalkmark и пользовательские опросы, подходящие для исследований с карточками реакций.
- Google Forms / Typeform — для быстрых и бюджетных исследований привлекательности с использованием вопроса-чекбокса со списком слов.
- UXtweak — инструменты для опросов и тестирования с доступом к панели и визуализацией результатов.
Анализ и визуализация:
- Excel / Google Sheets — для табулирования частот слов, процентных расчётов и создания ранжированных столбчатых диаграмм.
- Miro / FigJam — для создания диаграмм Венна, сравнивающих выбор слов между дизайнами или группами пользователей.
- Dovetail — для кодирования и анализа качественных ответов с тегированием и кластеризацией тем.
С использованием AI:
- ChatGPT / Claude — для адаптации списка слов, кодирования качественных ответов и подготовки отчётов.
- MonkeyLearn / Thematic — для автоматической классификации тональности и тем открытых ответов в масштабе.
Сочетается с
- Модерируемое юзабилити-тестирование (Ut): Проведение исследования привлекательности сразу после модерируемой юзабилити-сессии позволяет охватить как функциональное, так и эмоциональное измерение одного и того же опыта за одну сессию — участники уже имеют осмысленную реакцию на дизайн.
- A/B-тестирование (Ab): A/B-тестирование измеряет поведенческие различия (клики, конверсии), а исследование привлекательности — эмоциональные различия; сочетание обоих выявляет, ощущается ли лучше тот вариант, который показывает лучшие метрики.
- Концепт-тестирование (Ct): На этапе ранней оценки концепций данные о привлекательности добавляют эмоциональный слой к обратной связи по осуществимости и функциональности, помогая командам выбирать концепции, которые не только работают, но и находят отклик.
- Построение персон (Ps): Персоны определяют ценности и эмоциональные потребности целевой аудитории; результаты исследования привлекательности, сопоставленные с профилями персон, показывают, соответствует ли дизайн правильному эмоциональному регистру каждого сегмента аудитории.
- First Click Testing (Fc): First-click testing проверяет, начинают ли пользователи движение по правильному пути, а исследование привлекательности — правильно ли ощущается дизайн, пока они это делают; вместе они покрывают как когнитивные, так и эмоциональные первые впечатления.
Пример из практики
Европейская финтех-компания перепроектировала мобильное инвестиционное приложение для привлечения молодых пользователей (25-35 лет), которые описывали текущую версию как «корпоративную» и «устаревшую» в обращениях в поддержку. Продуктовая команда создала два дизайн-направления: «Смелое» (тёмные фоны, неоновые акценты, анимация) и «Чистое» (белое пространство, приглушённая палитра, статичные макеты). Оба прошли юзабилити-тестирование с сопоставимыми показателями завершения задач, что не дало команде однозначного победителя по функциональным критериям.
Исследовательская команда провела исследование привлекательности с 48 участниками из целевой демографии, поровну распределёнными между двумя дизайнами. Каждый участник взаимодействовал с прототипом три минуты, затем выбрал пять слов из адаптированного списка из 25 реакций. Топ-слова «Смелого» дизайна: «захватывающий» (67%), «современный» (58%), «креативный» (46%) и «перегруженный» (38%). Топ-слова «Чистого» дизайна: «надёжный» (71%), «профессиональный» (54%), «спокойный» (50%) и «скучный» (33%). Целевыми словами бренда были «надёжный», «современный» и «дружелюбный». Ни один дизайн не набрал хорошего результата по «дружелюбный» — оно появилось менее чем у 10% участников для обоих вариантов.
Команда выбрала «Чистое» направление как основу, поскольку «надёжный» был наиболее приоритетным атрибутом бренда для финансового продукта, и провела целевую итерацию для устранения сигнала «скучный» — добавив тонкие цветовые акценты и микроанимации. Повторное исследование привлекательности с 24 участниками показало, что «скучный» снизился до 8%, «надёжный» удержался на 67%, а «дружелюбный» вырос до 29%. Обновлённое приложение запустилось с ростом активаций новых аккаунтов на 22% в возрастной группе 25-35 лет за первый квартал.
Ошибки начинающих
Использование только позитивных слов в списке
Когда список содержит только лестные прилагательные («элегантный», «инновационный», «восхитительный»), каждый ответ участника выглядит как похвала, и у исследователя нет способа обнаружить проблемы. Это происходит, потому что начинающие беспокоятся, что включение негативных слов обидит стейкхолдеров или создаст предвзятость у участников. На самом деле верно обратное — оригинальное исследование Бенедека и Майнер рекомендовало не менее 40% негативных или нейтральных слов. Без них исследование даёт данные, которые не могут отличить любимый дизайн от посредственного. Всегда включайте слова вроде «запутанный», «дешёвый», «скучный» и «пугающий» наряду с позитивными.
Слишком долгое взаимодействие участников с продуктом перед предъявлением списка слов
Если участники тратят 20 минут на выполнение задач в прототипе перед тем, как увидеть список слов, их реакции отражают полный опыт выполнения задач (включая юзабилити-проблемы), а не эмоциональное впечатление от дизайна. Это замутняет данные: слово «раздражающий» может быть о сломанном выпадающем списке, а не о визуальном дизайне. Для исследований, сфокусированных на визуально-эстетической реакции, ограничьте взаимодействие кратким просмотром (30-60 секунд для скриншота) или короткой контролируемой задачей (2-3 минуты в прототипе). Для исследований, которые намеренно охватывают полный опыт, укажите это в исследовательском вопросе и отчёте.
Отсутствие целевых слов бренда до начала исследования
Без заранее определённых целевых слов анализ становится субъективным — исследователь смотрит на результаты и ретроспективно решает, какие слова «хорошие», а какие «плохие». Это ведёт к предвзятости подтверждения, при которой исследователь интерпретирует любой результат как поддерживающий дизайн. Определите 3-5 целевых слов бренда до сбора данных, согласуйте их со стейкхолдерами и используйте как ориентир для анализа. Если наиболее выбираемые слова не пересекаются с целевыми, у дизайна есть эмоциональный пробел, который необходимо устранить.
Восприятие выбора слов как голосования
Начинающий может сообщить, что «62% участников выбрали “современный”» и заключить, что дизайн современный, без оговорок. Но в исследовании привлекательности каждый участник выбирает 5 слов — данные показывают относительный акцент, а не абсолютную оценку. Содержательный анализ — сравнительный: как «современный» ранжируется относительно других слов? Это первое слово или пятое? Появляется ли оно рядом с совместимыми словами («чистый», «свежий») или противоречивыми («запутанный», «загромождённый»)? Паттерн совместного выбора слов рассказывает историю, а не процент отдельного слова в изоляции.
Проведение исследования с недостаточным количеством участников
При менее чем 15 участниках на вариант дизайна процентные показатели частот слов колеблются значительно — выбор одного участника может сместить ранжирование слова на 7-10 процентных пунктов. Это делает невозможным отличить сигнал от шума. Начинающие иногда проводят исследование с 5-8 участниками, потому что воспринимают его как качественный метод. Исследование привлекательности производит количественные частотные данные, которые требуют выборки от 20 участников для стабильных ранжирований и содержательных сравнений.
AI-промпты для этого метода
4 готовых AI-промптов с placeholder’ами — скопируйте и подставьте свой контекст. Все промпты для «исследования привлекательности» →.