Как провести tree testing: практическое руководство с AI-промптами
Крупный университет переделывал сайт, разросшийся до 4 000 страниц: учебные программы, студенческие сервисы, приём, научные проекты, кампусная жизнь. Студенты жаловались, что не могут найти сроки подачи на финансовую помощь, заявки на общежитие и инструкции по регистрации на курсы. UX-команда провела открытую карточную сортировку с 40 участниками и предложила навигационную структуру из 8 категорий верхнего уровня и 35 подкатегорий — но прежде чем переходить к визуальному дизайну, провела tree testing с 60 участниками.
Результаты показали, что 7 из 10 задач превышают порог 70% успеха, но три провалились: срок подачи на финансовую помощь (48%), общежитие для переводных студентов (52%), добавление дополнительной специальности (41%). Анализ путей показал, что финансовая помощь была разнесена между двумя категориями, общежитие находилось на третьем уровне вложенности, а изменение специальности скрывалось в категории, которую участники ассоциировали с выписками, а не с учебным планом. Команда объединила финансовую помощь в одну категорию верхнего уровня, подняла общежитие и перенесла управление специальностями к учебным программам. Повторный tree testing подтвердил: все три задачи теперь превышают 70% — ещё до начала визуального дизайна.
Именно это даёт tree testing: валидацию навигационной структуры на основе данных, за долю стоимости и времени полноценного юзабилити-теста.
Что такое tree testing
Tree testing (древовидное тестирование) — это метод исследования на основе задач, который оценивает, могут ли пользователи найти информацию в предложенной навигационной иерархии. Участникам показывают только текстовую структуру категорий сайта — без визуального дизайна, макета и контента — и просят найти конкретные элементы. Убирая всё, кроме названий категорий и их вложенности, tree testing изолирует навигационную структуру от визуальных подсказок и показывает, имеет ли информационная архитектура смысл для пользователей или названия, группировки и уровни вложенности нужно переработать.
На какие вопросы отвечает
- Могут ли пользователи найти ключевые ресурсы в этой навигационной структуре и какие категории вызывают наибольшую путаницу?
- Понятны ли пользователям названия категорий, или они ожидают других названий для того же контента?
- На каком уровне иерархии пользователи теряются — на верхнем, на втором или глубже?
- Есть ли категории, в которых пользователи систематически попадают не туда, что указывает на проблему с названием или группировкой?
- Как одна предложенная структура навигации работает по сравнению с альтернативной?
- Какие части навигации работают хорошо и должны быть сохранены при редизайне?
Когда использовать tree testing
- Когда предложенная информационная архитектура уже существует (из карточной сортировки, от стейкхолдеров или дизайн-исследования) и команде нужно проверить, могут ли пользователи найти контент в ней, прежде чем создавать макеты и страницы.
- Когда команда переделывает навигацию сайта или приложения и хочет быстро и дёшево сравнить несколько структурных вариантов (разные названия категорий, разные группировки) перед выбором.
- Когда аналитика или обратная связь указывают, что пользователи не находят важный контент, но непонятно, проблема в навигационной структуре, визуальном дизайне или содержании страниц — tree testing изолирует структуру.
- Когда нужен быстрый, лёгкий метод, который можно провести за несколько дней без прототипа, визуального дизайна и создания контента.
- Когда нужно замерить базовые показатели нахождения контента (success rate, время, прямолинейность) до редизайна, чтобы потом измерить улучшение.
Метод не подходит, когда предложенной иерархии ещё нет — если команда пока генерирует идеи по организации контента, нужна карточная сортировка (она создаёт структуру; tree testing — оценивает). Также не подходит, когда исследовательский вопрос касается визуального дизайна, паттернов взаимодействия или качества контента — tree testing намеренно убирает всё это. Если пользователям нужно видеть реалистичный интерфейс, используйте first-click test или модерируемый юзабилити-тест.
Что получается в результате
- Показатели успеха по задачам: процент участников, нашедших правильное место, с разделением на прямой успех (пошли сразу правильно) и непрямой (нашли после возвратов).
- Правильность первого клика: был ли первый выбор категории верным путём — сильный предиктор итогового успеха.
- Время выполнения: сколько участники искали или сдавались по каждому заданию.
- Анализ путей: пошаговая последовательность кликов каждого участника, показывающая, где именно пользователи свернули не туда.
- Визуализации pietree или treemap: наглядное распределение правильных и неправильных путей по всем участникам.
- Отчёт по проблемным категориям: приоритизированный список категорий с низким успехом и рекомендациями по переименованию, перегруппировке или изменению структуры.
Участники и сроки
Для качественного tree testing (выявление проблем) достаточно 5-8 участников. Для количественного (бенчмаркинг, статистическое сравнение двух структур) нужно 50+ участников на каждый вариант дерева. NNGroup рекомендует качественный подход для итеративных улучшений и количественный — для финального сравнения.
Немодерируемый tree testing занимает 10-15 минут на участника при 8-10 задачах. Модерируемые сессии — 20-30 минут. Подготовка — 1-2 дня, анализ — 1-2 дня, общий срок — 3-7 дней.
Как провести tree testing (пошагово)
1. Подготовьте дерево из предложенной навигации
Экспортируйте предложенную информационную архитектуру в плоский список с отступами — каждая строка это категория, отступ обозначает уровень вложенности. Включите все уровни вплоть до расположения целевых ресурсов. Не включайте отдельные страницы контента — только навигационные категории и подкатегории.
2. Напишите задания, которые не выдают ответ
Создайте 8-12 задач, покрывающих самые важные типы контента и категории, в которых вы наименее уверены. Каждая задача должна описывать потребность пользователя, не используя точное название категории. Если категория называется «Начало бизнеса», задача должна звучать: «Вы хотите открыть небольшой бизнес по уходу за газонами. Найдите ресурсы, которые помогут начать». Включите разнотипные задачи и одну простую разогревочную задачу в начале. Для каждой задачи определите правильный ответ.
3. Выберите модерируемый или немодерируемый формат
Модерируемый — для качественной, исследовательской оценки: фасилитатор может спросить «Что вы ожидали здесь найти?», когда участник кликает не ту категорию. Немодерируемый — для количественного бенчмаркинга: масштабируется на большие выборки. Выбирайте исходя из цели: понять, почему пользователи теряются (модерируемый), или измерить, сколько теряются (немодерируемый).
4. Настройте исследование в инструменте
Импортируйте дерево и задачи в инструмент (Treejack, Maze, UserZoom или UX Metrics). Настройте правильные ответы. Включите рандомизацию порядка задач (кроме разогревочной). При сравнении двух деревьев используйте between-subjects дизайн: каждый участник видит только одно дерево.
5. Проведите пилот
Запустите с 2-3 коллегами, не участвовавшими в создании навигации. Отловите неоднозначные задачи, отсутствующие категории и случайное использование слов из названий категорий. Пилот также помогает оценить время прохождения — оно должно быть менее 15 минут для немодерируемых исследований.
6. Рекрутируйте и запустите
Для немодерируемых — распространите ссылку. Для модерируемых — запланируйте 20-30 минутные сессии. Рекрутируйте участников, соответствующих реальной аудитории сайта — члены команды, создавшие навигацию, не являются валидными участниками.
7. Проанализируйте результаты по задачам
По каждой задаче изучите: success rate, прямолинейность, правильность первого клика, время. Отметьте задачи с успехом ниже 70% или прямолинейностью ниже 50%. Используйте анализ путей, чтобы увидеть, какие категории притягивали ошибочные клики.
8. Выявите паттерны и рекомендуйте изменения
Ищите закономерности: одни и те же категории создают проблемы в нескольких задачах, один уровень систематически проблемный, категории привлекают клики, но никогда не оказываются правильным ответом. Классифицируйте проблемы: именование (название вводит в заблуждение), группировка (контент в неправильной родительской категории), глубина (контент слишком глубоко). Рекомендуйте конкретные изменения и запланируйте повторный tree testing для проверки.
Как AI меняет tree testing
AI-совместимость: частичная — AI помогает генерировать сценарии задач, анализировать данные о путях, предлагать альтернативные названия категорий и составлять отчёты, но ключевые решения об информационной архитектуре требуют человеческого понимания домена, пользователей и организационного контекста.
Что может AI
- Генерировать сценарии задач из списка элементов контента и целевых категорий, создавая реалистичные потребности пользователей без использования точных названий категорий.
- Анализировать данные о путях и выявлять паттерны — какие категории притягивают больше всего ошибочных кликов, где чаще всего происходит возврат.
- Предлагать альтернативные названия для проблемных категорий.
- Составлять отчёты о результатах из показателей успеха, данных путей и заметок из модерируемых сессий.
- Сравнивать два варианта дерева, резюмируя, какая структура работает лучше.
Что требует исследователя
- Проектирование самой структуры дерева — группировка контента, создание категорий и определение глубины вложенности требуют знания домена.
- Написание реалистичных и непредвзятых задач — AI-сгенерированные задачи часто случайно включают слова из названий категорий.
- Интерпретация причин неправильного выбора — в модерируемых сессиях фасилитатор задаёт уточняющие вопросы в реальном времени.
- Принятие решений о реструктуризации — выбор между переименованием, перегруппировкой, уплощением и разделением требует суждения о взаимосвязях контента и организационных ограничениях.
Рабочий процесс с AI
До AI цикл tree testing включал ручное написание каждого сценария (с тщательным избеганием слов из названий), ручной просмотр визуализаций путей и ручную сборку отчёта. Написание задач для 10-задачного исследования занимало полдня, анализ количественного исследования — целый день.
С AI цикл ускоряется с обеих сторон. Исследователь предоставляет дерево и список контента, LLM за минуты создаёт черновики сценариев — исследователь проверяет на «утечку» названий и реалистичность, сокращая создание задач с часов до менее чем часа. Для анализа необработанные данные, загруженные в LLM, дают выявление паттернов за минуты. Время исследователя перемещается от обработки данных к интерпретации и принятию решений — что именно менять в информационной архитектуре.
Инструменты
Специализированные платформы:
- Optimal Workshop (Treejack) — самый известный инструмент для tree testing с визуализациями pietree, анализом путей и сравнением вариантов.
- Maze — платформа продуктовых исследований с tree testing, интегрированным с карточной сортировкой и тестированием прототипов.
- UserZoom (UserTesting) — корпоративная платформа с tree testing и статистическим сравнением.
- UX Metrics — лёгкий инструмент для карточной сортировки и tree testing.
- Lyssna (бывший UsabilityHub) — tree testing вместе с first-click тестами.
Вспомогательные инструменты:
- Miro / FigJam — для визуализации и редактирования структуры дерева перед импортом.
- Google Sheets / Excel — для подготовки дерева в формате с отступами.
- Google Analytics / Mixpanel — для выявления контента, который пользователи не находят.
AI-инструменты:
- ChatGPT / Claude — генерация задач, анализ путей, предложения названий, составление отчётов.
Типичные ошибки начинающих
Использование названий категорий в формулировке задач
Самая частая и вредная ошибка. Если задача «Найдите информацию о начале бизнеса», а в дереве есть категория «Начало бизнеса» — задача проверяет умение читать, а не находить. Описывайте потребность пользователя, не используя названия категорий, и попросите постороннего человека проверить задачи.
Слишком мало или слишком много задач
Менее 5 задач не покрывают навигацию достаточно. Более 15 вызывают утомление участников. NNGroup рекомендует 8-12, каждая тестирует отдельную категорию или путь.
Отсутствие разогревочной задачи
Участники, впервые видящие аккордеонный интерфейс, могут растеряться. Простая разогревочная задача знакомит с форматом и отсеивает невнимательных. Без неё первая реальная задача впитывает кривую обучения, занижая показатели.
Путаница между tree testing и карточной сортировкой
Tree testing оценивает существующую структуру, карточная сортировка создаёт новую. Правильная последовательность: сначала сортировка, потом tree testing.
Анализ только success rate без данных о путях
Задача с 75% успехом может скрывать, что 60% участников несколько раз возвращались назад. Прямолинейность и правильность первого клика так же важны, как итоговый успех. Низкая прямолинейность при высоком успехе означает, что структура восстановима, но запутана.
Хорошо сочетается с
- Карточная сортировка: создаёт структуру, tree testing — проверяет. Сначала сортировка для выявления группировок, потом tree testing для проверки нахождения.
- First-click testing: добавляет визуальный контекст, который tree testing убирает. После подтверждения структуры first-click проверяет, находят ли пользователи нужную точку входа в реальном макете.
- Юзабилити-тестирование (модерируемое): после валидации структуры юзабилити-тест оценивает полный опыт навигации, включая визуальный дизайн и контент.
- Тепловые и клик-карты: показывают, куда пользователи кликают в текущей навигации — данные для фокусировки задач tree testing.
- Аналитика и кликстрим: показывают, какие страницы пользователи находят через поиск (обходя навигацию) и какие внутренние запросы указывают на навигационные проблемы.
AI-промпты для этого метода
4 готовых AI-промптов с placeholder’ами — скопируйте и подставьте свой контекст. Все промпты для «tree testing» →.