Как провести tree testing: практическое руководство с AI-промптами

Крупный университет переделывал сайт, разросшийся до 4 000 страниц: учебные программы, студенческие сервисы, приём, научные проекты, кампусная жизнь. Студенты жаловались, что не могут найти сроки подачи на финансовую помощь, заявки на общежитие и инструкции по регистрации на курсы. UX-команда провела открытую карточную сортировку с 40 участниками и предложила навигационную структуру из 8 категорий верхнего уровня и 35 подкатегорий — но прежде чем переходить к визуальному дизайну, провела tree testing с 60 участниками.

Результаты показали, что 7 из 10 задач превышают порог 70% успеха, но три провалились: срок подачи на финансовую помощь (48%), общежитие для переводных студентов (52%), добавление дополнительной специальности (41%). Анализ путей показал, что финансовая помощь была разнесена между двумя категориями, общежитие находилось на третьем уровне вложенности, а изменение специальности скрывалось в категории, которую участники ассоциировали с выписками, а не с учебным планом. Команда объединила финансовую помощь в одну категорию верхнего уровня, подняла общежитие и перенесла управление специальностями к учебным программам. Повторный tree testing подтвердил: все три задачи теперь превышают 70% — ещё до начала визуального дизайна.

Именно это даёт tree testing: валидацию навигационной структуры на основе данных, за долю стоимости и времени полноценного юзабилити-теста.

Что такое tree testing

Tree testing (древовидное тестирование) — это метод исследования на основе задач, который оценивает, могут ли пользователи найти информацию в предложенной навигационной иерархии. Участникам показывают только текстовую структуру категорий сайта — без визуального дизайна, макета и контента — и просят найти конкретные элементы. Убирая всё, кроме названий категорий и их вложенности, tree testing изолирует навигационную структуру от визуальных подсказок и показывает, имеет ли информационная архитектура смысл для пользователей или названия, группировки и уровни вложенности нужно переработать.

На какие вопросы отвечает

Могут ли пользователи найти ключевые ресурсы в этой навигационной структуре и какие категории вызывают наибольшую путаницу?
Понятны ли пользователям названия категорий, или они ожидают других названий для того же контента?
На каком уровне иерархии пользователи теряются — на верхнем, на втором или глубже?
Есть ли категории, в которых пользователи систематически попадают не туда, что указывает на проблему с названием или группировкой?
Как одна предложенная структура навигации работает по сравнению с альтернативной?
Какие части навигации работают хорошо и должны быть сохранены при редизайне?

Когда использовать tree testing

Когда предложенная информационная архитектура уже существует (из карточной сортировки, от стейкхолдеров или дизайн-исследования) и команде нужно проверить, могут ли пользователи найти контент в ней, прежде чем создавать макеты и страницы.
Когда команда переделывает навигацию сайта или приложения и хочет быстро и дёшево сравнить несколько структурных вариантов (разные названия категорий, разные группировки) перед выбором.
Когда аналитика или обратная связь указывают, что пользователи не находят важный контент, но непонятно, проблема в навигационной структуре, визуальном дизайне или содержании страниц — tree testing изолирует структуру.
Когда нужен быстрый, лёгкий метод, который можно провести за несколько дней без прототипа, визуального дизайна и создания контента.
Когда нужно замерить базовые показатели нахождения контента (success rate, время, прямолинейность) до редизайна, чтобы потом измерить улучшение.

Метод не подходит, когда предложенной иерархии ещё нет — если команда пока генерирует идеи по организации контента, нужна карточная сортировка (она создаёт структуру; tree testing — оценивает). Также не подходит, когда исследовательский вопрос касается визуального дизайна, паттернов взаимодействия или качества контента — tree testing намеренно убирает всё это. Если пользователям нужно видеть реалистичный интерфейс, используйте first-click test или модерируемый юзабилити-тест.

Что получается в результате

Показатели успеха по задачам: процент участников, нашедших правильное место, с разделением на прямой успех (пошли сразу правильно) и непрямой (нашли после возвратов).
Правильность первого клика: был ли первый выбор категории верным путём — сильный предиктор итогового успеха.
Время выполнения: сколько участники искали или сдавались по каждому заданию.
Анализ путей: пошаговая последовательность кликов каждого участника, показывающая, где именно пользователи свернули не туда.
Визуализации pietree или treemap: наглядное распределение правильных и неправильных путей по всем участникам.
Отчёт по проблемным категориям: приоритизированный список категорий с низким успехом и рекомендациями по переименованию, перегруппировке или изменению структуры.

Участники и сроки

Для качественного tree testing (выявление проблем) достаточно 5-8 участников. Для количественного (бенчмаркинг, статистическое сравнение двух структур) нужно 50+ участников на каждый вариант дерева. NNGroup рекомендует качественный подход для итеративных улучшений и количественный — для финального сравнения.

Немодерируемый tree testing занимает 10-15 минут на участника при 8-10 задачах. Модерируемые сессии — 20-30 минут. Подготовка — 1-2 дня, анализ — 1-2 дня, общий срок — 3-7 дней.

Как провести tree testing (пошагово)

1. Подготовьте дерево из предложенной навигации

Экспортируйте предложенную информационную архитектуру в плоский список с отступами — каждая строка это категория, отступ обозначает уровень вложенности. Включите все уровни вплоть до расположения целевых ресурсов. Не включайте отдельные страницы контента — только навигационные категории и подкатегории.

2. Напишите задания, которые не выдают ответ

Создайте 8-12 задач, покрывающих самые важные типы контента и категории, в которых вы наименее уверены. Каждая задача должна описывать потребность пользователя, не используя точное название категории. Если категория называется «Начало бизнеса», задача должна звучать: «Вы хотите открыть небольшой бизнес по уходу за газонами. Найдите ресурсы, которые помогут начать». Включите разнотипные задачи и одну простую разогревочную задачу в начале. Для каждой задачи определите правильный ответ.

3. Выберите модерируемый или немодерируемый формат

Модерируемый — для качественной, исследовательской оценки: фасилитатор может спросить «Что вы ожидали здесь найти?», когда участник кликает не ту категорию. Немодерируемый — для количественного бенчмаркинга: масштабируется на большие выборки. Выбирайте исходя из цели: понять, почему пользователи теряются (модерируемый), или измерить, сколько теряются (немодерируемый).

4. Настройте исследование в инструменте

Импортируйте дерево и задачи в инструмент (Treejack, Maze, UserZoom или UX Metrics). Настройте правильные ответы. Включите рандомизацию порядка задач (кроме разогревочной). При сравнении двух деревьев используйте between-subjects дизайн: каждый участник видит только одно дерево.

5. Проведите пилот

Запустите с 2-3 коллегами, не участвовавшими в создании навигации. Отловите неоднозначные задачи, отсутствующие категории и случайное использование слов из названий категорий. Пилот также помогает оценить время прохождения — оно должно быть менее 15 минут для немодерируемых исследований.

6. Рекрутируйте и запустите

Для немодерируемых — распространите ссылку. Для модерируемых — запланируйте 20-30 минутные сессии. Рекрутируйте участников, соответствующих реальной аудитории сайта — члены команды, создавшие навигацию, не являются валидными участниками.

7. Проанализируйте результаты по задачам

По каждой задаче изучите: success rate, прямолинейность, правильность первого клика, время. Отметьте задачи с успехом ниже 70% или прямолинейностью ниже 50%. Используйте анализ путей, чтобы увидеть, какие категории притягивали ошибочные клики.

8. Выявите паттерны и рекомендуйте изменения

Ищите закономерности: одни и те же категории создают проблемы в нескольких задачах, один уровень систематически проблемный, категории привлекают клики, но никогда не оказываются правильным ответом. Классифицируйте проблемы: именование (название вводит в заблуждение), группировка (контент в неправильной родительской категории), глубина (контент слишком глубоко). Рекомендуйте конкретные изменения и запланируйте повторный tree testing для проверки.

Как AI меняет tree testing

AI-совместимость: частичная — AI помогает генерировать сценарии задач, анализировать данные о путях, предлагать альтернативные названия категорий и составлять отчёты, но ключевые решения об информационной архитектуре требуют человеческого понимания домена, пользователей и организационного контекста.

Что может AI

Генерировать сценарии задач из списка элементов контента и целевых категорий, создавая реалистичные потребности пользователей без использования точных названий категорий.
Анализировать данные о путях и выявлять паттерны — какие категории притягивают больше всего ошибочных кликов, где чаще всего происходит возврат.
Предлагать альтернативные названия для проблемных категорий.
Составлять отчёты о результатах из показателей успеха, данных путей и заметок из модерируемых сессий.
Сравнивать два варианта дерева, резюмируя, какая структура работает лучше.

Что требует исследователя

Проектирование самой структуры дерева — группировка контента, создание категорий и определение глубины вложенности требуют знания домена.
Написание реалистичных и непредвзятых задач — AI-сгенерированные задачи часто случайно включают слова из названий категорий.
Интерпретация причин неправильного выбора — в модерируемых сессиях фасилитатор задаёт уточняющие вопросы в реальном времени.
Принятие решений о реструктуризации — выбор между переименованием, перегруппировкой, уплощением и разделением требует суждения о взаимосвязях контента и организационных ограничениях.

Рабочий процесс с AI

До AI цикл tree testing включал ручное написание каждого сценария (с тщательным избеганием слов из названий), ручной просмотр визуализаций путей и ручную сборку отчёта. Написание задач для 10-задачного исследования занимало полдня, анализ количественного исследования — целый день.

С AI цикл ускоряется с обеих сторон. Исследователь предоставляет дерево и список контента, LLM за минуты создаёт черновики сценариев — исследователь проверяет на «утечку» названий и реалистичность, сокращая создание задач с часов до менее чем часа. Для анализа необработанные данные, загруженные в LLM, дают выявление паттернов за минуты. Время исследователя перемещается от обработки данных к интерпретации и принятию решений — что именно менять в информационной архитектуре.

Инструменты

Специализированные платформы:

Optimal Workshop (Treejack) — самый известный инструмент для tree testing с визуализациями pietree, анализом путей и сравнением вариантов.
Maze — платформа продуктовых исследований с tree testing, интегрированным с карточной сортировкой и тестированием прототипов.
UserZoom (UserTesting) — корпоративная платформа с tree testing и статистическим сравнением.
UX Metrics — лёгкий инструмент для карточной сортировки и tree testing.
Lyssna (бывший UsabilityHub) — tree testing вместе с first-click тестами.

Вспомогательные инструменты:

Miro / FigJam — для визуализации и редактирования структуры дерева перед импортом.
Google Sheets / Excel — для подготовки дерева в формате с отступами.
Google Analytics / Mixpanel — для выявления контента, который пользователи не находят.

AI-инструменты:

ChatGPT / Claude — генерация задач, анализ путей, предложения названий, составление отчётов.

Типичные ошибки начинающих

Использование названий категорий в формулировке задач

Самая частая и вредная ошибка. Если задача «Найдите информацию о начале бизнеса», а в дереве есть категория «Начало бизнеса» — задача проверяет умение читать, а не находить. Описывайте потребность пользователя, не используя названия категорий, и попросите постороннего человека проверить задачи.

Слишком мало или слишком много задач

Менее 5 задач не покрывают навигацию достаточно. Более 15 вызывают утомление участников. NNGroup рекомендует 8-12, каждая тестирует отдельную категорию или путь.

Отсутствие разогревочной задачи

Участники, впервые видящие аккордеонный интерфейс, могут растеряться. Простая разогревочная задача знакомит с форматом и отсеивает невнимательных. Без неё первая реальная задача впитывает кривую обучения, занижая показатели.

Путаница между tree testing и карточной сортировкой

Tree testing оценивает существующую структуру, карточная сортировка создаёт новую. Правильная последовательность: сначала сортировка, потом tree testing.

Анализ только success rate без данных о путях

Задача с 75% успехом может скрывать, что 60% участников несколько раз возвращались назад. Прямолинейность и правильность первого клика так же важны, как итоговый успех. Низкая прямолинейность при высоком успехе означает, что структура восстановима, но запутана.

Хорошо сочетается с

Карточная сортировка: создаёт структуру, tree testing — проверяет. Сначала сортировка для выявления группировок, потом tree testing для проверки нахождения.
First-click testing: добавляет визуальный контекст, который tree testing убирает. После подтверждения структуры first-click проверяет, находят ли пользователи нужную точку входа в реальном макете.
Юзабилити-тестирование (модерируемое): после валидации структуры юзабилити-тест оценивает полный опыт навигации, включая визуальный дизайн и контент.
Тепловые и клик-карты: показывают, куда пользователи кликают в текущей навигации — данные для фокусировки задач tree testing.
Аналитика и кликстрим: показывают, какие страницы пользователи находят через поиск (обходя навигацию) и какие внутренние запросы указывают на навигационные проблемы.

AI-промпты для этого метода

4 готовых AI-промптов с placeholder’ами — скопируйте и подставьте свой контекст. Все промпты для «tree testing» →.