AInterviewer: платформа для проведения качественных интервью под управлением ИИ

Платформа AInterviewer для AI-интервью в качественных исследованиях

Группа исследователей из Копенгагенского университета и IT-университета Копенгагена представила AInterviewer — открытую платформу для разработки и проведения качественных интервью под управлением ИИ. Платформа реализует мультиагентный конвейер на основе языковых моделей и предназначена для устранения ключевых недостатков существующих решений в области AI-интервьюирования.

Зачем нужна новая платформа

В последние годы появилось множество систем для автоматизированных качественных интервью с использованием больших языковых моделей (LLM). Такие системы масштабируют методы глубинных интервью, которые традиционно ограничены высокими затратами на сбор данных. Однако большинство существующих решений опираются на проприетарные коммерческие чат-боты, что создаёт три системных проблемы.

Первая — ограниченный контроль над формулировками вопросов, что подрывает сопоставимость результатов между интервью. Вторая — отсутствие контроля над моделью, что снижает воспроизводимость исследований. Третья — недостаточный контроль над данными, что противоречит требованиям конфиденциальности в качественных исследованиях.

AInterviewer создан как инструмент, сочетающий гибкость разговорного ИИ с управляемыми выходными данными и прозрачной архитектурой системы. Платформа выпущена под лицензией GNU Affero General Public License v3.0 (AGPLv3).

Архитектура системы

Гайд интервью

Каждое интервью определяется гайдом, который задаёт его структуру в соответствии с устоявшимися практиками дизайна интервью в социальных науках. Гайд организует вопросы в тематические разделы. Каждый раздел включает набор основных вопросов и зондов (уточняющих вопросов), опирающихся на контекстную информацию.

Гайд позволяет задавать поля контекста нескольких уровней. Поле общего фрейминга содержит информацию, актуальную для всего интервью — например, «Это интервью о том, как люди используют генеративный ИИ». Допускается также контекст, применимый только в пределах конкретного тематического раздела. Основные вопросы формулируются дизайнером заранее и задаются в каждом интервью для обеспечения сопоставимости. Дизайнер может указать, задавать ли их дословно или адаптировать с учётом разговорного контекста.

Зонды — это потенциальные уточняющие вопросы, которые задаются в зависимости от ответа респондента. Гайд содержит только примеры таких вопросов, а система сохраняет гибкость в их переформулировке или генерации более контекстуально уместного уточнения на основе разворачивающегося разговора.

Мультиагентный конвейер

Интервью проводится через конвейер из трёх агентов, каждый из которых реализует отдельную LLM со своей задачей. Архитектура управляется тремя принципами: отзывчивость, контроль и безопасность.

Агент зондирования генерирует релевантные уточняющие вопросы, опираясь на гайд и первоначальный ответ респондента. Генерация зондов обусловлена детальными, но легко модифицируемыми промптами — например, для указания предпочтительного стиля вопросов, языкового регистра или инструкций по работе с чувствительными темами.

Агент переформулирования может перестраивать основные вопросы при наступлении заданных исследователем условий. Для каждого вопроса дизайнер определяет, должен ли агент создавать плавный разговорный переход и/или учитывать информацию, уже предоставленную респондентом. Цель разговорного перехода — обеспечить органичное встраивание вопроса в беседу без изменения его содержательной части.

Агенты классификации отвечают за управление ходом интервью, в том числе за активацию других агентов. Они оценивают выполнение определённых условий на основе шаблона структурированного промпта и релевантного контекста. Выход агента классификации — бинарное значение, запускающее соответствующее действие. В системе реализованы три агента классификации: один определяет, был ли вопрос уже затронут ранее; второй фиксирует отказ респондента отвечать; третий оценивает, задано ли достаточное количество уточнений к текущему основному вопросу.

Система оптимизирована для работы с открытыми LLM или моделями с открытыми весами, а не с проприетарными API, что обеспечивает безопасный сбор данных, воспроизводимость исследований и методологическую прозрачность.

Пользовательский интерфейс для респондентов

Респонденты участвуют в интервью через веб-приложение. Верхняя часть экрана отображает историю переписки, нижняя содержит раскрывающееся текстовое поле для ответов. Дизайн интерфейса вдохновлён приложениями для обмена сообщениями с акцентом на минимализм и высококонтрастные визуальные элементы. Разговор в настоящее время ведётся в текстовом формате с пошаговым чередованием реплик; голосовой интерфейс находится в разработке.

Рабочий процесс для дизайнеров интервью

Платформа поддерживает исследователей в области социальных наук на всех этапах исследования, основанного на интервью.

На этапе разработки гайда дизайнеры определяют тематические разделы, формулируют основные вопросы и зонды, а также задают порядок вопросов. Гайды обычно проходят несколько итераций до развёртывания.

На этапе конфигурации агентов выбираются языковые модели для каждого агента — через локально размещённые модели или сторонние API-провайдеры — и настраиваются их гиперпараметры. Промпты по умолчанию можно адаптировать под конкретные задачи интервью.

На этапе пилотного тестирования симулируются интервью в контролируемой среде: ответы респондентов могут быть заранее определены исследователями или автоматически сгенерированы настраиваемыми синтетическими агентами. Синтетические респонденты создаются с использованием предопределённых персон или рандомизированных характеристик. В ходе пилота проверяются содержание и формулировки вопросов, порядок интервью, производительность различных LLM-агентов и способность системы обрабатывать рискованные ситуации.

На этапе распределения исследователи рассылают участникам автоматически сгенерированные уникальные URL или QR-коды. Платформа поддерживает автоматическое распределение респондентов по разным версиям интервью для тестирования различных условий — например, эффектов порядка вопросов.

На этапе управления данными исследователи получают доступ к данным интервью непосредственно через панель управления в формате HTML или экспортируют их в предпочтительном формате (например, CSV) для последующего анализа в NVivo или R. Кроме того, AInterviewer поддерживает публикацию точной конфигурации системы исследования, что позволяет воспроизвести весь процесс с теми же настройками.

Пилотная оценка системы

Система была оценена в пилотном исследовании с участием 40 очных участников — студентов университета. Тема интервью касалась практик обращения за помощью в академической среде. Участников случайным образом распределяли между обученным человеком-интервьюером и AInterviewer через чат-интерфейс. Информированное согласие было получено; участники знали, в каком экспериментальном условии они находятся. Исследование было одобрено Институциональным наблюдательным советом Копенгагенского университета.

В первоначальной реализации использовалась модель OpenHermes-2.5-Mistral-7B в качестве базовой LLM для мультиагентного конвейера. Авторы отмечают, что на момент написания статьи проводились эксперименты с моделью gpt-oss-120b, которая продемонстрировала улучшение как в формулировке зондов, так и в поддержке многоязычности.