AI-промпты для контент-анализа: драфт кодбука, кодирование, сводки

Эти четыре промпта покрывают те части проекта контент-анализа, где AI экономит больше всего времени, не уступая в строгости: первый драфт кодбука из выборки, применение готового кодбука в масштабе, сводки по категориям с иллюстративными цитатами и аудит автокодированного вывода на систематические ошибки. Каждый промпт нужно заполнить своими данными и контекстом, а потом запустить в Claude, ChatGPT, Gemini или любой LLM с достаточно длинным контекстным окном.

Промпт 1. Сделать первый драфт кодбука из выборки

Я веду проект контент-анализа на [тип данных — например, отзывы в App Store, обращения в поддержку, NPS-комментарии] для [продукт или контекст]. Исследовательский вопрос:

[конкретный вопрос, на который должен ответить анализ]

Вот [50–100] единиц-выборки из датасета в порядке сбора:

[Вставь единицы, по одной на строку, пронумерованные]

Пожалуйста:
1. Прочитай все единицы и предложи 8–15 кандидатских категорий, схватывающих основные темы, жалобы, запросы или настроения
2. Для каждой категории напиши определение в одно предложение
3. Для каждой категории напиши однострочное правило включения и однострочное правило исключения
4. Для каждой категории подбери 2–3 единицы-примера из выборки, чисто попадающие в категорию
5. Отметь любую категорию, которая пересекается с другой, и предложи, как сохранить их взаимно исключающими
6. Отметь любые единицы из выборки, которые не подошли ни одной категории — они могут сигнализировать о пропущенном коде или элементе вне scope
7. Предложи, какую единицу анализа ты использовала (один отзыв, одно предложение, один абзац) и объясни выбор

Промпт 2. Применить готовый кодбук к батчу единиц

У меня есть готовый кодбук для проекта контент-анализа. Сначала вставлю кодбук, потом батч единиц для кодирования.

Кодбук:
[Вставь имя категории, определение, правило включения, правило исключения и 2–3 примера для каждой]

Правила кодирования:
- Применять один первичный код на единицу, если только единица явно не затрагивает две разные категории
- Если единица не подходит ни одной категории, помечай OUT_OF_SCOPE и поясни почему
- Если единица неоднозначна, помечай AMBIGUOUS и поясни, какие две категории конкурировали
- Цитируй точную фразу, которая запустила каждый код

Единицы для кодирования:
[Вставь единицы, пронумерованные, по одной на строку]

Верни таблицу со столбцами: unit_id, primary_code, secondary_code (если есть), trigger_phrase, confidence (1–5), notes.

Промпт 3. Собрать сводки по категориям и подобрать иллюстративные цитаты

Я закончила кодирование [N] единиц по [M] категориям в проекте контент-анализа на тему [тема]. Исследовательский вопрос:

[конкретный вопрос]

Вот все единицы, отнесённые к категории [CATEGORY_NAME]:

[Вставь все единицы в категории]

Пожалуйста:
1. Напиши абзац-сводку (5–7 предложений) с описанием того, что схватывает эта категория, какие самые частые подпаттерны внутри неё и как она соотносится с исследовательским вопросом
2. Найди 2–4 различных подпаттерна внутри категории и назови каждый
3. Подбери 5 иллюстративных цитат, которые вместе передают диапазон — самая репрезентативная, самая крайняя, самая удивительная и две, показывающие разные подпаттерны
4. Отметь любые единицы в категории, которые, кажется, не попадают чисто, — они могут нуждаться в перекодировании или категория может потребовать разделения
5. Предложи одну конкретную рекомендацию, на которую команда может действовать только на основании этой категории

Промпт 4. Аудит автокодированного вывода на систематические ошибки

Я автокодировала [N] единиц следующим кодбуком, и мне нужно провести аудит вывода до того, как доверять счётчикам.

Кодбук:
[Вставь кодбук]

Вот 50 случайно выбранных единиц с присвоенными кодами:

[Вставь единицы с присвоенным первичным кодом]

Пожалуйста:
1. Для каждой единицы оцени, корректен ли присвоенный код, частично корректен или ошибочен, и поясни почему
2. Найди систематические паттерны ошибок — категории, которые автокодировщик путает, типы высказываний, которые он неверно интерпретирует, сарказм или смешанная тональность, которые он пропустил
3. Предложи конкретные изменения в определениях кодбука или правилах исключения, которые исправят систематические ошибки
4. Оцени общую точность прохода автокодирования и нужно ли перекодировать датасет после правок
5. Отметь отдельные единицы, выглядящие как пограничные случаи, которые стоит поднять на ридауте с командой