MIT Sloan: пять способов, которыми LLM меняют маркетинговые исследования

Генеративный AI в маркетинговых исследованиях — цифровые двойники и AI-интервьюеры

Получение потребительских insights, необходимых для уверенных решений, традиционно обходится в десятки тысяч долларов и требует нескольких месяцев сбора и анализа данных. К моменту готовности результатов рыночная ситуация нередко уже успевает измениться. Способен ли генеративный AI принципиально изменить это положение дел?

Опираясь на собственное исследование, опубликованное в Journal of Marketing, а также на интервью с руководителями крупных организаций, авторы статьи выделяют пять способов, которыми большие языковые модели (LLM) начинают трансформировать маркетинговую функцию и переформатировать индустрию insights стоимостью 153 миллиарда долларов. LLM способны практически сжать сроки маркетинговых исследований с месяцев до дней за счёт новых подходов к быстрому тестированию концепций — таких как использование потребительских «цифровых двойников» — и обеспечения качественных исследований в масштабе. Эти техники позволяют компаниям эффективнее работать с неструктурированными данными, а небольшим исследовательским командам — проводить значительно более масштабные исследования, чем прежде.

Организации проводят маркетинговые исследования, чтобы извлекать потребительские insights, направляющие стратегические и тактические бизнес-решения. Исторически генерация insights — это многоэтапный, трудоёмкий и времязатратный процесс.

Типичный пайплайн маркетинговых исследований включает: формулировку проблемы, дизайн исследования, разработку инструментария, отбор выборки, сбор данных, их анализ и представление insights. Часть задач качественная — интервью, фокус-группы — часть количественная: опросы. Такие исследования могут выполняться внутренними командами или передаваться специализированным агентствам. Проект занимает от нескольких недель до нескольких месяцев и обходится от десятков до сотен тысяч долларов.

Генеративный AI делает процесс генерации потребительских insights существенно более эффективным и открывает новые способы повысить его результативность. Компании могут перейти от крупных, нечастых исследований, занимающих месяцы, к небольшим, частым исследованиям, синхронизированным с циклами принятия решений.

Генерация потребительских insights с помощью синтетических цифровых двойников

Один из ключевых способов, которыми LLM обеспечивают генерацию данных для потребительских insights, — использование цифровых двойников. Цифровой двойник — это синтетическое, основанное на данных представление объекта или процесса, позволяющее проводить симуляции и экспериментировать со сценариями «что, если» при минимальных затратах. В маркетинге LLM открывают возможность использовать потребительские цифровые двойники — персоны, способные симулировать процессы принятия решений, изменения предпочтений и реакции на маркетинговые стимулы — в качестве полигонов для экспериментов до выхода продукта на рынок. Вместо того чтобы ждать сбора новых данных, аналитики могут симулировать тестирование концепций, ассортиментные решения, ценовые изменения или реакции на кампании in silico — прежде чем делать значительные финансовые обязательства.

AI-компания Evidenza в партнёрстве с немецкой компанией в сфере информационно-коммуникационных технологий изучала, насколько B2B-покупатели готовы доверить компании управление кибербезопасностью и облачной инфраструктурой для чувствительных данных. Исследовательская команда использовала синтетические выборки лиц, принимающих решения, для симуляции исследования и быстрой проверки гипотез о траекториях расходов, продуктах, способных вызвать смену вендора, и других вопросах. Валидация на основе существующего опроса реальных людей показала высокие корреляции (0,75–0,88) по метрикам, подтвердив, что синтетические выборки дали направленно точные insights. Синтетический подход позволил получить ценные данные за долю времени и стоимости традиционного маркетингового исследования.

Потребительские цифровые двойники могут генерироваться из разнообразных демографических, психографических и поведенческих данных из различных внутренних и внешних источников. Исследование авторов статьи показало, что LLM способны генерировать высококачественные, информационно насыщенные качественные данные. Данные, сгенерированные LLM и людьми, выглядят и воспринимаются очень похоже, хотя ответы LLM превосходят человеческие по глубине и содержательности — поскольку не ограничены временем или готовностью к развёрнутым ответам. Цифровые двойники также помогают охватить нишевые или труднодоступные сегменты, дополняя реальных респондентов значимым образом.

Кроме того, авторы обнаружили, что цифровые двойники добавляют значительную ценность на этапе разработки инструментария исследования. LLM можно использовать для генерации синтетических ответных данных на опрос ещё до его проведения среди реальных респондентов. Такой «перевёрнутый» подход к маркетинговым исследованиям позволяет исследователям протестировать дизайн опроса до его запуска. Они могут изучить синтетические результаты и понять, какие вопросы стоит убрать или добавить, насколько качественными будут insights. В ряде случаев синтетические данные и вовсе устраняют необходимость проводить опрос — например, когда одна концепция явно доминирует над всеми остальными.

Качественные исследования в масштабе

Традиционная модель маркетинговых исследований предполагает начало с неструктурированных качественных исследований — этнографий, глубинных интервью или фокус-групп — с небольшим числом респондентов, после чего следует масштабный опрос. Поскольку качественные данные трудоёмки и дороги в сборе и анализе, компании исторически делали ставку на данные опросов. LLM меняют это, делая качественные данные значительно проще в сборе и анализе.

AI как движок сбора данных. Впечатляющий случай применения генеративного AI в сборе данных — роль интервьюера. Здесь AI выполняет три функции последовательно: следует гайду, задавая конкретные вопросы; оценивает ответ респондента по метрикам ясности и глубины; если оценка ниже установленного порога — просит уточнить. Этот трёхшаговый подход применим не только для интервью с людьми, но и для генерации синтетических данных.

AI-модерированные интервью — мощное дополнение к инструментарию маркетингового исследователя, позволяющее собирать качественные данные в масштабе. В отличие от человека-модератора, AI-модератор способен собирать детализированные неструктурированные данные — видео, аудио или текст — от множества респондентов по всему миру за долю стоимости традиционного личного глубинного интервью. Хотя опытный человек-модератор может лучше считывать тон, язык тела и невербальные сигналы, AI-модератор выигрывает в способности быстро проводить интервью в масштабе и через географические границы. AI-модераторы также могут предлагать дополнительное преимущество в ситуациях, когда люди стесняются обсуждать продукт из-за социальной желательности или страха осуждения.

По данным Outset, платформа завершила 100 интервью за несколько дней — задача, которая в обычных условиях заняла бы недели. Полученные качественные данные выявили проблемы, о которых клиент не подозревал, и помогли сформировать мессенджинг для брендовых кампаний. Подход также дал клиенту возможность проводить исследования непрерывно, а не один-два раза в год.

AI как движок анализа данных. Традиционный подход к анализу качественных данных — преимущественно ручной: эксперты-аналитики перебирают большие объёмы неструктурированного текста и аудиовизуальных данных. Для текстовых данных анализ предполагает тематический концептуальный анализ: чтение текста, исключение словесного мусора, выделение ключевых фраз, группировку в связанные концепции, итерацию для удаления повторений и консолидацию тем в краткое резюме. Исследование показывает, что LLM значительно упростили многие из этих задач без потери качества.

По данным Voxpopme, использование AI привело к сокращению стоимости качественных исследовательских проектов на 30–50%, увеличению использования существующих insights на 50% и 60-кратному ускорению анализа. LLM-инструменты позволяют проводить качественные и количественные исследования в масштабе — что ранее было нереалистично. Компании, в свою очередь, быстро обнаруживают, что они могут делать с неструктурированными данными значительно больше, чем было возможно прежде.

Помимо традиционных качественных данных из интервью и фокус-групп, существует богатая информация в неструктурированных данных — онлайн-отзывы, транскрипты колл-центров, публикации в социальных сетях. Как отметил старший эксперт McKinsey Чонси Холдер, «AI-агенты могут работать с мультимодальными данными — социальными сетями, характеристиками категорий и поведенческими сигналами, — чтобы выявлять неудовлетворённые потребности и возникающие тренды, идентифицируя возможности более эффективно, чем традиционные методы». LLM с предобучением изменили ситуацию, обеспечив семантическое обобщение, извлечение тем, классификацию тональности и генерацию нарративных insights из массивных мультимодальных данных с куда меньшими усилиями.

Интеграция разрозненных данных с помощью RAG

Хотя современные LLM обладают впечатляющим набором возможностей, их производительность на сложных задачах, требующих предметных знаний — например, внутренних маркетинговых исследований конкретного бренда, — может быть ограниченной. Для таких ситуаций retrieval-augmented generation (RAG) — это экономичный метод, позволяющий улучшить качество выводов. RAG включает информацию из внешнего источника знаний, например существующих качественных данных компании, в качестве дополнительного ввода наряду с запросом пользователя.

RAG особенно полезен для маркетинговых исследований, где менеджеры опираются на множество внешних источников информации. Эффективная интеграция разрозненных потоков insights — сложная задача для маркетинговых организаций: трекеры опросов, CRM-системы, social listening и сторонние данные редко «разговаривают» между собой связно. LLM с RAG обеспечивают «соединительную ткань» для разрозненных источников и позволяют синтезировать информацию из нескольких потоков.

RAG можно также использовать для интеграции нескольких источников — внутренних CRM, данных опросов и демографических данных — и создания AI-чатбота, или persona bot, который бренд-менеджеры могут использовать для более глубокого понимания своих клиентов. Как отметила Лиза Гуддинг, президент по стратегическому росту в Ipsos: «Компании теперь смешивают собственные поведенческие данные с синдикативными исследованиями и сигналами трендов, которые мы предоставляем, для создания более богатых и динамичных экосистем insights. Этот сдвиг породил data as a service (DaaS), где AI открывает новый вид консультативной аналитики».