Microsoft представила модель для симуляции поведения пользователей

Microsoft показала новую языковую модель UserLM-8B, предназначенную не для генерации ответов от лица ассистента, а наоборот, для симуляции поведения человека в диалоге. Это первый масштабный эксперимент Microsoft по созданию моделей, которые ведут себя как реальные пользователи: уточняют, ошибаются, выражают эмоции и даже меняют мнение в ходе разговора.

UserLM-8B построена на базе Llama 3.1 8B, но была дообучена на уникальном корпусе WildChat-1M. Наборе из более миллиона реальных и синтетических диалогов. Там модель наблюдала, как люди формулируют вопросы, пересказывают мысли и реагируют на непонимание со стороны собеседника. Такой подход позволил достичь необычного уровня естественности. UserLM может, например, перебивать, просить объяснить попроще или использовать разговорные выражения.

Microsoft видит в этом технологию для будущего поколения AI-тестирования и обучения ассистентов. Модель может имитировать клиентов в колл-центрах, пользователей в чатах поддержки, студентов на обучающих платформах или даже аудиторию социальных сетей. Это открывает путь к созданию реалистичных сценариев взаимодействия человека и ИИ, где поведение пользователя не запрограммировано, а динамично и правдоподобно.

В исследовании, опубликованном на Hugging Face, отмечается, что UserLM-8B превосходит существующие модели симуляции пользователей по метрикам естественности и разнообразия. Microsoft также рассматривает возможность интеграции модели в Copilot Studio, чтобы разработчики могли тестировать интерфейсы и агентов на живых имитациях пользователей.

Если GPT-модели учат машины говорить как ассистенты, то UserLM делает обратное — учит ИИ понимать, как говорит человек. И это может стать основой нового класса симуляторов для обучения и стресс-тестирования ИИ-систем.