Кластерные рекомендации и интересы в персонализации: как не разориться на инфраструктуре при постоянном росте кол-ва пользователей

День выступления: 18.04.2025
Время начала: 13:55
Время окончания: 14:25
Зал: 310. Данные
Категории: Разработка
Секции: Машинное обучение

Описание:

При построении персональных рекомендаций зачастую подразумевается, что мы должны получить для каждого пользователя свою, уникальную подборку товаров. Однако в случае, когда пользователей становится слишком много, а в инфраструктуре товары хранятся с обогащением бизнес-факторами, такая схема становится все менее масштабируема. Расскажу о том, как мы без просадки в качестве существенно сократили затраты на инфраструктуру за счет кластеризации пользователей и товаров.

Основные тезисы:

- кластеризация пользователей (эмбеддинги WildBERT), создание агрегированной выдачи для кластера;

- кластеризация товаров (e5) - выделение интересов, отображение пользователя в пространство интересов;

- сравнение схем "храним подборку для каждого пользователя" и "храним только кластера, юзера описываем как набор кластеров и интересов" в разрезе ранжирующих метрик и затрат на инфраструктуру;

- как в такой схеме не просадить качество - доранжирование по эмбедингам в онлайне в момент формирования выдачи;

- зеленый АБ-тест с тестированием описанной схемы, и оценка по экономии на инфраструктуре.

Ждём ваш отзыв

О спикере

Евгений Иванов

RecSys Team Lead @ Wildberries
Москва

Первый человек в команде персонализации WB, автор тг канала @WildRecSys

Похожие доклады

Спикеры

Кластерные рекомендации и интересы в персонализации: как не разориться на инфраструктуре при постоянном росте кол-ва пользователей

Описание:

Евгений Иванов