Рекомендательный датасет Яндекса в опенсорсе
Выпуск

Рекомендательный датасет Яндекса в опенсорсе

  • 27 ноября 2025
  • 51:48

О выпуске

С Владимиром Байкаловым, старшим разработчиком рекомендательных технологий Яндекса, поговорили про YaMBDa — Yandex Music Billion-Interactions Dataset. Это датасет на логах Яндекс Музыки, который может стать стандартом для оценки рекомендательных алгоритмов, использующих машинное обучение, — как в индустрии, так и в академической среде.

Датасет Яндекс Музыки: https://clck.ru/3QVudN

00:38 Конец интро
00:50 Деятельность Владимира в компании
01:35 Что такое рекомендательные системы
02:42 Чем занимается разработчик рекомендательной системы
03:30 Что происходит с рекомендательными алгоритмами в последние годы с точки зрения технологий
05:21 Насколько индустрия сферы рекомендательных систем опирается на опенсорс-решения
09:40 Какие данные есть в датасете YaMBDa
13:25 Зачем Яндекс выложил датасет
15:08 Кому будет полезен датасет
18:57 Публикуют ли датасеты за рубежом
20:45 Использовал ли Яндекс зарубежные датасеты
21:28 Чем различаются датасеты
23:13 Как взрастить рекомендательную систему на опенсорсном датасете
25:03 Правда ли, что «у кого больше качественных данных, у того лучше рекомендательные системы»
27:26 Всем ли сервисам нужна рекомендательная система
30:11 Насколько рекомендации вовлекают пользователей и улучшают их опыт
32:12 Как бороться с тем, что рекомендации делают контент более релевантным, но менее разнообразным
35:17 По каким метрикам понять, что рекомендации плохие
40:58 Проблемы в индустрии рекомендаций
47:34 Будущее рекомендательных систем
51:27 Аутро. Подписывайтесь!

Реклама
ООО "ЯНДЕКС"
ИНН 7736207543
erid: 2W5zFJo98QG

Команда
Ведущий — Алексей Юр, стартап-предприниматель и сооснователь сервиса GOGYM: https://t.me/yur_lico;
Редактор — Серафима Весь;
Продюсер — Виктория Витославская;
Звукорежиссер — Филипп Девяткин;
Проджект-менеджер — Екатерина Манько.

Подпишись на подкаст, чтобы не пропустить новые выпуски: https://redbarn.ru/podcast/bagreport

Подписывайся на наш канал: https://t.me/redbarnlife
——
Подкаст создан студией Red Barn (медиакомпания Double Day).
Наш сайт — https://redbarn.ru | Связаться — hay@redbarn.ru

Пользуясь нашим сайтом, вы соглашаетесь с тем, что мы используем cookies
player img

Тестовое название выпуска в 2 строки

Название подкаста

00:00

29:21

Тестовое название выпуска в две строки или в три строки и так далее

Название подкаста

00:00

29:21