Интернет-сервис потокового аудио Spotify запущен в 2008 году. Сейчас у него 180 млн активных пользователей и 83 млн подписчиков. Как Amazon, Netflix и другие сервисы, набравшие популярность в предыдущем десятилетии, Spotify предлагает слушателям огромный каталог музыки по баснословно низкой цене. Но это лишь часть его успеха.
Решающий момент — это прогностические технологии Spotify на базе машинного обучения. Они рекомендуют пользователям контент, который им нравится. Помимо прочего, ИИ еженедельно предлагает слушателям плейлист, составленный по их индивидуальным предпочтениям.
В распоряжении пользователей — миллионы музыкальных композиций. Но в таком количестве контента легко потеряться. Забив в поиске название любимой группы или исполнителя, можно послушать последний альбом. Ежедневно в библиотеку добавляются тысячи новых треков, и раскопать в этих залежах новые таланты почти невозможно.
Еженедельно Spotify предлагает слушателям 30 новых треков на основании их истории прослушивания. Может, кто-то помнит, как друзья записывали для него сборники на кассетах. Так вот, ИИ — такой же друг-меломан или диджей на радио, который предугадывает вкусы аудитории.
Еженедельный плейлист придумали, когда стало ясно, что важны не только сами рекомендации, но и форма подачи. Понятие плейлистов появилось на заре эпохи цифровой музыки, и с тех пор все к ним привыкли. Поэтому Spotify остановилась на такой форме автоматических рекомендаций.
Индивидуальный плейлист составляется на основе истории прослушивания — по аналогии с рекомендательным сервисом Netflix. А сам процесс называют совместной фильтрацией.
Вот пример: пользователь А часто слушает группу Х и группу Y, пользователь В часто слушает группу Y и группу Z. Из этих данных алгоритмы совместной фильтрации делают вывод, что с некоторой вероятностью пользователю А понравится группа Z, а пользователю В — группа Х.
Пользователей и групп миллионы, и, конечно, конструируемая матрица значительно сложнее, чем в нашем примере. Алгоритмы ИИ осуществляют эти вычисления в других масштабах. В фильтрации учитываются и негативные сигналы. Если пользователь выключит песню в первые 30 секунд, алгоритмы решат, что она ему не понравилась, и не будут добавлять ее в индивидуальный плейлист.
Рекомендательный сервис Spotify пошел дальше, чем предполагалось, и в составлении плейлистов использует анализ аудио и обработку естественного языка. В анализе аудиотрек делится на части: темп, ритм, высота нот, виды инструментов и семплов, наличие текста, его содержание и многое другое. Алгоритм ищет треки с такими же элементами, как в понравившихся пользователю песнях, и включает их в индивидуальный плейлист. Обработка естественного языка применяется к внешним данным — текстам в интернете, имеющим отношение к конкретным трекам. Алгоритмы Spotify ищут любую информацию о музыке в Сети и анализируют эмоциональное отношение к ней. Из определений вроде «торжественная», «фанковая», «меланхоличная» и «тяжелая» ИИ делает вывод, понравится ли песня конкретному пользователю.
Глубокое обучение и нейронные сети сводят все данные воедино и решают — с большой точностью, — что придется по вкусу пользователям. Что, если дать другу пароль от своего аккаунта? Spotify известно, что некоторые так делают. Поэтому алгоритмы игнорируют заметные, но краткосрочные колебания в истории прослушиваний.
У Spotify нет своих центров данных. В 2018 году компания окончательно перенесла всю платформу в Google Cloud. Это позволяет ей легко масштабироваться без частых апгрейдов инфраструктуры.
Рекомендуемые плейлисты отвечают вкусам пользователей, а значит, они дольше останутся подписчиками Spotify.
Точный прогноз считается основным фактором успеха сервиса. База подписчиков выросла на 8 млн пользователей, а стоимость акций поднялась на 25% за три месяца после внесения в список Нью-Йоркской фондовой биржи в апреле 2018 года.