Книга: Формула YouTube. Все, что необходимо знать, от старта канала до вирусного контента
Назад: Глава 3 Искусственный интеллект YouTube: глубокое машинное обучение
Дальше: Часть II Возможность

Глава 4
Разбивка алгоритма

Вы только что узнали много нового об истории алгоритмов, на которых работал YouTube с момента его создания, а также о том, что на сегодняшний день они практически совершенны. Но что это значит? Как именно работает навигация? Давайте проясним, что происходит, когда на платформе появляется посетитель.
Как только пользователи заходят на youtube.com, за ними начинают следить. Выглядит это так. Представьте, что, будучи подростком, вы пришли в гости к своему другу, а его надоедливый младший брат не дает вам прохода. Но при этом он не висит на вас, требуя к себе внимания, а молча наблюдает за вашим поведением и выполняет каждую прихоть. Вы хотите перекусить – он бежит на кухню и приносит яблоко. Вы говорите: «Нет, спасибо». Тогда он забирает яблоко и возвращается с пакетом чипсов. Вы едите Cheetos. Затем у вас заходит разговор о Хане Соло, поэтому он бежит в гостиную и включает «Империя наносит ответный удар».
Когда вы придете в следующий раз, он с порога вручит вам печенье и включит «Возвращение джедая». Его предположение о том, что вы, возможно, захотите поесть или посмотреть, основано на вашем последнем визите, и, скорее всего, оно абсолютно точно. Держу пари, вы захотите почаще бывать в этом доме, раз в нем к вам так хорошо относятся и знают, чем угодить. (Если только он не включит «Последнего джедая» или «Соло», тогда в следующий раз вы пойдете к Цукербергу, потому что эти фильмы – полный отстой.)
Допустим, вместо Cheetos вы захотели морковные палочки, а вместо «Звездных войн» – комедию «Офис». В следующий раз вам предложат брокколи и сериал «Парки и зоны отдыха». Концепция работает с любыми предпочтениями.
Эти примеры иллюстрируют цели YouTube:
• Спрогнозировать, что будет смотреть зритель.
• Сохранять его максимальную вовлеченность и удовлетворенность.

 

То, как эти цели достигаются, разбивается на два процесса:
1) Сбор и использование данных статистики.
2) Алгоритмы (во множественном числе).
1. Сбор и использование данных
Ежедневно ИИ YouTube собирает 80 миллиардов единиц данных о поведении пользователей. Для достижения целей он собирает сведения в двух ключевых областях. Первая область, в которой ведется наблюдение, – это поведение пользователей, вычисляемое с помощью метаданных. Информация о видео основывается на поведении человека, чьи глаза смотрят на экран, а пальцы кликают. «Сигналы удовлетворения» обучают ИИ тому, что предлагать, а что – нет.
Существует конкретный перечень этих сигналов:
• какие видео смотрит пользователь;
• какие видео он пропускает;
• время, которое он тратит на просмотр;
• лайки и дизлайки;
• фидбек «не интересно»;
• опросы после просмотра видео;
• вернется ли он, чтобы пересмотреть или закончить просмотр;
• сохранит ли ссылку, чтобы вернуться и посмотреть позже.
Все эти сигналы питают контур обратной связи удовлетворенности. Этот цикл создается на основе данных, которые алгоритм получает от конкретного поведения. Он «зацикливает» типы видео, которые вам нравятся, с помощью своих предложений. Именно так персонализируется опыт каждого пользователя.
СБОР МЕТАДАННЫХ
Как именно ИИ собирает данные? Наблюдение начинается с превью. Искусственный интеллект YouTube использует передовые технологии набора продуктов ИИ Google. Он работает с программой под названием Cloud Vision (CV), применяющей оптическое распознавание символов (OCR) и изображений для классификации видео на основе превью. CV фиксирует каждый элемент превью и, используя миллиарды единиц данных, уже имеющихся в системе, распознает эти элементы и передает информацию обратно в алгоритм. Например, превью, включающее крупный план лица всемирно известного физика Стивена Хокинга, распознается как таковое в CV, поэтому видео будет помещено в подборку рекомендаций вместе с другими видео, имеющими тег «Стивен Хокинг». Именно так ваши видео обнаруживаются и просматриваются.
Вы хотите перекусить – он бежит на кухню и приносит яблоко. Вы говорите: «Нет, спасибо». Тогда он забирает яблоко и возвращается с пакетом чипсов. Вы едите Cheetos. Затем у вас заходит разговор о Хане Соло, поэтому он бежит в гостиную и включает «Империя наносит ответный удар».
Кроме того, CV использует инструмент «безопасность», который, основываясь на данных, собранных из изображений в превью, определяет, насколько видео безопасно для просмотра всеми аудиториями, или в нем есть темы только для взрослых, кадры насилия или другой сомнительный контент. Программа подтверждает «достоверность» сделанной оценки. Оценка также отражает, насколько точно содержимое видео соответствует тому, что показано в превью.
Cloud Vision позволяет создателям видео загрузить превью и заранее узнать, как оно, скорее всего, будет оценено системой. Если по какой-то причине CV отметит превью как неуместное, вы сможете изменить его перед загрузкой видео. Эта возможность помогает избежать демонетизации и других проблем, с которыми авторы сталкивались в прошлом. Программа помогает действовать на опережение вероятных проблем. CV не дублирует меры безопасности YouTube, но достаточно близка к ним, что позволяет авторам заранее понять, как контент будет оценен платформой. CV может пропустить то, что для YouTube окажется неприемлемым, но все же этого достаточно для предварительного запуска.

 

Рис. 4.1. Превью с точками данных

 

ВИДЕОИНТЕЛЛЕКТ
После проверки превью ИИ просматривает каждый кадр видео, создает список кадров и проставляет на них метки. Например, если вы снимаете видео на парковке, ИИ отмечает фасад магазина, людей, цветы, названия брендов и многое другое. Эту информацию он будет использовать для рекомендаций, а также проверит ее на безопасность, как и превью. Знайте, что находится на каждом кадре видео, которое вы создаете! ИИ все заметит и отсортирует, выделит главные объекты и отсеет второстепенные в видео и его метаданных.
ЗАКРЫТЫЕ СУБТИТРЫ
То же самое ИИ делает с речью в видео. У платформы есть функция автоматических субтитров, и ИИ распознает слова в роликах, чтобы дополнить данные об их содержании. Таким образом, просмотр кадров с присвоением меток похож на визуальный просмотр видео, а прослушивание аудио позволяет оценить, что на самом деле произносится. Все поступает в систему.
ЕСТЕСТВЕННЫЙ ЯЗЫК
ИИ также вычленяет фактическую структуру предложения и разбивает ее на схемы. Так он определяет смысл сказанного и особенности стиля изложения, чтобы группировать видео по категориям, а не только по темам. Например, два создателя контента сняли видео о Стивене Хокинге. Но одно из них биографическое или научное, а другое – юмористическое или развлекательное. Несмотря на то, что в обоих роликах говорится об одном человеке, они попадут в разные категории рекомендуемых видео.
НАЗВАНИЕ И ОПИСАНИЕ ВИДЕО
Думаю, вы понимаете, что алгоритм также просматривает заголовок и описание видео, чтобы дополнить то, что он уже узнал из превью, покадрового просмотра и языка. Но он отслеживает все эти сведения только до тех пор, пока не начнут поступать данные о просмотре.
ИИ «знает», что люди могут вводить в заблуждение, но у них не получится скрыть содержание видео. Не добавляйте название и описание к своим роликам бездумно, лишь бы заполнить все поля перед загрузкой. Словоблудие отталкивает, поэтому подбирайте слова с умом. Большинство создателей контента не составляют описание для видео, а ведь это еще одна точка данных, на которую обращает внимание ИИ при ранжировании видео в поиске.
Не добавляйте название и описание к своим роликам бездумно, лишь бы заполнить все поля перед загрузкой. Словоблудие отталкивает, поэтому подбирайте слова с умом.
2. Алгоритмы (во множественном числе)
Знаете ли вы, что у YouTube не один алгоритм? ИИ использует несколько систем, и каждая из них имеет цель и назначение.
Вот базовые функции сайта, которые видят зрители:
• Главная страница;
• Подписки;
• Рекомендации;
• В тренде;
• Уведомления;
• Поиск.
Каждую из этих функций обслуживают отдельные алгоритмы, которые оптимизируются для более высокой точности попадания, и все они включены в ИИ YouTube. У них есть отдельные показатели соответствия, позволяющие определять, что работает для пользователей в каждой конкретной системе. Уровень попаданий отражает, как часто зрители находят то, что действительно хотят посмотреть. Вы знаете, что такое поклевка? Это когда рыба клюет на приманку. Представьте, что вы рыбак, который забросил свою удочку-видео в воду. Потенциальные зрители – это рыбы, заметившие вашу «приманку». Примерно десять из них проплывут мимо, потому что приманка им не понравится. Но найдется рыба, которая скажет: «Выглядит неплохо» и клюнет. Допустим, вы забрасываете удочку 10 раз, и из 100 рыб 10 клюнут. Вот ваш показатель попадания. Скорость попадания очень важна для каждой системы в ИИ. Алгоритмы крайне чувствительны к поведению пользователей и метаданным каждого источника трафика, поэтому они знают, как изменить их, чтобы увеличить частоту попаданий.
Кроме того, YouTube постоянно проводит эксперименты – несколько тысяч в год – и внедряет примерно одно из десяти изменений, доказавших свою эффективность. За год их набирается несколько сотен. Это помогает системе стать умнее и точнее подбирать для зрителей то, что им захочется посмотреть.
ГЛАВНАЯ СТРАНИЦА
Главная страница YouTube неоднократно изменялась. Сейчас пользователям уже не нужно вводить запрос в поисковой строке или самостоятельно что-то разыскивать. Раньше на главной странице показывались только видео от каналов, на которые пользователь подписан. Теперь там размещена персональная лента рекомендаций, основанная на его истории просмотра.
Пока пользователь заходит на YouTube, алгоритмы отслеживают, какие видео он смотрел раньше, чтобы предположить, чего ему захочется сейчас, даже если раньше он ничего подобного не смотрел. Это выглядит нелогичным. Кажется, что алгоритм был бы точнее, предлагая ранее просмотренные и понравившиеся видео. Но на самом деле все наоборот. Именно наличие свежих предложений заставляет пользователей дольше оставаться на платформе, потому что им не подсовывают одни и те же старые ролики.
YouTube добивается результата, разделяя контент главной страницы на две категории: знакомое и найденное. В знакомом он показывает пользователям популярные или премьерные видео с каналов, на которые они заходили раньше. А в найденном – те, что смотрели и полюбили пользователи с похожими шаблонами просмотра. YouTube обнаружил, что комбинация этих стратегий повышает вовлеченность. Если вы, как производитель контента, хотите попасть на главную страницу – а это определенно должно быть вашей целью – изучите механизмы, благодаря которым видео туда попадают. Постарайтесь повысить коэффициент кликабельности и усилить удержание зрителей: это поможет вам выйти на более широкую аудиторию.
ПОДПИСКИ
Этот пункт не требует долгих объяснений. Раздел «Подписки» предлагает контент от каналов, на которые вы подписаны. Он будет рекомендовать новые видео от них, особенно если те похожи на то, что вы смотрели раньше. Например, вы посмотрели один или два видео с пранками от канала, на который подписаны, поэтому ИИ добавит последнее загруженное на этот канал видео на ту же тему в вашу ленту подписок.
РЕКОМЕНДАЦИИ
Еще одно место, на котором должны сосредоточиться создатели контента помимо главной страницы, – подборка рекомендаций, в том числе видео из раздела «Следующее». Рекомендации располагаются ниже (в приложении) просматриваемого видео или справа (в браузере) от него. За то, чтобы ваше видео туда попадало, сто́ит бороться! Когда эта функция работает на отлично, зрители «зависают» на YouTube, что и является его целью. Если вы умеете использовать механизмы, которые продвигают ваше видео в ленту рекомендаций, то находитесь именно там, где вам нужно быть.
Какие бывают механизмы? Во-первых, весь ваш контент должен быть связан между собой. Это означает, что, если метаданные всех ваших видео перекликаются, то алгоритм будет предлагать их одно за другим, и просмотры резко вырастут. Метаданные – это заголовок, теги, описание и сам контент. Подробно поговорим о них в части III.
Если вы, как производитель контента, хотите попасть на главную страницу – а это определенно должно быть вашей целью – изучите механизмы, благодаря которым видео туда попадают. Постарайтесь повысить коэффициент кликабельности и усилить удержание зрителей: это поможет вам выйти на более широкую аудиторию.
Во-вторых, на то, какие видео попадают в подборку рекомендованных, влияет поведение зрителей. Если ваш контент заставляет их досмотреть ролик до конца, а не прыгать с одного видео на другое, то, скорее всего, он будет рекомендован.
Другие механизмы, которые ИИ подключает в этой функции, включают типы рекомендаций «кроличья нора» и «смотреть что-то еще». С «кроличьей норой» все понятно: это видео, которые так или иначе похожи, что заставляет зрителя следовать по определенному пути. К ним относятся:
• видео с одного канала;
• видео и каналы, похожие на то, что вы смотрели;
• видео, на которые кликали другие люди после просмотра текущего видео.

 

Тип «смотреть что-то еще» (также очевидный) существует потому, что зрители в итоге устают смотреть похожие видео, и им нужно что-то совершенно другое, чтобы захотеть остаться на платформе. Это не случайный выбор, а все еще персональная рекомендация, основанная на их прошлом поведении. Такая рекомендация возможна, когда у ИИ сохранена история просмотров конкретного зрителя.
В ТРЕНДЕ
Мне нравится называть эту подборку рекомендаций геоспецифическим «кулером для воды». Распространенное заблуждение считать определение «трендовый» синонимом «популярный». Тренды – это широкие темы, о которых люди сейчас говорят по всему Интернету. То, что в настоящее время обсуждают в новостях, в социальных сетях, на сайтах, в блогах и т. д. Под «геоспецифическим» я подразумеваю, что даже в Интернете есть «зоны», различающиеся по авторитетности. Сайты с бо́льшим авторитетом чаще формируют тренды, поэтому YouTube включает их темы в свой раздел трендов. Разработчики понимают, что подобная информация попадается людям и на других сайтах, поэтому они с большей вероятностью кликнут на видео на ту же тему, когда зайдут на платформу. Аудитория, проживающая в одном районе, часто интересуется похожими вещами. Например, то, что будет трендом в Лос-Анджелесе, скорее всего, не вызовет никакого интереса на Среднем Западе.
УВЕДОМЛЕНИЕ
YouTube уведомляет ваших подписчиков о том, что вы загрузили новое видео, но только если они попросили его об этом, нажав кнопку «колокольчик». Уведомление приходит через приложение или по электронной почте.
ПОИСК
Еще одной простой функцией является поиск. Пользователи вводят ключевое слово или фразу в строку запроса, чтобы найти то, что им хочется посмотреть. Алгоритм сужает результаты поиска, основываясь на метаданных и видео, а также внимательно изучает подобные запросы от других людей и их рекцию на отобранные видео. Многие авторы думают, что им просто нужно провести оптимизацию поисковых систем (SEO), чтобы их видео попадало в топ, но имеющаяся функция «новизны» будет предлагать последние загруженные видео, меняя результаты. Посмотрите, что находится на вкладке «В тренде», и создайте контент с правильными метаданными. Особенно обратите внимание на то, что сегодня в тренде в вашей нише. Если ваше видео подойдет, алгоритм сохранит его в результатах поиска, если провалится – отбросит.
Это не вина YouTube
Вы только что узнали много нового об истории YouTube и его внутреннем устройстве… Поздравляю! Вы немало раскопали, но ловите себя на мысли: «Отлично, но как мне использовать это для своего контента
Я часто сталкиваюсь с создателями видео, которые имеют добрые намерения и высокие цели, но не добиваются желаемых результатов и обвиняют в этом YouTube. Если я и хочу, чтобы вы что-то запомнили из этих первых четырех глав, так это следующее: не вините YouTube, вините свой контент.
Знаю, это звучит грубо – как будто я только что назвал вашего ребенка уродливым – но постарайтесь отстраниться и взглянуть на ситуацию объективно. Может быть, ваш «ребенок» и в самом деле уродлив. Если вы способны примирится с тем, что виноват ваш контент, а не Большой Плохой Алгоритм, вы готовы изучать Формулу YouTube. Если вы не в силах этого признать – никакие знания не спасут вас, можете закрыть книгу.
Посмотрите, что находится на вкладке «В тренде», и создайте контент с правильными метаданными. Особенно обратите внимание на то, что сегодня в тренде в вашей нише.
Теперь, когда вы немного лучше понимаете внутреннюю работу ИИ, пора переходить к другим частям книги и учиться внедрять системы и стратегии, которые работают с алгоритмом, вместо того чтобы боятся или игнорировать его. Цель YouTube проста: вовлечение и удовлетворение зрителей. Вам остается лишь создавать хороший контент. Цель этой книги – предложить формулу, позволяющую подстроить свой контент под цели YouTube, а также научить анализировать эффективность контента, чтобы вы могли настроиться на удовлетворение зрителей. Итак, теперь вы готовы вооружиться инструментами, необходимыми для того, чтобы вскопать почву и посадить правильные семена в своем контент-саду.
Назад: Глава 3 Искусственный интеллект YouTube: глубокое машинное обучение
Дальше: Часть II Возможность