RankBrain – это название Google для системы искусственного интеллекта с машинным обучением, которая помогает Google понять смысл запросов и предоставлять наиболее подходящие результаты поиска в ответ на эти запросы сообщило агентство Bloomberg. Это подтвердил и Google.
Машинное обучение – это компьютерная программа, которая учит саму себя.
Истинный искусственный интеллект, – это то, где компьютерная программа пополняет свою базу знаний как от обучения, так и от накопления знаний и создания новых связей.
Представьте, что компьютерная программа поможет вам выбрать фильм, который понравится вам. Первоначально программа показывает названия всех имеющихся у неё фильмов.
Программа еще не знает ваших предпочтений, и вы отмечаете из уже виденных фильмов какие вам не нравятся, перетягивая их в левую сторону. Те же фильмы, которые вам понравились – в правую. Так фильмы условно распределяются по виртуальной шкале от не понравившихся к понравившимся.
Чем больше фильмов вы расставите на виртуальной шкале, тем болеет точным будет предложение о новом просмотре. С каждой новой отметкой программа, самообучаясь дает более точное предсказание.
Сейчас уже искусственный интеллект способен по сотни отметок нравится узнать о вас больше, чем ваш сосед. По 200 лайкам узнает о вас больше, чем ваш (а) спутник (ца) жизни. Проанализировав 500 лайков, программа узнает о ваших предпочтениях лучше, чем вы сами. А сколько вы уже поставили лайков?
RankBrain – это часть общего поискового «алгоритма» Google, компьютерной программы, которая используется для сортировки миллиардов страниц, о которых она знает, и поиска наиболее подходящих для конкретных запросов.
RankBrain является частью алгоритма поиска Hummingbird от Google.
Hummingbird – это общий алгоритм поиска. Так же, как у автомобиля есть двигатель. Сам двигатель может состоять из различных частей, таких как масляный фильтр, топливный насос, радиатор и так далее. Так, Hummingbird включает в себя различные части, причем RankBrain является одним из новейших.
Потому что RankBrain не обрабатывает весь поиски, как это делает общий алгоритм. Он берет уже подготовленные для него сигналы, и только с ними работает.
Дэнни Салливан журналист и аналитик, который занимается исследованием в области цифрового и поискового маркетинга утверждает, что RankBrain является третьим по важности сигналом при ранжировании сайтов в ответах на запросы пользователей.
Первым пока остаются ссылки, которые Google подсчитывает ссылки в виде голосов.
Вторым сигналом он предполагает – «слова», где слова охватывают все – от слов на странице до того, как Google интерпретирует слова, которые люди вводят в окно поиска вне анализа RankBrain.
Третьим – RankBrain, который в основном используется для интерпретации запросов, которые люди вводят в строку поиска, чтобы найти страницы, которые могут не содержать точных слов, которые искали. Использование LSI-терминологии.
Например, если прежде человек в строке поиска вводил «Обувь», то Google отбирал на веб-страницах не только «Обувь», но и обуви, обувью, и подобные.
Теперь если пользователь ввел, «Обувь», то поисковик предложит и другие варианты: «туфли», «ботинки», «сапоги», «босоножки» и многое другое.
Люди часто сетевой адаптер для ноутбука называют зарядным устройством, зарядкой, и т. п. Google знает все варианты, и в результатах поиска выводит все варианты. Смотрите скриншот.
Как видите, Google понял, что пользователь хочет найти, и предложил лучшие ответы, не взирая на введенные слова.
Или более интеллектуальный поиск. Я ввел фразу «жена президента сша» с ошибкой
Но Google понял, что я имел ввиду. Google знает, что жена и супруга – слова синонимы. Google предположил наиболее вероятно, что меня интересуют супруги действующего президента, и вывел их первыми. Следующим результатом показал Меланью Трамп. И только после этого вывел список первых леди США.
Не правда ли, замечательная работа Google RankBrain? Так работает искусственный интеллект Google.
Как RankBrain помогает честным авторам?
Некоторое время назад одному заводу мы создавали 2 сайта: для главного завода и его филиала, территориально расположенные неподалёку друг от друга. Для главного завода главный инженер, доктор наук изъявил желание написать несколько ключевых текстов. Филиалу мы писали статьи сами. Получилось некоторое соревнование: чьи статьи Google будет позиционировать выше.
Как вы думаете кто победил: первоклассный копирайтер, использующий во всей мощи LSI-терминологию, или доктор наук? Победил доктор наук. При всех равных условиях его статьи в подавляющем большинстве позиционировались первыми, а статьи копирайтера – вторыми. Почему? Потому что доктор наук знал лучше терминологию и описываемый процесс, чем копирайтер. Доктор наук использовал большее количество синонимом, и связанных с ними слов.
Поясню на примере. Предположим, нужно написать статью, в которой рассказывается о демонстрации нового фильма в кинотеатре. Google мало иметь в статье слова кинотеатр и фильм. Ему нужны и сопутствующие слова, например, билеты, аншлаг, цена, и другие слова, которые обычно употребляются в обычной речи. Чем больше таких слов, тем Google считает тема раскрыта более полно.
Законный вопрос: откуда Google знает какие синонимы, термины и сопутствующие слова соответствуют не только всей теме, но и конкретному запросу. Не забывайте, что в Google индексе сотни миллиардов страниц (а может и больше), и анализируя эти страницы составляется база данных.
Если Google видит, что с набором определенных групп слов станица пользуется у посетителей популярностью, её цитируют, то из таких страниц и выбираются LSI-фразы.
С другой стороны, Google нужно понять, что ищет пользователь. Например, введя слово кухня, Google не понимает, о чем идет речь. И по популярности запросов прежних пользователей выбирает лучшие сайты из каждой группы, делает выдачу. Как видите из скриншота наиболее популярен сериал, затем мебель для кухни, далее продукция кафе «Кухня», а еще дальше «Кухни народов мира» и рецепты.
Более сложный процесс ранжирования сайтов, когда длинный запрос, и никогда прежде не вводился.
Проблема в том, что Google обрабатывает три миллиарда запросов в день. В 2007 году Google заявил, что до 25 процентов этих запросов никогда раньше не видел. В 2013 году эта цифра снизилась до 15 процентов, о чем сообщал Bloomberg, и Google подтвердил это.
Но 15 процентов из трех миллиардов – это по-прежнему огромное количество запросов, которые никогда не вводил ни один человек. Это 450 миллионов новых запросов в день.
Среди них могут быть сложные запросы, состоящие из нескольких слов, которые также называются «длинными хвостами». RankBrain разработан, чтобы помочь лучше интерпретировать эти запросы, чтобы найти лучшие страницы для поисковика.
Как утверждает Google, он может улавливать закономерности между, казалось бы, не связанными сложными запросами, чтобы понимать, насколько они на самом деле похожи друг на друга. Это самообучающая программа, в свою очередь, позволяет лучше понять будущие сложные поиски и их связь с конкретными темами. Самое главное, исходя из того, что Google сообщил нам, он может затем связать эти группы поиска с результатами, которые, по его мнению, понравятся пользователям.
Google не предоставляет примеры групп поиска и не даёт подробных сведений о том, как RankBrain угадывает, какие страницы являются лучшими. Но последнее, вероятно, объясняется тем, что, если он может перевести неоднозначный поиск во что-то более конкретное, он может затем ранжировать и выводить лучшие ответы.
Я сделал такое длинное описание, что бы было понятно, что какой-то сопливый копирайтер не получит высокой оценки за свою работу после анализа его статьи Google RankBrain, если в ранжировании учувствуют специалисты из области, в которой он написал статью. Но хорошо подготовленный специалист в своей статье раскроет тему так, что его статья будет высоко позиционироваться по нескольким ключевым фразам. Google RankBrain, как хороший специалист видит уровень написанного текста. Да он не понимает текст, а поэтому сопливый копирайтер уже не может навешать ему лапшу на уши.
Теперь SEO оптимизация – это не набор ключевых фраз, повторенных несколько раз, а полезный текст, который приятно читать конечному пользователю.