Глава шестая. Поисковые системы – второй «кит» интернет-бизнеса
Итак, в предыдущей главе мы с вами рассмотрели регистрацию в платежных интернет-системах Рунета и работу с ними. Если вы все внимательно прочитали, поняли и закрепили теорию практикой, можно сказать, что вы осуществили закладку первого важного кирпичика в фундамент здания вашей будущей интернет-империи, которая станет приносить вам со временем десятки и даже сотни тысяч долларов в год.
В этой главе мы переходим к закладке в фундамент второго по важности кирпича, а именно – сейчас вам предстоит разобраться с поисковыми системами и освоить на практике искусство поиска в Сети необходимой вам информации.
Навык просто жизненно необходимый для любого обитателя Сети, однако, как это ни парадоксально, более половины «сетян» грамотно искать информацию в Интернете вообще не умеют!
И если для рядового юзера это простительно, вам, будущему интернет-предпринимателю, данный пробел в знаниях может стоить весьма существенных убытков, равно как и массы потраченного впустую времени (которое в нашем деле – ДЕНЬГИ в прямом смысле этого слова).
Ежедневно нам приходится отвечать на сотни писем, написанных нашими клиентами и учениками. И каждый день несколько десятков писем из этого общего потока сводятся к банальным просьбам помочь найти в Интернете ту или иную программу, книгу, статью, информацию общего характера…
Все, что нужно сделать, так это просто открыть Яндекс и за 2–3 минуты отыскать нужную человеку информацию в виде соответствующих программ, книг, статей.
Иногда доходит до смешного – достаточно просто скопировать заданный человеком вопрос, слово в слово(!), и вставить его в поисковую строку Яндекса, чтобы получить на выходе искомый ответ, который мы и перенаправляем вопрошавшему!
Обратно, как правило, приходит письмо с кучей благодарностей, восторженных отзывов и нескрываемого восхищения тем, что мы «всегда все знаем и оперативно даем ответ на ЛЮБОЙ самый сложный вопрос».
Не спорю, получать благодарности в свой адрес всегда приятно. Однако чувство морального удовлетворения сводится на «нет» простым пониманием того, что все эти люди благодарят меня за то, что сами смогли бы найти в Интернете без каких-либо проблем, затратив на это лишь 3–5 минут своего времени!
А тот факт, что вместо реальной помощи я невольно оказываю всем этим людям, по сути дела, «медвежью услугу» и вовсе отравляет существование. Ведь получив легкий готовый ответ от меня, задавший его человек так и не научится пользоваться поисковыми системами самостоятельно. А я не всегда буду рядом. И в следующий раз, возможно, в более важной или даже критической ситуации, помочь человеку отыскать то, что ему нужно, будет просто некому!
Все это и заставило меня выделить обучение грамотному использованию поисковых систем в отдельную ФУНДАМЕНТАЛЬНУЮ главу. И обучиться этому нужно еще до того, как вы начнете создавать свой первый серьезный интернет-бизнес. Кто владеет информацией, тот владеет миром! А тот, кто умеет в совершенстве пользоваться поисковыми машинами, всегда будет владеть оперативной и актуальной информацией! Улавливаете, к чему я клоню?
Поверьте мне, за редкими (очень редкими) исключениями сегодня в Интернете можно найти практически ВСЕ!
Я уж не говорю об ответах на типовые вопросы (вроде того: «Что такое ТИЦ?», «Что такое браузер?», «Где можно скачать виртуальную машину Java?», «Кто такие киберсанты?» и т. д. и т. п.), не говорю о поиске учебников по HTML, Adobe PhotoShop или Macromedia Flash, молчу о поиске всевозможных компьютерных программ и т. д. и т. п.
Все перечисленное выше можно найти в Сети за пять минут, даже не обладая изощренной фантазией в составлении поисковых запросов. Ну а грамотная «ищейка» в некоторых ситуациях в состоянии отыскать в открытом доступе сети Интернет даже в высшей степени эксклюзивные материалы и конфиденциальную информацию (такую, например, как адрес конкретного человека или номер его телефона).
Одна моя клиентка, оформляя заказ на диск «Киберсант-Активатор», забыла указать в своем адресе для отправки ей бандероли номер квартиры и дома. Недолго думая, я нашел через Яндекс виртуальную телефонную книгу частных абонентов ее города, ввел в этой книге ее фамилию, имя и отчество, название улицы и… Правильно! Получил на выходе номера квартиры и дома, пропущенные в заказе.
Каково же было ее удивление и даже ужас, когда я попросил ее уточнить, верно ли мне удалось определить пропущенные в ее заказе данные? «Да, верно! Вы что, работаете на ФСБ?! – ответила перепуганная заказчица. – Мне уже как-то страшновато иметь с вами дело». Аналогичные ситуации возникали, когда я пытался восстановить пропущенные в заказе Ф.И.О. или иные реквизиты заказчика.
Сейчас, чтобы не пугать понапрасну клиентов, кроме пропущенного почтового индекса, я не восстанавливаю самостоятельно никакие другие их реквизиты. Просто пишу письмо с просьбой указать то, что они пропустили.
У страха глаза велики, и некоторым людям бывает очень сложно объяснить, что все это – следствие элементарных знаний того, как нужно пользоваться поисковыми системами. Знания, доступные любому интернет-пользователю, а вовсе не хакерство или черная магия.
Для начала несколько слов о сути работы поисковых систем и общие, так сказать, принципы. В отличие от каталогов (специальных списков сайтов, разбитых по категориям и снабженных кратким описанием), практически все основные поисковые системы работают по принципу индексации информации, содержащейся на тех или иных интернет-страничках.
Что это значит? Это значит, что, если каталогизацию производят живые люди (увы, ограниченные в своих возможностях, а потому объем ссылок в каталогах составляет ничтожно малый процент от общего объема сайтов Сети), индексацию в поисковиках производит поисковый робот. Поисковый робот без устали, двадцать четыре часа в сутки, бороздит Сеть в поисках появления новых ссылок на документы и обновления информации о ссылках старых, уже проиндексированных ранее.
Поисковая машина – это огромный программно-аппаратный комплекс, в котором различными этапами обработки индексируемой информации занимаются различные службы. Одни поисковые сервера заняты скачиванием интернет-страниц, другие эти страницы индексируют, третьи группируют индексы в единую базу, осуществляют нормализацию (приведение слов к единой форме)…
При подаче пользователем поискового запроса системе из ее базы выбираются проиндексированные документы, содержащие слова, которые были введены пользователем в строке запроса. Далее эти документы ранжируются по определенному, довольно сложному алгоритму, чтобы первыми в выданном по запросу пользователя списке оказались ссылки на те странички, которые содержат наиболее точный ответ на запрос пользователя. Это называется релевантностью.
Если говорить просто, то релевантность – это соотношение между желаемой и действительно получаемой информацией. Это то, насколько реально полученный документ соответствует тому, что следовало бы получить из поисковой системы. Несмотря на то что все поисковые системы построены на общих принципах (чем чаще искомые слова встречаются в документе, тем выше его вес, как правило), алгоритмы у них все же разные.
Каждая поисковая машина использует свой собственный алгоритм вычисления релевантности, не похожий на алгоритмы других поисковиков (например, для большинства поисковых систем высокорелевантным текстом считается тот, где вхождение запроса в текст равно приблизительно 4–7 %. Если больше, то система может принять текст за поисковый спам и наложить на страницу понижающий фильтр или вообще убрать ее из результатов выдачи по искомому запросу).
Также многие поисковики учитывают взаимное расположение слов в документе – если в найденном тексте слова расположены в том же порядке, что и в поисковом запросе, документ будет проранжирован выше. Может учитываться расстояние между словами – если искомые слова содержатся в одном предложении, документ будет иметь больший вес, чем если бы искомые слова содержались в пределах абзаца или даже страницы.
Еще вес искомого документа может увеличиваться поисковой машиной, если на данный документ имеется большее количество ссылок с других сайтов, чем на аналогичный документ, но с меньшим количеством ссылок. Значимость могут добавить ссылки с наиболее весомых страниц (PageRank).
Для точного поиска вам потребуется знание синтаксиса языка запросов. Это специальные символы, которые пишутся в поисковой строке вместе с ключевыми словами и уточняют критерии вашего поиска.
Синтаксис языка запросов в разных, поисковых системах может отличаться (обычно в справочных данных на поисковом сервере приводится подробная информация о синтаксисе запросов данной конкретной системы), однако основные поисковики, такие как Yandex, Google и Rambler, имеют некоторое сходство в использовании ряда специальных символов.
Поисковая фраза, заключенная в кавычки, будет найдена в точном соответствии поисковому запросу. То есть слова в документе будут находиться в той же форме и будут расположены в точно таком же порядке, что и в закавыченной фразе поискового запроса (точная цитата).
Символ «+» (плюс) перед словом поискового запроса задает параметр, согласно которому данное слово ОБЯЗАТЕЛЬНО должно присутствовать в искомом документе.
Символ «-» (минус) или «~» (тильда) перед словом поискового запроса задает противоположный параметр, согласно которому данное слово НЕ ДОЛЖНО присутствовать в найденных документах. В пределах предложения – «~» или в пределах всего документа – «~~» (В Rambler'e вместо «-» используется восклицательный знак «!»).
В Google «~» (тильда) обозначает поиск синонимов. Если в Google перед искомым словом поставить тильду «~», будут найдены документы, содержащие не только само слово, но и его синонимы.
Также очень широко в поисковых запросах используется логическая связка «или». В поисковых машинах Yandex и Rambler она имеет вид «|», а в Google вид «OR».
Несомненное достоинство Yandex и Rambler заключается также в том, что в этих поисковиках можно строить сложные поисковые запросы с использованием скобок и оператора логического сложения «&» (в Yandex оператор «НАЙТИ» означает, что искомые слова должны находиться в одном предложении, в Rambler – что они присутствуют в одном документе. Для того чтобы и Yandex искал по всему документу, используйте «& &»).
Так, если вам нужно найти картинку доллара или евро, ваш поисковый запрос может выглядеть следующим образом: (фото | изображение | картинка | рисунок) & (доллар | USD | евро | EUR). А можно тот же запрос составить гораздо проще, но при этом даже более эффективно: +доллар +евро +фото +картинка. По такому поисковому запросу вам будут выданы ссылки на изображения евро и доллара, а если вы перейдете на вкладку «картинки» поисковика, то и сами эскизы изображений искомых картинок.
Весьма немаловажно, что Yandex чувствителен к регистру букв. Если в поисковом запросе присутствует слово, написанное с заглавной буквы, то Yandex выдаст вам документы, в котором искомые слова написаны именно с заглавной буквы (если это слово не первое в предложении). Если же в поисковом запросе слово написано строчными буквами, Yandex выдаст документы, где данное слово встречается как написанное со строчной буквы, так и с прописной.
В Yandex, независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы. Например, если задан запрос «идти», то в результате поиска будут найдены ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т. д. На запрос «окно» будет выдана информация, содержащая и слово «окно», а на запрос «отзывали» – документы, содержащие так же и слово «отозвали».
Поисковых машин в Сети существует достаточно много. Приведем лишь десять самых известных и наиболее распространенных из них:
Yandex – http://www.yandex.ru
Google – http://www.google.com
Rambler – http://www.rambler.ru
Aport – http://aport.ru
Yahoo – http://www.yahoo.com
Mail.ru – http://mail.ru
AltaVista – http://www.altavista.com
Webalta – http://www.webalta.ru
MSN – http://www.msn.com
Lycos – http://www.lycos.com
Какому же поисковику отдать предпочтение? Какой может считаться лучшим? Боюсь, что однозначного ответа на эти вопросы просто не существует. Сколько людей, столько и мнений, столько предпочтений и пристрастий. Попробуйте поработать с разными поисковыми машинами и выберите ту, что вам понравится больше остальных.