Здравствуйте дорогие друзья. Сегодня я хотел бы вам рассказать о том как работают поисковые системы что и как в них появляется информация о сайтах. Даже на первый взгляд ответ очевиден, но не все знаю в чём заключается вся суть работы поисковика. И эти знания будут полезны как новичку, так и опытному пользователю. Овладев такой информацией вы будете знать о том, как появляются ваши страницы в индексе, как происходит поиск, по каким признакам происходит ранжирование сайта. Узнав всё это вы сможете создавать максимально оптимизированные страницы которые будут попадать в базу поисковой системы и выдаваться по определённым запросам.
Пять компонентов которые существуют в каждой поисковой системе
1) Search engine results engine — это система поиска и извлечение результатов из своей базы данных.
2) Паук — это робот который скачивает и анализирует ваши страницы сайта. Действует он так: когда новая страница создаётся у вас на сайте, поисковый робот заходит и скачивает всю информацию с этой страницы.
3) Краулер — это программа которая ищет все ссылки на сайтах и указывает дальнейший путь работы паука. Т. е когда краулер заметил неизвестную ему ссылку на сайте, он автоматически посылает туда паука для добавления этой страницы.
4) Индексатор — он разделяет страницы на части и выявляет все теги для дальнейшего анализа.
5) База данных — хранилище всех проиндексированных сайтов и другой информации поисковой системы. Хранилище требует огромного дискового пространства и огромных экономических и электрических ресурсов.
С каждым днём новых страниц в интернете создаётся огромное множество и для сортировки страниц и запросов ввели алгоритм поисковой системы. Поисковый алгоритм — это математический метод сортировки всех сайтов в базе данных. У каждой ПС будь это Яндекс, Гугл или рамблер при вводе одного и того же запросы вы уведите совсем разные результаты в выдаче — это говорит о том, что у них совсем разные поисковые алгоритмы.
Технические ресурсы ПС рассчитаны на то, что обновление информации поисковыми машинами осуществляется каждые 1-3 недели, но бывает и дольше. Google утверждает что обновляет около 20-100 миллионов страниц в день, но это лишь малая часть всего интернета.
У каждой поисковой системы имеется свой каталог, у Яндекса — это Яндекс каталог, у Google -это DMOZ. Эти каталоги содержат практически все качественные сайты. Сайты попавшие в такие каталоги имеет небольшие преимущества по сравнению с другими.
Ранжирование страниц в поисковой выдаче
Ранжирование страницы в поисковой выдаче зависит от весьма большого списка правил.
Поисковые системы анализируют страницу, вычисляют количество, важность и число ключевых слов расположенных на странице.
ПС Анализирует ваших конкурентов и ставит вашу страницу на то место которым считает нужным. В основном анализ сайта состоит из — проверки заголовков, анализ ключевых слов, анализ плотности ключевых слов, вхождений и т. д
Плотность не стоит вводить больше 4 % проверенно на практике! Плотность слов на странице вычисляется таким образом: допустим на странице есть 100 слов и два слова которые повторяются и являются вашими ключевыми словами, так вот эти два слова на 100 слов общего объёма страницы дадут 2 % плотности. Более подробно про сортировку сайта в можно узнать в статье — Факторы ранжирования сайта.
Источник сайт http://mignews.com