Индексация в гугле

Когда-то давно здесь была рубрика под названием «хроника».
В ней я от нефиг делать наблюдал за своим подопечным.
И все наблюдения — тщательно заносил сюда же.
Спустя какое-то время мне это надоело, «хроника» — была упразднена, а все записи из нее — перекочевали в раздел «лытдыбр».

После чего я забил на все эти наблюдения.

Сегодня — будет нечто вроде той самой «хроники».
С наблюдениями и соображениями.
Чисто для разнообразия.

Предметом наблюдений станет индексация в гугле. На днях сходил до одной забавной тулзы, и от нечего делать — проверил индексацию. Результаты — видны на скриншоте. В индексе гугла — содержится 199 страниц. Из них в соплях — 112, в основном индексе — 87. При этом мне достоверно известно, что страниц на этом блоге в настоящий момент — 554. А гугл видит — 199.

Статистика индексации в гугле и яндексе

Возникает вполне резонный вопрос: куда подевалось все остальное?
И на него есть вполне логичный ответ: оно просто побанилось.
Возникает второй вопрос: стало ли меньше посетителей с гугла?
И есть вполне логичный ответ: нет. Их стало больше.

Вот, к примеру, скрин статистики за вчера.

Статистика посещений сайта

Тогда возникает следующий вопрос: как так получается? И самое главное — почему так получается?

Потому что таков механизм индексации в гугле. Страницы сайта — не висят в индексе гугла перманентно, полным составом. Индексация в гугле начинается с того, что он распределяет проиндексированные страницы между двумя своими индексами. И очень внимательно на них смотрит.
Спустя какое-то время — он избавляется от части страниц в соплях.
Избавляется насовсем, что характерно.

А какие страницы остаются в индексе гугла?

Страницы, где много текста. Причем не просто много текста. Текст на оставшихся в индексе страницах — это не бессмысленная бодяга ни о чем. Содержание текста — четко отражено в его названии и описании. Периодически — название текста попадается и в самом тексте. Текст — содержит картинки с заполненным тегом «alt», в этом теге — тоже прописано нечто, относящееся к сути текста. Текст на этих страницах — написан не монолитным куском, а разбит на абзацы. В ряде случаев — он содержит списки, разбитые на несколько пунктов. Списки улучшают восприятие текста. Но не только. Отдельные фрагменты текста на странице — выделены курсивом, тегом strong или другим цветом.

Посетители, которых прислал на такие страницы гугл — задерживаются на них подолгу. Причем приходят они — по запросу, отраженному в названии статьи. Придя на такую страницу — они просматривают еще несколько страниц, тематически связанных с первой страницей. Для этого — они переходят по ссылкам, расставленным в теле (именно в теле!) статьи, эти ссылки — помогают пояснить суть изложенного на основной странице. Страницы, на которые ведут эти тематические ссылки — тоже исправно болтаются в индексе гугла.

Таким образом, индексация в гугле опирается сразу на целый ряд критериев, соответствовать которым — крайне тяжело.

Отслеживается качество контента, отслеживается соответствие контента его названию, отслеживается количество контента, и самое главное — отслеживается поведение юзера, который видит этот контент.

Если контент юзеру нравится, и он торчит здесь долго, если он оставляет под этой страницей комментарии, если он возвращается сюда, чтобы почитать еще, то страница с таким контентом — медленно, но верно дрейфует в серпе гугла вверх.
В результате возникают все эти «рутрекеры» и «djvu в doc».

Какие страницы гугл выбрасывает из индекса?

Если контент являет собой беспонтовый высер ни о чем, название которого — мало связано с его содержимым, текста в котором — мало, и этот текст — никому не интересен, то проживет такой высер в гугле очень и очень недолго.
Сразу после индексации он его сунет в сопли, затем — навсегда забанит. А еще гуглу очень нравятся страницы с блогунскими ссылками про керамогранит, газобетон и реактивные суперхренорезки.
Многократно замечал: такие страницы — гугл мочит в первую очередь. Поэтому закупка ссылок на таких страницах в подавляющем большинстве случаев является ни чем иным, как пустой тратой денег. Просто потому, что живет говенная блогунская страничка в индексе гугла — очень недолго, и эффект от ссылки с такой страницы в долговременной перспективе — стремится к нулю.

В этом месте можно лишний раз восхититься практичностью буржуинской искалки. Она индексирует, наблюдает, затем — сортирует, и оставляет только самое лучшее, тем самым обеспечивая неизменно высокое качество материалов в своей выдаче.

Для сравнения — можете глянуть на число страниц в индексе нашего дорогого Яшеньки. Их там 1170. То есть как оно проиндексировалось, так оно в куче и лежит. И ничегошеньки-то с этой кучей не происходит.
За исключением того, что периодически — куча просто вываливается из индекса.
Что характерно — вся.

И ты начинаешь писать Платоше жалостные письма. Верни мол, Платоша, меня на этот свет, я хороший! Тем самым доказывая платошиной искалке качество своего собственного сайта. Хотя искалка, по идее — должна бы разбираться в этом сама. А вот поди ж ты — без писем Васи-вебмастера она со своей выдачей разобраться не способна. Потому что в собственных соплях путается.

Одно слово: мрак.



Запись опубликована в рубрике SEO. Добавьте в закладки постоянную ссылку.