Как искать в кэше яндекса и гугла

Именно с таким вопросом сюда регулярно ломятся различные граждане. Где-то здесь я неосторожно брякнул про поиски в кэше (ссылку на туда искать откровенно ломает), и теперь, значит – подай кэш и все тут.

Ну, коль скоро граждане ищут информацию про то, как искать сайты в кэше поисковых систем – чего бы не попробовать помочь?

Допустим, есть некий сайт, который вам до зарезу нужен. И вот в какой-то момент он просто перестал открываться. А информация вам нужна. Что делать в такой ситуации?
Ответ один – попробовать поковыряться в кэше яндекса и гугла. Проблема в том, что искомая информация – далеко не всегда может быть доступна.
Но обо всем по порядку.

Возьмем конкретный пример.

В незапамятные времена, когда пресловутое «бомжедвижение» было шибко популярно, был такой персонаж – ижевский бомж. Как и положено «бомжу», сей персонаж вел блог по адресу homelessinizhevsk.blogspot.com.

Если вы сунетесь туда сейчас – обнаружите вывеску о том, что блог удален. Давайте попробуем восстановить информацию блога, пока это возможно.

Самый простой и очевидный способ – обратиться к кешу яндекса. Берем адрес бомжацкого блога, копируем его в запросную дырку яши, смотрим.
Вывалилась ссылка на блог. «Квартира в Ижевске» и все такое прочее.
Ссылку жать не надо.
Надо нажать кнопочку «копия» под ссылкой.

Яша послушно забросит нас на сохраненную копию морды бомжеблога.
Проблема тут одна: если вы попробуете сходить по какой-нибудь ссылке на той копии – вас опять выбросит на вывеску об удаленном блоге.
А вам нужен, к примеру, архив блога за декабрь месяц 2007 года.
Чтобы получить копию этого архива – копируем адрес этого архива с морды: http://homelessinizhevsk.blogspot.com/2007_12_01_archive.html,
снова суем его в поисковую строку яндекса и снова жмем кнопку «копия».
Получаем копию декабрьского архива блога ижевского бомжа:

Копия блога в кэше яндекса

Если интересует какая-то конкретная статья (или фраза) в удаленном блоге, можно попробовать воспользоваться вот такой конструкцией:

интересующая_фраза “адрес сайта”.

Допустим, интересует заметка про распространение флэш-игр.
Пишем в яндексе:

Распространение флеш-игр «homelessinizhevsk.blogspot.com»

Получаем ссылку на заметку, затем – жмем кнопку «копия»:

Архив блога в кеше яндекса

Примерно то же самое можно проделывать и с кэшем гугла. Но там все на порядок проще. Например, тот же декабрьский архив можно получить, просто вбив в поисковую строку команду:

cache:homelessinizhevsk.blogspot.com/2007_12_01_archive.html

И перед вами послушно возникнет архив.

Все это здорово и прекрасно, конечно. Однако во всем этом есть одно серьезное «но». Все эти фокусы с извлеканием удаленных сайтов из кэша работают только до тех пор, пока поисковик не почистит выдачу и собственно кэш. Гугл делает это значительно быстрее, чем яндекс. И если речь зашла о просмотре кэша поисковой системы – первым делом надо лезть именно в яшу. То есть в данном случае природная тупость и тормознутость яшеньки играет нам на руку: гугл уже все подчистил, а яша до этого сайта еще даже не доковылял.
Если говорить о вышеуказанном блоге, то копию его морды, к примеру, вы в кэше гугла уже не найдете. Гугл ее уже уничтожил. А в яндексе – копия морды все еще висит.

Что делать, если выдача и кэш поисковых систем уже пусты?

Тогда придется лезть в архивы: http://www.archive.org/web/web.php

Если сильно повезет – можно отыскать копию нужного сайта. Например, последняя копия вышеуказанного блога там датирована июлем текущего года:

Сайт в веб-архиве

Проблема тут только одна – копии сайтов в этом архиве далеко не всегда бывают полными. Но на безрыбье, как говорится…

P.S. Вся эта заметка – является наглядным подтверждением распространенного тезиса: все, что попало в Интернет – остается там навсегда. Так что дважды подумайте, что вы вывешиваете в этих ваших интернетах. А то мало ли…



Запись опубликована в рубрике Lytdybr. Добавьте в закладки постоянную ссылку.

2 комментария на «Как искать в кэше яндекса и гугла»

  1. justus говорит:

    А вы не могли бы посоветовать, что делать если статьи публикуются в RSS до ката? Как залезть под кат?

  2. admin говорит:

    Никак. Всю статью можно увидеть только на сайте.

Обсуждение закрыто.