вторник, 11 ноября 2014 г.

Как посмотреть вчерашние сайты

Как проверить сайт на мошенничество







Интернет, в котором можно найти почти любую информацию, очень похож на огромную библиотеку, которая каждый день становится больше и больше. Под массой новых поступлений тонет информация, которая, скорее всего, рано или поздно кому-нибудь точно понадобится. Изменение интернет-сайта, вызванное какими-либо причинами, может сделать недоступной информацию, которая очень необходима пользователю в данный момент. Существует несколько возможностей добыть информацию, которая была доступна, а потом пропала.

На самом деле все возможности сводятся к одному и тому же: информацию надо найти там, где по какой-то причине она осталась в виде архива, кеша или в другой форме.


Простой поиск в архиве сохраненных сайтов выдает ссылки на все сохраненные копии запрашиваемой страницы. Анализируя результаты различных запросов, становится очевидно, что с каждым годом сервис наращивает обороты: сохраненных копий из года в год становится все больше и больше. К примеру, по запросу http://freebsd.org всего выдано 1372 результата, из которых только 6 приходится на 1996 год, когда этот сайт был впервые занесен в архив. В 1997 году результатов было немногим больше — всего 10, а в 1998 — уже 15. Далее количество многократно увеличивается из года в год, достигая максимума в 2006 году (за исключением 2002-2003 годов, в которые по какой-то причине было относительно небольшое количество сохраненных копий).

  1. "Сохраненная копия" на http://yandex.ru/ — под каждым результатом, который выдает поиск, размещается ссылка на копию сайта, которая была сохранена в ходе индексации. Таким образом, довольно часто можно открыть даже те страницы, которые уже некоторое время не существуют, но до сих пор находятся в индексе. Сохраненная копия документа будет представлена в том виде, в котором сайт был в момент индексации. Это довольно удобно тем, что позволяет просматривать не только текстовое содержимое искомой страницы, но и графические материалы сайта.


К счастью, поисковые сервисы — не единственное место, в котором можно искать информацию, которая была на сайте в какой-то момент, а потом пропала. Сервисы, которые профессионально занимаются хранением различной информации, называются интернет-архивами. Одним из крупнейших представителей данной области является The Internet Archive ("Интернет-архив"). Данный сайт поддерживается некоммерческой организацией, которая ставит своей целью поддержку онлайн-библиотеки и архива веб- и мультимедиаресурсов. Данный архив бесплатно предоставляет огромное количество разнообразной информации, такой как сохраненные в различное время копии различных интернет-сайтов, книги, видеозаписи и аудиозаписи. Кроме того, архив является членом организации, которая объединяет библиотеки в США, что позволяет хранить в архиве материалы, которые ранее были доступны только посетителям обычных библиотек. Из некоторых данных следует, что многие крупнейшие библиотеки мира в настоящий момент уже хранят меньшее количество материалов, чем "Интернет-архив".

Популярные поисковые сервисы хранят в кеше страницы, которые могут быть уже недоступны


Следует отметить, что поисковые сервисы специально не занимаются сбором и учетом устаревших страниц. Данная функция предоставляется параллельно с основной их деятельностью, так или иначе данная информация сохраняется в индекс, и поисковые системы всего лишь дают доступ к тому, что и так сохраняется. Они не занимаются каталогизацией или каким-либо учетом страниц. В кеше поисковых систем нельзя найти версию сайта старше, чем версия, которая в последний раз была занесена в индекс.



Так как поисковые сервисы непосредственно показывают кешированную страницу, все они предваряют показ предупреждением о том, что не несут ответственность за содержимое данной страницы.

  • Cached на http://google.com/ — сохраняет полностью все содержимое страницы, не изменяя его. Кроме того, присутствует ссылка на эту же страницу, но очищенную от HTML-форматирования и без графики. Кроме того, отображаются дата и время, когда страница была занесена в индекс. Такая информация может стать довольно полезной, если разыскивается совершенно конкретное содержимое страницы, которое было в какой-то момент, а потом было перемещено или удалено.

  • "Интернет-архив" хранит огромное количество аудио-, видео- и текстовых материалов, поиск по которым позволяет получать доступ к огромному количеству материалов, которые ранее были доступны только пользователям специализированных библиотек. Однако одним из важных сервисов, которые предоставляет данный архив, является сервис Wayback Machine (дословно — "машина, возвращающая назад"). Он представляет собой огромный и постоянно пополняющийся архив различных интернет-страниц, который позволяет пользователю искать сохраненную в конкретный момент страницу. Разработчики заявляют, что ежемесячно размер их базы сохраненных материалов увеличивается на 20 терабайт (два в сороковой степени байт), а суммарный размер архива уже почти достиг двух петабайт (два в пятидесятой степени байт).

  • "Восстановить текст" на http://rambler.ru/ — принцип и объем предоставленной информации приблизительно такие же, как и у всех аналогов. Серьезным отличием от некоторых аналогов является то, что эта система сохраняет уже обработанную страницу, которая обычно уже очищена от части HTML-форматирования. Полностью теряются вся графика и другие элементы дизайна. Это не очень удобно в тех случаях, когда нужно восстановить содержимое сайта полностью, но текстовое наполнение страницы не теряется и остается вполне пригодным для чтения и использования.

  • "Интернет-архив" хранит больше материалов, чем любая библиотека мира




    Ежемесячно количество сохраненных материалов увеличивается на 20 терабайт



    Самый первый способ, которым следует воспользоваться, заключается в том, чтобы поискать нужный вам документ в кеше популярных поисковых сервисов. Называется такая возможность у всех по-разному, но так или иначе присутствует у всех популярных поисковых систем.

    Довольно полезным является то, что знаком "*" отмечены копии страниц, которые были обновлены по сравнению с предыдущей копией.

    Как показывает результат, во многих случаях архив хранит по несколько копий сайта в одном и том же его состоянии. В результатах поиска http://freebsd.org встречается до 10 страниц подряд, которые отмечены как неизменившиеся со времени последнего архивирования.

    Присутствует специальная возможность указать некоторые параметры поиска, такие как:

    • дата, с которой начинать поиск сохраненных страниц. Имеется в виду день, в который сделана самая ранняя копия, которая должна войти в результаты поиска;


  • день, который должен считаться последним днем для поиска;

  • возможность сравнения двух результатов поиска. Причем результаты сравнения показываются настолько удачно (хотя и не без некоторых сбоев на отдельных страницах), что сравнение становится действительно удобной и полезной функцией для тех, кто заинтересован в изучении разницы между двумя версиями страницы. Причем каждую из сравниваемых копий можно оперативно посмотреть по специальной ссылке в шапке страницы сравнения;


  • Фото советы по нашей теме с сети

    Как посмотреть вчерашние сайты
    Как посмотреть вчерашние сайты
    Как посмотреть вчерашние сайты
    Как посмотреть вчерашние сайты