Как проверить сайт на мошенничество
Интернет, в котором можно найти почти любую информацию, очень похож на огромную библиотеку, которая каждый день становится больше и больше. Под массой новых поступлений тонет информация, которая, скорее всего, рано или поздно кому-нибудь точно понадобится. Изменение интернет-сайта, вызванное какими-либо причинами, может сделать недоступной информацию, которая очень необходима пользователю в данный момент. Существует несколько возможностей добыть информацию, которая была доступна, а потом пропала.
На самом деле все возможности сводятся к одному и тому же: информацию надо найти там, где по какой-то причине она осталась в виде архива, кеша или в другой форме.
Простой поиск в архиве сохраненных сайтов выдает ссылки на все сохраненные копии запрашиваемой страницы. Анализируя результаты различных запросов, становится очевидно, что с каждым годом сервис наращивает обороты: сохраненных копий из года в год становится все больше и больше. К примеру, по запросу http://freebsd.org всего выдано 1372 результата, из которых только 6 приходится на 1996 год, когда этот сайт был впервые занесен в архив. В 1997 году результатов было немногим больше — всего 10, а в 1998 — уже 15. Далее количество многократно увеличивается из года в год, достигая максимума в 2006 году (за исключением 2002-2003 годов, в которые по какой-то причине было относительно небольшое количество сохраненных копий).
- "Сохраненная копия" на http://yandex.ru/ — под каждым результатом, который выдает поиск, размещается ссылка на копию сайта, которая была сохранена в ходе индексации. Таким образом, довольно часто можно открыть даже те страницы, которые уже некоторое время не существуют, но до сих пор находятся в индексе. Сохраненная копия документа будет представлена в том виде, в котором сайт был в момент индексации. Это довольно удобно тем, что позволяет просматривать не только текстовое содержимое искомой страницы, но и графические материалы сайта.
К счастью, поисковые сервисы — не единственное место, в котором можно искать информацию, которая была на сайте в какой-то момент, а потом пропала. Сервисы, которые профессионально занимаются хранением различной информации, называются интернет-архивами. Одним из крупнейших представителей данной области является The Internet Archive ("Интернет-архив"). Данный сайт поддерживается некоммерческой организацией, которая ставит своей целью поддержку онлайн-библиотеки и архива веб- и мультимедиаресурсов. Данный архив бесплатно предоставляет огромное количество разнообразной информации, такой как сохраненные в различное время копии различных интернет-сайтов, книги, видеозаписи и аудиозаписи. Кроме того, архив является членом организации, которая объединяет библиотеки в США, что позволяет хранить в архиве материалы, которые ранее были доступны только посетителям обычных библиотек. Из некоторых данных следует, что многие крупнейшие библиотеки мира в настоящий момент уже хранят меньшее количество материалов, чем "Интернет-архив".
Популярные поисковые сервисы хранят в кеше страницы, которые могут быть уже недоступны
Следует отметить, что поисковые сервисы специально не занимаются сбором и учетом устаревших страниц. Данная функция предоставляется параллельно с основной их деятельностью, так или иначе данная информация сохраняется в индекс, и поисковые системы всего лишь дают доступ к тому, что и так сохраняется. Они не занимаются каталогизацией или каким-либо учетом страниц. В кеше поисковых систем нельзя найти версию сайта старше, чем версия, которая в последний раз была занесена в индекс.
Так как поисковые сервисы непосредственно показывают кешированную страницу, все они предваряют показ предупреждением о том, что не несут ответственность за содержимое данной страницы.
"Интернет-архив" хранит огромное количество аудио-, видео- и текстовых материалов, поиск по которым позволяет получать доступ к огромному количеству материалов, которые ранее были доступны только пользователям специализированных библиотек. Однако одним из важных сервисов, которые предоставляет данный архив, является сервис Wayback Machine (дословно — "машина, возвращающая назад"). Он представляет собой огромный и постоянно пополняющийся архив различных интернет-страниц, который позволяет пользователю искать сохраненную в конкретный момент страницу. Разработчики заявляют, что ежемесячно размер их базы сохраненных материалов увеличивается на 20 терабайт (два в сороковой степени байт), а суммарный размер архива уже почти достиг двух петабайт (два в пятидесятой степени байт).
"Интернет-архив" хранит больше материалов, чем любая библиотека мира
Ежемесячно количество сохраненных материалов увеличивается на 20 терабайт
Самый первый способ, которым следует воспользоваться, заключается в том, чтобы поискать нужный вам документ в кеше популярных поисковых сервисов. Называется такая возможность у всех по-разному, но так или иначе присутствует у всех популярных поисковых систем.
Довольно полезным является то, что знаком "*" отмечены копии страниц, которые были обновлены по сравнению с предыдущей копией.
Как показывает результат, во многих случаях архив хранит по несколько копий сайта в одном и том же его состоянии. В результатах поиска http://freebsd.org встречается до 10 страниц подряд, которые отмечены как неизменившиеся со времени последнего архивирования.
Присутствует специальная возможность указать некоторые параметры поиска, такие как:
- дата, с которой начинать поиск сохраненных страниц. Имеется в виду день, в который сделана самая ранняя копия, которая должна войти в результаты поиска;