Веб-архив сайтов: как пользоваться Internet Archive Wayback Machine

Хочешь в ТОП? Хватит хотеть, пора действовать!

Начать продвижение

Веб-архив сайтов: как пользоваться Internet Archive Wayback Machine

Опубликовано: 16 ноября 2021
8.8к
13 минут
Веб-архив сайтов: как пользоваться Internet Archive Wayback Machine
Москва г. Москва, ул. Нобеля 7, п. 56 +7 (800) 700-59-30
В цифровом мире, которым является Глобальная сеть, машина времени вполне реальна. Более того, она давно существует и позволяет всем желающим вернуться в те самые «старые добрые» времена, когда солнце было ярче, а трава зеленее.

Найти сервис, предоставляющий доступ к старым версиям современных сайтов все желающие могут просто перейдя по ссылке. Казалось бы, для чего нужен ресурс, хранящий на своих серверах полноценный архив Глобальной сети? Но причин для этого есть множество:

  1. Это просто интересно с точки зрения рядового пользователя – многим любопытно вернуться к тому самому старому дизайну привычных сайтов, который много лет назад радовал глаз и казался родным и близким. Те изменения, которые претерпевают с годами все популярные ресурсы в интернете, вызывает массу споров и критики. И, как результат, совершенно естественное желание ещё раз вернуться к классическим версиям, крепко засевшим в памяти.

  2. Ведение архивов позволяет восстановить доступ к утерянной информации. Сайты закрываются и пропадают, вместе со всем, размещённым на них, контентом. Поэтому иногда может быть критически важным восстановить доступ к старой информации. Также ряд вебмастеров, владеющих собственной интеллектуальной собственностью в Глобальной сети, не ведут самостоятельно архивы. И в случаях повреждения баз данных, могут рассчитывать лишь на централизованные источники бекапов. 

  3. Возможность проведения сравнительного анализа состава наиболее важных ресурсов интернета позволяет делать далекоидущие выводы и прогнозы. Не менее ощутимые результаты приносят подобные анализы собственных ресурсов. Проследите их прогресс и те дивиденды, которые он принёс вместе с собой. 

Где хранится история интернета?

Архив интернета – это самостоятельная некоммерческая организация. Она была основана в 1996 году в Сан-Франциско. Именно американский программист Брюстер Кейл решил вести учёт всей информации, накапливающейся в Глобальной сети.

Этот архив хранит не просто старые версии сайтов. Он регулярно сканирует интернет и сохраняет различные версии ресурсов, ведя историю их изменений. Помимо сайтов, здесь можно найти аудиокниги, различные видео и даже программное обеспечение. 

В 2001 году владельцы Архива интернета разработали и саму машину времени – Wayback Machine. Инструмент занимается сканированием основной части открытой Сети и предоставляет доступ в интернет прошлого.

Книга и надпись History Книга и надпись History

Её используют не только для того, чтобы ностальгировать о прошлом, но находят ей практическое применение. Таким образом, например, можно возвращать к жизни старый контент. Он мог выпасть из поля зрения поисковых систем после удаления родительского сайта. Так что публикация таких статей зачастую рассматривается, как написание нового и уникального контента

Помимо машины времени, разработчики Архива интернета дали жизнь и другим сервисам:

  • Open Library – или открытая библиотека. Она хранит множество цифровых изданий и предоставляет к ним доступ сроком на две недели совершенно бесплатно. 

  • Archive it – полноценная служба архивирования. Она помогает физическим и юридическим лицам с созданием и обработкой цифровых архивов. Благодаря подобным программным решениям, вы можете создавать собственные библиотеки ключевых бекапов личной интеллектуальной собственности. 

Технически Архив интернета основан на принципе зеркальных сайтов. То есть создаёт несколько собственных резервных копий на различных серверах. Они размещаются по всему свету и не могут быть выведены из строя одновременно. 

Что такое веб-архив?

В широком смысле, веб-архив – это база данных с сохранёнными версиями страниц Глобальной сети. То есть владелец сайта может самостоятельно скопировать нужные страницы и отправить их на хранение в веб-архив. 

Для самостоятельного сохранения внешнего вида интернета на определённый момент времени, веб-архивы используют поисковых роботов, активно перемещающихся по просторам Глобальной сети. Они копируют все доступные страницы и фиксируют наименования серверов их размещения. Систематизируя собранный контент по датам получения, веб-архивы фиксируют реальную историю интернета. 

Благодаря таким сервисам, любой желающий может отправиться на пару десятков лет назад и посмотреть, как именно выглядели сайты того времени. Насколько они отличаются от современных аналогов и были ли действительно лучше.

Ведь на самом деле большинство изменений связаны с прогрессом и оптимизацией, а вовсе не вводятся для того, чтобы вас позлить. Дизайн меняется в угоду упрощению и эргономичности.

Сегодня наиболее важным параметром для любого ресурса является скорость его загрузки, а значит объёмные программируемые элементы просто недопустимы. 

Самые посещаемые сайты могут похвастаться не одной сотней тысяч различных точек сохранения. Это говорит о важности фиксирования информации во всём её многообразии и изменении.

Воспринимая Глобальную сеть, как живой организм, который растёт и развивается, веб-архивы предстают в роли биологов, ведущих научные исследования.

Зачем нужен web archive и как его можно использовать?

Визуализация архива Визуализация архива

Вариантов применения веб-архивов более чем достаточно. Хотя, с точки зрения рядового пользователя, не создающего самостоятельно контент в Глобальной сети, области применения подобных инструментов могут казаться и не столь очевидными:

  • Поиск старой или утерянной информации – зачастую, интересный контент может быть похоронен под тяжестью поисковой выдачи. Далеко не всегда те сайты, которые кажутся интересными и достойными вашего внимания, пользуются спросом большинства пользователей. В итоге они начинают застаиваться, терять свою актуальность и попросту вылетать из индекса. Дабы освежить в памяти понравившиеся статьи или ознакомиться с теми, которые ускользнули от вашего внимания, можно воспользоваться веб-архивом. Он может сохранять и видео, размещаемые на популярных площадках. Срок жизни у видеоконтента ощутимо меньше, в сравнении с текстовым. Так что, с этой точки зрения, архивы ещё более актуальны.

  • Восстановление собственных ресурсов, в случае поломок – причин для нарушения корректной работы собственных ресурсов бывает огромное множество. Связаны они могут быть не только с ошибками владельцев, но и с неполадками на арендуемом сервере. Поэтому подстраховаться и сохранить резервные копии в альтернативном архиве бывает очень полезно.

  • Получение уникального контента – некоторые очень предприимчивые вебмастеры собирают большие объёмы уникального текста из архивов. Это позволяет зарабатывать на органическом трафике.

  • Анализ точек роста сайта – сравнение показателей прошлой и текущей версий сайта открывает доступ к большому объёму полезный данных. Например, проследите поведенческие факторы, после смены элементов навигации. Оцените, как аудитория справляется с изменениями, и стоят ли они того. Может быть выгоднее вернуть старый интерфейс в угоду эффективности и  удобства посетителей. 

  • Собирайте информацию из веб-архивов перед покупкой доменов. Проследите, каким было содержание в прошлом, и оцените имидж адреса до того, как решитесь потратить на него свои деньги. Крайне актуально при покупке дорогих доменов. Будет неприятно, если вы купите один из них, а окажется, что он давно скомпрометирован и находится под фильтрами большинства поисковых систем.

  • Современные дизайнеры и верстальщики могут почерпнуть немало полезной информации из веб-архивов. Ведь там хранится настоящая галерея искусства прошлых лет. Проследите эволюцию основных трендов, касающихся оформления и оснащения популярных сайтов.

Как просмотреть старые версии сайтов на Wayback Machine?

Принцип работы поиска веб-архивов, в общем-то, не должен вызывать особых вопросов:

  1. Для начала отправляйтесь на сайт веб-архива: https://web.archive.org
  2. В открывшемся окне найдите строку поиска и введите адрес интересующего вас ресурса. Если вы не знаете точного домена, просто попробуйте поиск по ключевым словам. Он позволяет поработать с привычной выдачей, содержащей сайты, сохранённые ботами. 

  3. Скриншот строки ввода url на Wayback Mashine Скриншот строки ввода url на Wayback Mashine

  4. После того, как вы нашли нужный вам сайт и перешли в соответствующее окно, перед вами откроется информация о количестве сохранений и времени каждого из них. Здесь же располагается и временная шкала по годам. Проверить наличие актуальной версии можно на каждый день с момента открытия веб-архива. Разумеется, далеко не все сайты обладают резервными копиями прямо в каждый день. но чёрный график, располагающийся над временной шкалой, демонстрирует количество сохранений в те или иные периоды.

  5. Скриншот календаря версий в Wayback Mashine Скриншот календаря версий в Wayback Mashine

  6. В календаре могут присутствовать отметки разного цвета. Синие означают положительный ответ и наличие доступной копии. Зелёный – при проверке произошёл редирект. Оранжевый – ошибка на стороне клиента. Красный – недоступность сервера. Таким образом вы сможете отследить периоды недоступности отслеживаемого сайта и проанализировать её причины.

  7. После клика на кружок, которым отмечен нужный день, вы сможете выбрать версию. В один день бывает несколько сохранений, особенно если тогда происходили ключевые изменения в структуре ресурса. Все ссылки, проставленные в восстановленной версии страницы, будут активными и приведут вас туда, куда и должны были в тот момент, когда существовала сохранённая версия. Но некоторые элементы дизайна и изображения могут оказаться потерянными


Скриншот версии сайта 2010 года в Wayback Mashine Скриншот версии сайта 2010 года в Wayback Mashine

Как посмотреть архив сайта в Google?

Самая популярная в мире поисковая система обладает собственными возможностями по работе с сохранёнными версиями сайтов, находящихся в органической выдаче. Найти кешированную страницу можно прямо из результатов выдачи. Для этого перейдите к нужной строке и нажмите на изображение небольшой стрелки, расположенной рядом с URL-адресом целевой страницы. После нажатия на эту стрелку, вы увидите выпадающее меню с пунктом: «Сохранённая копия». 

Где посмотреть сохраненную версию страницы сайта в Google Где посмотреть сохраненную версию страницы сайта в Google

Возможности Google, как веб-архива, очень ограничены. Потому что доступ вы сможете получить только к последней актуальной версии сайта. Это делается только для того, чтобы предоставить возможность получить необходимую информацию в условиях недоступности сервера, на котором размещается ресурс.

Фактически, сохранённая страница добавляется в архив Google в тот момент, когда поисковый бот её посещает. Так что версия может быть и месячной давности.

Как посмотреть копию сайта на определённую дату?

Различных инструментов, позволяющих получить доступ к сохранённой версии сайта, сегодня достаточно. Правда не все они предполагают возможность выбора различных точек сохранения. Большинство позволяет обращаться только к последней актуальной версии. Наиболее популярные из них следующие:

  • Internet Archive https://archive.org. Именно он содержит исчерпывающую и максимально подробную историю развития Глобальной сети. Доступность просматривать сайты в любой точке сохранения открывает широкие возможности для изучения контента. Самая настоящая машина времени для интернета.

  • Собственный кэш поисковых систем – и Google, и Яндекс предоставляют возможность просматривать последние сохранённые версии страниц, находящихся в органической выдаче. Если сайт попал в индекс, значит вы сможете отыскать доступную версию всех его проиндексированных страниц.

  • Попробуйте обратиться к необычным поисковикам, вроде Baidu – этот азиатский ресурс сканирует отечественный и западный сегменты Глобальной сети достаточно редко. Поэтому, если вы хотите получить доступ к недавно заблокированным страницам, поиск сохранённых версий в этом поисковике – вполне актуальное решение. 

  • CashedView.com – специализированая поисковая система, которая работает только с сохранёнными версиями сайтов. На фоне востребованности веб-архивов, появилось несколько подобных ресурсов. В качестве аналога можно рассмотреть, например, cashedpages.com. Подобные варианты придутся как нельзя кстати, если вас интересуют только недоступные или неактуальные версии страниц.

  • Внутренний кэш браузера – он работает с теми страницами, которые вы уже посещали. Сохраняя их в файлах cookies, он может намного быстрее загружать нужную информацию, при повторных посещениях. Но никто не запрещает вам восстанавливать сохранённые данные. Для этого просто введите в адресной строке своего браузера начало URL адреса в виде:
    Google Chrome – chrome://cache
    Opera – opera://cache
    Mozilla Firefox – about:cache 


Оценить статью

3 5