Как скачать сайт с вебархива
- Установка Ruby в Windows
- Запуск программы Ruby в Windows
- Скачивание сайта с web.archive.org на определённую дату
- Скачивание только нужных файлов (изображения, скрипты, стили)
В жизни каждого администратора сайтов бывают ситуации, когда необходимо восстановить сайт, переставший функционировать, а резервная копия оказалась утеряна или вовсе не создавалась.
В этой статье мы расскажем, как восстановить сайт с помощью web.archive.org, используя компьютер с операционной системой Windows 10.
Приступим! Эта инструкция подойдёт тем, кому необходимо восстановить от нескольких десятков до тысяч страниц.
Установка Ruby в Windows
Ruby — популярный язык программирования, на котором создано множество полезных утилит, таких как WPScan, WhatWeb, Wayback Machine Downloader и другие.
Нас интересует именно Wayback Machine Downloader, поэтому начнём с установки Ruby в Windows.
Перейдите на страницу загрузки установщика: https://rubyinstaller.org/downloads
Там вы увидите несколько версий установщиков, отличающихся составом файлов. Все они включают в себя язык Ruby, среду выполнения, документацию и прочее.
Этот установщик обеспечивает совместимость с большинством gem-пакетов и включает MSYS2-Devkit, позволяющий компилировать C-расширения сразу после установки.
- Запустите скачанный файл.
- Согласитесь с лицензионным соглашением.
- Установите все предложенные компоненты (оставьте галочки по умолчанию).
В последнем окне установки оставьте галочку для настройки инструментов MSYS2 и нажмите Finish.
Затем произойдёт установка компонентов Ruby:
1 - MSYS2 base installation 2 - MSYS2 system update (optional) 3 - MSYS2 and MINGW development toolchain Which components shall be installed? If unsure press ENTER [1,3]
Нажмите Enter и установите все компоненты по умолчанию.
После завершения установки нажмите ENTER для выхода.
Готово — Ruby установлен в Windows 10.
Запуск программы Ruby в Windows
Нас интересует утилита Wayback Machine Downloader, предназначенная для восстановления сайтов из веб-архива.
Для её установки выполните следующее:
- Откройте командную строку: нажмите Win + R, введите
cmd
и нажмите ENTER.
Введите команду:
gem install wayback_machine_downloader
Проверьте установку с помощью команды:
wayback_machine_downloader --help
Запустите пробное восстановление сайта:
wayback_machine_downloader http://raduga-kanevsk.ucoz.ru
Архив сайта будет сохранён в папке websites, которая находится по пути:
C:\Users\Имя_пользователя\websites
Или: Этот компьютер → Локальный диск (C:) → Пользователи → [Ваш профиль] → websites.
Скачивание сайта с web.archive.org на определённую дату
На сайте web.archive.org введите адрес нужного сайта и нажмите ENTER.
В появившемся календаре выберите диапазон дат — начальную и конечную.
Скопируйте ссылку, как показано ниже:
Начало: http://web.archive.org/web/20230327194856/http://raduga-kanevsk.ucoz.ru Конец: http://web.archive.org/web/20231003201927/http://raduga-kanevsk.ucoz.ru
Введите команду в консоли:
wayback_machine_downloader -f20230327194856 -t20231003201927 raduga-kanevsk.ucoz.ru
Сайт будет восстановлен по заданному периоду. Все файлы сохраняются в папке:
C:\Users\Имя_пользователя\websites\raduga-kanevsk.ucoz.ru
Скачивание только нужных файлов (изображения, скрипты, стили)
Если вам не нужен весь сайт, а только определённые типы файлов, используйте фильтр:
wayback_machine_downloader https://site.clan.su --only "/\.(gif|jpg|jpeg|png|js|ttf|woff|woff2|eot|svg)$/i" --directory downloaded-backup/
Просто замените https://site.clan.su
на адрес своего сайта.
Файлы будут сохранены в папке:
C:\Users\Имя_пользователя\downloaded-backup
Откройте папку и восстановите необходимые элементы, например, случайно удалённые с FTP-аккаунта.