Уеб страниците са ефимерни – съществуват на нечий друг компютър и са под контрола на някой друг. Информацията, на която разчитате и от която се нуждаете, може да издържи десетилетия, само за да изчезне за една нощ, когато имате най-голяма нужда от нея. С Archivy можете лесно да запазвате уеб страници като Markdown, след което да ги организирате и редактирате в собствената си система. Твой завинаги. Ето как.
Защо бихте искали да създадете свой собствен архив?
Почти цялата информация в света е достъпна онлайн: Wikipedia е най-голямата енциклопедия в света създаден, а MakeUseOf.com хоства отлични технически статии, които ви показват как да правите готино и интересно неща. Ако харесвате статия, това е достатъчно лесно маркирайте го във вашия браузър, за да го посетите по-къснои ако имате свързан акаунт с Google или друга услуга, можете да получите достъп до отметките си на всяко устройство.
Но уеб страниците изчезват, сайтовете реорганизират структурите си за свързване и често страниците се актуализират, за да отразяват последните новини, технологии и данни. Можете да маркирате набор от инструкции за определена версия на софтуера, само за да се върнете месеци по-късно и да откриете, че стъпките са променени, за да отговарят на най-новата версия. Ако искате да можете да разчитате и да се връщате към информацията, която намирате онлайн, най-добре е да запазите собственото си копие офлайн.
Какво е архивиране?
Archivy е едно от няколкото решения за офлайн архивиране, които можете да стартирате на своя Raspberry Pi. Някои, като напр ArchiveBox ще сканира уебсайтове и ще записва изхода в различни формати, включително HTML, PDF и екранни снимки.
Архивът е личен архив, базиран на дървовидна структура на Markdown документи. Можете да създавате папки с разклонения и ако добавите отметка, тя ще изтрие уеб страницата и ще преобразува текста в Markdown вместо вас – и ще създаде и преобразува заглавията в съдържание, върху което може да се кликне, и в някои случаи автоматично ще изтегли изображенията и ще ги съхрани на вашия Pi.
Можете да редактирате Markdown, да добавяте бележки и етикети, за да накарате архива да работи за вас, и дори да добавяте самостоятелни бележки за вашите собствени мисли и разсъждения. Това е повече от уеб архив: това е личен архив, до който имате достъп отвсякъде.
Как да инсталирате Archivy на вашия Raspberry Pi
Archivy е приложение на Python и е предназначено за достъп през браузър, така че преди да започнете, ще трябва да настройте своя Raspberry Pi като уеб сървър. Ако нямате PIP и Python вече са инсталирани на вашия Raspberry Pi, инсталирайте ги сега.
Въпреки че Archivy може да използва ElasticSearch, за да ви помогне да търсите и управлявате архива си, той работи добре и с RipGrep. Инсталирайте RipGrep с:
sudo apt Инсталирай ripgrep
Сега можете да инсталирате Archivy с:
пип Инсталирай архив
Създайте нова директория, където Archivy ще съхранява своите данни:
mkdir ~/Архивни_данни
Сега трябва да конфигурирате вашата система и да създадете администраторски потребител.
архив инициал
...ще стартира съветника
Помощникът ще ви попита за пълния път на вашата директория с данни и дали искате да можете да използвате търсене. Въведете "ripgrep" в подканата, когато бъдете попитани какъв тип искате да използвате. Когато бъдете попитани дали искате да създадете администраторски потребител, въведете „y“.
Можете да стартирате архивиране с:
изпълнение на архив
Архивът работи на порт 5000 и можете да получите достъп до него, като въведете:
Вашият.местен.pi.адрес:5000
...в браузър във вашата локална мрежа.
Ако искате да получите достъп до архива на архива извън дома си, създайте нов конфигурационен файл на Apache:
cd /etc/apache2/sites-availablesudo nano archivy.conf
В този нов файл въведете:
<VirtualHost *:443>
Име на сървъраВашият.домейн.tld
ProxyPass / http://127.0.0.1:5000/
ProxyPassReverse / http:/127.0.0.1:5000/
ProxyPreserveHost включен
</VirtualHost>
Запазете и излезте с Ctrl + O тогава Ctrl + X. След това рестартирайте Apache с:
sudo service apache2 рестартиране
Получете нов сертификат за сигурност от Let's Encrypt с
sudo certbot
Certbot ще ви представи списък и ще ви помоли да изберете за кой сайт искате сертификат за сигурност. Въведете подходящото число и натиснете Връщане, и Certbot ще провери дали всичко е наред и ще създаде сертификат и ключов файл на вашата система. Изберете „пренасочване“, когато бъдете попитани, след което рестартирайте Apache отново.
Сега, когато посетите вашия домейн или поддомейн, Archivy ще бъде обслужван чрез криптирана връзка.
Използвайте архивиране, за да архивирате интернет и вашите идеи
Влезте в Archivy с администраторското потребителско име и парола и ще видите, че има само една папка: корен. Можете да създадете нова подпапка, като въведете име в полето до Създайте поддиректория, след което щракнете върху бутона. Поддиректориите са вложени и можете да продължите толкова дълбоко, колкото искате. Вляво на екрана се генерира дървовидна диаграма, за да ви помогне да навигирате в структурата.
За да добавите уеб страница към вашия архив, щракнете върху Нова отметка бутон. Ще бъдете помолени за URL адреса и за определяне на тагове. Не е нужно да добавяте етикети, но това помага за навигацията. Когато сте готови, ударете Запазване, а Archivy ще изтрие страницата и ще генерира форматиран Markdown документ, пълен с тагове и ToC.
Можете да промените оформлението на документа, като щракнете върху редактиране бутон и използвайки стандартно форматиране на Markdown да го приспособим прецизно. Можете да добавите допълнителни тагове, като поставите новия си таг в скоби с „#“ навсякъде в документа. Ако щракнете върху някой от етикетите, ще видите списък с други архивирани статии със същия етикет. За да добавите собствен файл или бележка, щракнете Нова бележка и въведете директно Markdown.
Архивът все още е в процес на работа, така че можете да очаквате нови функции да бъдат добавени в бъдеще и тъй като това е проект с отворен код, можете дори сами да допринесете за кода.
Използвайте своя Raspberry Pi за повече!
Raspberry Pi е изключително гъвкава машина и се представя изключително добре като сървър. Raspberry Pi 4 по-специално може да се справи с изключително натоварване и може да управлява десетки сайтове и услуги едновременно. Каквито и да са вашите интереси, от готвене до кодиране, архивиране до аудиокниги, има самостоятелно хоствано решение, което ще работи на вашия Raspberry Pi.