Всички сме били там: въвеждате име на уебсайт в адресната лента на любимия си браузър или може би щракнете върху резултата от търсене с Google. След това внезапно в края на URL адреса на сайта се появява низ от привидно произволни думи и символи. Разбира се, нямате представа защо е там, но сте щастливи, че безопасно разглеждате обяви в Amazon, резултати от търсене с Google или който и да е уебсайт, който изберете.
Може да изглежда като безсмислици за неопитното око, но всеки знак в URL служи за определена цел. Нека разбием анатомията на URL адреса на уебсайта, от протокола до низа на заявката.
5-те ключови компонента на URL
Един URL може да бъде разделен на три основни части: протокол, име на домейн и път. След това можете да хванете низ на заявка или да станете фантазия с anchor таг.
1. протокол
Първият компонент на URL е протоколът. Това е методът, използван за достъп до ресурс в интернет. Най-разпространеният протокол за уеб сърфиране е HTTP (протокол за трансфер на хипертекст). Той изпраща заявка от браузъра на потребителя до сървъра, хостващ уебсайта, и сървърът след това изпраща обратно искания ресурс като отговор.
HTTP има защитена версия, наречена HTTPS (HTTP Secure), която използва криптиране, за да добави допълнителен слой сигурност. HTTPS се използва, когато чувствителни данни, като пароли или информация за кредитни карти, се предават по интернет. Вашият уебсайт се нуждае от SSL сертификат да използва HTTPS протокола в своите URL адреси.
2. Име на домейн
Името на домейна е уникалният идентификатор за уебсайт в интернет. Състои се от две части: домейна от първо ниво (TLD) и домейна от второ ниво. TLD указва категорията на уебсайта, като .com за търговски уебсайтове, .edu за образователни институции и .org за нестопански организации. Домейнът от второ ниво е уникалното име, избрано от собственика на уебсайта.
Например в името на домейна www.makeuseof.com "makeuseof" е домейнът от второ ниво, а "".com" е TLD. Имената на домейни се регистрират при регистратори на домейни и могат да бъдат закупени за определен период, обикновено една година, но понякога и по-дълго.
3. Пътека
URL пътят указва местоположението на ресурс в уебсайт. Обикновено идва след името на домейна и започва с наклонена черта (/). Пътят се използва за организиране на съдържание на уебсайт и за улесняване на навигацията на потребителите.
Например в URL адреса www.example.com/blog/post1 "blog" е директорията, която съдържа публикациите в блога, а "post1" е конкретната публикация в блога. Пътят може да се използва и за оптимизация за търсачки (SEO) чрез включване на подходящи ключови думи.
4. Низ на заявка
Низът на заявката е част от URL адреса, който започва с въпросителен знак (?) и съдържа двойки ключ-стойност, разделени с амперсанд (&). Използва се за предаване на данни между уеб страници и може да съдържа информация като думи за търсене или потребителски предпочитания.
Например в URL адреса www.example.com/search? q=example&category=books, низът на заявката съдържа две двойки ключ-стойност: "q=example" показва, че думата за търсене е "example", а "category=books" показва, че търсенето е за книги. Обикновено ще видите низове на заявки, съдържащи набор от параметри за търсене, когато сърфирате в уебсайтове, които ви позволяват да филтрирате резултатите от търсенето си, или уебсайтове, които искат да заснемат данни за проследяване.
5. Anchor Tag
Етикетът за закрепване е идентификатор на фрагмент, който идва след URL адреса и започва със символ хеш (#). Той препраща към определена част от уеб страница и може да се използва за създаване на съдържание или за връзка към определен раздел от дълга статия.
Например в ръководство от 5000 думи авторът може да включи навигационно меню, за да разбие съдържанието:
- Дефиниции
- История
- Предизвикателства на индустрията
- Често задавани въпроси
Ако задържите курсора на мишката над една от тези връзки, URL адресът може да съдържа anchor таг, като например „#definitions“, който сигнализира на браузъра да превърти надолу до секцията с този идентификатор в HTML.
Какво е URL кодиране?
URL адресите съдържат знаци от набора от знаци ASCII, подмножество от набора от знаци Unicode. Unicode е международен стандарт за кодиране на знаци на различни езици и азбуки. Когато в URL се използва знак извън набора от знаци ASCII, той трябва да бъде кодиран, за да се гарантира, че браузърът го разбира правилно.
URL кодирането е процесът на преобразуване на знаци извън набора от ASCII символи в техния ASCII еквивалент. Например символът на Unicode „é“ ще бъде кодиран като „%e9“. URL кодирането се използва и за специални знаци като интервали, които се кодират като „+“ или „%20“.
Не се притеснявайте да запомните всяка възможна комбинация от кодиране. The Справочник за кодиране на URL адреси на W3Schools ръководството е удобен ресурс за тази тема.
Какво представляват URL пренасочванията?
Понякога, когато въведете URL в адресната лента на браузъра си, уеб страницата ще пренасочи към друга уеб страница. Това е така, защото има няколко начина, по които URL адресите могат да бъдат структурирани и някои от тях може да не работят според очакванията. Когато това се случи, сървърът отговаря с HTTP код за състояние, показващ, че трябва да пренасочи към друг URL (обикновено 301 или 302). След това новото местоположение може да бъде посочено в заглавката на отговора.
Кодовете за състояние и тяхното значение включват:
- 200 - Добре: Заявката беше успешна.
- 301- Преместен за постоянно: Заявеният ресурс е преместен за постоянно на ново място и трябва да бъде извличан от там при бъдещи заявки.
- 302 - Намерено (временно пренасочване): Това показва, че страницата временно се намира на различен URL адрес и не трябва да се кешира от търсачките или да се използва като достоверен източник на информация за нейното съдържание. Може също така да показва поддръжка на сървъра, където страниците се пренасочват, докато се извършват актуализации или когато целевите страници трябва да обслужват алтернативни URL адреси за целите на проследяване, като A/B тестване или разделяне тестове.
Горните кодове за състояние са специфични за валидността на самия URL адрес и вероятно дори няма да разберете, че съществуват, докато небрежно разглеждате функционален уебсайт.
Въпреки това, когато се появят проблеми с URL адреса, уебсайта или основната уеб хостинг услуга, ще видите един от различен набор от кодове:
- 403 - Забранено: Това показва, че не сте упълномощени да видите уеб страницата. Това може да се дължи на неправилни разрешения или липса на идентификационни данни за удостоверяване.
- 404 Страницата не е намерена: Това показва, че исканият ресурс не съществува на сървъра и трябва да бъде премахнат от всички отметки или страници с резултати от търсачките (SERP).
- 500+ - Сървърни грешки: Те показват, че е възникнала грешка при обработката на вашата заявка и обикновено се причинява от проблем с конфигурацията на сървъра, като например грешки в кодирането в скриптове, проблеми с базата данни и т.н.
Грешките в уебсайта могат да бъдат досадни, но не са краят на света. Първо опитайте принудително опресняване на уеб страницата. След това проверете адресната си лента за грешки, причинени от човека. Добавихте ли писмо? Дали марката изписва една от думите нетрадиционно? Котката ви мина ли по клавиатурата? Ако нищо от горното не работи и това е вашият уебсайт, свържете се с вашия хост. За съжаление, ако уебсайтът принадлежи на някой друг, ще трябва да го изчакате.
Разбиране на URL адресите от протоколи до пътища
URL адресът се състои от много компоненти, всеки от които служи за определена цел. Като разберете анатомията на URL адреса, можете по-лесно да навигирате в уебсайтове и да се възползвате максимално от наличните функции. Независимо дали търсите информация или пазарувате онлайн, разбирането на URL адресите може да ви помогне да се възползвате максимално от мрежата.