Когда появилась ошибка 404

Ошибка 404 Page Not Found преследует экраны компьютеров по всему миру на протяжении десятилетий. И хотя многие пользователи до сих пор не знают, почему она возникает, «последняя страница Интернета» за последние тридцать лет появлялась так часто, что проложила себе путь в поп-культуру как городская легенда.

Мы не осознаём этого, но подобная ошибка встречается довольно часто, поскольку большинство сайтов каждый день сталкиваются с новыми неработающими ссылками. Более того, веб-страницы, созданные до 2005 года, постоянно «умирают». Следовательно, мы можем только гадать, сколько надгробий с надписью 404 Page Not Found существует на онлайн-кладбище.

Сегодня 404 является мощным символом, который используют во всём мире для освещения чего-либо неизвестного.

Что такое 404 Page Not Found?

Мы все с ней сталкивались, но как возникает эта ошибка? 404 – это код состояния HTTP. Когда пользователь посещает веб-страницу, устройство запрашивает данные с сервера с помощью HTTP — протокола прикладного уровня передачи данных.

После этого колёса и шестерёнки всемирной паутины начинают двигаться, и мы осознаём, что всё в Интернете связано с обменом данными quid pro quo (одна передача зависит от другой). Перед тем как отобразить страницу, веб-сервер отправляет HTTP-заголовок с кодом состояния, и наш браузер отвечает взаимностью, отправляя свои заголовки. Если всё нормально, статус обмена данными считывается нормально:

«200 ОК».

«Запрос выполнен успешно».

Мы не видим этого, поскольку сервер отправляет содержимое страницы. Код выдаёт, если происходит ошибка.

«404 Not Found».

Такое случается, когда запрашиваемая страница больше не существует. Эта ошибка довольно распространена и может возникнуть на любом веб-сайте.

Развенчание мифа о комнате 404

В период с 1981 по 1992 год, работая в ЦЕРНе, изобретатель всемирной паутины Тим Бернерс-Ли и его помощник Роберт Кайо создали новую систему просмотра и распространения информации на основе гипертекста. Им приходилось отвечать на различные запросы, выделяя файлы и передавая их по сети, и делали они это вручную.

Вскоре они стали настолько перегруженными, что не могли отвечать на все запросы, отправляемые через сеть. Пользователи, которых стало слишком много, вводили неправильные данные и в конечном итоге отправляли не те названия файлов.

Поскольку одни и те же проблемы возникали постоянно, учёные обновили систему, придумав сообщение для тех, кто отправлял запросы с неправильными названиями файлов. Оно выглядело следующим образом:

«Room 404: file not found».

Сообщение стало популярным. В 1992 году Консорциум Всемирной паутины ввёл коды состояния HTTP, которые были разработаны ещё в 1990 году.

Тим и Роберт работали вместе в офисе на четвёртом этаже здания. Там же, в комнате под номером 404, располагалась центральная база данных всемирной паутины с первыми веб-серверами.

«Первый веб-сайт в ЦЕРНе – и в мире – был посвящён самому проекту всемирной паутины (World Wide Web) и размещался на компьютере NeXT Бернерса-Ли. В 2013 году ЦЕРН запустил проект по восстановлению первого в истории веб-сайта: info.cern.ch».

Роберт Кайо развенчал миф о том, что ошибка 404 была названа в честь серверной комнаты в ЦЕРНе. На четвёртом этаже не было комнаты с номером 404.

Как ни странно, в здании «4» нет комнаты «04», офисы начинаются с 410-го — не спрашивайте, почему. Извините, что разочаровываем вас, но в ЦЕРНе нет комнаты 404 — её просто не существует, и уж точно не она была «местом, где зародилась паутина».

Роберт Кайо подтвердил это во время интервью: «Цифра 404 никогда не была связана с какой-либо комнатой или физическим местоположением в ЦЕРНе. Это самый настоящий миф».

Когда его спросили об одержимости людей термином 404, Кайо ответил: «Вероятно, это связано с иррациональностью, отрицанием очевидного и ухода от реальности, что весьма характерно для людей».

Разгадка тайны 404

Таким образом, ошибка 404 стала Интернет-загадкой и нигилистическим парадоксом. Тем не менее, скорее случайно, чем преднамеренно, нам, возможно, удалось найти ответ. Дело в том, что любители городских легенд и разрушители мифов искали разгадку не в той комнате в ЦЕРНе.

Рейсы 404

Код 404 появился ещё тогда, когда Интернет только зарождался. Тим Бернерс-Ли изобрёл всемирную паутину (WWW) в 1989 году, и именно в тот год произошла первая трагедия с участием самолёта, выполнявшего рейс 404.

Рейс 404 Pakistan International Airlines

Рейс PK404 исчез почти сразу же после взлёта 25 августа 1989 года. Самолёт Fokker F27 Friendship поднялся в небо в Гилгите (Пакистан) в 7:35, он держал курс на столицу Исламабад.

В 7:40 пилоты вышли на связь. Затем самолёт исчез с радаров. Эксперты полагают, что он разбился в Гималаях, однако до сих пор не было обнаружено никаких обломков. Рейс 404 исчез бесследно.

Можете себе представить, сколько раз Тим Бернерс-Ли и Роберт Кайо слышали об этом в новостях. У них могла неосознанно отложиться в памяти фраза «404-й не найден».

Рейс 404 авиакомпании Alitalia

Рейс 404 авиакомпании Alitalia был международным пассажирским рейсом, который 14 ноября 1990 года направлялся из аэропорта Линате в Милане, Италия, в аэропорт Цюриха в Швейцарии, и потерпел крушение. Самолёт Douglas DC-9–32 компании Alitali, приближаясь к аэропорту Цюриха, упал в лесах Вайаха, убив всех 46 человек, находившихся на борту.

Между Вайахом и местом рождения Интернета в ЦЕРНЕ всего около 240 километров. Новостные каналы, вероятно, связали трагедию с рейсом PK404. Следовательно, мы можем предположить, что цифра 404 снова засела в подсознании каждого.

Заключение

Оглядываясь на историю Интернета, мы видим, что сочетание неблагоприятных обстоятельств, известных как «идеальный шторм», породило ошибку 404. Удивительно, почему до сих пор никто не соединил следующие точки:

* Август 1989 года – рейс PK404 исчезает вскоре после взлёта.

* Октябрь 1990 года – Тим Бернерс-Ли начинает писать код для клиентской программы, браузера/редактора, который он называет World Wide Web, на своём новом компьютере NeXT.

* Ноябрь 1990 года – рейс Alitalia 404 терпит крушение в Швейцарии.

* Декабрь 1990 года – появляется первый веб-сайт, nxoc01.cern.ch.

Тим Бернерс-Ли и Роберт Кайо молчат об истинном происхождении сообщения «404 not found». Однако они могут даже не подозревать о подсознательных нюансах «404». Следовательно, ошибка продолжит пугать пользователей сети как «тупиковая страница Интернета».

Откуда взялась ошибка 404 — Детали на Look At Me

Тот случай, когда в городскую легенду хочется верить

  • Антон Мухатаев, 21 апреля 2015
  • 15893

Откуда взялась ошибка 404. Изображение № 1.

В рубрике «Интернет-археология» Look At Me рассказывает о том, как в интернете появились стандарты, которые мы часто не замечаем. В сегодняшнем выпуске говорим о самом известном коде ошибки, который показывают браузеры.

Откуда взялась ошибка 404. Изображение № 2.

До того, как современный интернет стал доступен по всему миру, сеть не была глобальной. Современные протоколы, которые в ней применяют, придумали в 80-х и 90-х годах в CERN. Тим Бернерс-Ли, изобретатель HTTP, самого известного из них, создал его на основе файлового протокола FTP. Бернерс-Ли также изобрёл URI, URL, HTML и, конечно же, WWW в целом — аббревиатуры, знакомые любому опытному пользователю интернета.

Версия HTTP 0.9, которая появилась в 1992 году, включала в себя коды состояния из трёх цифр. Первая обозначала вид сообщения: 1 — информационное, 2 — успех, 3 — перенаправление, 4 — ошибка клиента, 5 — ошибка сервера. Вторая цифра обозначала подгруппу сообщений, третья — конкретное сообщение в этой группе. Коды вроде 200 («хорошо») и 304 («не изменилось») мы никогда не видим, потому что вместо этих цифр браузеры отображают содержимое страниц. А вот ошибка 404 («не найдено») хорошо всем известна. С ней сталкивался любой пользователь, кто неправильно вводил адрес страницы в строку браузера или переходил по ссылке на несуществующую страницу.

Хотя это всего лишь легенда, она, как и сама ошибка 404, уже превратилась в часть интернет-фольклора

С ошибкой 404 связана городская легенда. Якобы в своё время в офисе CERN на четвёртом этаже была комната 404, где находился центральный сервер. Там сидели несколько человек, которые вручную обрабатывали приходившие запросы. Если запрос был ошибочным, то появлялось сообщение «Room 404: file not found». И хотя это всего лишь легенда, она уже вошла в интернет-фольклор, а сама ошибка 404 стала частью популярной культуры и сленга, полигоном для юмора веб-дизайнеров и символом благотворительности.

ТИМ БЕРНЕРС-ЛИ

изобретатель HTTP

«Как человек, который работал в CERN, говорю вам, что комнаты 404 на четвёртом этаже офиса не было. В CERN комнаты нумеруют по-другому: первая цифра обозначает номер здания, а две других — номер комнаты. Но в здании номер 4 нет комнаты номер 04, отсчёт там начинается с 410 и идёт по нарастанию — не спрашивайте меня, почему».

ИСТОЧНИК

Page semi-protected

From Wikipedia, the free encyclopedia

In computer network communications, the HTTP 404, 404 not found, 404, 404 error, page not found or file not found error message is a hypertext transfer protocol (HTTP) standard response code, to indicate that the browser was able to communicate with a given server, but the server could not find what was requested. The error may also be used when a server does not wish to disclose whether it has the requested information.[1]

The website hosting server will typically generate a «404 Not Found» web page when a user attempts to follow a broken or dead link; hence the 404 error is one of the most recognizable errors encountered on the World Wide Web.

English Wikipedia’s 404 Page

Overview

When communicating via HTTP, a server is required to respond to a request, such as a web browser request for a web page, with a numeric response code and an optional, mandatory, or disallowed (based upon the status code) message. In code 404, the first digit indicates a client error, such as a mistyped Uniform Resource Locator (URL). The following two digits indicate the specific error encountered. HTTP’s use of three-digit codes is similar to the use of such codes in earlier protocols such as FTP and NNTP. At the HTTP level, a 404 response code is followed by a human-readable «reason phrase». The HTTP specification suggests the phrase «Not Found»[1] and many web servers by default issue an HTML page that includes both the 404 code and the «Not Found» phrase.

A 404 error is often returned when pages have been moved or deleted. In the first case, it is better to employ URL mapping or URL redirection by returning a 301 Moved Permanently response, which can be configured in most server configuration files, or through URL rewriting; in the second case, a 410 Gone should be returned. Because these two options require special server configuration, most websites do not make use of them.

404 errors should not be confused with DNS errors, which appear when the given URL refers to a server name that does not exist. A 404 error indicates that the server itself was found, but that the server was not able to retrieve the requested page.

History

The origin of the 404 error code dates back to the early days of the World Wide Web. In 1992, Tim Berners-Lee, the inventor of the Web, and his team at CERN, the European Organization for Nuclear Research, created the first web server software, called CERN httpd.[2] This software used a simple file system to store and retrieve web pages, and it assigned a three-digit number to each type of request and response. The number 404 was chosen to indicate that the requested file was not found on the server.[3]

The term «404 Not Found» was coined by Berners-Lee himself, who explained in a 1998 interview that he wanted to make the error message «slightly apologetic».[4][3] He also said that he considered using «400 Bad Request» instead, but decided that it was too vague and technical.[4][3]

The first documented case of a 404 error appearing on a web page was in 1993, when a user tried to access a page about the Mosaic web browser on the NCSA website. The page had been moved to a different location, but the link had not been updated.[2] The user reported the error to the NCSA team, who fixed the link and added a humorous message to their 404 page: «We’re sorry, but the document you requested is not here. Maybe you should try someplace else.»[3]

Since then, 404 errors have become one of the most common and recognizable errors on the Web. Many websites have customized their 404 pages with creative designs, messages, or features to entertain or assist their visitors. For example, Google’s 404 page features a broken robot and a link to its homepage,[5] while GitHub’s 404 page shows a random image of a parallax star field and a link to its status page.[6] Some websites have also used their 404 pages to showcase their brand personality, humor, or social causes. For instance, Lego’s 404 page shows an image of a Lego character searching for a missing brick,[7] while Amazon’s 404 page displays the image of a dog with a message about conservation.[8]

Soft 404 errors

Some websites report a «not found» error by returning a standard web page with a «200 OK» response code, falsely reporting that the page loaded properly; this is known as a soft 404. The term «soft 404» was introduced in 2004 by Ziv Bar-Yossef et al.[9]

Soft 404s are problematic for automated methods of discovering whether a link is broken. Some search engines, like Yahoo and Google, use automated processes to detect soft 404s.[10] Soft 404s can occur as a result of configuration errors when using certain HTTP server software, for example with the Apache software, when an Error Document 404 (specified in a .htaccess file) is specified as an absolute path (e.g. http://example.com/error.html) rather than a relative path (/error.html).[11] This can also be done on purpose to force some browsers (like Internet Explorer) to display a customized 404 error message rather than replacing what is served with a browser-specific «friendly» error message (in Internet Explorer, this behavior is triggered when a 404 is served and the received HTML is shorter than a certain length, and can be manually disabled by the user).

There are also «soft 3XX» errors where content is returned with a status 200 but comes from a redirected page, such as when missing pages are redirected to the domain root/home page.

Proxy servers

Some proxy servers generate a 404 error when a 500-range error code would be more correct. If the proxy server is unable to satisfy a request for a page because of a problem with the remote host (such as hostname resolution failures or refused TCP connections), this should be described as a 5xx Internal Server Error, but might deliver a 404 instead. This can confuse programs that expect and act on specific responses, as they can no longer easily distinguish between an absent web server and a missing web page on a web server that is present.

Intentional 404s

In July 2004, the UK telecom provider BT Group deployed the Cleanfeed content blocking system, which returns a 404 error to any request for content identified as potentially illegal by the Internet Watch Foundation.[12] Other ISPs return a HTTP 403 «forbidden» error in the same circumstances.[13] The practice of employing fake 404 errors as a means to conceal censorship has also been reported in Thailand[14] and Tunisia.[15] In Tunisia, where censorship was severe before the 2011 revolution, people became aware of the nature of the fake 404 errors and created an imaginary character named «Ammar 404» who represents «the invisible censor».[16]

Microsoft Internet Server 404 substatus error codes

The webserver software developed by Microsoft, Microsoft’s Internet Information Services (IIS), returns a set of substatus codes with its 404 responses. The substatus codes take the form of decimal numbers appended to the 404 status code. The substatus codes are not officially recognized by IANA and are not returned by non-Microsoft servers.

Substatus codes

Microsoft’s IIS 7.0, IIS 7.5, and IIS 8.0 servers define the following HTTP substatus codes to indicate a more specific cause of a 404 error:

  • 404.0 – Not found.
  • 404.1 – Site Not Found.
  • 404.2 – ISAPI or CGI restriction.
  • 404.3 – MIME type restriction.
  • 404.4 – No handler configured.
  • 404.5 – Denied by request filtering configuration.
  • 404.6 – Verb denied.
  • 404.7 – File extension denied.
  • 404.8 – Hidden namespace.
  • 404.9 – File attribute hidden.
  • 404.10 – Request header too long.
  • 404.11 – Request contains double escape sequence.
  • 404.12 – Request contains high-bit characters.
  • 404.13 – Content length too large.
  • 404.14 – Request URL too long.
  • 404.15 – Query string too long.
  • 404.16 – DAV request sent to the static file handler.
  • 404.17 – Dynamic content mapped to the static file handler via a wildcard MIME mapping.
  • 404.18 – Query string sequence denied.
  • 404.19 – Denied by filtering rule.
  • 404.20 – Too Many URL Segments.

Custom error pages

The Wikimedia 404 message

Web servers can typically be configured to display a customised 404 error page, including a more natural description, the parent site’s branding, and sometimes a site map, a search form or 404-page widget. The protocol level phrase, which is hidden from the user, is rarely customized. Internet Explorer, however, will not display custom pages unless they are larger than 512 bytes, opting instead to display a «friendly» error page.[17] Google Chrome included similar functionality, where the 404 is replaced with alternative suggestions generated by Google algorithms, if the page is under 512 bytes in size.[18] Another problem is that if the page does not provide a favicon, and a separate custom 404-page exists, extra traffic and longer loading times will be generated on every page view.[19][20]

Many organizations use 404 error pages as an opportunity to inject humor into what may otherwise be a serious website. For example, Metro UK shows a polar bear on a skateboard, and the web development agency Left Logic has a simple drawing program.[21] During the 2015 UK general election campaign the main political parties all used their 404 pages to either take aim at political opponents or show relevant policies to potential supporters.[22] In Europe, the NotFound project, created by multiple European organizations including Missing Children Europe and Child Focus, encourages site operators to add a snippet of code to serve customized 404 error pages[23] which provide data about missing children.[24]

While many websites send additional information in a 404 error message—such as a link to the homepage of a website or a search box—some also endeavor to find the correct web page the user wanted. Extensions are available for some content management systems (CMSs) to do this.[25]

Tracking 404 errors

A number of tools exist that crawl through a website to find pages that return 404 status codes. These tools can be helpful in finding links that exist within a particular website. The limitation of these tools is that they only find links within one particular website, and ignore 404s resulting from links on other websites. As a result, these tools miss out on 83% of the 404s on websites.[26] One way around this is to find 404 errors by analyzing external links.[27]

One of the most effective ways to discover 404 errors is by using Google Search Console, Google Analytics or crawling software.

Another common method is tracking traffic to 404 pages using log file analysis.[28] This can be useful to understand more about what 404s users reached on the site. Another method of tracking traffic to 404 pages is using JavaScript-based traffic tracking tools.[29]

Causes

There are many possible causes for a page not to exist. Some of the common ones are:[30][31][32]

  • The page was deleted by the owner or administrator of the website.
  • The page was moved to a different location or renamed without updating the links that point to it.
  • The page was never created in the first place or is still under construction.
  • The page is temporarily unavailable due to maintenance or technical issues.
  • The page is blocked by the user’s network or firewall settings.
  • The page is restricted by the website’s privacy or security policies.
  • The page contains illegal or harmful content that was removed by the authorities or the website itself.

Solutions

If a user encounters a page that doesn’t exist, there are some steps they can take to try to find the information they are looking for or to report the problem.[30][31][32]

  • Check the URL of the page. Sometimes, a simple typo or spelling mistake can cause a page not to load. Make sure the correct address is entered and try again.
  • Refresh the page. Sometimes, a temporary glitch or network issue can prevent a page from loading. Try reloading the page by pressing F5 or clicking on the refresh button on the browser.
  • Go back to the previous page. Sometimes, a link might be broken or outdated. Try going back to the page where the link was found and see if there is an updated or alternative link to the same information.
  • Use a search engine. Sometimes, a page might be indexed by a search engine even if it doesn’t exist anymore. Try searching for keywords related to the topic of the page and see if other sources of information can be found.
  • Contact the website owner or administrator. Sometimes, a page might be removed or moved without notice. Try contacting the person or organization responsible for the website and ask them about the status of the page. Their contact information can usually be found on their homepage or in their footer section.
  • Report the error. Sometimes, a page might not exist due to an error on the website’s part. Try reporting the error to the website owner or administrator so they can fix it as soon as possible. Their feedback form or email address can usually be found on their homepage or in their footer section.

See also

  • Blue screen of death
  • Funky caching
  • Link rot
  • List of HTTP status codes

References

  1. ^ a b Fielding, R.; Reschke, J. (June 2014). Fielding, R; Reschke, J (eds.). «RFC 7231, HTTP/1.1 Semantics and Content, Section 6.5.4 404 Not Found». ietf.org. doi:10.17487/RFC7231. S2CID 14399078. Retrieved 13 December 2018.
  2. ^ a b «404 page design: best practices and awesome examples». www.justinmind.com. Retrieved 19 May 2023.
  3. ^ a b c d «What is a 404 error and what should I do if I get one? » Internet » Windows » Tech Ease». Retrieved 19 May 2023.
  4. ^ a b What is the world wide web? — Twila Camp, retrieved 19 May 2023
  5. ^ «Google 404 Error Page». Google. CS1 maint: url-status (link)
  6. ^ «Github 404 Error Page». Github. CS1 maint: url-status (link)
  7. ^ «LEGO 404 Error Page». Lego. CS1 maint: url-status (link)
  8. ^ «Amazon’s 404 error page». Amazon. CS1 maint: url-status (link)
  9. ^ Ziv Bar-Yossef; Andrei Z. Broder; Ravi Kumar; Andrew Tompkins (2004). Sic Transit Gloria Telae: Towards an Understanding of the Web’s Decay. Proceedings of the 13th International Conference on World Wide Web (WWW). pp. 328–337. doi:10.1145/988672.988716. ISBN 978-1581138443. S2CID 587547.
  10. ^ «Why is your crawler asking for strange URLs that have never existed on my site?». Yahoo Ysearch Help page. Archived from the original on 15 July 2014. Retrieved 4 September 2013.
  11. ^ «Farewell to soft 404s». Google Official Blog. Retrieved 20 September 2008.
  12. ^ «LINX Public Affairs » Cleanfeed: the facts». Publicaffairs.linx.net. 10 September 2004. Archived from the original on 13 May 2011. Retrieved 6 March 2011.
  13. ^ «DEMON – Error 403». Retrieved 14 June 2012.
  14. ^ Sambandaraksa, Don (18 February 2009). «The old fake ‘404 Not Found’ routine — Dead link». Bangkok Post. Retrieved 12 September 2010.
  15. ^ Noman, Helmi (12 September 2008). «Tunisian journalist sues government agency for blocking Facebook, claims damage for the use of 404 error message instead of 403». Open Net Initiative. Retrieved 21 November 2010.
  16. ^ «Anti-censorship movement in Tunisia: creativity, courage and hope!». Global Voices Advocacy. 27 May 2010. Retrieved 28 August 2010.
  17. ^ «Friendly HTTP Error Pages». msdn.com. 18 August 2010. Archived from the original on 2 December 2010. Retrieved 14 June 2012.
  18. ^ «Issue 1695: Chrome needs option to turn off «Friendly 404″ displays». bugs.chromium.org. Retrieved 25 December 2021.
  19. ^ Heng, Christopher (7 September 2008). «What is Favicon.ico and How to Create a Favicon Icon for Your Website». The Site Wizard. Retrieved 23 February 2011.
  20. ^ «The Dastardly «favicon.ico not found» Error». Internet Folks. 3 August 1999.
  21. ^ «From skateboarding bears to missing children: The power of the 404 Not Found error page». Metro. 6 June 2011. Retrieved 16 April 2013.
  22. ^ «The political Page 404 war». BBC Newsbeat. 27 April 2015. Retrieved 18 May 2018.
  23. ^ «Notfound.org». notfound. notfound. Archived from the original on 2 September 2014.
  24. ^ «Missing children messages go on 404 error pages». BBC News. 27 September 2012. Retrieved 20 September 2014.
  25. ^ Swenson, Sahala (19 August 2008). «Make your 404 pages more useful». Official Google Webmaster Central Blog. Google, Inc. Retrieved 28 August 2009.
  26. ^ «Sources Leading To 404s». SpringTrax. Retrieved 11 February 2013.
  27. ^ Cushing, Anne (2 April 2013). «A Data-Centric Approach To Identifying 404 Pages Worth Saving». Search Engine Land. Retrieved 7 June 2013.
  28. ^ «Tracking and Preventing 404 Errors». 404errorpages.com. Retrieved 7 June 2013.
  29. ^ «Understand 404 Errors». SpringTrax.com. Retrieved 7 June 2013.
  30. ^ a b Edgar, Matthew (11 April 2023). «How To Fix 404 Errors On Your Website». Matthew Edgar. Retrieved 19 May 2023.
  31. ^ a b Frickey, Dean (18 November 2008). «A More Useful 404». A List Apart. Retrieved 19 May 2023.
  32. ^ a b «What ‘Error 404’ means and how to fix it». IONOS Digital Guide. 31 January 2023. Retrieved 19 May 2023.

External links

  • A More Useful 404
  • 404 Not Found of the Hypertext Transfer Protocol (HTTP/1.1): Semantics and Content specification, at the Internet Engineering Task Force
  • ErrorDocument Directive – instructions on custom error pages for the Apache 2.0 web server
  • 404: Not Found – an award-winning song about the error code

Page semi-protected

From Wikipedia, the free encyclopedia

In computer network communications, the HTTP 404, 404 not found, 404, 404 error, page not found or file not found error message is a hypertext transfer protocol (HTTP) standard response code, to indicate that the browser was able to communicate with a given server, but the server could not find what was requested. The error may also be used when a server does not wish to disclose whether it has the requested information.[1]

The website hosting server will typically generate a «404 Not Found» web page when a user attempts to follow a broken or dead link; hence the 404 error is one of the most recognizable errors encountered on the World Wide Web.

English Wikipedia’s 404 Page

Overview

When communicating via HTTP, a server is required to respond to a request, such as a web browser request for a web page, with a numeric response code and an optional, mandatory, or disallowed (based upon the status code) message. In code 404, the first digit indicates a client error, such as a mistyped Uniform Resource Locator (URL). The following two digits indicate the specific error encountered. HTTP’s use of three-digit codes is similar to the use of such codes in earlier protocols such as FTP and NNTP. At the HTTP level, a 404 response code is followed by a human-readable «reason phrase». The HTTP specification suggests the phrase «Not Found»[1] and many web servers by default issue an HTML page that includes both the 404 code and the «Not Found» phrase.

A 404 error is often returned when pages have been moved or deleted. In the first case, it is better to employ URL mapping or URL redirection by returning a 301 Moved Permanently response, which can be configured in most server configuration files, or through URL rewriting; in the second case, a 410 Gone should be returned. Because these two options require special server configuration, most websites do not make use of them.

404 errors should not be confused with DNS errors, which appear when the given URL refers to a server name that does not exist. A 404 error indicates that the server itself was found, but that the server was not able to retrieve the requested page.

Soft 404 errors

Some websites report a «not found» error by returning a standard web page with a «200 OK» response code, falsely reporting that the page loaded properly; this is known as a soft 404. The term «soft 404» was introduced in 2004 by Ziv Bar-Yossef et al.[2]

Soft 404s are problematic for automated methods of discovering whether a link is broken. Some search engines, like Yahoo and Google, use automated processes to detect soft 404s.[3] Soft 404s can occur as a result of configuration errors when using certain HTTP server software, for example with the Apache software, when an Error Document 404 (specified in a .htaccess file) is specified as an absolute path (e.g. http://example.com/error.html) rather than a relative path (/error.html).[4] This can also be done on purpose to force some browsers (like Internet Explorer) to display a customized 404 error message rather than replacing what is served with a browser-specific «friendly» error message (in Internet Explorer, this behavior is triggered when a 404 is served and the received HTML is shorter than a certain length, and can be manually disabled by the user).

There are also «soft 3XX» errors where content is returned with a status 200 but comes from a redirected page, such as when missing pages are redirected to the domain root/home page.

Proxy servers

Some proxy servers generate a 404 error when a 500-range error code would be more correct. If the proxy server is unable to satisfy a request for a page because of a problem with the remote host (such as hostname resolution failures or refused TCP connections), this should be described as a 5xx Internal Server Error, but might deliver a 404 instead. This can confuse programs that expect and act on specific responses, as they can no longer easily distinguish between an absent web server and a missing web page on a web server that is present.

Intentional 404s

In July 2004, the UK telecom provider BT Group deployed the Cleanfeed content blocking system, which returns a 404 error to any request for content identified as potentially illegal by the Internet Watch Foundation.[5] Other ISPs return a HTTP 403 «forbidden» error in the same circumstances.[6] The practice of employing fake 404 errors as a means to conceal censorship has also been reported in Thailand[7] and Tunisia.[8] In Tunisia, where censorship was severe before the 2011 revolution, people became aware of the nature of the fake 404 errors and created an imaginary character named «Ammar 404» who represents «the invisible censor».[9]

Microsoft Internet Server 404 substatus error codes

The webserver software developed by Microsoft, Microsoft’s Internet Information Services (IIS), returns a set of substatus codes with its 404 responses. The substatus codes take the form of decimal numbers appended to the 404 status code. The substatus codes are not officially recognized by IANA and are not returned by non-Microsoft servers.

Substatus codes

Microsoft’s IIS 7.0, IIS 7.5, and IIS 8.0 servers define the following HTTP substatus codes to indicate a more specific cause of a 404 error:

  • 404.0 – Not found.
  • 404.1 – Site Not Found.
  • 404.2 – ISAPI or CGI restriction.
  • 404.3 – MIME type restriction.
  • 404.4 – No handler configured.
  • 404.5 – Denied by request filtering configuration.
  • 404.6 – Verb denied.
  • 404.7 – File extension denied.
  • 404.8 – Hidden namespace.
  • 404.9 – File attribute hidden.
  • 404.10 – Request header too long.
  • 404.11 – Request contains double escape sequence.
  • 404.12 – Request contains high-bit characters.
  • 404.13 – Content length too large.
  • 404.14 – Request URL too long.
  • 404.15 – Query string too long.
  • 404.16 – DAV request sent to the static file handler.
  • 404.17 – Dynamic content mapped to the static file handler via a wildcard MIME mapping.
  • 404.18 – Query string sequence denied.
  • 404.19 – Denied by filtering rule.
  • 404.20 – Too Many URL Segments.

Custom error pages

The Wikimedia 404 message

Web servers can typically be configured to display a customised 404 error page, including a more natural description, the parent site’s branding, and sometimes a site map, a search form or 404-page widget. The protocol level phrase, which is hidden from the user, is rarely customized. Internet Explorer, however, will not display custom pages unless they are larger than 512 bytes, opting instead to display a «friendly» error page.[10] Google Chrome included similar functionality, where the 404 is replaced with alternative suggestions generated by Google algorithms, if the page is under 512 bytes in size.[11] Another problem is that if the page does not provide a favicon, and a separate custom 404-page exists, extra traffic and longer loading times will be generated on every page view.[12][13]

Many organizations use 404 error pages as an opportunity to inject humor into what may otherwise be a serious website. For example, Metro UK shows a polar bear on a skateboard, and the web development agency Left Logic has a simple drawing program.[14] During the 2015 UK general election campaign the main political parties all used their 404 pages to either take aim at political opponents or show relevant policies to potential supporters.[15] In Europe, the NotFound project, created by multiple European organizations including Missing Children Europe and Child Focus, encourages site operators to add a snippet of code to serve customized 404 error pages[16] which provide data about missing children.[17]

While many websites send additional information in a 404 error message—such as a link to the homepage of a website or a search box—some also endeavor to find the correct web page the user wanted. Extensions are available for some content management systems (CMSs) to do this.[18]

Tracking 404 errors

A number of tools exist that crawl through a website to find pages that return 404 status codes. These tools can be helpful in finding links that exist within a particular website. The limitation of these tools is that they only find links within one particular website, and ignore 404s resulting from links on other websites. As a result, these tools miss out on 83% of the 404s on websites.[19] One way around this is to find 404 errors by analyzing external links.[20]

One of the most effective ways to discover 404 errors is by using Google Search Console, Google Analytics or crawling software.

Another common method is tracking traffic to 404 pages using log file analysis.[21] This can be useful to understand more about what 404s users reached on the site. Another method of tracking traffic to 404 pages is using JavaScript-based traffic tracking tools.[22]

See also

  • Blue screen of death
  • Funky caching
  • Link rot
  • List of HTTP status codes

References

  1. ^ a b Fielding, R.; Reschke, J. (June 2014). Fielding, R; Reschke, J (eds.). «RFC 7231, HTTP/1.1 Semantics and Content, Section 6.5.4 404 Not Found». ietf.org. doi:10.17487/RFC7231. S2CID 14399078. Retrieved 13 December 2018.
  2. ^ Ziv Bar-Yossef; Andrei Z. Broder; Ravi Kumar; Andrew Tompkins (2004). Sic Transit Gloria Telae: Towards an Understanding of the Web’s Decay. Proceedings of the 13th International Conference on World Wide Web (WWW). pp. 328–337. doi:10.1145/988672.988716. ISBN 978-1581138443. S2CID 587547.
  3. ^ «Why is your crawler asking for strange URLs that have never existed on my site?». Yahoo Ysearch Help page. Archived from the original on 15 July 2014. Retrieved 4 September 2013.
  4. ^ «Farewell to soft 404s». Google Official Blog. Retrieved 20 September 2008.
  5. ^ «LINX Public Affairs » Cleanfeed: the facts». Publicaffairs.linx.net. 10 September 2004. Archived from the original on 13 May 2011. Retrieved 6 March 2011.
  6. ^ «DEMON – Error 403». Retrieved 14 June 2012.
  7. ^ Sambandaraksa, Don (18 February 2009). «The old fake ‘404 Not Found’ routine — Dead link». Bangkok Post. Retrieved 12 September 2010.
  8. ^ Noman, Helmi (12 September 2008). «Tunisian journalist sues government agency for blocking Facebook, claims damage for the use of 404 error message instead of 403». Open Net Initiative. Retrieved 21 November 2010.
  9. ^ «Anti-censorship movement in Tunisia: creativity, courage and hope!». Global Voices Advocacy. 27 May 2010. Retrieved 28 August 2010.
  10. ^ «Friendly HTTP Error Pages». msdn.com. 18 August 2010. Archived from the original on 2 December 2010. Retrieved 14 June 2012.
  11. ^ «Issue 1695: Chrome needs option to turn off «Friendly 404″ displays». bugs.chromium.org. Retrieved 25 December 2021.
  12. ^ Heng, Christopher (7 September 2008). «What is Favicon.ico and How to Create a Favicon Icon for Your Website». The Site Wizard. Retrieved 23 February 2011.
  13. ^ «The Dastardly «favicon.ico not found» Error». Internet Folks. 3 August 1999.
  14. ^ «From skateboarding bears to missing children: The power of the 404 Not Found error page». Metro. 6 June 2011. Retrieved 16 April 2013.
  15. ^ «The political Page 404 war». BBC Newsbeat. 27 April 2015. Retrieved 18 May 2018.
  16. ^ «Notfound.org». notfound. notfound. Archived from the original on 2 September 2014.
  17. ^ «Missing children messages go on 404 error pages». BBC News. 27 September 2012. Retrieved 20 September 2014.
  18. ^ Swenson, Sahala (19 August 2008). «Make your 404 pages more useful». Official Google Webmaster Central Blog. Google, Inc. Retrieved 28 August 2009.
  19. ^ «Sources Leading To 404s». SpringTrax. Retrieved 11 February 2013.
  20. ^ Cushing, Anne (2 April 2013). «A Data-Centric Approach To Identifying 404 Pages Worth Saving». Search Engine Land. Retrieved 7 June 2013.
  21. ^ «Tracking and Preventing 404 Errors». 404errorpages.com. Retrieved 7 June 2013.
  22. ^ «Understand 404 Errors». SpringTrax.com. Retrieved 7 June 2013.

External links

  • A More Useful 404
  • 404 Not Found of the Hypertext Transfer Protocol (HTTP/1.1): Semantics and Content specification, at the Internet Engineering Task Force
  • ErrorDocument Directive – instructions on custom error pages for the Apache 2.0 web server
  • 404: Not Found – an award-winning song about the error code

Page semi-protected

From Wikipedia, the free encyclopedia

In computer network communications, the HTTP 404, 404 not found, 404, 404 error, page not found or file not found error message is a hypertext transfer protocol (HTTP) standard response code, to indicate that the browser was able to communicate with a given server, but the server could not find what was requested. The error may also be used when a server does not wish to disclose whether it has the requested information.[1]

The website hosting server will typically generate a «404 Not Found» web page when a user attempts to follow a broken or dead link; hence the 404 error is one of the most recognizable errors encountered on the World Wide Web.

English Wikipedia’s 404 Page

Overview

When communicating via HTTP, a server is required to respond to a request, such as a web browser request for a web page, with a numeric response code and an optional, mandatory, or disallowed (based upon the status code) message. In code 404, the first digit indicates a client error, such as a mistyped Uniform Resource Locator (URL). The following two digits indicate the specific error encountered. HTTP’s use of three-digit codes is similar to the use of such codes in earlier protocols such as FTP and NNTP. At the HTTP level, a 404 response code is followed by a human-readable «reason phrase». The HTTP specification suggests the phrase «Not Found»[1] and many web servers by default issue an HTML page that includes both the 404 code and the «Not Found» phrase.

A 404 error is often returned when pages have been moved or deleted. In the first case, it is better to employ URL mapping or URL redirection by returning a 301 Moved Permanently response, which can be configured in most server configuration files, or through URL rewriting; in the second case, a 410 Gone should be returned. Because these two options require special server configuration, most websites do not make use of them.

404 errors should not be confused with DNS errors, which appear when the given URL refers to a server name that does not exist. A 404 error indicates that the server itself was found, but that the server was not able to retrieve the requested page.

Soft 404 errors

Some websites report a «not found» error by returning a standard web page with a «200 OK» response code, falsely reporting that the page loaded properly; this is known as a soft 404. The term «soft 404» was introduced in 2004 by Ziv Bar-Yossef et al.[2]

Soft 404s are problematic for automated methods of discovering whether a link is broken. Some search engines, like Yahoo and Google, use automated processes to detect soft 404s.[3] Soft 404s can occur as a result of configuration errors when using certain HTTP server software, for example with the Apache software, when an Error Document 404 (specified in a .htaccess file) is specified as an absolute path (e.g. http://example.com/error.html) rather than a relative path (/error.html).[4] This can also be done on purpose to force some browsers (like Internet Explorer) to display a customized 404 error message rather than replacing what is served with a browser-specific «friendly» error message (in Internet Explorer, this behavior is triggered when a 404 is served and the received HTML is shorter than a certain length, and can be manually disabled by the user).

There are also «soft 3XX» errors where content is returned with a status 200 but comes from a redirected page, such as when missing pages are redirected to the domain root/home page.

Proxy servers

Some proxy servers generate a 404 error when a 500-range error code would be more correct. If the proxy server is unable to satisfy a request for a page because of a problem with the remote host (such as hostname resolution failures or refused TCP connections), this should be described as a 5xx Internal Server Error, but might deliver a 404 instead. This can confuse programs that expect and act on specific responses, as they can no longer easily distinguish between an absent web server and a missing web page on a web server that is present.

Intentional 404s

In July 2004, the UK telecom provider BT Group deployed the Cleanfeed content blocking system, which returns a 404 error to any request for content identified as potentially illegal by the Internet Watch Foundation.[5] Other ISPs return a HTTP 403 «forbidden» error in the same circumstances.[6] The practice of employing fake 404 errors as a means to conceal censorship has also been reported in Thailand[7] and Tunisia.[8] In Tunisia, where censorship was severe before the 2011 revolution, people became aware of the nature of the fake 404 errors and created an imaginary character named «Ammar 404» who represents «the invisible censor».[9]

Microsoft Internet Server 404 substatus error codes

The webserver software developed by Microsoft, Microsoft’s Internet Information Services (IIS), returns a set of substatus codes with its 404 responses. The substatus codes take the form of decimal numbers appended to the 404 status code. The substatus codes are not officially recognized by IANA and are not returned by non-Microsoft servers.

Substatus codes

Microsoft’s IIS 7.0, IIS 7.5, and IIS 8.0 servers define the following HTTP substatus codes to indicate a more specific cause of a 404 error:

  • 404.0 – Not found.
  • 404.1 – Site Not Found.
  • 404.2 – ISAPI or CGI restriction.
  • 404.3 – MIME type restriction.
  • 404.4 – No handler configured.
  • 404.5 – Denied by request filtering configuration.
  • 404.6 – Verb denied.
  • 404.7 – File extension denied.
  • 404.8 – Hidden namespace.
  • 404.9 – File attribute hidden.
  • 404.10 – Request header too long.
  • 404.11 – Request contains double escape sequence.
  • 404.12 – Request contains high-bit characters.
  • 404.13 – Content length too large.
  • 404.14 – Request URL too long.
  • 404.15 – Query string too long.
  • 404.16 – DAV request sent to the static file handler.
  • 404.17 – Dynamic content mapped to the static file handler via a wildcard MIME mapping.
  • 404.18 – Query string sequence denied.
  • 404.19 – Denied by filtering rule.
  • 404.20 – Too Many URL Segments.

Custom error pages

The Wikimedia 404 message

Web servers can typically be configured to display a customised 404 error page, including a more natural description, the parent site’s branding, and sometimes a site map, a search form or 404-page widget. The protocol level phrase, which is hidden from the user, is rarely customized. Internet Explorer, however, will not display custom pages unless they are larger than 512 bytes, opting instead to display a «friendly» error page.[10] Google Chrome included similar functionality, where the 404 is replaced with alternative suggestions generated by Google algorithms, if the page is under 512 bytes in size.[11] Another problem is that if the page does not provide a favicon, and a separate custom 404-page exists, extra traffic and longer loading times will be generated on every page view.[12][13]

Many organizations use 404 error pages as an opportunity to inject humor into what may otherwise be a serious website. For example, Metro UK shows a polar bear on a skateboard, and the web development agency Left Logic has a simple drawing program.[14] During the 2015 UK general election campaign the main political parties all used their 404 pages to either take aim at political opponents or show relevant policies to potential supporters.[15] In Europe, the NotFound project, created by multiple European organizations including Missing Children Europe and Child Focus, encourages site operators to add a snippet of code to serve customized 404 error pages[16] which provide data about missing children.[17]

While many websites send additional information in a 404 error message—such as a link to the homepage of a website or a search box—some also endeavor to find the correct web page the user wanted. Extensions are available for some content management systems (CMSs) to do this.[18]

Tracking 404 errors

A number of tools exist that crawl through a website to find pages that return 404 status codes. These tools can be helpful in finding links that exist within a particular website. The limitation of these tools is that they only find links within one particular website, and ignore 404s resulting from links on other websites. As a result, these tools miss out on 83% of the 404s on websites.[19] One way around this is to find 404 errors by analyzing external links.[20]

One of the most effective ways to discover 404 errors is by using Google Search Console, Google Analytics or crawling software.

Another common method is tracking traffic to 404 pages using log file analysis.[21] This can be useful to understand more about what 404s users reached on the site. Another method of tracking traffic to 404 pages is using JavaScript-based traffic tracking tools.[22]

See also

  • Blue screen of death
  • Funky caching
  • Link rot
  • List of HTTP status codes

References

  1. ^ a b Fielding, R.; Reschke, J. (June 2014). Fielding, R; Reschke, J (eds.). «RFC 7231, HTTP/1.1 Semantics and Content, Section 6.5.4 404 Not Found». ietf.org. doi:10.17487/RFC7231. S2CID 14399078. Retrieved 13 December 2018.
  2. ^ Ziv Bar-Yossef; Andrei Z. Broder; Ravi Kumar; Andrew Tompkins (2004). Sic Transit Gloria Telae: Towards an Understanding of the Web’s Decay. Proceedings of the 13th International Conference on World Wide Web (WWW). pp. 328–337. doi:10.1145/988672.988716. ISBN 978-1581138443. S2CID 587547.
  3. ^ «Why is your crawler asking for strange URLs that have never existed on my site?». Yahoo Ysearch Help page. Archived from the original on 15 July 2014. Retrieved 4 September 2013.
  4. ^ «Farewell to soft 404s». Google Official Blog. Retrieved 20 September 2008.
  5. ^ «LINX Public Affairs » Cleanfeed: the facts». Publicaffairs.linx.net. 10 September 2004. Archived from the original on 13 May 2011. Retrieved 6 March 2011.
  6. ^ «DEMON – Error 403». Retrieved 14 June 2012.
  7. ^ Sambandaraksa, Don (18 February 2009). «The old fake ‘404 Not Found’ routine — Dead link». Bangkok Post. Retrieved 12 September 2010.
  8. ^ Noman, Helmi (12 September 2008). «Tunisian journalist sues government agency for blocking Facebook, claims damage for the use of 404 error message instead of 403». Open Net Initiative. Retrieved 21 November 2010.
  9. ^ «Anti-censorship movement in Tunisia: creativity, courage and hope!». Global Voices Advocacy. 27 May 2010. Retrieved 28 August 2010.
  10. ^ «Friendly HTTP Error Pages». msdn.com. 18 August 2010. Archived from the original on 2 December 2010. Retrieved 14 June 2012.
  11. ^ «Issue 1695: Chrome needs option to turn off «Friendly 404″ displays». bugs.chromium.org. Retrieved 25 December 2021.
  12. ^ Heng, Christopher (7 September 2008). «What is Favicon.ico and How to Create a Favicon Icon for Your Website». The Site Wizard. Retrieved 23 February 2011.
  13. ^ «The Dastardly «favicon.ico not found» Error». Internet Folks. 3 August 1999.
  14. ^ «From skateboarding bears to missing children: The power of the 404 Not Found error page». Metro. 6 June 2011. Retrieved 16 April 2013.
  15. ^ «The political Page 404 war». BBC Newsbeat. 27 April 2015. Retrieved 18 May 2018.
  16. ^ «Notfound.org». notfound. notfound. Archived from the original on 2 September 2014.
  17. ^ «Missing children messages go on 404 error pages». BBC News. 27 September 2012. Retrieved 20 September 2014.
  18. ^ Swenson, Sahala (19 August 2008). «Make your 404 pages more useful». Official Google Webmaster Central Blog. Google, Inc. Retrieved 28 August 2009.
  19. ^ «Sources Leading To 404s». SpringTrax. Retrieved 11 February 2013.
  20. ^ Cushing, Anne (2 April 2013). «A Data-Centric Approach To Identifying 404 Pages Worth Saving». Search Engine Land. Retrieved 7 June 2013.
  21. ^ «Tracking and Preventing 404 Errors». 404errorpages.com. Retrieved 7 June 2013.
  22. ^ «Understand 404 Errors». SpringTrax.com. Retrieved 7 June 2013.

External links

  • A More Useful 404
  • 404 Not Found of the Hypertext Transfer Protocol (HTTP/1.1): Semantics and Content specification, at the Internet Engineering Task Force
  • ErrorDocument Directive – instructions on custom error pages for the Apache 2.0 web server
  • 404: Not Found – an award-winning song about the error code

Ошибка 404 Page Not Found преследует экраны компьютеров по всему миру на протяжении десятилетий. И хотя многие пользователи до сих пор не знают, почему она возникает, «последняя страница Интернета» за последние тридцать лет появлялась так часто, что проложила себе путь в поп-культуру как городская легенда.

Мы не осознаём этого, но подобная ошибка встречается довольно часто, поскольку большинство сайтов каждый день сталкиваются с новыми неработающими ссылками. Более того, веб-страницы, созданные до 2005 года, постоянно «умирают». Следовательно, мы можем только гадать, сколько надгробий с надписью 404 Page Not Found существует на онлайн-кладбище.

Сегодня 404 является мощным символом, который используют во всём мире для освещения чего-либо неизвестного.

Что такое 404 Page Not Found?

Мы все с ней сталкивались, но как возникает эта ошибка? 404 – это код состояния HTTP. Когда пользователь посещает веб-страницу, устройство запрашивает данные с сервера с помощью HTTP — протокола прикладного уровня передачи данных.

После этого колёса и шестерёнки всемирной паутины начинают двигаться, и мы осознаём, что всё в Интернете связано с обменом данными quid pro quo (одна передача зависит от другой). Перед тем как отобразить страницу, веб-сервер отправляет HTTP-заголовок с кодом состояния, и наш браузер отвечает взаимностью, отправляя свои заголовки. Если всё нормально, статус обмена данными считывается нормально:

«200 ОК».

«Запрос выполнен успешно».

Мы не видим этого, поскольку сервер отправляет содержимое страницы. Код выдаёт, если происходит ошибка.

«404 Not Found».

Такое случается, когда запрашиваемая страница больше не существует. Эта ошибка довольно распространена и может возникнуть на любом веб-сайте.

Развенчание мифа о комнате 404

В период с 1981 по 1992 год, работая в ЦЕРНе, изобретатель всемирной паутины Тим Бернерс-Ли и его помощник Роберт Кайо создали новую систему просмотра и распространения информации на основе гипертекста. Им приходилось отвечать на различные запросы, выделяя файлы и передавая их по сети, и делали они это вручную.

Вскоре они стали настолько перегруженными, что не могли отвечать на все запросы, отправляемые через сеть. Пользователи, которых стало слишком много, вводили неправильные данные и в конечном итоге отправляли не те названия файлов.

Поскольку одни и те же проблемы возникали постоянно, учёные обновили систему, придумав сообщение для тех, кто отправлял запросы с неправильными названиями файлов. Оно выглядело следующим образом:

«Room 404: file not found».

Сообщение стало популярным. В 1992 году Консорциум Всемирной паутины ввёл коды состояния HTTP, которые были разработаны ещё в 1990 году.

Тим и Роберт работали вместе в офисе на четвёртом этаже здания. Там же, в комнате под номером 404, располагалась центральная база данных всемирной паутины с первыми веб-серверами.

«Первый веб-сайт в ЦЕРНе – и в мире – был посвящён самому проекту всемирной паутины (World Wide Web) и размещался на компьютере NeXT Бернерса-Ли. В 2013 году ЦЕРН запустил проект по восстановлению первого в истории веб-сайта: info.cern.ch».

Роберт Кайо развенчал миф о том, что ошибка 404 была названа в честь серверной комнаты в ЦЕРНе. На четвёртом этаже не было комнаты с номером 404.

Как ни странно, в здании «4» нет комнаты «04», офисы начинаются с 410-го — не спрашивайте, почему. Извините, что разочаровываем вас, но в ЦЕРНе нет комнаты 404 — её просто не существует, и уж точно не она была «местом, где зародилась паутина».

Роберт Кайо подтвердил это во время интервью: «Цифра 404 никогда не была связана с какой-либо комнатой или физическим местоположением в ЦЕРНе. Это самый настоящий миф».

Когда его спросили об одержимости людей термином 404, Кайо ответил: «Вероятно, это связано с иррациональностью, отрицанием очевидного и ухода от реальности, что весьма характерно для людей».

Разгадка тайны 404

Таким образом, ошибка 404 стала Интернет-загадкой и нигилистическим парадоксом. Тем не менее, скорее случайно, чем преднамеренно, нам, возможно, удалось найти ответ. Дело в том, что любители городских легенд и разрушители мифов искали разгадку не в той комнате в ЦЕРНе.

Рейсы 404

Код 404 появился ещё тогда, когда Интернет только зарождался. Тим Бернерс-Ли изобрёл всемирную паутину (WWW) в 1989 году, и именно в тот год произошла первая трагедия с участием самолёта, выполнявшего рейс 404.

Рейс 404 Pakistan International Airlines

Рейс PK404 исчез почти сразу же после взлёта 25 августа 1989 года. Самолёт Fokker F27 Friendship поднялся в небо в Гилгите (Пакистан) в 7:35, он держал курс на столицу Исламабад.

В 7:40 пилоты вышли на связь. Затем самолёт исчез с радаров. Эксперты полагают, что он разбился в Гималаях, однако до сих пор не было обнаружено никаких обломков. Рейс 404 исчез бесследно.

Можете себе представить, сколько раз Тим Бернерс-Ли и Роберт Кайо слышали об этом в новостях. У них могла неосознанно отложиться в памяти фраза «404-й не найден».

Рейс 404 авиакомпании Alitalia

Рейс 404 авиакомпании Alitalia был международным пассажирским рейсом, который 14 ноября 1990 года направлялся из аэропорта Линате в Милане, Италия, в аэропорт Цюриха в Швейцарии, и потерпел крушение. Самолёт Douglas DC-9–32 компании Alitali, приближаясь к аэропорту Цюриха, упал в лесах Вайаха, убив всех 46 человек, находившихся на борту.

Между Вайахом и местом рождения Интернета в ЦЕРНЕ всего около 240 километров. Новостные каналы, вероятно, связали трагедию с рейсом PK404. Следовательно, мы можем предположить, что цифра 404 снова засела в подсознании каждого.

Заключение

Оглядываясь на историю Интернета, мы видим, что сочетание неблагоприятных обстоятельств, известных как «идеальный шторм», породило ошибку 404. Удивительно, почему до сих пор никто не соединил следующие точки:

* Август 1989 года – рейс PK404 исчезает вскоре после взлёта.

* Октябрь 1990 года – Тим Бернерс-Ли начинает писать код для клиентской программы, браузера/редактора, который он называет World Wide Web, на своём новом компьютере NeXT.

* Ноябрь 1990 года – рейс Alitalia 404 терпит крушение в Швейцарии.

* Декабрь 1990 года – появляется первый веб-сайт, nxoc01.cern.ch.

Тим Бернерс-Ли и Роберт Кайо молчат об истинном происхождении сообщения «404 not found». Однако они могут даже не подозревать о подсознательных нюансах «404». Следовательно, ошибка продолжит пугать пользователей сети как «тупиковая страница Интернета».

4.04 все причастные ко всемирной паутине, и веб-мастеры в частности отмечают день Интернета (День святого Исидора Севильского — покровителя сети).

В этот день хочется поздравить всех, причастных к функционированию данной инфраструктуры, без которой многие уже и не представляют современное общество.

Не стану перечислять того множества профессий, которое трудится на благо Сети, ибо для простого обывателя мы по прежнему остаемся «компьютерщиками».

Хочется просто остановиться на историях возникновения данного сообщения(официальных, альтернативных, своих).

Причастные наверняка в курсе, что 404 — это код состояния из трех цифр, корнями уходящий в лихие 90-е.

Версия HTTP 0.9, которая появилась в 1992 году, включала в себя коды состояния из трёх цифр.
Первая обозначала вид сообщения: 1 — информационное, 2 — успех, 3 — перенаправление, 4 — ошибка клиента, 5 — ошибка сервера.

Вторая цифра обозначала подгруппу сообщений, третья — конкретное сообщение в этой группе.
Коды вроде 200 («хорошо») и 304 («не изменилось») мы никогда не видим, потому что вместо этих цифр браузеры отображают содержимое страниц.

А вот ошибка 404 («не найдено») хорошо всем известна.

С ней сталкивался любой пользователь, кто неправильно вводил адрес страницы в строку браузера или переходил по ссылке на несуществующую страницу.

Но это скучная официальная версия.

С ошибкой 404 связана городская легенда.

Якобы в своё время в офисе CERN на четвёртом этаже была комната 404, где находился центральный сервер.

Там сидели несколько человек, которые вручную обрабатывали приходившие запросы.
Если запрос был ошибочным, то появлялось сообщение «Room 404: file not found».

В память о героях, работавших до поздней ночи в стенах CERN, 404-я комната сохранилась как «место Web».

Ни одна другая комната больше не используется для WWW.

Я решил тоже попрактиковаться на литературной стезе и сначала получилось следующее:

В огромном машинном зале вычислительного центра все было подчинено строгому порядку.
И вот в 40 ряду четвертым с краю (запомните эти цифры!) трудился скромный веб-сервер.
Он работал настолько хорошо (uptime 99.99%), что на него просто перестали обращать внимание.
Соседним машинам добавляли памяти, объединяли в кластера и увеличивали емкость жестких дисков, а маленькому серверу не доставалось ничего.

Но он не обижался, а продолжал честно выполнять свою работу, хотя и запоминал все апгрейды, которые делались компьютерам в машинном зале.

И вот, когда 403 разом была замена подающего лотка у принтера, маленькому серверу стало действительно обидно.

Он так разволновался, что даже поднялась температура процессора(запомните этот факт)!
И вот, дабы обратить на себя внимание, он решил подать Людям весточку о себе, но единственное, что он знал — это свой номер и номер ряда!

Поэтому, на все приходящие запросы стал отвечать сообщением — 40 ряд, 4 сервер, либо просто 404, ибо машина что стояла слева красовалась номером 403(и новым модулем памяти), а машина справа была под номером 405, и всем хвалилась новым массивом RAID.

Сообщение родилось совершенно бесполым, но у дежурной смены в тот день было плохое настроение, и они нарекли его ошибкой!

Так маленький сервер получил новый процессор, а сообщение — пол.

По совершенно случайному стечению обстоятельств все это произошло 4 апреля, а как мы знаем рожденные под знаком Овна имеют весьма норовливый характер.

Вот так и бродит теперь по веб-серверам Ошибка 404, требуя дать ей имя и отменить позорный статус, но администраторы почему-то бросаются искать проблему в железе/cофте.

Итак, отныне нарекаю сообщение 404 Наташей, Наталкою или просто Nata!

Но как Вы могли заметить, заглавие украшает совсем другая барышня, а следовательно должен «выстрелить» и другой вариант.

В тридесятом царстве, в тридевятом государстве, нет, не то… Давным-давно в далекой Галактике, снова не так …

Дело было в те самые 90-е годы когда пронхаб-а и в помине не было, а сотрудники организации CERN только работали над разработкой стандарта HTTP.
Так вот, пикантные фото в цифровом виде блуждали просторами FIDO и BBS-ок даже тогда.
При этом модемы 4800 Бит! заметьте в секунду считались весьма неплохим вариантом.

В общем, все мы люди, и сотрудники вышеуказанной организации — тоже, а потому складывали «малинку» в папку с именем 404.

При этом ссылкой делились с менее занятыми коллегами, а дабы не палиться перед начальством и была придумана данная ошибка — page not found!

Кстати, Ошибка 404 означает, что запрашиваемый ресурс может быть доступен в будущем, что однако не гарантирует наличие прежнего содержания.

Данная формулировка косвенно подтверждает последнюю версию.

В завершение, хочу пожелать всем поменьше видеть сообщение 404 на своих экранах!

С уважением, Электропчеловод Андрей

В статье рассказывается:

  1. Как появился код ошибки 404
  2. Что означает ошибка 404
  3. Как ошибка 404 влияет на индексирование сайта
  4. Как найти ошибку 404
  5. Как найти ошибку 404 с помощью GTM (Google Tag Manager)
  6. Как работать в WordPress с ошибкой 404
  7. Как настроить ошибку 404 на других движках
  8. Скучная ошибка 404: что делать, чтобы исправить ситуацию
  9. 5 советов, как сделать ошибку 404 полезной
  10. Как учесть поведенческие факторы при настройке отображения ошибки 404
  11. Примеры оригинального, креативного оформления страниц с ошибкой 404

Если пользователь попадет к вам на сайт и увидит надпись «ошибка 404» с сообщением «страница не найдена», то, скорее всего, сразу же уйдет. Однако посетителя нужно удержать, убедить перейти на другие страницы ресурса. Особенно это важно для недавно созданных сайтов, для которых ценен каждый посетитель. Что значит «ошибка 404», почему она возникает, как уменьшить число потерянных пользователей, и как лучше оформить страницу с этой ошибкой 404, чтобы она не превратилась в тупик для гостей сайта? Об этом читайте в нашем материале.

Ошибка 404

До всемирного распространения веб-паутины она не была глобальной. Протоколы, используемые в ней сегодня, разработали в 80-х и 90-х гг. в CERN. Тим Бернерс-Ли, изобретатель протокола HTTP, самого известного из них, создал его на основе файлового протокола FTP. Также Бернерс-Ли придумал и разработал URI, URL, HTML и, конечно, WWW в целом. Эти аббревиатуры знакомы любому интернет-пользователю.

В версии HTTP 0.9, вышедшей в 1992 году, содержались коды состояния из трех цифр. Первая означала вид сообщения: 1 было информационным, 2 — успех, 3 — перенаправление, 4 говорило о клиентской ошибке, 5 — об ошибке сервера. Вторая цифра обозначала подгруппу сообщений, третья — конкретное сообщение в данной группе.

Коды типа 200 («хорошо») и 304 («не изменилось») мы никогда не видим, поскольку браузеры отображают не эти значения, а контент на страницах. А вот ошибка 404 «сервер не найден» знакома всем. Ее видел, пожалуй, любой пользователь, когда неправильно вводил адрес страницы в браузерную строку или, кликая по ссылке, переходил на страницу, которой нет.

С ошибкой 404 связан один миф. Согласно ему, в офисе СERN на четвертом этаже находилась комната 404 с центральным сервером. Там работало несколько сотрудников компании, в обязанности которых входила ручная обработка запросов. Если в запросе была ошибка, всплывало сообщение: «Room 404: file not found». Этот миф стал неотъемлемой частью интернет-фольклора. Она часто используется в сленге, по поводу нее шутят веб-дизайнеры.

По словам Тима Бернерса-Ли, изобретателя HTTP, никакой комнаты на четвертом этаже в офисе не было. В CERN нумерация комнат иная: первая цифра означает номер здания, две другие — номер комнаты. Но в здании № 4 нет комнаты 04. Отсчет там стартует с 410 и идет по нарастающей. «Не интересуйтесь, почему именно так», — говорит Бернерс-Ли.

Ошибка 404

Итак, при переходе выдается ошибка 404: «страница не найдена». Как исправить ситуацию? Чтобы лучше понять этот вопрос и разобраться со служебными файлами на сайте, нужно изучить тему гипертекстового представления страниц при помощи языка HTML (HyperText Markup Language — «язык гипертекстовой разметки») и HTTP-протокол, через который осуществляется доступ. Несмотря на то, что придется разбираться в языке программирования, форма его представления элементарна, а потому понятна любому человеку.

Интернет появился в тот момент, когда английский инженер Тимоти Джон Бернерс-Ли придумал представлять текстовые страницы в сети в формате гипертекста и описал принцип доступа к ним по прикладному протоколу HTTP. Общая идея предполагает, что юзер со своего устройства, в частности с браузера, делает сетевой запрос на конкретный ресурс. В это время открывается сессия на сервере, куда он старается попасть. В качестве ответа возвращается HTML-страница.

Конечно, сегодня используются более сложные алгоритмы доступа и «подкачки» страниц больших размеров. Но общая схема не меняется. Чтобы оказаться на определенном сайте, у пользователя должно быть доменное имя и IP-адрес. Только при условии выполнения этих правил и пребывания ресурса в рабочем состоянии «error 404 not found» будет возвращаться на отсутствующий документ.

Ошибка 404

Иначе говоря, ошибка 404 на сайте — это код состояния http, свидетельствующий о том, что связаться с сервером удалось, но нужная страница на нем отсутствует. Такое случается, если ресурс, на который вы желаете зайти, не функционирует или к нему больше нет доступа.

Ссылки, ведущие в никуда, называют «мертвыми» или «сломанными». Код состояния HTTP 404 нередко называют «ошибка 404», «HTTP 404» или «код 404».

Чаще всего такое сообщение появляется в связи с тем, что содержимое ресурса удалили или переместили на новый URL-адрес. Но появление «404: Page Not Found» можно объяснить и иначе:

  1. URL-адрес сайта или его содержимое переместили или полностью удалили (не откорректировав внутренние ссылки).

  2. URL-адрес с самого начала был написан с ошибками (при разработке или реконструкции сайта), обозначен неверно или введен в браузерную строку поиска неправильно.

  3. Сервер, связанный с веб-сайтом, временно не отвечает, или соединение прервано.

  4. Преобразовать запрашиваемое доменное имя в IP-адрес сайта при помощи DNS-сервера (системы доменных имен) не представляется возможным.

  5. Введенного доменного имени больше нет.

Неактивные ссылки могут находиться в интернет-пространстве довольно долго, поскольку операторы не успевают следить за перемещением, удалением сайтов и их контента. Поэтому многие удаленные или перемещенные на другие URL-адреса ресурсы, как и ранее, видны в поисковой выдаче, но попасть на них больше нельзя (по крайней мере, невозможно пройти по введенному URL-адресу).

Критики считают, что сообщение «ошибка 404» идет вразрез с правилами этикета, поскольку не каждый юзер сразу понимает, что это не он ее допустил. В этом есть рациональное зерно, поскольку существует 68 http-сообщений и большинство из них можно трактовать однозначно.

Итак, перед юзером возникла 404 ошибка. Проверить он, в первую очередь, хочет адресную строку, делая повторный запрос. Если ситуация не меняется, значит, нужно попробовать через какое-то время снова. Если URL-адрес корректный, лучше проверить страницу позднее. Не исключено, что неполадки вызваны сильной загрузкой сайта или работой сервера.

Ошибка 404

Если же вы знаете содержимое страницы, то используйте поиск и попытайтесь найти ее по другому адресу. Если все получилось, значит, администратор не добавил перенаправление 301 на новый адрес.

Иными словами, страницы, которые видны в Интернете, не генерируются вашим ПК. Чаще всего это страницы сервера, с которыми вы стараетесь связаться. Множество сайтов разрабатывают свои страницы 404 по собственному дизайну и предназначают их для размещения разных данных, например контактной информации, а также для перенаправления на целевую страницу.

Как ошибка 404 влияет на индексирование сайта

Некоторые считают, что от ошибок 404 ухудшаются позиции сайта в поисковой выдаче или его индексирование. Как правило, это мнение ошибочно.

Что происходит со страницей, когда ее находит робот? Он удаляет ее из индекса (если она там есть; если нет, то просто не сканирует). Это вполне логично, так как там отсутствует информация и страница не несет никакой пользы.

Следует помнить и о «мягких» ошибках. SOFT 404 не является официальным ответом сервера. Скорее, это ярлык, который поисковики вешают на страницы после обхода.

Ошибка 404

Почему поисковые системы решили, что с этими страницами что-то не так, в чем проблема?

  1. На них мало контента, или он вовсе отсутствует (по мнению Google, страница может быть 404, по мнению «Яндекса», — некачественной).

  2. Редирект настроен на страницу, не отвечающую пользовательским запросам.

  3. Несуществующая страница выдает ответ сервера не 404 или 410.

Нередко при диагностике страниц сайта можно выявить 404, закрытую от индексации в файле robots.txt. В этом случае все ссылки на мертвые страницы (и URL с ошибками) перенаправляются при помощи 302 редиректа на специально созданную страницу.

Ошибка 404

302 редирект сообщает поисковикам, что страница временно располагается по другому адресу. Поэтому в индексе такие страницы сохраняются. То есть из-за роботов вы теряете время, поскольку они снова и снова обходят страницы. Кроме того, вы заставляете их чувствовать свою некомпетентность, поскольку они ведут юзеров к нерелевантным страницам.

Итак, страница удалена. Что дальше? Настраивать 404 ответ сервера или 301 редирект?

В каждом случае все индивидуально. Способ, эффективный для интернет-магазина, для портала услуг или другой торговой площадки, может не дать результатов.

Ошибка 404

Необходимо настроить 404 ответ сервера, если в силу каких-либо обстоятельств страница полностью удалена с ресурса.

301 редирект более уместен, чем 404, если:

  • поменялся адрес страницы (допустим, изменилась структура);

  • страница релевантна пользовательскому запросу;

  • возможно перенаправление к другой странице с подобным содержанием (одной темы или с карточки продукции на каталог);

  • есть внешние ссылки на страницу.

Кейс: VT-metall

Узнай как мы снизили стоимость привлечения заявки в 13 раз для металлообрабатывающей компании в Москве

Узнать как

301 перенаправление на основную страницу — не лучшее решение и для юзеров (они не поймут, что к чему), и для SEO (к примеру, Googlebot расценит их как SOFT 404).

Как найти ошибку 404

Когда, обходя сайт, поисковые роботы сообщают об обнаружении 10–20 ошибок, это одна ситуация. А если ежедневно этот показатель растет, исчисляясь сотнями тысяч? Срочно вмешиваться и решать проблему нужно, если число 404 ошибок превысило 10 % от общего числа страниц на сайте.

Почему несуществующих страниц может быть так много? Причин немало. Но, как правило, такие ситуации происходят из-за ошибок в коде (допустим, эти страницы могут формироваться при помощи скрипта и стилей, если стили находятся в коде шаблона, а не в самостоятельном файле).

Ошибка 404

Еще одна причина обхода мертвых страниц роботами — результаты вирусной атаки (к примеру, размещение дорвеев на сайте). Даже после предупреждения атаки и удаления дора роботы какое-то время стараются обходить созданные страницы. Из-за этого может возникнуть множество 404 ошибок.

Различные сервисы без особых трудностей позволяют контролировать переходы по таким ссылкам.

Для отслеживания переходов юзеров на 404 страницу применяют инструменты:

  1. «Яндекс.Метрика»

    С помощью «Параметров визитов» в «Яндекс.Метрике» вы можете отслеживать переходы юзеров по ссылкам. Необходимо лишь поместить в код счетчика строчку «params:window.yaParams||{ }});».

    В любое место непосредственно 404 страницы следует вписать такой JS-код:

    <script>

    var url = document.location.pathname + document.location.search

    var url_referrer = document.referrer;

    var yaParams = {error404: {page: url, from: url_referrer}};

    </script>

    где url является текущим адресом 404 страницы, а url_referrer — адресом, с которого пришли. Код позволяет отслеживать как мертвые ссылки, так и страницы, на которых они вписаны.

  2. Google Analytics

    Для отслеживания переходов на 404 страницу нужно вписать такой код:

    <script>

    ga(‘send’, ‘pageview’, ‘404.html?page=’+ document.location.pathname + document.location.search +’&from=’ + document.referrer);

    </script>

    где document.location.pathname + document.location.search – URL страницы, которая отсутствует на сайте; document.referrer – URL страницы, с которой юзер перешел на 404 страницу.

  3. «Яндекс.Вебмастер» и Google Search Console

    Узнать о 404 ошибках, на которые натыкаются поисковые роботы, позволяют инструменты для веб-мастеров.

    • «Яндекс.Вебмастер»

    Чтобы просмотреть страницы, зайдите в раздел «Индексирование» — «Страницы в поиске» — «Исключенные страницы». Для выделения страниц с нужной ошибкой используют фильтр по статусу «ошибка HTTP: 404».

    • Google Search Console

    Для выявления ошибок используют «Сканирование» — «Ошибки сканирования» — «Ошибка 404».

  4. Инструменты для сканирования сайта на наличие битых ссылок

    Приведенные ниже сервисы помогают изучить интернет-ресурс и выявить на нем неактивные ссылки:

    • Screaming Frog SEO Spider Tool

    После анализа всего сайта во вкладке «Response Code» появляются страницы с 4хх и 5хх ошибками и документы с размещенными там ссылками. Единственный недостаток сервиса — платное использование.

    Но есть и бесплатные инструменты для проверки мертвых ссылок:

    • Netpeak Spider,

    • Xenu’s Link Sleuth,

    • Siteliner,

    • WildShark SEO Spider,

    • Webbee SEO Spider Tool.

    Для проверки ответа сервера страниц из карты сайта используют Map Broker XML Sitemap Validator.

Как найти ошибку 404 с помощью GTM (Google Tag Manager)

Ошибка 404

Перед тем как настроить отслеживание 404 ошибок, нужно удостовериться, что на ресурсе корректно установлен контейнер GTM и через него встроен Google Analytics.

Шаг 1. Создайте переменную

Здесь необходимо действовать по следующему алгоритму:

  1. Перейти по ссылке «Переменные» на панели навигации.

  2. В разделе «Пользовательские переменные» нажать на кнопку «Создать».

  3. Придумать, как будет называться переменная.

  4. В примере переменная называется Http Request. Если придумаете другое название, измените наименование и в коде следующей переменной.

  5. Выберите вид переменной — «Собственный код JavaScript».

  6. Вставьте такой JavaScript-код:

function getReq(){

var req = false;

if (window.XMLHttpRequest) {

try {

req = new XMLHttpRequest();

} catch (e) {

req = false;

}

} else if (window.ActiveXObject){

try {

req = new ActiveXObject(‘Microsoft.XMLHTTP’);

} catch (e) {

req = false;

}

}

if (!req){}

return req;

}

Ошибка 404

Шаг 2. Создайте еще одну переменную

Вторая переменная будет обращаться к первой и отдавать код ответа сервера.

Для этого следует действовать так же, как и при создании первой переменной. Но название должно быть другим (в примере вторую переменную назвали «Код ответа сервера»). Вставляется такой JavaScript-код:

function() {

var req = {{Http Request}};

try {

req.open(‘GET’, ‘{{Page URL}}’, false);

req.send(»);

} catch (e) {

success = false;

error_msg = «Error: » + e;

}

return req.status;

}

Ошибка 404

Шаг 3. Создайте триггер с такими параметрами:

  1. Тип триггера: «Просмотр страницы».

  2. Условия активации: «Некоторые просмотры страниц».

  3. Условие, при котором должен активироваться триггер: в коде ответа сервера содержится 404.

Ошибка 404

Создайте тег с такими параметрами:

  1. Тип тега: «Universal Analytics».

  2. Тип отслеживания: Событие.

  3. Категория: в нашем случае «error 404».

  4. Действие: необходимо выбрать значение {{Page URL}}, чтобы увидеть, на какой странице сработало событие.

  5. Триггер активации: триггер, созданный на предыдущем этапе.

Ошибка 404

Шаг 5. Проверьте и опубликуйте тег

Открыв режим предварительного просмотра, перейдите на несуществующую страницу на сайте. Если при нажатии кнопки контейнер в консоли отобразится под строчкой «Tags Fired On This Page», значит, тег установлен правильно.

Ошибка 404

После того как вы увидите, что тег настроен без ошибок, настройте отслеживание цели в Google Analytics.

Для этого нужно создать и настроить новую цель в Google Analytics. Сведения, которые вы указывали, настраивая тег в GTM, повторите и при настройке цели в Google Analytics.

Ошибка 404

Шаг 6. Проверьте, все ли вы сделали правильно

Можете считать, что цель достигнута, если удастся перейти на несуществующую страницу на сайте. Перейдите по ней и посмотрите событие в Google Analytics. Для этого необходимо перейти в «Отчеты» — «В режиме реального времени» — «События».

Ошибка 404

По такой схеме нам удалось настроить отслеживание 404 ошибок, не вмешавшись в исходный код страниц.

Как работать в WordPress с ошибкой 404

Ошибка 404

Как правило, ошибка браузера 404 появляется в случае перемещения или удаления страницы на интернет-ресурсе. Если мы говорим о WordPress, то некоторые баги приводят к тому, что постоянные ссылки ведут на 404 страницу.

Постоянные ссылки — это URL-адреса, которые генерируются для указания существующих записей, категорий и списков по тегам. Другие юзеры могут пользоваться этими ссылками, чтобы указывать на ваши записи в своих в текстовых материалах. Если ссылка связана с отдельной записью, считается, что такой URL-адрес постоянный, а не динамический (меняющийся).

Ссылки в WordPress бывают трех видов. Это ссылки по умолчанию Default, mod_rewrite и PATHINFO. Форматирование ссылок первого вида производится в соответствии с настройками актуальной WordPress и действуют во всех серверных средах. Этот формат выглядит так: http://X.com/?p=N rel=»nofollow», где N – порядковое число. Изящным его нельзя назвать, зато он прекрасно справляется со своей задачей. 

Ссылки mod_rewrite выглядят так: http://X.com/yyyy/mm/dd/post-name/ rel=»nofollow». Это постоянные ссылки, которым необходим модуль mod_rewrite на Apache и которые не работают на других серверах. 

Вид постоянных ссылок PATHINFO следующий: http://X.com/index.php/yyyy/mm/dd/postname/ rel=»nofollow». Они работают на всех типах серверов, кроме Apache. 

При переходе к постоянным ссылкам на сайте могут возникать проблемы. Так, если на сервере есть модуль Frontpage Extensions, то такие ссылки неактивны до внесения необходимых коррективов. Если в модуле нет потребности, лучше отключить его. До тех пор, пока вы этого не сделаете, любые настройки в панели управления WordPress вызовут повреждение данного модуля, поскольку он взаимодействует с файлом htaccess.

Есть проблема, связанная с обрезкой ссылок по длине. Из-за этого возникают 404 ошибки. И случается это не потому, что в ссылке содержатся неправильные значения, вопреки распространенному мнению.

С этой проблемой можно справиться, если добавить в файл .htaccess строку:

1RewriteRule ^post/([0-9]+)?/?([0-9]+)?/?$ /index.php?p=& page= [QSA]

Также можно сформировать URL-адреса, заключив их в угловые скобки. В этом случае большая часть почтовых и иных программ, с которыми возникают сложности, не станут обрезать протяженные URL-адреса.

Еще один важный момент: если вы не пользуетесь сервером Apache xampp, то и постоянные ссылки не будут работать вплоть до внесения необходимых исправлений и настроек.

Каждый раз, когда WordPress выявляет, что не удается найти страницу, ядро движка проверяет два файла: 404.php и index.php. Если становится ясно, что у активной темы — шаблон 404.php, то сайт его отображает. Если страницу 404.php найти не удается, движок направляет на index.php и выполняет инструкции в конце цикла, которые сообщают ему о порядке действий в случае, если контент страницы не удается обнаружить.

Ошибка 404

В большей части тем для WordPress есть шаблон 404.php. Вы можете взглянуть на шаблон своей темы, пройдя по адресу wp-content/themes/active-theme. Если предстоит работать со страницей 404 на WordPress, то начать следует с 404.php.

Как правило, на странице 404, поставляемой с вашей темой, указано нечто обобщенное. Также предусмотрена возможность применить поиск, чтобы найти необходимую страницу по заголовку или другие подобные страницы. Можете добавить ссылки на карту и другие страницы сайта, если нужно.

Как настроить ошибку 404 на других движках

Ошибка 404По мнению многих администраторов, страница 404 по умолчанию выглядит непрезентабельно, а потому не может вызвать интерес к интернет-площадке. Администраторы считают, что нужно персонализировать эту страницу. Обычно есть возможность настроить страницу так, чтобы она была интересной, сообщала пользователю, где именно произошли сбои, какая возникла проблема, выдавала в качестве альтернативы ссылки на другие страницы, например домашнюю страницу, карту сайта и поиск.

Создание пользовательской страницы для 404 ошибки — задача простая. Самый легкий способ удержать юзеров — направить их на домашнюю страницу или карту сайта. Для этого в файл .thaccess помещают строку:

1ErrorDocument

404

/sitemap.html

Это перенаправит страницу 404 на карту сайта. Если у вас другой адрес, обозначьте свой.

Целевая страница, которую вы планируете отобразить, должна находиться на сервере. В противном случае перенаправление превратится в бесконечный процесс.

Укажите полный путь к странице относительно корневого каталога учетной записи (символ / в самом начале имени файла или каталога указывает положение относительно корневой папки).

Для создания персональной страницы для 404 ошибки нужно открыть новую страницу в используемом редакторе, например MS FrontPage или DreamWeaver. На этой странице может быть размещено абсолютно все, к примеру картинки, ссылки и пр.

Далее нужно сохранить файл с запоминающимся названием, допустим 404errors.html, а потом создать каталог прямо в папке public_html, задать имя error и разместить в нем файлы.

Затем добавить в .htaccess эту строчку:

1ErrorDocument 404

/error/404errors.html

Отныне всякий раз, когда сайт будет генерировать 404 ошибку, юзеры будут видеть пользовательскую страницу и переходить через нее на полезные ссылки, использовать поиск и т. д.

Скучная ошибка 404: что делать, чтобы исправить ситуацию

Итак, мы поняли, ошибка 404 — что это. Как исправить ее? Нередко на многих ресурсах страница 404 выглядит очень просто, по всем параметрам напоминая стандартный шаблон. Конечно, если сайт деловой или же является «лицом» серьезной компании, в строгости и лаконичности нет ничего плохого.

Ошибка 404

Но для мультимедийных площадок, близких к развлекательным, это не годится. Страницу 404 нужно оформлять с юмором, креативно. Это удержит внимание посетителя — следовательно, он дольше останется на ресурсе и сформирует о нем положительное впечатление.

Хороший вариант — разместить на странице с 404 ошибкой какую-нибудь ценную информацию. Не нужно указывать примитивное «error 404 not found».

Можно сослаться на другие информационные источники со схожей тематикой или предложить пользователю альтернативы. Если не хотите делать рекламу сторонним сайтам, ссылайтесь на другие страницы своей же площадки.

Очень важно указать данные главной страницы ресурса вместе с ее координатами.

Еще хороший вариант — рассказать пользователям, как убрать ошибку 404. Это может вызвать у них интерес и заставить их задержаться на сайте.

Пользуйтесь полем для поиска как инструментом привлечения пользователей. Использование такой схемы позволит проще работать с сайтом, и он станет еще более функциональным и информативным для посетителей.

То есть человек, зашедший на страницу с 404 ошибкой, сможет ввести в строке поиска желаемый ключевой запрос и не покинет ваш сайт.

Следующий этап оформления страницы 404 — добавление функции отправки отчета об ошибке. Это полезно как для гостя сайта, которого волнуют причины сбоя, так и для владельца —ему будет легче понять, какие технические проблемы возникают на ресурсе.

Вот как должна выглядеть 404 страница:

НЕТ ДА

Она не должна отдавать код сервера «200 ОК» и, соответственно, индексироваться, создавая тем самым бесчисленное количество дублей

Код ответа сервера должен быть «404 Not Found». Проверка 404 ошибки может быть выполнена здесь [redbot.org].

Графики и отвлекающих элементов дизайна не должно быть очень много. Это отвлекает пользователя, и он не сразу понимает, что искомых данных здесь нет. Пример такого оформления приведен после таблицы

На странице с 404 ошибкой нужно поместить логотип, фирменную цветовую гамму, чтобы гость сразу понял: он попал на нужный ему ресурс

Не стоит показывать Google AdSense, что использовать правила данной контекстной рекламы запрещается

В идеале должна быть проставлена ссылка на главную страницу, важные разделы на сайте, поиск по ресурсу. Также желательно наличие красиво оформленных блоков с информацией об акциях, а также разделов, где содержатся рекомендации, популярные статьи, форма обратной связи по типу: «Вы можете обратиться к системному администратору сайта и описать проблему».

Можно попытаться объяснить, что это за сбой и как исправить ошибку 404 not found. Спасти положение с помощью необычного веселого элемента и оказаться в списке собирателей эффектных 404

Вот как, например, не должна выглядеть 404 страница:

Ошибка 404

5 советов, как сделать ошибку 404 полезной

Как лучше оформить страницу 404? Поставьте себя на место пользователя. Итак, он ищет определенные сведения и оказывается на странице, где видит: «ошибка 404». Скорее всего, он кликнет по кнопке «Назад» и уйдет с ресурса, сочтя его нефункционирующим.

Даже если вы указали ссылку «Вернуться на главную», вряд ли это спасет положение. Пользователь должен кликнуть по ней, оказаться на главной странице, а потом еще искать данные. Это сложно. Как поступить? Как не дать юзеру уйти из-за 404 ошибки?

  1. Будьте вежливы

    Ошибка 404

    Нужно поприветствовать посетителя. Сказать, что случилось, объяснить, почему не удается найти страницу, предложить помощь. Не зацикливайтесь на технических вопросах.

  2. Правильный дизайн

    Ошибка 404

    Оформлять 404 страницу нужно в соответствии с общей стилистикой шаблона. Должен быть такой же логотип, рубрики, меню. Непременно используйте фотоконтент. На некоторых сайтах можно встретить веселые тематические изображения, заставляющие людей задерживаться на несколько секунд и вызывающие у них улыбку. А это уже хорошо. Кто-то и вовсе размещает видеоролики. Но помните, что это должно быть к месту.

  3. Польза для посетителей

    Ошибка 404

    Даже если пользователь оказался на странице, где выдается ошибка сервера 404, у него все равно должна быть возможность дальше пользоваться вашим сайтом. Не делайте 404 страницу чисто информационной. Разместите на ней поисковую строку, ссылку на основную страницу, карту сайта, сформируйте перечень популярных материалов. Также многие ресурсы размещают у себя кнопку «Сообщить о битой ссылке».

  4. Предложите альтернативу

    Ошибка 404

    Нередко на сайтах выводятся аналогичные или рекомендуемые записи. А интернет-магазины предлагают подобную продукцию, акции, скидки и т. п.

  5. Настройте SEO

    Лучше, если на сайте вообще не будут размещены внутренние ссылки на 404 страницы. Чтобы отслеживать мертвые ссылки, пользуются разными сервисами, например Google Search Console, где с ними можно ознакомиться во вкладке «Ошибки сканирования», или «Яндекс.Вебмастером» (раздел «Исключенные страницы»).

Как учесть поведенческие факторы при настройке отображения ошибки 404

Что делаете лично вы, когда, заходя на сайт за нужной информацией, видите белый экран с «404 Error. Page Not Found»? Как и другие пользователи, покидаете ресурс и уходите на другой.

Конечно, чем больше страниц на сайте выдают 404 ошибку, чем чаще перед пользователями всплывает эта информация, тем меньше посещений. Поисковые системы работают по особому алгоритму, где поведенческие факторы играют очень важную роль и влияют на ранжирование.

Чтобы поведенческие факторы не ухудшались, нужно стимулировать пользователей оставаться на сайте. Для этого важно правильно создавать 404 страницу, используя креативные идеи.

Для удержания пользователя на сайте следует задуматься над разработкой своей 404 страницы, которая отображалась бы в случае ошибки.

Нередко веб-мастера вовсе игнорируют ее. В итоге гости видят следующее:

Ошибка 404

Страница должна решать такие задачи:

  • привлекать внимание посетителей;

  • объяснять им, в чем дело;

  • показывать варианты устранения проблемы.

В отношении своей страницы 404 поисковики советуют следующее:

«Яндекс»:

  • внешний вид страницы должен отличаться от других страниц на сайте;

  • при создании страницы пользуйтесь другой цветовой гаммой и не применяйте графику.

Google:

  • стиль страницы (в том числе, навигация) должен быть таким же, как на основном сайте;

  • на странице нужно размещать ссылки на самые популярные материалы или разделы комментариев;

  • предоставьте посетителям возможность сообщать о мертвых ссылках.

Общие рекомендации:

  • в странице не должно быть ссылки на главную страницу;

  • вежливо и четко объясните пользователю, что к желаемой странице нет доступа.

Скачайте полезный документ:

Чек-лист: Как добиваться своих целей в переговорах с клиентами

Все приведенные нами советы, как устранить ошибку 404, — не безоговорочные правила. Все зависит от тематики и ЦА ресурса. К примеру, для интернет-магазина лучше добавить строку поиска, для сайта услуг — контактную информацию. Представители старшей возрастной категории вряд ли обрадуются при виде такой страницы. Но для сайта, целевая аудитория которого состоит из молодых девушек и парней — поклонников компьютерных игр, она будет уместна.

Ошибка 404

Если ответ сервера настроен правильно, а страница с ошибкой 404 разработана грамотно, у ресурса не будет проблем даже при большом количестве страниц с 404 ошибкой. Не старайтесь обмануть поисковики и юзеров через настройку редиректов, отсылающих к нерелевантным страницам. Пользуясь удобным для себя методом, вы всегда сможете отслеживать мертвые ссылки и понимать, как их устранять.

Примеры оригинального, креативного оформления страниц с ошибкой 404

Ошибка 404

Ошибка 404

Ошибка 404

Ошибка 404

Ошибка 404

Ошибка 404

Ошибка 404

Ошибка 404

Ошибка 404

Ошибка 404

Сергей Касьянов

Статья опубликована: 09.01.2019

Облако тегов

Понравилась статья? Поделитесь:

Сегодня Международный день интернета, который также называют Днем ошибки 404. Почему? Ответ ниже.

Почему именно 4 апреля? Просто так совпало?

Дата празднования Международного дня интернета выбрана не случайно, вглядитесь в цифровое отображение сегодняшнего дня: 4.04.Ничего не напоминает? Да-да, это она, до боли знакомая ошибка 404.

Страницу с надписью «Error: 404» наверняка видел каждый, кто хоть раз заходил в интернет. Вводишь адрес сайта, ошибся одним символом, и вот, пожалуйста: ошибка, страница не найдена. Или даже так: пишешь диплом, неистово серфишь в поисках первоисточника или оригинального исследования, белочкой прыгаешь по ссылкам, и в конце концов утыкаешься в стену «404»: когда-то, может, страница и существовала, а теперь ее нет. Не найдено. Ищи в другом месте.

кофе

Других идей нет?

Есть еще одна вкусная теория: якобы Днем интернета выбрана закодированная в дате ошибка 404, потому что основная база данных научного центра CERN (European Organization for Nuclear Research), в стенах которого и зародился интернет, располагалась на 4-ом этаже в комнате №404. Когда данных во внутренней сети CERN стало слишком много, и мощности серверов для обработки входящих запросов стали подходить к концу, разработчики якобы решили выдавать сообщение об ошибке вида «Room 404: file not found». И это подтолкнуло разработчиков вывести интернет в люди, сделать сеть всемирной.

Но Тим Бернерс-Ли это опровергает. Согласно его утверждению, в CERN вообще никогда не существовало комнаты №404. Там совершенно другая нумерация офисов: первая цифра означает порядковый номер корпуса здания, а комбинация вторых – номер комнаты. Причем в 4 корпусе нумерация офисов начиналась не с №401, как можно было бы предположить, а с №410. Так что комната №404 – это всего лишь красивый миф, в который хотелось бы поверить.

404

Почему она возникает?

Ошибка 404 или Not Found – стандартный ответ протокола HTTP, он переводится примерно так: клиент, я тебя понял, но на сервере такой страницы нет. Увы. Ее могли удалить, перенести, временно закрыть из-за технических работ, а может, ее никогда и не было.

HTTP вообще кодирует все ответы в трех цифрах. Первая цифра означает вид сообщения: 1 — информационное, 2 — успех, 3 — перенаправление, 4 — ошибка клиента, 5 — ошибка сервера. Коды типа 102 («В процессе»), 200 («ОК»), 304 («Не изменилось») пользователь не видит, вместо этого браузер просто подвисает или загружает нужную страницу. А вот 400-е и 500-е коды предстают пред нами во всей красоте.

404

И что делать?

Внимательно посмотреть, нет ли ошибки в написании адреса страницы. Может, все дело в невнимательности пользователя. Все верно? Тогда попробуйте обновить страницу. Еще раз. Если не помогло, то самое время вернуться, откуда пришел, или подняться на главную страницу сайта.

Впрочем, иногда со страницы с ошибкой и уходить не хочется.

404

А что, страницы 404 бывают крутыми?

Да, бывают. Авторские страницы 404 – это правило хорошего тона веб-разработки. Они есть и у Гугла, и у Яндекса, и у Вконтакте и Фейсбуком, и у нас. Некоторые компании прячут в них свои «пасхальные яйца». Например, «Пежо» на странице с ошибкой выдает изображение машины Peugeot 404, причем, картинка меняется от страны к стране.

https://i.stack.imgur.com/PC0JS.png

Горячо рекомендую посмотреть страницу с ошибкой 404 некогда работавшей веб-студии «Протеус». Студия давно закрылась, в живых осталась только эта фееричная страничка. А вот еще 10 ссылок, на которые надо переходить, потому что принтскрин страницы не покажет всей красоты: 1

http://nouveller.com/404

http://hotdot.pro/en/404/

https://github.com/404

http://www.bluedaniel.com/404

http://lab.hakim.se/404/netmag.html

https://lurkmore.co/404

http://www.tinsanity.net/404.shtml

http://www.homestarrunner.com/random_garbage_text

http://mikekus.com/404

http://www.b3ta.com/404Все

Ошибку 404 еще как-то используют?

Увы, да. Провайдеры зачастую «прикрываются» страницей ошибки 404, когда по каким-либо причинам блокируют доступ страницы. Например, по требованию законодательства. Среди известных случаев: британская система блокировки контента Cleanfeed именно так блокирует страницы, которые занесены в реестр Internet Watch Foundation. Похожая ситуация в Тунисе, там даже появился свой мем – виртуальный цензор «Аммар 404», который блокирует неугодные правительству сайты.

404

Инициатива ведения интернет-цензуры для защиты общества от детской порнографии на Украине, фигурирует в сообщениях под названием «Закон 404». Этому, впрочем, есть и другое объяснение: именно 404 депутата Рады поддержали этот законопроект.

404

«Дети 404» – российский общественный интернет-проект поддержки ЛГБТ-подростков. Доступ к сайту закрыт (пропаганда гомосексуализма), но проект продолжает работать в социальных сетях.

Ошибка 404 успешно прижилась в сленге юных англичан. 404 в текстовых сообщениях подростков означает «невежественый», тот, кто «не в теме». Ты спрашиваешь что-то у собеседника, а у него на лице будто написано: «Error 404». Не найдено, чистый лист. Ну вот и о чем с ним разговаривать…

Кстати, если во вторник отмечать День интернета вам не с руки, можете подождать до пятницы. Именно в эту пятницу, 7 апреля, будет отмечаться День рунета. Так что, с праздниками, друзья!

Понравилась статья? Поделить с друзьями:
  • Когда тонометр выдает ошибку
  • Когда поймешь свои ошибки текст песни
  • Когда существенно нарастает стоимость изменений и коррекции ошибок
  • Когда поймешь свои ошибки минус
  • Когда специально делаешь ошибки