Ошибки при создании карты сайта

Sitemap.xml — это файл, в котором содержится список ссылок на все полезные страницы вашего сайта.

У каждой ссылки (страницы) есть дата последнего изменения и приоритет индексации.

Пример sitemap.xml без ошибок

Зачем нужен sitemap.xml

Благодаря sitemap.xml, поисковики понимают, какие страницы нужно проиндексировать (или обновить информацию) и в каком порядке это следует делать.

Выходит, что sitemap.xml — это аналог карты для поискового робота.

По этой карте он легко доберется до любой страницы и добавит ее в индекс.

Основные ошибки

1. Мусорные страницы в файле

В карте сайта не должно быть бесполезных для поисковика страниц:

  • Страницы результатов поиска по сайту
  • Страницы пагинации
  • Страницы авторизации и входа в админку
  • Страницы, формируемые динамическими фильтрами товаров
  • Бесполезные страницы, не содержащие полезной информации
  • Неканонические страницы (дубли)
  • Страницы, закрытые от индексации
  • Удаленные страницы (404)
  • Страницы с редиректами (301/302)
  • Другие страницы, код ответа которых не 200

2. Ошибка в протоколе http

Частый косяк, который обычно встречается у сайтов, переехавших с http на https (подключивших SSL сертификат).

Получается, что ваш сайт уже работает на https, а ссылки в файле указаны на протокол с http.

Это грубая ошибка.

3. Не указаны даты последнего изменения страниц

Любые изменения на странице должны учитываться в карте сайта (даже обновления цены или остатков).

Если вы не будите обновлять даты изменения страниц, поисковик не сможет понять, какие страницы следует переиндексировать (большая проблема для интернет магазинов).

4. Не указаны приоритеты индексации

Поисковой робот не может индексировать сайт целиком. Если у вас 1000 страниц, то он сможет обойти за раз около 200.

Какие страницы он обойдет, решать нам.

Следует верно расставлять приоритеты.

Если вы интернет магазин, то главные приоритеты следует отдать главной странице и страницам товарных категорий.

5. Не указанна ссылка на sitemap.xml в файле robots.txt

Если вы не укажите ссылку на карту сайта, поисковик ее не найдет.

Файл robots.txt — это набор инструкций для поискового робота. В этом файле должна быть ссылка на вашу карту.

6. Слишком больший sitemap.xml

Если ваша карта сайта содержит более 5000 страниц, то:

  1. ужно разбить карту на 2 разных файла.
  2. Нужно создать один общий файл sitemap (называется индексный файл) и из него поставить ссылки на 2 ваших Сайтмапа.

Все правила формирования изложенные выше, применимы как к обычному сайтмапу, так и к индексному.

Ищем кривые sitemap.xml у сайтов из поиска

У каждого 3-го сайта есть проблемы с sitemap.xml

Дабы показать вам суровую реальность, я записал небольшое видео, в котором устроил проверку поисковой выдачи.

Вы создали карту сайта, загрузили ее в Google Search Console, но файл не получил статус «Успешно» или «Ок»? А, может, отчет о файлах Sitemap выглядит хорошо, но поисковикиигнорирует ваш файл Sitemap и не собирается индексировать многие страницы из карты сайта. Возникает вопрос, можно ли что-нибудь сделать для улучшения статистики индексирования. Отвечаем — можно, и даже расскажем, как это сделать.

Если у вас еще нет карты сайта и вы хотите узнать, зачем она нужна, ознакомьтесь с нашим вводным интенсивом по созданию файла Sitemap. Здесь мы расскажем о преимуществах использования карты сайта и действенных рекомендациях по работе с ней. Если вы пока не знаете, для чего используют теги <loc> и <lastmod>, что такое карта сайта для видео или файл индекса Sitemap, вводное руководство вам точно пригодится.

В первой части этой статьи перечислены все ошибки, с которыми вы можете столкнуться в отчетах о файлах Sitemap в Google Search Console. Если же вы ищете способ устранить конкретные проблемы, воспользуйтесь содержанием, чтобы перейти к интересующим вас ошибкам.

Во второй части — рекомендации, которые помогут вам извлечь максимальную выгоду из карты сайта. Вы узнаете, как найти мусорные страницы в файле Sitemap, где искать страницы, которые вы могли пропустить и не добавить в карту сайта, и как заставить поисковик проиндексировать как можно больше страниц из файла Sitemap. Поэтому очень советую всем внимательно ознакомиться со второй главой этой статьи.

Исправление ошибок в отчете Sitemap

После загрузки карты сайта в Google в столбце «Статус» можно увидеть, удалось ли поисковику обработать файл. Если ваш файл соответствует всем правилам, появится статус «Успешно». В этой главе мы рассмотрим другие статусы, а именно «Не получено» и «Обнаружены проблемы».

Проблемы со сканированием вашего файла Sitemap

Начнем с самого худшего сценария, когда поисковик не может обработать файл Sitemap. Сначала разберемся с Google — что делать, если статус вашей карты сайта «Не получено». 

Статус карты сайта «Не получено»

В этом случае вам придется использовать «Инструмент проверки URL», чтобы выяснить, что может быть причиной проблемы. В инструменте нажмите кнопку «Проверить страницу на сайте» и посмотрите статус получения страницы. Если написано «Успешно», значит ошибка на стороне Google.

Статус получения страницы в GSC

Если Google не удалось получить вашу карту сайта, убедитесь, что ничто не блокирует доступ к файлу Sitemap — будь то директивы robots.txt или плагины CMS (да, иногда виноваты они!). Также проверьте, правильно ли введен URL-адрес карты сайта — обратите внимание на протокол и префикс www.

Ошибка «Не получено» может возникнуть как при загрузке отдельной карты сайта, так и в случае загрузки в Google Search Console файла индекса Sitemap. Проблему нужно решить так же, как и с одной картой сайта.

Ошибки в файле индекса Sitemap

Теперь перейдем к случаям, когда поисковики просканировали добавленный вами файл и обнаружили ошибки. И начнем мы с ошибок файла индекса Sitemap.

Файл индекса Sitemap содержит ссылки на несколько карт сайта — поисковой системе необходимо обработать их все, чтобы наконец получить доступ к URL-адресам вашего сайта. В Google Search Console вы получите ошибку «Неполные URL в файле индекса Sitemap», если поисковик не сможет обработать URL-адреса, перечисленные в файле индекса Sitemap. Обычно это означает, что Google не удалось найти одну или несколько ваших карт сайта, потому что вы использовали относительные URL-адреса. Все URL-ы, которые указывают на отдельные карты сайта в файле индекса Sitemap, должны быть абсолютными, иначе Google не сможет их найти.

Кроме того, в вашем файле индекса Sitemap не должны быть указаны другие файлы индекса Sitemap, а только карты сайта. Если вы сделаете так, то получите сообщение «Вложенные файлы индекса Sitemap» в Google Search Console.

И последняя ошибка. В Google она звучит так «Слишком много файлов Sitemap в файле индекса». Это происходит с огромными сайтами, которые содержат более 50 000 карт сайта в одном файле.

Недопустимый размер файла Sitemap и ошибки сжатия

Ограничения по размеру применяются как к файлам индекса Sitemap, так и к отдельным картам сайта. Размер файла Sitemap в несжатом виде не должен превышать 50 МБ, а в карте сайта не должно быть более 50 000 URL-адресов. Если вы не соблюдаете эти правила, то получите ошибку «Превышен максимальный размер файла Sitemap» в Google. Узнать больше о том, как разделить карту сайта на несколько файлов, можно из нашего полного руководства по созданию файла Sitemap. 

Карта сайта должна не только не превышать допустимые размеры, но и не быть пустой. Если вы загрузите пустой Sitemap, то получите соответствующую ошибку в консоли.

Я говорила, что допустимый размер карты сайта в несжатом виде должен быть меньше 50 МБ, но часто файлы Sitemap сжимают для экономии пропускной способности канала. Обычно для этой цели используют инструмент gzip, который добавляет расширение gz к файлу. Сообщение об ошибке сжатия или разархивирования в отчете означает, что что-то пошло не так во время процесса сжатия, и вам нужно сделать это еще раз.

Проблемы со сканированием URL-адресов в карте сайта

По ряду причин поисковики могут не просканировать некоторые URL-адреса, которые указаны в карте сайта. Давайте разберемся со всеми подобными ошибками.

«Файл Sitemap содержит URL, доступ к которым заблокирован в файле robots.txt» — ошибка довольно простая, поскольку поисковики укажут вам на заблокированные URL-адреса. Все зависит от того, хотите ли вы, чтобы эти URL-ы были проиндексированы. Если да, то вам придется снять блокировку, в другом случае необходимо удалить адреса из карты сайта.

Еще одна довольно очевидная проблема, которая не позволяет Google сканировать страницу, — это код ответа, отличный от 200 ОК. В отчете поисковиков это называется ошибкой HTTP, и точный код указывается для каждой отдельной страницы. Кроме консолей вебмастеров, проверить коды ответа URL-адресов из вашей карты сайта можно с помощью инструмента «Аудит сайта» от SE Ranking.

Всю необходимую информацию ищите в разделе «Код ответа сервера».

Раздел «Код ответа сервера» в SE Ranking

Google также выделяет другие не такие очевидные и простые ошибки. Кратко пройдемся по каждой из них.

Ошибка «URL недоступны» означает, что поисковик обнаружил вашу карту сайта в указанном месте, но не смог получить все URL-адреса из списка. В этом случае вам снова нужно использовать «Инструмент проверки URL» и проверять доступность для сканирования каждого проблемного URL-а.

Ошибка «Переход по URL не выполнен» возникает либо из-за того, что вы использовали относительные URL-адреса в карте сайта вместо абсолютных, либо из-за проблем с редиректами. Цепочки и циклы редиректов, временные редиректы, которые используют вместо постоянного перенаправления, а также HTML- и JS-редиректы могут привести к этим ошибкам.

Google Search Console не указывает, что именно может быть причиной проблемы. Поэтому вам нужно использовать другие инструменты, чтобы понять, какие ошибки необходимо исправить. Например, в инструменте «Аудит сайта» SE Ranking есть специальный раздел «Редиректы», где можно проверить, есть ли на вашем сайте какие-либо проблемы с перенаправлениями.

Если инструмент обнаружит какие-либо ошибки, вы получите всю необходимую информацию по каждой из них — щелкнув на количество страниц, можно узнать, на какой странице есть проблема и как она связана с другими страницами сайта.

Раздел «Редиректы» в SE Ranking

Ошибка «Нельзя использовать URL» означает, что ваша карта сайта содержит URL-адреса, которые находятся на более высоком уровне или в другом домене по сравнению с файлом Sitemap. Например, если ваша карта сайта находится по адресу: vashsajt.com/category1/sitemap.xml и вы добавили в нее страницу, адрес которой: vashsajt.com/stranitsa1, поисковики не смогут получить к ней доступ.

Что касается разных доменов, помните, что для Google версии сайта на HTTP и HTTPS, а также с www и без www считаются разными. Поэтому, если ваша карта сайта находится по адресу http://www.vashsajt.com/sitemap.xml, URL вида https://vashsajt.com/stranitsa1 будет считаться некорректным. 

Если вы недавно перешли на HTTPS, обязательно создайте новую карту сайта с HTTPS URL-адресами. Инструмент «Аудит сайта» SE Ranking напомнит вам об этом.

Раздел «Безопасность сайта» в SE Ranking

Google считает, что вы указали неправильные URL

Также стоит обратить внимание на еще одну ошибку, которую выделяет Google. Если вы добавите URL без префикса www в свою карту сайта, адрес которой содержит www, вы получите ошибку «Несоответствующий путь». То же самое касается файла Sitemap с www и URL-адресом без соответствующего префикса. Даже если ваш сайт доступен как с префиксом www, так и без него, не нужно путать эти вещи в карте сайта. Если ваш файл Sitemap находится по адресу: https://example.com/sitemap.xml, ни один из URL-ов, которые она содержит, не должен включать www. Если ваша карта сайта находится по адресу: https://www.example.com/sitemap.xml, все перечисленные в ней URL-ы должны включать www.

Синтаксические ошибки в карте сайта

В большинстве случаев вам не нужно беспокоиться о синтаксических ошибках в карте сайта — создав файл Sitemap с помощью одного из специальных сервисов, вы можете быть уверены, что с тегами и атрибутами не будет проблем. Однако, если вы самостоятельно сделали карту сайта, то можете столкнуться с одной из ниже описанных ошибок. 

  • «Недопустимое значение тега». Значение тега — это то, что вы указываете между начальным и конечным тегами — URL-адрес между тегами <loc>, или дата, которую вы определяете с помощью тега <lastmod>. Ошибка возникает, когда вы указываете недопустимое значение в карте сайта, например, устанавливаете приоритет вне диапазона от 0,0 до 1,0.
  • «Неверное значение атрибута». Значение атрибута указывается после знака равенства (=) в кавычках. В следующей строке кода перечислены различные языковые версии страницы в файле Sitemap.
<url><loc>https://example.com</loc><xhtml:link rel=”alternate” hreflang=”gb” href=”https://example.com”/><xhtml:link rel=”alternate” hreflang=”fr” href=”https://example.com/fr”/></url>

Здесь “alternate”, “gb” и “fr” являются значениями атрибутов, но “gb” используется неправильно. Вы не можете указать в hreflangs только код страны — он должен сочетаться с кодом языка, например, “en-gb”.

  • «Неправильно введена дата». Все довольно просто — вы использовали неправильный формат даты для тега <lastmod>. Единственный допустимый формат:
2005-02-21 
2005-02-21T18:00:15+00:00
  • «Недопустимый URL». Как вы могли догадаться, эта ошибка означает, что нужно искать опечатки в добавленных URL-адресах. Напомню, что все URL-ы в вашей карте сайта должны быть абсолютными.
  • Ошибки «Отсутствует атрибут XML» и «Отсутствует тег XML» тоже довольно очевидны. Отсутствие обязательных тегов и атрибутов (urlset, url, loc, xmlns) недопустимо — их нужно добавить, чтобы ваша карта сайта работала должным образом.
  • «Недопустимый XML: слишком много тегов». Эта ошибка может возникнуть, если вы используете один из тегов несколько раз. Например, вы указали два разных адреса или две даты изменения для одного URL. В этом случае вам необходимо удалить повторяющийся тег.
<url>
<loc>http://www.example.com/</loc>
<lastmod>2021-01-01</lastmod>
<lastmod>2021-02-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
  • «Неправильно указано пространство имен». Пространство имен, указанное в вашем теге <urlset>, должно быть одним из принятых протоколов. В настоящее время используется следующий протокол:

Обычные файлы Sitemap — xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9”

Файлы Sitemap для новостей — xmlns:news=”http://www.google.com/schemas/sitemap-news/0.9″

Файлы Sitemap для видео — xmlns:video=”http://www.google.com/schemas/sitemap-video/1.1″

Файлы Sitemap для изображений — xmlns:image:=”http://www.google.com/schemas/sitemap-image/1.1″

Напомню, что специальные карты сайта для новостей, картинок и видео поддерживает только Google.

Если вы использовали неправильный протокол для своей карты сайта, вы получите ошибку «Неподдерживаемый формат файла» в Google Search Console. Она также может появиться из-за других всевозможных синтаксических ошибок, таких как использование неправильных кавычек (принимаются только прямые одинарные или двойные), отсутствие тега кодировки или некорректный префикс UTF-8.

Ошибка «Неподдерживаемый формат файла» в GSC

Также Google выделяет несколько ошибок, связанных с файлом Sitemap для видео: «Слишком большой/маленький значок видео», «Адреса видео и страницы воспроизведения совпадают», «URL видео указывает на страницу воспроизведения». Вы можете найти более подробную информацию об этих ошибках здесь.

Чтобы избежать синтаксических ошибок, перед отправкой файла Sitemap используйте один из сервисов проверки карты сайта, подобных этому. Инструменты будут выделять проблемы, которые необходимо исправить.

После устранения всех ошибок в файле Sitemap нужно повторно загрузить обновленную карту сайта в Google Search Console.

Такие действия заставят Google повторно просканировать ваш сайт и, наконец, проиндексировать страницы, которые они не смогли просканировать из-за ошибок.

Загруженные vs проиндексированные URL-адреса

Ваша карта сайта и файл индекса Sitemap могут получить статус «Успешно» или «Ок», но на этом ваша работа не заканчивается.

Давайте сначала разберем, что делать дальше в Google Search Console. Щелкните на значок диаграммы рядом с количеством выявленных URL-адресов, чтобы перейти к отчету об индексировании. Как только вы начнете анализировать его, вы скорее всего заметите, что не все отправленные страницы были проиндексированы.

Отчет об индексировании в GSC

Это нормально, когда страницы исключаются из индексации — Google не может оценить и проиндексировать все страницы вашего сайта, о которых он знает. Более того, почти на каждом сайте есть страницы, которые вебмастера не хотят индексировать: страницы защищенные паролем, служебные страницы и дубли. Что не нормально, так это наличие ошибок и предупреждений в вашем отчете об индексировании. Также недопустимо, чтобы количество исключенных страниц во много раз превышало количество страниц без ошибок.

Так почему же поисковики не могут проиндексировать страницы, которые были добавлены в карту сайта? В большинстве случаев это происходит, когда вы добавляете туда страницы, которых в карте сайта быть не должно. Возможно, поисковики просто не могут проиндексировать страницу из-за директивы noindex. Кроме того, поисковики могут запутаться, действительно ли вы хотите, чтобы страница была проиндексирована — например, когда вы добавляете неканонические страницы в карту сайта. 

Все подобные ошибки можно найти в разных вкладках «Отчета об индексировании» в Google Search Console. Но их удобнее проверять с помощью инструмента «Аудит сайта» SE Ranking — если на вашем сайте есть подобные проблемы, вы легко найдете их все в разделе «Сканирование» в «Отчете об ошибках».

Вкладка «Сканирование» в SE Ranking

Удалите из карты сайта неиндексируемые и неканонические страницы. А если страницы были по ошибке помечены как неиндексируемые и неканонические, решите эту проблему.

Оптимизируйте карту сайта с подсказками от Google

Убедившись, что с вашей картой сайта все в порядке, изучите «Отчет об индексировании», чтобы найти случаи, когда ваше мнение о странице расходится с Google.

  • На вкладке «Без ошибок, есть предупреждения» обратите внимание на страницы, которые были проиндексированы, несмотря на директиву noindex. Скорее всего, Google был прав, и вам нужно удалить тег noindex из этих страниц или из вашего X-Robots-Tag.
  • На вкладке «Страница без ошибок» посмотрите внимательно на проиндексированные, но не отправленные в файл Sitemap страницы — вы можете добавить их в карту сайта, так как Google считает их качественными. В то же время, если Google проиндексировал ваше «Пользовательское соглашение», которое вы не включили в карту сайта, можно ничего не делать. Также следите за дублями страниц, которые были проиндексированы, но отсутствовали в вашей карте сайта — такие случаи часто возникают из-за проблем с пагинацией и обработкой параметров URL-адресов.
  • Наконец, перейдите на вкладку «Исключено». Большинство страниц здесь исключены из индексации в соответствии с вашими собственными директивами, например старые страницы 404, страницы, заблокированные robots.txt, неиндексируемые и неканонические страницы. Обратите внимание на канонические страницы, которые Google решил не индексировать, — поисковая система считает, что на вашем сайте есть альтернативы получше. Тщательно изучите каждый случай и решите, действительно ли страница более ценна, чем ее дубли — исправьте свои теги canonical, если Google был прав. Если вы по-прежнему считаете, что страницу нужно проиндексировать, вам придется поработать над ее содержанием, профилем бэклинков и внутренней линковкой, чтобы убедить Google в обратном.

На вкладке «Исключено» можно увидеть еще две интересные категории страниц: «Просканированы, но пока не проиндексированы», и «Обнаружены, не проиндексированы». Оба типа обычно определяют некачественные страницы с малым содержанием, которые Google не хочет показывать пользователям. В первом случае страница была по крайней мере просканирована, а затем признана некачественной. А во втором случае поисковик даже не потратил краулинговый бюджет на страницу. Тщательно проанализируйте все такие страницы и посмотрите, что вы можете сделать, чтобы повысить их ценность: поработайте над контентом, взаимодействием с пользователем, внутренней линковкой и т. д.

Заключение

Благодаря разнообразию инструментов для создания карты сайта сделать файл Sitemap очень легко. Однако, если вы просто воспользуетесь одним из случайных инструментов и проигнорируете рекомендации по созданию карты сайта, то наверняка получите отчет о файле Sitemap с большим количеством ошибок, или отправите через карту сайта множество некачественных страниц на рассмотрение поисковикам.

Я надеюсь, что это руководство помогло вам исправить каждую ошибку в отчете о файле Sitemap. А воспользовавшись советами из второй части этого руководства, вы сможете оставить в карте сайта только качественные страницы и убрать все те, которые поисковики все равно не захотят индексировать. Если у вас остались вопросы, не стесняйтесь оставлять их в комментариях ниже.

Даша — контент-маркетолог и редактор в SE Ranking. Пишет статьи о SEO и диджитал-маркетинге. Любит разбираться в сложных вещах и описывать их просто и доступно. В свободное от блога время Даша путешествует, изучает искусство фотографии и посещает картинные галереи.

blog-icon

Sitemap.xml — это карта сайта для поисковых роботов, которая находится в корне сайта и содержит рекомендации того, какие страницы необходимо обходить в первую очередь и с какой частотой. Это ускоряет и упрощает процесс индексации. Создание карты сайта sitemap.xml не является обязательным правилом. Такая карта должна быть на сайтах, которые имеют большое количество страниц, и в тех случаях, когда контент на страницах часто обновляется. В некоторых CMS есть возможность карту сайта создать автоматически, сделать это можно с помощью специального плагина. Однако это не исключает появление ошибок. 

Ошибки в sitemap.xml существенно снижают скорость попадания сайта в индекс и затрудняют работу поисковых роботов Яндекс и Google. Поэтому их необходимо вовремя находить и устранять. Однако, если на вашем сайте большое количество страниц, найти неисправности в sitemap вручную будет непросто из-за большого объема данных. На помощь приходит сервис Labrika, в котором есть полезный инструмент для работы с sitemap.xml. Он поможет вам своевременно проверить ошибки и исправить их автоматически, в один клик.

Находится этот инструмент в разделе «Технический аудит» левого бокового меню:

Технический аудит

Рассмотрим подробнее, как пользоваться этим подразделом и какие данные можно в нем увидеть:

Технический аудит

  1. Здесь представлены данные о страницах, которые есть в sitemap.xml, но которых нет на сайте. Эти страницы перечислены ниже, в виде списка. Возможно, они были удалены с сайта и отдают ошибку 404, но в sitemap информацию о них не убрали.
  2. Далее мы можем видеть страницы, которые доступны для индексации поисковых роботов, но отсутствуют в sitemap. Чтобы роботы своевременно посещали эти страницы, их необходимо добавить в sitemap.xml.
  3. И наконец, страницы, которые есть в sitemap, но при этом закрыты от индексации. Вероятно, такие страницы были добавлены в карту сайта, но потом их закрыли от индексации в файле robots.txt.

    Продемонстрируем данные, которые выводятся во вкладках, описанных во втором и третьем пунктах, на следующих скриншотах:

    Технический аудит

    Технический аудит

  4. При нажатии на клавишу «Перепроверить sitemap.xml» Лабрика проанализирует карту сайта и выдаст информацию об ошибках, описанных в первых трех пунктах.
  5. После нажатия кнопки «Скачать исправленный sitemap.xml» Лабрика самостоятельно исправит все обнаруженные ошибки и сохранит правильную обновленную версию sitemap.xml на ваш компьютер. Вам останется только выгрузить ее на сайт взамен старого файла.
  6. Не забудьте подгрузить новый xml файл sitemap без ошибок в Яндекс Вебмастер и Google Search Console. 

Online SEO-инструменты для продвижения сайтов

Проверьте свой сайт и сайты конкурентов на 205 факторов поисковых систем.

Небольшой пост по поводу ошибок в xml-карте сайта:

  • Почему возникают?
  • Насколько критично?
  • Всегда ли надо устранять?

Файл sitemap — это файл с информацией о страницах сайта, подлежащих индексированию. Разместив этот файл на сайте, вы можете:

  • сообщить Яндексу, какие страницы вашего сайта нужно индексировать;
  • как часто обновляется информация на страницах;
  • индексирование каких страниц наиболее важно.

Как правило, xml-карта доступна по адресу site.ru/sitemap.xml

О проблемах с сайтом можно узнать при помощи сервиса Яндекс.Вебмастер, для этого необходимо добавить сайт в Вебмастер.

Яндекс.Вебмастер сигнализирует о возможной проблеме

Яндекс.Вебмастер сигнализирует о возможной проблеме

Сразу замечу, что в обязательном порядке необходимо реагировать на фатальные ошибки. К «самым фатальным ошибкам» относятся заражение сайта вирусами и полный запрет на индексирование сайта в файле robots.txt (Disallow: /).

В конкретном случае сервис сообщает, что возможно есть какие-то проблемы с файлами Sitemap.

В одном или нескольких файлах Sitemap обнаружены ошибки, которые могут повлиять на обработку файлов индексирующим роботом.

В одном или нескольких файлах Sitemap обнаружены ошибки, которые могут повлиять на обработку файлов индексирующим роботом
Много ошибок в файле Sitemap
После щелчка по ссылке «Проверить» возникла ужасающая картина — почти 11 тыс. ошибок в файле Sitemap с постами сайта

У особо впечатлительных веб-мастеров может подняться давление, но сперва следует разобраться в причине статуса.

Ошибки в sitemap тег image

Как оказалось, проблема в теге image:image, который не смог распознать робот Яндекса

Этот тег появился в картах Sitemap по той причине, что в качестве SEO-плагина на сайте установлен Yoast SEO, который создает Sitemap согласно пожеланиям Google.

Тег <image:image> содержит всю информацию об одном изображении. Он нужен для того, чтобы картинки были представлены в результатах поиска Google.

Следуя рекомендациям для веб-мастеров и советам по публикации изображений, вы повысите вероятность того, что ваши картинки будут представлены в результатах поиска. Кроме того, можно предоставить Google дополнительную информацию о графических материалах, размещенных на вашем сайте, с помощью специальных функций файла Sitemap. Это поможет Google найти контент, который иначе нельзя было бы обнаружить (например, если он загружается с помощью JavaScript), а также позволит вам указать изображения, которые необходимо сканировать и индексировать.

Получается, что хорошо для Google, то плохо для Яндекса. На некоторых блогах появились рекомендация убирать все лишнее из файлов Sitemap чтобы у Яндекса не было замечаний. Но надо ли на самом деле убирать то, что рекомендует Google? Насколько критичны данные ошибки для сайта? Чтобы ответить на этот вопрос, обратимся к справке Яндекса.

Файл Sitemap может содержать различную информацию о страницах сайта, которая передаётся роботам с помощью тегов в файле. Робот Яндекса поддерживает следующие теги:

  • loc (адрес страницы);
  • lastmod (дату последнего обновления страницы);
  • changefreq (частоту изменения страницы);
  • priority (относительную значимость страницы).

Если файл содержит другие теги, например, с указанием на мобильную или мультиязычную версию, а также с адресами картинок, в Яндекс.Вебмастере появится ошибка «Неизвестный тег». Неподдерживаемые теги игнорируются роботом при обработке Sitemap, при этом данные из поддерживаемых тегов учитываются, поэтому менять файл Sitemap необязательно. Если содержимое файла будет изменено, потребуется до двух недель на обновление информации в Яндекс.Вебмастере.

Итак, согласно справки Яндекса, если ошибки связаны с тегом <image:image>, то нет необходимости его удалять. Однако всегда терзают смутные сомнения. А может ошибки все же негативно влияют на продвижение сайта? Чтобы дать адекватный ответ на этот вопрос, я нашел несколько топовых сайтов строительной тематики на движке WordPress с установленным плагином Yoast SEO и посмотрел их параметры:

  • Возраст;
  • Посещаемость;
  • Количество статей.

Согласно выработанным мною метрикам, у изученных сайтов все замечательно. Для большей наглядности привожу статистику одного из них.

Возраст сайта — 1,5 года, количество статей — 450, посещаемость более 15 тыс. человек в сутки. Плагин Yoast SEO был установлен с первых дней создания сайта

Все вышесказанное относилось к тегу <image:image>. Естественно, возникают и  другие ошибки, которые действительно могут негативно сказаться на индексировании сайта. Во всех случаях необходимо руководствоваться тем, что при помощи sitemap.xml поисковые роботы должны узнать обо всех документах которые вы хотите видеть в выдаче. Любой робот поймет следующую разметку:

<url>
<loc>https://mukhutdinov.com/gde-kupit-domen-deshevo.html</loc>
<lastmod>2012-08-22T18:08:20+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority>1</priority>
</url>

Должна быть ссылка на каждый «нужный» документ. На практике могут возникать случаи, когда Вебмастера Яндекса и Google говорят «good», а на самом деле проблема существует. Например, ссылки на новые документы могут не появляться в карте сайта. Это может произойти из-за некорректной работы скриптов отрисовывающих Sitemap. Выявить данную неисправность довольно просто — опубликовав тестовую страницу, убедитесь, что ссылка на неё появились в карте сайта.

обновлено: 13.01.2020 1554996048

Александр Коваленко, CEO/founder агентства Advermedia.ua, опыт в SEO более 10 лет.
Канал автора в телеграм: @seomnenie

  • View Larger Image

Содержание статьи

  1. Что такое карта сайта
  2. Зачем нужна и нужна ли карта сайта?
  3. Виды XML карты
    3.1 XML карта сайта страниц
    3.2 XML карта изображений сайта
    3.3 XML карта видео
    3.4 XML карта для Google.Новости
  4. XML карта сайта для мультиязычного сайта
  5. XML карта сайта для габаритного сайта
  6. Требования для XML карта сайта в Google и Яндекс
    6.1 Пример карты сайта
    6.2 Требования и рекомендации Google
    6.3 Требования и рекомендации Яндекс
  7. Правильное указание ссылки на карту сайта в robots.txt
  8. Как создать XML карту сайта
    8.1 С помощью генератора XML карты сайта онлайн
    8.2 С помощью программы для генерации XML карты сайта
    8.3 С помощью PHP скрипта и MySQL
    8.4 В ручную
  9. XML карта сайта в разных CMS
    9.1 XML карта сайта для CMS WordPress
    9.2 XML карта сайта для CMS Joomla
    9.3 XML карта сайта для CMS Битрикс
    9.4 XML карта сайта для CMS Drupal
  10. Правильное указание ссылки на карту сайта в robots.txt
  11. Добавление карты сайта в поисковые системы
    11.1 Добавление карты сайта в Google
    11.2 Добавление карты сайта в Яндекс
  12. Частые ошибки при создание карты сайта
  13. Как проверить XML карту сайта на ошибки
  14. Распространенные заблуждения и мифы о карте сайта
  15. Как создать HTML карту сайта

Что такое карта сайта

Карта сайта – это список страниц сайта для поисковых систем или пользователей.

Есть 2 основных вида карты сайтта:

  • В XML формате (список страниц сайта для поисковых систем, используется для помощи в индексирование сайта поисковиками, документ формируется по стандарту https://www.sitemaps.org/index.html)
  • В HTML формате (содержание сайта – полный перечень разделов и/или всех страниц сайта в иерархическом порядке, используется как вспомогательная навигация на сайте)

Зачем нужна и нужна ли карта сайта?

Назначение карты сайта:
Предоставить поисковым роботам информацию о документах (страницах) сайта.

Задача карты сайта:
Помочь роботу найти все страницы сайта и добавить их в поисковый индекс. А также, указать роботу дополнительные рекомендации, к примеру – чаще или реже посещать те или иные страницы сайта.

Так нужна ли карта сайта?
Нужна, тем не менее без нее могут обходиться многие сайты. Мы рекомендуем создавать карту сайта даже для самых небольших проектов.

Что говорит Gооgle:

Если страницы файла корректно связаны друг с другом, поисковые роботы могут обнаружить большую часть материалов. Тем не менее с помощью файла Sitemap можно оптимизировать сканирование сайта, особенно в следующих случаях:
– Размер сайта очень велик. Поисковые роботы Google могут пропустить недавно созданные или измененные страницы.
– Сайт содержит большой архив страниц, которые не связаны друг с другом. Чтобы они были успешно просканированы, их можно перечислить в файле Sitemap.
– Ваш сайт создан недавно, и на него указывает мало ссылок. Робот Googlebot и другие поисковые роботы сканируют Интернет, переходя по ссылкам с одной страницы на другую. Если на ваш сайт указывает мало ссылок, его будет сложно найти.
– На сайте используется мультимедийный контент, он отображается в Новостях Google или использует другие аннотации, совместимые с файлами Sitemap. Из файлов Sitemap поисковая система может получать дополнительную информацию для показа в результатах поиска.

Источник: https://support.google.com/webmasters/answer/156184?hl=ru

Типы XML карт

  • XML карта сайта страниц

Файл Sitemap позволяет сообщить Google и другим поисковым системам о том, как организован контент на вашем сайте.. Поисковые системы, в том числе, Google, просматривают этот файл, чтобы более точно индексировать ваши страницы.

Инструкция  Google:
https://support.google.com/webmasters/answer/156184?hl=ru&ref_topic=4581190

  • XML карта изображений сайта

Следуя рекомендациям для веб-мастеров и советам по публикации изображений, вы повысите вероятность того, что ваши картинки будут представлены в результатах поиска. Кроме того, можно предоставить Google дополнительную информацию о графических материалах, размещенных на вашем сайте, с помощью специальных функций файла Sitemap. Это поможет Google найти контент, который иначе нельзя было бы обнаружить (например, если он загружается с помощью JavaScript), а также позволит вам указать изображения, которые необходимо сканировать и индексировать.
Для изображений можно создать отдельный файл Sitemap или обновить уже существующий. В следующем примере приведена запись для страницы  http://example.com/sample.html, на которой размещены два графических файла:

 
http://example.com/primer.html
http://example.com/kartinka.jpg
http://example.com/photo.jpg

Используя такой синтаксис, вы можете указать до 1000 изображений для каждой страницы.

Инструкция  Google:
https://support.google.com/webmasters/answer/178636?hl=ru&ref_topic=4581190

  • XML карта видео

Файл Sitemap для видео содержит дополнительную информацию о видео, размещенных на страницах вашего сайта. С его помощью можно передавать в Google сведения обо всех видео на вашем сайте, включая контент, который невозможно обнаружить с помощью обычных методов сканирования. Файлы Sitemap для видео, которые используются в Google, – это расширение стандарта Sitemap.

Ниже приведен пример файла Sitemap для одной страницы и одного видео. В этом фрагменте кода есть все теги, используемые Google.

 
http://www.example.com/videos/some_video_landing_page.html
http://www.example.com/thumbs/123.jpg
Как приготовить отличный шашлык
Алла учит правильно готовить шашлык
http://streamserver.example.com/video123 .mp4
http://www.example.com/videoplayer.php?video=123
600
2021-11-05T19:20:30+08:00
4.2
12345
2007-11-05T19:20:30+08:00
yes
IE GB US CA
1.99
yes
GrillyMcGrillerson
no

Инструкция  Google:
https://support.google.com/webmasters/answer/80471?hl=ru&ref_topic=4581190

  • XML карта для Google.Новости

Файл Sitemap содержит подробную информацию о типах контента на вашем сайте. С его помощью можно контролировать, какие материалы появляются в Google Новостях. Если вы уже загружали файл Sitemap для всего сайта, рекомендуем добавить отдельный файл для новостного контента.

Перед созданием файла убедитесь, что ваш ресурс включен в каталог Google Новостей. Если это не так, отправьте запрос на добавление в Google Новостях для издателей.

Пример карты сайта для новостей. В файле Sitemap для Google Новостей используется протокол Sitemap. Вот пример кода в таком файле:

 http://www.sitemaps.org/schemas/sitemap/0.9” xmlns:news=”http://www.google.com/schemas/sitemap-news/0.9“>  http://www.example.org/business/article55.html   The Example Times en  2008-12-23 Companies A, B in Merger Talks   

Инструкция  Google:
https://support.google.com/webmasters/answer/74288?hl=ru&ref_topic=4581190

XML карта сайта для мультиязычного сайта

Карту сайта можно использовать для передачи Google атрибут rel=”alternate” hreflang=”x”. С помощью этого атрибута пользователи увидят страницы  на нужном языке и с нужными адресами с корректным регионом.

Фактически, таким образом мы говорим Google, что у каждой страницы сайта есть 1 или несколько альтернативных языковых версий.

Правила для файлов Sitemap

  • Указывайте пространство имен xhtml следующим образом:
    xmlns:xhtml=”http://www.w3.org/1999/xhtml”
  • Создавайте отдельный элемент <url> для каждого URL.
  • В каждом элементе <URL> должен быть дочерний элемент <loc>, в котором указывается URL страницы.
  • В каждом элементе <URL> должен быть дочерний элемент <xhtml:link rel=”alternate” hreflang=”код языка“>, в котором перечисляются все варианты страницы, включая текущую.  Порядок дочерних элементов <xhtml:link> не имеет значения, но вы можете придерживаться определенной последовательности, чтобы было проще отслеживать ошибки. Подробнее…

Пример

Ниже приведен пример для страницы на английском языке для англоговорящих пользователей со всего мира, имеющей два варианта для говорящих на немецком: для посетителей из Швейцарии и из других стран. Вот все URL, которые должны быть на сайте:

  • www.example.com/english/page.html – для англоговорящей аудитории;
  • www.example.com/deutsch/page.html – для тех, кто говорит на немецком;
  • www.example.com/schweiz-deutsch/page.html – для пользователей из Швейцарии, говорящих на немецком.

Ниже приведен файл Sitemap для этих трех страниц.

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xhtml="http://www.w3.org/1999/xhtml">
<url>
<loc>http://www.example.com/english/page.html</loc>
<xhtml:link
rel="alternate"
hreflang="de"
href="http://www.example.com/deutsch/page.html"/>
<xhtml:link
rel="alternate"
hreflang="de-ch"
href="http://www.example.com/schweiz-deutsch/page.html"/>
<xhtml:link
rel="alternate"
hreflang="en"
href="http://www.example.com/english/page.html"/>
</url>
<url>
<loc>http://www.example.com/deutsch/page.html</loc>
<xhtml:link
rel="alternate"
hreflang="de"
href="http://www.example.com/deutsch/page.html"/>
<xhtml:link
rel="alternate"
hreflang="de-ch"
href="http://www.example.com/schweiz-deutsch/page.html"/>
<xhtml:link
rel="alternate"
hreflang="en"
href="http://www.example.com/english/page.html"/>
</url>
<url>
<loc>http://www.example.com/schweiz-deutsch/page.html</loc>
<xhtml:link
rel="alternate"
hreflang="de"
href="http://www.example.com/deutsch/page.html"/>
<xhtml:link
rel="alternate"
hreflang="de-ch"
href="http://www.example.com/schweiz-deutsch/page.html"/>
<xhtml:link
rel="alternate"
hreflang="en"
href="http://www.example.com/english/page.html"/>
</url>
</urlset>

Инструкция Google:
https://support.google.com/webmasters/answer/189077

XML карта сайта для габаритного сайта

Если сайт достаточно габаритный, необходимо реализовать несколько файлов sitemap и объединить их в родительском файле карты сайта.

Например:

  • отдельная карта для всех товаров магазина
  • отдельная карта для всех категорий магазина
  • отдельная карта для статей блога
  • отдельная карта для всех остальных страниц

*к примеру, если страниц товаров больше 50 000 – необходимо сформировать несколько карт для страниц товаров.

Пример родительской карты сайта:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.example.com/sitemap1.xml.gz</loc>
<lastmod>2004-10-01T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/sitemap2.xml.gz</loc>
<lastmod>2005-01-01</lastmod>
</sitemap>
</sitemapindex>

Инструкция  Google:
https://support.google.com/webmasters/answer/75712?hl=ru&ref_topic=4581190

Описание протокола Sitemap.xml и файла индекса:
https://www.sitemaps.org/ru/protocol.html#index

XML карта для нескольких сайтов

Если ваш сайт состоит из нескольких поддоменов, в Google есть возможно добавить их в рамках одного основного домена.

Один файл Sitemap, содержащий URL нескольких сайтов (в том числе в разных доменах). Например, файл Sitemap, размещенный по адресу http://host1.example.com/sitemap.xml, может содержать следующие URL:
http://host1.example.com
http://host2.example.com
http://host3.example.com
http://host1.example1.com
http://host1.example.ch
Отдельные файлы Sitemap (по одному для каждого сайта) в одном местоположении:
http://host1.example.com/host1-example-sitemap.xml
http://host1.example.com/host2-example-sitemap.xml
http://host1.example.com/host3-example-sitemap.xml
http://host1.example.com/host1-example1-sitemap.xml
http://host1.example.com/host1-example-ch-sitemap.xml

Добавить карты таким способом, можно только если каждый из поддоменом подтвержден в консоли Google.

Инструкция  Google:
https://support.google.com/webmasters/answer/75712?hl=ru&ref_topic=4581190

Требования для XML карты сайта в Google и Яндекс

Поисковые системы Яндекс и Гугл ориентируются на протокол Sitemap.xml, описание:
https://www.sitemaps.org/ru/protocol.html#index

Пример XML-карты сайта:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.example.com/catalog?item=12&amp;desc=vacation_hawaii</loc>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.example.com/catalog?item=73&amp;desc=vacation_new_zealand</loc>
<lastmod>2004-12-23</lastmod>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.example.com/catalog?item=74&amp;desc=vacation_newfoundland</loc>
<lastmod>2004-12-23T18:00:15+00:00</lastmod>
<priority>0.3</priority>
</url>
<url>
<loc>http://www.example.com/catalog?item=83&amp;desc=vacation_usa</loc>
<lastmod>2004-11-23</lastmod>
</url>
</urlset>

Требования и рекомендации Google

  1. Файл Sitemap может содержать не более 50 000 URL,
  2. Размер файла Sitemap в несжатом виде не должен превышать 50 МБ
  3. Файлы Sitemap должны использовать кодировку UTF-8
  4. В списке адресов страниц в файле Sitemap необходимо использовать один синтаксис для всех URL (т.е. если сайт размещен на http://www.example.com/, все адреса должны иметь вид: http://www.____/)
  5. Если на сайте есть URL идентификаторы сессий – они не должны фигурировать в карте сайта
  6. Если карта содержит более 50 000 URL создайте файл индекса Sitemap, перечислив в нем все файлы Sitemap, и отправьте его в Google вместо отдельных файлов.
  7. Сообщите Google о версии страницы на других языках с помощью атрибута hreflang.
  8. Используйте расширения файлов Sitemap для дополнительных типов информации, в частности видео, изображений и новостей.
  9. Если у сайта 2 версии: дескопная и обычная, необходимо добавить только 1 версию страниц сайта в карту сайта. Если все же требуется указание на оба URL, добавьте для них аннотации, чтобы распознавались разные версии.
  10. Файл Sitemap может содержать только символы ASCII.
Символ Маскирование
  • Амперсанд
& &amp;
  • Одинарные кавычки
&apos;
  • Двойные кавычки
&quot;
  • Больше чем
> &gt;
  • Меньше чем
< &lt;

11. Поддерживаемые форматы:

  • XML
  • RSS, mRSS и Atom 1.0
  • Текстовый файл

Примечание: Google не поддерживает  priority></priority>.

Инструкция  Google:
https://support.google.com/webmasters/answer/183668?hl=ru

Требования и рекомендации Яндекс

  1. Кодировка UTF-8.
  2. Кириллические URL робот Яндекса распознает как в закодированном виде, так и в оригинале.
  3. Максимальное количество ссылок — 50 000.
  4. Максимальный размер файла в несжатом виде — 50 МБ.
  5. В карте сайта должны быть ссылки только на сайт, на котором будет расположен файл карты.
  6. При обращение к файлу карты – сервер должен возвращать HTTP-код 200.
  7. Поддерживаемые форматы:
  • XML
  • Текстовый файл

Инструкция  Яндекс:
https://yandex.ru/support/webmaster/controlling-robot/sitemap.html#sitemap__is-necessary

Как создать XML карту сайта

  • С помощью генератора XML карты сайта онлайн

Мы собрали 20 сервисов для подготовки бесплатной карты сайта от 50 до 5000 страниц, а также платные версии сервисов, которые позволяют генерировать карту для большего объема страниц.

Сервис 1: https://mysitemapgenerator.com/
Бесплатный до 500 страниц, свыше 500 страниц – платно.

Сервис 2: http://www.majento.ru/index.php?page=seo-analize/sitemap/index
Бесплатный до 250 страниц, свыше – платно.

Сервис 3: https://tools.saitreport.ru/xml-sitemap-generator

Сервис 4: https://gensitemap.ru/
Бесплатный до 1000 страниц, свыше – платно.

Сервис 5: https://www.cy-pr.com/tools/sitemap/
Бесплатный до 500 страниц, свыше 500 страниц – платно.

Сервис 6: https://sitedozor.ru/xml-sitemap-generator

Сервис 7: https://topvisor.com/ru/support/audit/sitemap/generator/#
Платный сервис.

Сервис 8: https://htmlweb.ru/analiz/sitemap.php

Сервис 9: http://sitespy.ru/sozdati-sitemap
Бесплатный до 1200 страниц.

Сервис 10: https://xmlsitemapgenerator.org/sitemap-generator.aspx
Бесплатный до 2000 страниц.

Сервис 11: http://www.web-site-map.com/
Бесплатный до 3500 страниц.

Сервис 12: https://www.g-sitemap-generator.com/en/free
Бесплатный до 1000 страниц, также есть платные версии

Сервис 13: http://xsitemap.com/

Сервис 14: http://makeasitemap.com/

Сервис 15: https://www.xml-sitemaps.com/
Бесплатный до 500 страниц, также есть платные версии

Сервис 16: http://sitemaps-builder.com/
Бесплатный до 1000 страниц, также есть платные версии

Сервис 17: https://www.g-sitemap-generator.com/en/free
Бесплатный до 5000 страниц, также есть платные версии, требует регистрации

Сервис 18: http://xml-sitemaps4u.com/default.aspx
Бесплатный до 1000 страниц, также есть платные версии

Сервис 19: http://xml-sitemaps4u.com/default.aspx

Сервис 20: https://www.powermapper.com/products/mapper/maps/sitemap-generator/

С помощью программы для генерации XML карты сайта

Программа 1. https://netpeaksoftware.com/ru/spider
Платная программа

Полезное видео:
https://www.youtube.com/watch?v=RzPoY3-7_DE

Программа 2. https://www.screamingfrog.co.uk/xml-sitemap-generator/
Платная программа

Полезная информация:
https://www.screamingfrog.co.uk/how-to-audit-xml-sitemaps/

  • С помощью PHP и MySQL

Существует множество плагинов для различных систем управления контентом (CMS), которые позволяют установить карту сайта в 2-4 клика, но если сайт создан с нуля на PHP – плагины не помогут, модуль нужно будет писать программисту.

Пример простого решения:

Столбцы базы данных table:

ID страницы (номер страницы)
URL (адрес страницы)
Date (дата и время последнего изменения)
Meta (если у страницы есть мета-тег noindex)

Файл db.php

';
for ($i=0; $i<=$row; $i++) {
echo 'http://site.ru/sitemap.xml?p='.$i.'';
}
echo '';
}
}
$mysqli->close();
exit();
}
function sitemapN($i) {
define('dbOn', '');
require_once 'абсолютный_адрес/db.php';
if (!$mysqli->set_charset("utf8")) {
printf("Ошибка при загрузке набора символов utf8: %sn", $mysqli->error);
exit();
} else {
if ($result = $mysqli->query("SELECT url, update FROM table WHERE id>=". $i*1000 ." AND id<". ($i+1)*1000 ." AND meta NOT LIKE '%noindex%' LIMIT 1000;")) {
header("Content-Type: application/xml;");
echo '
';
while ($row = $result->fetch_assoc()) {
echo '

http://site.ru/'. $row['url'] .'
'. date('c', strtotime($row['update'])) .'
';
}
echo '
';
}
}
$mysqli->close();
exit();
}
function sitemap404() { /
http_response_code(404);
include_once 'http://site.ru/404.php';
exit();
}

Файл .htaccess

RewriteEngine On # если такой записи нету
RewriteRule ^sitemap.xml$ /sitemap.php

Также есть другие готовые скрипты:

https://www.plop.at/en/xml-sitemap.html
https://www.xml-sitemaps.com/news-20180517.html

  • В ручную

Если сайт небольшой, а программной возможности составить карту сайта нет, можно сделать ее вручную.
Основные теги карты сайта:

  • – тег для указания адреса страницы;
  • – для указания большого количества url адресов;
  • – тег для указания url;
  • – для указания даты последнего обновления;
  • – для указания периодичности обновления страницы (с атрибутами never, always, yearly, monthly и т.д.);
  • – дл корректировки приоритетности индексации страницы от 0,1 до 1).

Порядок создания:

  1. Откройте блокнот или Word
  2. Выпишите перечень страниц сайта
  3. Скопируйту образец тут: https://www.sitemaps.org/protocol.html
    <? xml version = "1.0" encoding = "UTF-8"?>
    < urlset xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9">
    < url >
    < loc > http://www.example.com/ </ loc>
    < lastmod > 2005-01-01 </ lastmod>
    </ Url>
    </ URLset>
  4. Создайте для каждой страницы свой блок, пример
    <? xml version = "1.0" encoding = "UTF-8"?>
    < urlset xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9">
    < url >
    < loc > СТРАНИЦА 1 </ loc>
    < lastmod > 2005-01-01 </ lastmod>
    </ Url>
    < url >
    < loc > СТРАНИЦА 2 </ loc>
    < lastmod > 2005-02-01 </ lastmod>
    </ Url>
    </ URLset>

Добавление XML карты сайта в поисковые системы

  • Как добавить карту сайта в Google
  1. Необходимо перейти в консоль Google https://search.google.com/u/3/search-console
  2. Выбрать нужный сайт (если их несколько)
  3. Перейти в пункт Файлы Sitemap
  4. Добавить карту сайта
  5. Нажать кнопку “Отправить”

Могут возникнуть ошибки:

  • Обнаружены проблемы – файл Sitemap содержит по меньшей мере одну ошибку, однако все URL, которые удалось из него извлечь, будут добавлены в очередь на сканирование. Нажмите на файл в таблице, чтобы увидеть список ошибок. Подробнее об ошибках…
  • Не получено – файл Sitemap не получен. Чтобы выяснить причину, проверьте его с помощью этого инструмента.
    1. Укажите полный путь к файлу, скопировав префикс пути с карточки “Добавьте файл Sitemap” и добавив относительный адрес отправленного файла, например: https://example.com/sitemaps/mobile/sitemap.txt. Копируйте эти адреса непосредственно из отчета, чтобы быть уверенными в том, что вы тестируете тот же URL, который использует Google.
    2. Нажмите Выполнить проверку в инструменте проверки URL. Отобразится информация о том, существует ли файл Sitemap и есть ли у нас к нему доступ.

Инструкция Google по ошибкам в карте сайта:
https://support.google.com/webmasters/answer/7451001#error-list

  • Как добавить карту сайта в Яндекс
  1. Необходимо перейти в консоль Google https://webmaster.yandex.ru/
  2. Выбрать нужный сайт (если их несколько)
  3. Перейти в пункт Индексирование – Файлы Sitemap
  4. Добавить карту сайта
  5. Нажать кнопку “Отправить”

Частые ошибки при создание карты сайта

  • Ошибка 1. Карта сайта содержит удаленные страницы с 404 кодом
  • Ошибка 2. Карта сайта содержит страницы, которые закрыты от индексации в файле robots.txt или путем добавления мета-тега noindex.
  • Ошибка 3. Карта сайта содержит неканонические URL-адреса страниц, вместо канонических URL-адресов (например, когда 1 товара есть 2 URL-адреса (основной и неканонический))
  • Ошибка 4. Устаревшая карта сайта. Не обновление карты сайта после изменения URL-адресов сайта или отсутствие автоматического системного обновления.

Технические ошибки в файлах sitemap детально описывает инструкция Google:
https://support.google.com/webmasters/answer/7451001?hl=ru&visit_id=636897922572528575-3232438947&rd=1

Распространенные заблуждения и мифы о карте сайта

  • Заблуждение 1. Добавление страницы в карту сайта = гарантия индексации
    Это не так. XML карта сайта – это рекомендации для поисковой системы. XML карта не гарантирует индексацию страниц, которые указаны в документе карты сайта.

Что говорит Google:

Даже если вы создали файл Sitemap, это не гарантирует, что Google будет сканировать и индексировать все ваши страницы, так как эти процедуры выполняются при помощи сложных алгоритмов. В большинстве случаев эти файлы приносят пользу и не приводят к ошибкам.

Источник: https://support.google.com/webmasters/answer/156184?hl=ru

  • Заблуждение 2. Удаление URL из карты = удалению URL из индекса ПС.
    Это не так. Если URL уже проиндексирован поисковой системой, удаление его из документа карты сайта не удалит его из индекса.
  • Заблуждение 3. Не добавим URL в карту = поисковая система не проиндексирует URL
    Это не так. В большинстве случаев поисковый робот сможет найти URL на сайте и без карты сайта.
  • Заблуждение 4. Файл Sitemap.xml обязателен для всех сайтов
    Это не так. Если сайт небольшой (до 500-1000 страниц), с проработанной структурой с доступностью в 1-3 клика от главной всех страниц – робот справиться и без карты. Тем не менее рекомендуем оптимизировать этот процесс путем создания карты сайта.

Что говорит Google:

Если страницы файла корректно связаны друг с другом, поисковые роботы могут обнаружить большую часть материалов. Тем не менее с помощью файла Sitemap можно оптимизировать сканирование сайта, особенно в следующих случаях:

  • –Размер сайта очень велик. Поисковые роботы Google могут пропустить недавно созданные или измененные страницы.
  •  Сайт содержит большой архив страниц, которые не связаны друг с другом. Чтобы они были успешно просканированы, их можно перечислить в файле Sitemap.
  •  Ваш сайт создан недавно, и на него указывает мало ссылок. Робот Googlebot и другие поисковые роботы сканируют Интернет, переходя по ссылкам с одной страницы на другую. Если на ваш сайт указывает мало ссылок, его будет сложно найти.
  •  На сайте используется мультимедийный контент, он отображается в Новостях Google или использует другие аннотации, совместимые с файлами Sitemap. Из файлов Sitemap поисковая система может получать дополнительную информацию для показа в результатах поиска.
    Источник: https://support.google.com/webmasters/answer/156184?hl=ru

Как создать HTML карту сайта

HTML карта (sitemap.html) – это список статических основных страниц сайта, другими словами – путеводитель по сайту.

Основная задача – упрощение навигации для пользователя.

Например у нас:

Ссылка на карту сайта, как правило, расположена в нижней части сайта как “Карта сайта”.

Требования для создания карты сайта

  1. Отображает структуру сайта (только основные страницы)
  2. Из карты исключатся:
    – страницы товаров
    – статьи блога
    – новости
    – страницы пагинации
  3. Карта должна иметь функционал автоматического самообновления.
  4. До 150 ссылок. Если больше – можно реализовать карту из нескольких страниц (использовать пагинацию)
  5. Ссылка на карту сайта должна быть размещена со всех страниц сайта в футере.

Пример простой HTML карты сайта:
https://advermedia.ua/sitemap/

Как создать:

  1. Вручную
  2. С помощью плагинов CMS
  3. С помощью сервисов для генерации карты

Loading…

CEO/founder агентства Advermedia.ua, опыт в SEO более 10 лет.
Канал автора в телеграм: @seomnenie

Новые материалы

Related Posts

Популярные статьи

Подписаться на телеграм канал СEO Advermedia Мнение SEO

Публикуем интересные материалы из блога и разбираем вопросы по SEO от подписчиков!


https://t.me/seomnenie
Подписаться

Понравилась статья? Поделить с друзьями:
  • Ошибки при создании бизнес плана
  • Ошибки при создании альпийской горки
  • Ошибки при содержании аквариума
  • Ошибки при согласовании слов
  • Ошибки при согласовании подлежащего и сказуемого