Создание Sitemap. XML Sitemap: полное руководство по использованию Сервис sitemap

Карту сайта можно сравнить с оглавлением в книге, содержащим перечень всех важнейших разделов. На сайте это такой каталог, где указаны ссылки на главные разделы и страницы веб-ресурса. В целом же в сайтмап находится следующая информация:

  • список URL-адресов страниц сайта в иерархическом порядке;
  • формат появившегося на сайте контента: текст, видео, картинки;
  • сведения о видео и изображениях, необходимые роботам для их внесения в базу данных и формирования поисковой выдачи;
  • информация о приоритетности страницы;
  • данные о внесении последних изменений документов и регулярности их обновлений;
  • сведения про другие версии веб-страницы.

Sitemap помогает посетителям и особенно роботам поисковиков быстро определять расположение всех самых необходимых для индексации страниц, а также их важность по отношению к другим документам, частоту и время последнего изменения, при этом делать как можно меньше «лишних» переходов. Sitemap помогает системе индексировать ресурс более эффективно.

Да, на мелких сайтах к любому документу можно перейти всего в пару кликов, но вот крупные содержат по несколько тысяч страниц и структура их куда сложнее. Без Sitemap на таких ресурсах будет сложно и посетителям, и поисковым ботам.

Исходя из вышеописанного можно выделить три основных ситуации, в ходе которых возникают проблемы с индексацией ресурса и нужен сайтмап:

  1. огромное число страниц;
  2. сложная структура ресурса;
  3. отсутствие внешних либо внутренних бэклинков на важные для индексации страницы.

Виды карт

Любой поисковик вносит страницы сайта в индекс постепенно, начиная с главной страницы и заканчивая документами с глубокой вложенностью это зависит какой имеет сайт.

TXT

Еще один метод оформления карты сайта – файл Sitemap в txt (текстовом формате). Здесь содержится перечень всех важных для индексации ссылок. А вообще данный вариант актуален для вебмастеров, которые не желают особо заморачиваться.

Да, в TXT карте можно тоже разместить 50 тысяч ссылок, но в ней нет возможности указывать дату последнего изменения и относительную приоритетность документов.

Пример

1. http://site.com/; 2. http://site.com/page1/; 3. http://site.com/page2.

Требования Яндекса и Google к картам

Я выделил 6 общих требований, которые два популярнейших поисковика выдвигают к файлу Sitemap:

  1. Необходимо применять UTF-8 кодировку.
  2. Лимит по количеству URL-адресов – до 50 тысяч ссылок.
  3. Если размер файла превышает 10 МБ, поделите его на несколько карт и пропишите их все в файле индекса Sitemap.
  4. В процессе обращения к сайтмапу сервер должен отправлять ответ 200 OK.
  5. Вносите исключительно канонические УРЛы документов: не должно быть никаких идентификаторов сессий или GET-параметров.
  6. Ссылки в файле должны вести на тот же домен, где располагается сама карта сайта. Казалось бы, это элементарное требование. Но на деле многие вебмастера, имеющие несколько веб-ресурсов, перенося шаблон с файлом Sitemap забывали поменять уже имеющиеся ссылки на актуальные.

Есть у поисковых систем и свои, уникальные требования.

Яндекс:

  • максимально допустимый размер – 10 МБ;
  • допускается применять URL-адреса с кириллическими символами.
  • максимально допустимый размер файла – 50 МБ;
  • работает только с латинскими символами и цифрами (кириллические домены можно перекодировать в латинские посредством Punycode).

Важно! Для уменьшения требований к пропускной способности канала применяется архиватор gzip. 10 и 50 МБ – это размеры файлов Sitemap до сжатия архиваторов, а не после.

Влияет ли карта сайта на продвижение?

Отмечу, что без сайтмапа поисковики не понизят ваш ресурс в выдаче. Поисковые системы не глупые и даже если у вас на сайте нет Sitemap, они все равно его.

Сейчас поисковые машины даже без карты сайта сканируют страницы и включают их в выдачу довольно хорошо. Да и в теории они самостоятельно должны этим заниматься, безо всякой помощи со стороны вебмастеров.

Но нередко возникают проблемы, когда роботы дают сбой и не могут просканировать все страницы. Зачастую это случается из-за:

  • глубокой вложенности некоторых разделов, для перехода на которые необходимо перейти по множеству ссылок;
  • динамических УРЛов.

Поэтому в интересах вебмастеров помогать поисковым системам.

Наличие карты сайта позволяет избежать данных ситуаций. Sitemap в определенной степени положительно влияет на SEO продвижение веб-ресурса, потому что делает для роботов процесс обхода и включения в поиск страниц быстрее и легче.

Еще с данным файлом у вашего ресурса уменьшается риск превратиться из первоисточника в копипаст вследствие того, что страницы попадут в индекс раньше, чем конкурентам удастся украсть контент с него и разместить у себя.

Важно! Добавляйте в Sitemap основные страницы, играющие ключевую роль в оптимизации сайта, чтобы они попали в выдачу в первую очередь. Не прописывайте в файле страницы со служебной информацией, динамическими URL, тегами и запрещенные к индексации.

Можно ли без Sitemap?

Ответ очевидный – да. Поисковики воспринимают sitemap.xml лишь в качестве рекомендации для роботов. На практике у веб-ресурсов, где нет карты сайта, Яндекс отмечает наличие возможных, а не критичных либо фатальных проблем.

Как было написано выше, поисковые роботы способны самостоятельно и эффективно индексировать ресурсы, но крупным сайтам и тем, где есть динамические УРЛы, лучше сделать Sitemap, к тому же это не займет много времени, а в дальнейшем может прилично сэкономить ваши нервы.

Как создать карту сайта?

К данному процессу нужно подойти ответственно, потому что здесь необходимо указать основные страницы, которые вы хотите видеть в поисковой выдаче.

HTML

Сайтмап в формате HTML – это прежде всего навигация по разделам сайта для пользователей. Если веб-ресурс имеет лишь несколько сотен страниц, у него простая структура и понятное меню, подключать HTML-карту необязательно.

Но когда сайт масштабный и структура довольно сложная, есть смысл создать страницу с перечнем ссылок на основные страницы.

Учитывайте нишу, к которой относится ваш ресурс и соответственно его целевую аудиторию. Если у вас посетители преимущественно пожилого возраста, карта сайта поможет им сориентироваться в сайте, так как в главном меню разобраться сложнее.

Есть множество способов, как создать Sitemap в формате HTML на движке . Лучше всего сделать это посредством плагина Hierarchical HTML Sitemap и ему подобных. Скачиваете плагин для своей , устанавливаете, а дальше активируете надстройку для установки файла. После – размещаете выданный плагином шорткод на страницу, где хотите подключить сайтмап.

Карта сайта будет доступна по адресу:

http://site.com/sitemap.html

Для других движков есть такие решения:

  • Drupal – плагин Sitemap .
  • Joomla! – плагин OSMap .

Тем кто пользуется OpenCart не нужно беспокоиться о создании HTML карты сайта, потому что она появляется там автоматически.

XML

Если решили создать XML карту сайта, определитесь, каким способом будете это делать:

  1. Cгенерировать сайтмап при помощи движка управления ресурсом , если у него есть соответствующая встроенная функция, используя различные плагины и модули.
  2. Скачать ПО-генератор. Большинство из этих программ платные, но благодаря ним вы можете с легкостью создавать XML файл как для одного, так и для нескольких ресурсов. Вот самые популярные: WonderWebWare SiteMap Generator и SiteMap XML Dynamic SiteMap Generator .
  3. Скачать файл Sitemap онлайн генератором. Выбор специальных сервисов сегодня очень велик, у всех у них разные ограничения и возможности. К примеру, на сайте xml-sitemaps.com настраивается изобилие параметров карты, но разместить в ней можно максимум 500 ссылок.
  4. Ручное подключение Sitemap.

С помощью генератора онлайн

Преимущество данного способа заключается в отсутствии привязки к какому-либо CMS. Онлайн генераторы позволяют создать карту сайта для веб-ресурсов на любых движках и даже на статичных HTML сайтах.

Минус же использования генераторов в том, что бесплатные сервисы сильно ограничены по количеству страниц и больше подходят, например, для сайтов-визиток, где есть несколько страниц и новые появляться уже не будут.

Если же ресурс регулярно пополняется новыми статьями, то бесплатные генераторы не подойдут. Они не обновляют Sitemap, поэтому там не будут появляться новые URL-адреса, из-за чего файл быстро станет неактуальным.

Самый популярный генератор:

Приведу пример, как создать XML карту с XML-Sitemaps.

Заходите на сайт сервиса и указываете адрес своего ресурса, кликаете на кнопку START.

Через несколько минут сайтмап в формате XML будет сгенерирован. Далее закачиваете файл на жесткий диск компьютера.

Затем нужно загрузить Sitemap в корневую папку сайта при помощи FTP-клиента, к примеру, WinSCP . Если не знаете где искать корневой каталог, введите в поиске index.html. Сюда загружаете файл.

Через программное обеспечение

Создать XML карту сайта данным способом не так уж сложно. Сейчас я покажу, как это сделать на примере программы для ПК Majento :

  1. ресурс.
  2. В верхней вкладке заходите в раздел «Сайты», затем кликаете «Генерировать Sitemap».
  3. Сохраняете файл в.xml формате.
  4. Все – карта на вашем сайте.

Посредством плагинов для CMS

Данный вариант куда удобнее, чем бесплатные генераторы онлайн. Плагины для движков управления сайтами более функциональные, позволяют изменять параметры карты сайта. А один из главных плюсов – наличие надстроек для автоматического обновления файла сразу после появления новых документов, а также уведомления о них поисковым системам.

Для сайтов на базе WordPress одним из лучших вариантов является модуль Google XML Sitemaps . Установите, а затем активируйте плагин. Далее зайдите в настройки.

В основных параметрах включите оповещения для Google, укажите адрес карты сайта в файле robots и активируйте функцию сжатия Sitemap.xml.

Перейдите в «Приоритет статьи» и отключите функцию автоматической приоритезации страниц. Потом вам нужно будет указать приоритеты публикаций самостоятельно. Загляните в раздел «Содержание Sitemap». Включите в карту сайте исключительно те типы документов, которые вы хотите проиндексировать.

Не забудьте поставить галочку напротив Include the last modification time. Так модуль покажет роботам в сайтмапе дату последнего обновления страницы, что поможет им рассчитать дату повторного обхода сайта.

Опция Change Frequencies позволяет выставить периодичность переиндексации определенных типов документов. Зачастую поисковики не следуют тегу changefreq, прописанному в файле Sitemap, потому что они самостоятельно определяют краулинговый бюджет ресурса и отталкиваются от него.

Однако плагин предоставляет возможность дополнительно настроить периодичность сканирования, но и это будет рекомендацией, а не командой.

Excluded Items позволяет удалить из sitemap.xml определенные документы либо категории.

Вкладка «Приоритеты» говорит сама за себя. Здесь указывается приоритетность страниц, значения для них выставляются от 0,1 до 1. Изначально у каждой страницы стоит значение 0,5. Выставьте наивысший приоритет самым важным для ранжирования страницам.

В конце обязательно сохраните изменения в настройках. Плагин продолжит функционировать в фоновом режиме и уже не будет необходимости в него заходить – карта сайта продолжит оставаться актуальной, так как все обновляется автоматически. Далее нужно лишь добавить файл в вебмастерские панели Яндекса и Google.

Для изображений

Поисковый гигант работает также с картами сайта, предназначенными для изображений. Благодаря ему роботы Google могут получать больше данных про изображения на сайте. Еще синтаксис помогает поисковику быстрее находить и индексировать картинки, которые ему не удалось отыскать в процессе сканирования ресурса.

Можно сделать синтаксис для картинок отдельно либо добавить его в уже созданный Sitemap. В сайтмапе для изображений, как и в стандартном, содержатся необязательные и обязательные теги XML.

К числу обязательных относятся:

  • – УРЛ-адрес картинки;
  • – тег, подобный , содержащий в себе адрес и другую информацию касательно изображения.

Необязательные теги следующие:

  • – подпись для картинки;
  • – название картинки;
  • – место, где делалось фото;
  • – УРЛ лицензии картинки.

Для видео

Google еще поддерживает карты сайта в формате XML, предназначенные специально для видео. Преимущества данного синтаксиса следующие:

  • позволяет показать поисковикам подробное описание видеофайла;
  • показывает ботам тип контента на ресурсе;
  • в результатах выдачи может отображать заставку для видеоролика, что в потенциале повышает клики и переходы на сайт;
  • контент можно будет найти в Google Видео .

XML карта для видео включает в себя обязательные теги:

  • – содержит все данные о видеофайле;
  • – в нем прописывается УРЛ страницы, где есть видео, а при наличии более одного видеофайла на странице в теге можно прописать несколько для каждой видеозаписи отдельно;
  • – описание к видео, которое необходимо прописывать на основе страницы, а количество символов не должно превышать 2048;
  • – адрес заставки (миниатюры) для видеофайла с допустимыми размерами от 160x90 до 1920x1080 пикселей и возможными форматами png, gif, jpg, or;
  • – заголовок для видео, который нужно указать аналогично названию документа, где размещена видеозапись.

Описание и заголовок видеофайла необходимо либо экранировать, либо поместить в блок CDATA. Сгенерировать видео для sitemap.xml можно используя плагин WP Video SEO .

TXT

Необходимо создать текстовый файл в кодировке UTF-8. В нем прописывать исключительно УРЛы страниц, которые следует проиндексировать.

Где разместить карту сайта?

Файл Sitemap лучше всего размещать в корневой папке веб-ресурса. А ссылка на карту сайта размещается в . Выглядеть она должна примерно так:


Наглядно посмотреть можно в нашем примере robots.txt по ссылке

Как добавить в Яндекс Вебмастер

Сайтмап предоставляет возможность сообщить поисковой системе про актуальную структуру ресурса, поэтому его можно добавить в панель вебмастера Яндекса .

Здесь можно:

  1. Загрузить карту сайта.
  2. Оповестить о ее обновлении.
  3. Исключить файл.
  1. Выберите веб-ресурс из списка.
  2. Укажите в соответствующем поле УРЛ-адрес расположения файла.
  3. Кликните «Добавить».

Так вы отправите карту сайта на обработку. Поисковый бот загрузит файл не позже чем через 14 дней. Все добавляемые файлы поисковая машина обрабатывает по-отдельности. Когда файлы загрузятся, напротив каждого из них отобразится статус:

  • ОК. Файл создан корректно и загружен в базу данных. Возле него будет показана дата последнего обновления. Документы, которые роботы уже проиндексировали, отобразятся в результатах выдачи не позже чем через 2 недели.
  • Редирект. Адрес файла перенаправляет на другой УРЛ. В данном случае требуется удалить редирект и оповестить систему про обновление .
  • Ошибка. Файл сделан некорректно. Перейдите по ссылке Ошибка , где будут описаны ее причины. Исправьте все, что требует поисковик и далее сообщите о внесении изменений.
  • Не проиндексирован. Сервер отправляет HTTP-код, который отличается от 200 ОК. Зайдите в инструмент Проверка ответа сервера и вставьте полный URL расположения карты сайта, чтобы убедиться, есть ли у поискового бота доступ к ней. Если файл недоступен, свяжитесь с администратором сервера или ресурса, где он размещен.

Также убедитесь, что в robots.txt вы не применили к файлу директиву Disallow, запрещающую его индексацию.

Обновление

При внесении каких-либо изменений в карту сайта нет необходимости удалять ее, а потом опять загружать, так как боты часто проверяют сайтмап на обновления и наличие ошибок. Рекомендуется лишь кликнуть по значку ручного обновления, что позволит ботам быстрее обойти файл.

На заметку. Количество попыток ручного обновления ограничено, поэтому используйте его с умом.

  1. Зайдите в панель вебмастера Google.
  2. Найдите раздел «Сканирование», в нем перейдите в «Файлы Sitemap».
  3. Кликните «Добавление/Проверка файла».
  4. Введите адрес, по которому доступна карта сайта.
  5. Кликните «Отправить».

Если вы хотите проверить Sitemap на ошибки, рядом с кнопкой «Отправить» находится «Тест» – нажмите для проверки. После проверки отобразится окно с сообщением о наличии или отсутствии ошибок.

В справке Google можно ознакомиться со списком всех возможных ошибок и вариантов их решения.

Удаление

Если у вас новый интерфейс Search Console, напишите в поддержку поисковой системы.

Но наиболее оптимальный вариант – переключиться на старую версию внизу страницы. А дальше все как и в Яндекс.Вебмастер: переходите к выбору сайта из списка и затем напротив Sitemap ставите галочку для удаления файла.

Заключение

Тщательно продумайте, какие страницы вашего веб-ресурса самые приоритетные по отношению к другим, и указывайте их в файле Sitemap. Это эффективный инструмент, грамотное применение которого поможет роботам поисковых систем быстрее обходить сайт и получать информацию о его структуре.

С помощью файла Sitemap можно сообщить Яндексу об актуальной структуре сайта, указав специальную директиву в robots.txt или добавив в Яндекс.Вебмастер.

Вебмастер позволяет:

Загрузка Sitemap

    Выберите из списка сайт.

    В поле впишите URL, по которому доступен файл. Например, https://example.com/sitemap.xml .

    Нажмите кнопку Добавить .

После добавления файл попадает в очередь на обработку. Робот загрузит его в течение двух недель. Каждый добавленный файл, в том числе вложенный в файл индекса Sitemap , обрабатывается роботом отдельно.

После загрузки напротив каждого файла вы увидите один из статусов:

Статус Описание Примечание
«OK»
«Редирект» Удалите редирект и сообщите роботу об обновлении
«Ошибка» Файл сформирован неправильно сообщите роботу об обновлении
«Не проиндексирован»
Disallow сообщите роботу об обновлении
Статус Описание Примечание
«OK» Файл сформирован правильно и загружен в базу робота

Напротив файла отобразится дата последней загрузки.

Проиндексированные страницы появятся в результатах поиска в течение двух недель

«Редирект» Указанный URL перенаправляет на другой адрес Удалите редирект и сообщите роботу об обновлении
«Ошибка» Файл сформирован неправильно Нажмите ссылку Ошибка , чтобы узнать подробности. После внесения изменений в файл сообщите роботу об обновлении
«Не проиндексирован» При обращении к Sitemap сервер возвращает HTTP-код, отличный от 200

Проверьте, доступен ли файл для робота с помощью инструмента , указав полный путь к файлу.

Если файл недоступен, обратитесь к администратору сайта или сервера, на котором он расположен.

Доступ к файлу запрещен в robots.txt с помощью директивы Disallow Разрешите доступ к Sitemap и сообщите роботу об обновлении

Обновление Sitemap

Если вы изменили добавленный в Яндекс.Вебмастер файл Sitemap , его не надо удалять и загружать снова - робот регулярно проверяет файл на обновления и ошибки.

Чтобы ускорить обход файла, нажмите значок . Если вы используете файл индекса Sitemap , можно запустить обработку каждого перечисленного в нем файла. Робот загрузит данные в течение трех дней. Использовать функцию можно до 10 раз для одного хоста.

Когда вы израсходуете все попытки, следующая будет доступна через 30 дней после первой. Точная дата отображается в интерфейсе Вебмастера.



Удаление Sitemap

В интерфейсе Яндекс.Вебмастера можно удалить те файлы, которые были добавлены на странице Файлы Sitemap : Если для Sitemap была добавлена директива в файле robots.txt , удалите ее. После внесения изменений информация о Sitemap пропадет из базы робота и Яндекс.Вебмастера в течение нескольких недель.

Вопросы и ответы

Sitemap отображается в сервисе как исключенная страница со статусом «Неверный формат документа»

Отображение файла Sitemap (как и других XML-файлов) как исключенных страниц имеет только информативный характер и никак не влияет на индексирование сайта или обработку Sitemap .

Файл Sitemap может отображаться в группе исключенных страниц, так как робот попытался проиндексировать его как обычную страницу, в то время как файлы формата XML не индексируются в поисковой системе Яндекса и в результатах поиска не участвуют.

При обработке Sitemap возникла ошибка «Неизвестный тег»

Файл Sitemap может содержать только определенные XML-элементы . Если Вебмастер обнаружит в файле другие элементы (например, указание на мобильную или мультиязычную версию, адреса картинок), в Вебмастере появится ошибка «Неизвестный тег». Неподдерживаемые элементы игнорируются роботом при обработке Sitemap , при этом данные из поддерживаемых элементов учитываются. Поэтому менять файл Sitemap необязательно.

Если содержимое файла будет изменено, потребуется до двух недель на обновление информации в Вебмастере.

Файл Sitemap находится в статусе «Не проиндексирован»

Файл Sitemap может быть не проиндексирован по нескольким причинам:

    Робот обошел файл Sitemap недавно и еще не успел обработать его. Подождите две недели. Если вы используете файл индекса Sitemap с несколькими файлами, то их обработка может занять больше времени, чем одного файла Sitemap .

    Сайт ранее был недоступен для индексирующего робота. Необходимо дождаться следующего посещения сайта роботом.

    Доступ к Sitemap запрещен в файле

Из этой статьи вы узнаете, как создать файл Sitemap и предоставить к нему доступ роботам Google.

Создание и отправка файлов Sitemap

Форматы файлов Sitemap

Google поддерживает несколько форматов файлов Sitemap, описанных ниже. Во всех форматах следует использовать стандартный протокол . Google в настоящее время не учитывает атрибут В файлах Sitemap.

Для всех форматов действуют следующие ограничения: файл Sitemap может содержать не более 50 000 URL, а его размер в несжатом виде не должен превышать 50 МБ. Если объем файла или количество перечисленных в нем адресов превышают эти лимиты, разбейте его на несколько частей. Вы можете создать файл индекса Sitemap , перечислив в нем все файлы Sitemap, и отправить их в Google все сразу.

Пример URL, в котором содержится символ, не относящийся к кодировке ASCII (ü), а также символ, требующий экранирования (&):
http://www.example.com/ümlat.html&q=name
Тот же URL в кодировке ISO-8859-1 (для размещения на сервере, использующем эту кодировку) и с примененным экранированием:
http://www.example.com/%FCmlat.html&q=name
Тот же URL в кодировке UTF-8 (для размещения на сервере, использующем эту кодировку) и с примененным экранированием:
Тот же URL с экранированной последовательностью вместо символа амперсанда:
http://www.example.com/%C3%BCmlat.html&q=name

  • Помните, что мы не гарантируем сканирование каждого URL в файле Sitemap. Такие файлы лишь помогают Google определить, какие страницы вы считаете важными.
  • Значения priority и changefreq игнорируются, поэтому их не нужно добавлять.
  • Google считывает значение lastmod , но только если оно указано корректно.
  • Как сделать файл Sitemap доступным для Google

    Файл Sitemap анализируется только при первом его обнаружении, а не при каждом сканировании сайта. Чтобы файл был обработан повторно, вам необходимо сообщить нам о том, что данные в нем изменились. Это делается с помощью запроса ping. Не добавляйте несколько раз одинаковые файлы Sitemap и не отправляйте запросы ping, если в файл не вносились изменения и он не новый.

    Предоставить роботам Google доступ к файлу Sitemap можно несколькими способами:

    • Отправьте его в Google с помощью специального инструмента в Search Console
    • Вставьте в любом месте файла robots.txt строку, указывающую на расположение файла Sitemap:
      Sitemap: http://example.com/sitemap_location.xml
    • Воспользуйтесь запросом ping. Отправьте HTTP-запрос GET:
      http://www.google.com/ping?sitemap=<polniy_url_faila_sitemap >
      Пример:
      http://www.google.com/ping?sitemap=https://example.com/sitemap.xml

    Предположим у вас есть сайт, забитый уникальным контентом, на котором проведена SEO оптимизация и сидите вы, потирая ладошки в ожидании, когда же ваше детище начнет посещаться поисковым роботом, индексироваться и приносить заветный трафик. Идет время, а результат ваших стараний не особо-то и виден. В чем же дело? Возможно, что-то все же было упущено из виду, что-то да забылось в погоне за ништяками. Предположим, что сайт по-прежнему уникальный и оптимизаторы из вас хоть куда. Тогда нужно разбираться, почему поисковик так неохотно вас посещает и по какой причине все происходит так медленно.

    Каждый web-проект должен иметь два важных, а может и основных файла: это роботс (robots.txt) и карта сайта (). Если какой-то из них отсутствует или неверно заполнен, велика вероятность, что ресурс не даст того результата, на который вы рассчитывали. Ведь у поисковых ботов есть заданные ограничения как по времени нахождения на ресурсе, так и по количеству документов, которые они могут проверить и занести в базу. А это все к тому, что если вами не были заданы пути перемещения для поискового робота, то он может добраться до контента очень нескоро, перед этим побродив в файлах движка.

    Чтобы избежать подобной неразберихи, в файле роботс мы говорим, на что ботам не стоит тратить время, а с помощью карты сайта, наоборот, подсказываем куда следует заглянуть и где побродить.

    Предположим, что у нас все срослось и поисковики начали индексировать наш проект, а вот отсутствие второго может затянуть достижение поставленных целей. А теперь подробнее про создание sitemap.

    XML и HTML версии карты сайта

    Sitemap.html выступает в роли навигации для гостей нашего ресурса, которая помогает понять структуру сайта и найти интересующий их раздел.

    Sitemap.xml подсказывает и помогает поисковым ботам обнаружить и начать индексировать страницы нашего проекта. Если мы имеем большой уровень вложенности и многочисленное количество веб-страниц на сайте, XML гарантирует, что боты не упустят из вида, то что нужно проиндексировать. Как приятный бонус мы получаем плюсик к карме в виде увеличения доверия к ресурсу со стороны поисковиков.

    Положительные стороны присутствия sitemap. xml на сайте

    • ускоренное индексирование недавно созданных страниц;
    • стопроцентная вероятность того что поисковик отыщет необходимые страницы;
    • возможность указать приоритеты при проверке, частоту и дату последнего обновления страницы;
    • немного увеличивается доверие к ресурсу.

    Важно!

    • используйте для карты сайта кодировку UTF-8 ;
    • вес файла должен быть не более 10 MB и его содержание не должно быть больше 50 тысяч URL .

    Как создать и добавить sitemap. xml на сайт

    Берем любой текстовый редактор, например Notepad++, и начинаем творить.

    Первым блоком идет стандартная часть, в которой мы указываем:

    http://Наш сайт.ru/ 2016-05-23T23:45:36+00:00 daily 1.0

    Значения тегов:

    • «loc» - в него мы заключили адрес страницы нашего сайта, которую в скором времени должны проиндексировать поисковые роботы;
    • «lastmod» - отображается последняя дата обновления страницы указанной в первом теге;
    • «changefreq» - показывает как часто будет обновляться контент (в нашем случае каждый день);
    • «priority» - задает приоритетность к индексации страницы (от 0 до 1)

    Сохраняем получившийся файлик в формате XML и помещаем его в . Далее указываем путь к нему в robots. txt прописывая данную строчку:

    http://Наш сайт/sitemap.xml

    Либо мы можем использовать один из онлайн-генераторов. Например, , который рассчитан на создание не больше чем 500 страниц. Но зачастую больше и не надо, поэтому работаем с ним.

    В первую строку вписываем полный URL нашего сайта с http://Наш сайт.

    Вторая строка, которая называется « Change frequency», показывает поисковым роботам, как часто будут обновляться веб-страницы. Можем выбрать: never, weekly, daily, hourly, monthly, yearly.

    Третья строка « Last modification » показывает, когда последний раз обновлялась страница, можем выбрать либо дату когда мы решили создать карту сайта, либо выбрать « Use server’s response » - тогда генератор автоматически внесет дату последнего изменения.

    И четвертая строка « Priority», как мы уже ранее обсуждали позволяет выбрать приоритет к индексации, выбираем « Automatically Calculated Priority ».

    Нажимаем кнопку «Start» и ждем когда сгенерируется карта сайта в формате XML , после опять проделываем манипуляции с помещением в корень и указания пути в robots.txt.

    Как сообщить о файле sitemap после создания Google и Яндекс

    Заходим в Вебмастер и действуем следующим образом.

    Выбираем проверку карты сайта:

    И задаем путь к нашему файлу sitemap.

    Проверяем что получилось:

    Убеждаемся, что все в порядке и отправляемся на поклон к Google.

    Для того чтобы попасть в Search Console Гугл, в которой, собственно, и можно сообщить о нашей карте, переходим

    Обновляем страницу - перед нами результат проверки и если в колонке «Проблемы» стоит прочерк, значит, мы все сделали правильно.

    Подведем итоги

    Создать и разместить файл sitemap. xml на ресурсе по факту минутное дело, для этого можно использовать любой текстовый редактор или онлайн-генератор. Если у вас есть карта сайта на своем ресурсе вы ускоряете и упрощаете жизнь поисковому роботу, который следует по указанному пути и индексирует нужные страницы. Это значит, что результат вашей работы по оптимизации имеет шанс быстрее стать заметным. Но важно не забывать про карту сайта и периодически ее обновлять, т.к. страница может перестать участвовать в продвижении, а боты будут продолжать ее посещать, что отразится на позициях. Также наш XML-проводник может служить помощником не только роботам, но и воришкам контента, ведь в sitemap мы указываем нужные нам документы, что значительно упрощает жизнь копипастерам. Поэтому рекомендуем периодически проверять контент вашего ресурса на уникальность. Соблюдая эти правила вы повышаете доверие поисковых систем Google и Яндекс к своему ресурсу.

    Файл sitemap.xml - это инструмент, который позволяет вебмастерам информировать поисковые системы о страницах сайта, доступных к индексации. Также, в XML карте можно указывать дополнительные параметры страниц: дата последнего обновления, частота обновлений и приоритет относительно других страниц. Информация в sitemap.xml может влиять на поведение поискового краулера и, в целом, на процесс индексации новых документов. Sitemap содержит в себе директивы включения страниц в очередь на обход и дополняет robots.txt, содержащий директивы исключения страниц.

    В этом руководстве вы найдете ответы на все вопросы, касающиеся использования sitemap.xml.

    Нужен ли мне sitemap.xml

    Поисковые системы используют sitemap для поиска новых документов на сайте (это могут быть html-документы или медиа-контент), которые недоступны через навигацию, но их необходимо просканировать. Наличие ссылки на документ в sitemap.xml не гарантирует его сканирование или индексацию, но чаще всего файл помогает большим сайтам индексироваться лучше. К тому же, данные из XML карты используются при определении канонических страниц, если это специально не указано в теге rel=canonical.

    Sitemap.xml важен для сайтов, где:

    • Некоторые разделы недоступны через навигационное меню.
    • Имеется множество изолированных страниц или плохо связанных между собой.
    • Используются технологии, слабо поддерживаемые поисковыми системами (например, Ajax, Flash или Silverlight).
    • Присутствует очень много страниц и есть вероятность, что поисковый краулер пропустит новый контент.

    Если это не ваши случаи, то скорей всего sitemap.xml вам не нужен. Для сайтов, где каждая важная для индексации страница доступна в пределах 2х кликов, где для отображения контента не используются технологии JavaScript или Flash, где при необходимости используются канонические и региональные теги, и свежий контент появляется не чаще, чем на сайт заходит робот, в файле sitemap.xml нет необходимости.

    Для небольших проектов при наличии проблемы лишь большого уровня вложенности документов, ее легко решить с помощью HTML карты сайта, не прибегая к использованию XML карты. Но если вы решили, что sitemap.xml вам все-таки нужен, то прочитайте это руководство полностью.

    Техническая информация

    • Sitemap.xml является текстовым файлом формата XML . Однако, поисковые системы также поддерживают текстовый формат (см. следующий раздел).
    • Каждый сайтмап может содержать максимум 50 000 адресов и весить не более 50Мб (10Мб для Яндекса).
    • Можно использовать gzip-сжатие для уменьшения размера файла sitemap.xml и увеличения скорости его передачи. В таком случае используйте расширение gz (sitemap.xml.gz). При этом, ограничения по весу остаются для несжатых сайтмапов.
    • Местоположение файла Sitemap определяет набор URL-адресов, которые можно включить в этот Sitemap. Карта, содержащая адреса страниц всего сайта, должна располагаться в корне. Если сайтмап располагается в папке, то и все URL в этом сайтмапе должны располагаться в этой папке или глубже ().
    • Адреса в sitemap.xml должны быть абсолютными.
    • Максимальная длина URL - 2048 символов (1024 символа для Яндекса).
    • Спецсимволы в URL (типа амперсанда "&" или кавычек) должны маскироваться в HTML-сущности.
    • Указанные в карте страницы должны отдавать 200 http-код статуса.
    • Перечисленные в карте адреса не должны быть закрыты в файле robots.txt или в meta-robots.
    • Sitemap не должен быть закрыт в robots.txt, иначе поисковая система его не просканирует. Сам файл может находиться в индексе, это нормально.

    Форматы XML карт

    Поисковые системы поддерживают простой текстовый формат карты сайта, где просто списком перечислены URL-адреса страниц без дополнительных параметров. В таком случае файл должен иметь кодировку UTF-8 и иметь расширение .txt .

    Также поисковиками поддерживается стандартный XML-протокол . Google дополнительно поддерживает сайтмапы для изображений, видео и новостей.

    Пример файла Sitemap, содержащий только один адрес.

    https://сайт/ 2018-06-14 daily 0.9

    XML-теги
    urlset
    url (обязательный) - родительский тег для каждого URL-адреса.
    loc (обязательный) - URL-адрес документа, должен быть абсолютным.
    lastmod - дата последнего изменения документа в формате Datetime .
    changefreq - частота изменения страницы (always, hourly, daily, weekly, monthly, yearly, never). Значение этого тега является рекомендацией поисковым системам, а не командой.
    priority - приоритетность URL относительно других адресов (от 0 до 1) для очередности сканирования. Если не указывается, то по умолчанию равна 0.5.

    XML карта для изображений

    Некоторые оптимизаторы вставляют в sitemap.xml ссылки на изображения аналогично ссылкам на html-документы. Так можно делать, но лучше для Google использовать расширение стандартного протокола и вместе с урлами отправлять дополнительную информацию об изображениях. Создавать XML карты изображений полезно, если картинки необходимо сканировать и индексировать, и при этом, они напрямую не доступны боту (например, используется JavaScript).

    Пример карты сайта, содержащей одну страницу и принадлежащие ей изображения

    http://example.com/primer.html http://example.com/kartinka.jpg http://example.com/photo.jpg Вид на Балаклаву Севастополь, Крым http://creativecommons.org/licenses/by-nd/3.0/legalcode

    XML-теги
    image:image (обязательно) - информация об одном изображении. Максимум может использоваться 1000 изображений.
    image:loc (обязательно) - путь к файлу изображения. Если используется CDN, то допустимо ссылаться на другой домен, если он подтвержден в панели для вебмастеров.
    image:caption - подпись к изображению (может содержаться длинный текст).
    image:title - название изображение (обычно короткий текст).
    image:geo_location - место съемки.
    image:license - URL лицензии изображения. Используется при расширенном поиске по картинкам.

    XML карта для видео

    Подобно карте для изображений, Google также имеет расширение sitemap протокола для видео, где можно указывать подробную информацию о видео-контенте, влияющую на отображение в поиске по видео. Видео-сайтмап необходим, когда на сайте используются видео, которые хостятся локально, и когда индексация этих видео затруднена из-за используемых технологий. Если вы на сайте внедряете видео из YouTube, то video-sitemap здесь не нужен.

    Файл Sitemap для новостей

    При наличии на сайте новостного контента и участии в Google Новостях полезно использовать Sitemap для новостей, так Google будет быстрей находить ваши свежие материалы и индексировать все новостные статьи. В этом случае Sitemap должен содержать только адреса страниц, опубликованных за последние 2 дня и содержать не более 1000 урлов.

    Использование нескольких карт

    При необходимости можно использовать несколько карт сайтов, объединяя их в один индексный сайтмап. Несколько sitemap.xml используются в случаях, когда:

    • На сайте используется несколько движков (CMS).
    • На сайте больше 50 000 страниц.
    • Необходимо настроить удобное отслеживание ошибок в разделах.

    В последнем случае каждый большой раздел сайта имеет свой sitemap.xml и все они добавляются в панель для вебмастеров, где удобно наблюдать, в каком из разделов больше всего ошибок (см. раздел поиска ошибок в карте сайта).

    Если у вас 2 и более сайтмапа, их необходимо объединить в индексный сайтмап, который выглядит также как обычный (за исключением наличия тегов sitemapindex и sitemap вместо urlset и url), имеет аналогичные ограничения и может ссылаться только на обычные XML карты (не на индексные).

    Пример Sitemap Index:

    http://www.example.com/sitemap-blog.xml.gz 2004-10-01T18:23:17+00:00 http://www.example.com/sitemap-webinars.xml.gz 2005-01-01

    sitemapindex (обязательный) - указывает стандарт текущего протокола.
    sitemap (обязательный) - содержит информацию об отдельном sitemap.
    loc (обязательный) - местоположение sitemap (в формате xml, txt или rss для Google).
    lastmod - время изменения сайтмапа. Позволяет поисковикам быстро обнаруживать новые URL на сайтах больших размеров.

    Как создать sitemap.xml

    Методы создания XML Sitemap:

    • Внутренние средства CMS. Многие CMS уже поддерживают создание карты сайта. Чтобы это выяснить, почитайте документацию к вашей CMS, посмотрите пункты меню в администраторской панели или обратитесь в техподдержку движка. Загрузите на вашем сайте файл https://вашсайт.com/sitemap.xml , возможно он уже существует и динамически формируется.
    • Внешние плагины. Если в CMS нет функционала генерации карты сайта, и она поддерживает плагины, погуглите, какой из плагинов закрывает вопрос sitemap.xml для вашего движка и установите его. В некоторых случаях необходимо обратиться к программистам, чтобы они написали вам подобный плагин.
    • Отдельный скрипт на сайте. Зная протокол XML карты и технические ограничения, можно создать sitemap.xml самостоятельно, добавив скрипт генерации в CRON. Если вы не программист, используйте другие пункты этого списка.
    • Генераторы Sitemap. Существует множество генераторов sitemap.xml, которые сканируют ваш сайт и дают скачать готовую карту. Недостаток здесь в том, что при каждом обновлении сайта необходимо вручную генерировать сайтмап.
    • Парсеры. Десктопные программы, предназначенные для технического анализа сайта, обычно предоставляют возможность скачать sitemap.xml, сгенерированный на основе просканированных страниц. Работает аналогично генераторам sitemap, только запускается локально на своей машине.

    Популярные онлайн-генераторы карты сайта

    XML-Sitemaps.com

    Позволяет получить sitemap.xml в несколько кликов. Поддерживает форматы XML, HTML, TXT и GZ. Удобно использовать для небольших сайтов (до 500 страниц).

    Похожий генератор, но имеет чуть больше настроек и позволяет создать карту до 2000 страниц бесплатно.

    Имеет множество настроек, позволяет импортировать URL-адреса из CSV-файла. Бесплатно сканирует до 500 урлов.

    Не имеет лимитов на количество страниц для сканирования. Но для больших сайтов процесс генерации может подвисать на несколько десятков минут.

    Локальные программы для генерации XML Sitemap

    G-Mapper Sitemap Generator

    Бесплатная десктопная версия генератора карты сайта под Windows.

    Screaming Frog SEO Spider

    Гибкий инструмент генерации карты сайта с множеством настроек. Удобно, если вы уже пользуетесь скримин фрогом для других SEO-задач. После сканирования сайта используйте пункт меню Sitemaps -> Create XML Sitemap.

    Netpeak Spider

    Менее гибкое, но тоже удобное решение для быстрой генерации sitemap.xml. После сканирования сайта необходимо использовать пункт меню Инструменты -> Генерация Sitemap.