Xml-карти що таке і як їй користуватися - блог adventum

XML-карта (вона ж sitemap.xml) - це спосіб повідомити пошуковим системам інформацію про сторінки веб-сайту. Якщо неправильно налаштувати XML-карти, ви втратите позиції у видачі. XML-карту часто плутають з HTML-картою. Різниця в тому, що HTML-карта націлена на людей, а XML-карта - на роботів.

Спробуємо розібратися, як користуватися XML-картами.

Індексація

Коли ви завантажуєте XML-карту, ви підказуєте пошуковикам інформацію про сторінки вашого сайту. XML-карта додається в Google Search Console або Яндекс.Вебмайстер.

Xml-карти що таке і як їй користуватися - блог adventum

XML-карта робить індексацію сайту розумніше, але пошуковики ставляться до неї як до підказкою, а не керівництву до дії.

Крім XML-карти є ще два способи роботи з індексацією, які доповнюють XML-карту:

Мета-тег прописується в шапку сторінки і має чотири значення:

Значення можна використовувати в парі:

Значення не чутливі до регістру і їх можна комбінувати.

Не можна одночасно додавати сторінку в XML-карту і robots.txt: так ви відправите пошуковик індексувати заборонену до індексації сторінку. Якщо не хочете індексувати окрему сторінку, пропишіть "noindex, follow". Якщо ви прописали "noindex, follow", не додавайте таку сторінку в XML-карту.

Як поліпшити якість сайту

Принцип оцінки сайту невідомий: алгоритми ранжирування постійно змінюються. Яндекс і Гугл дають загальні поради:

  • Думати про користувачів, а не пошукових системах. Дизайн і контент повинні бути зручні людині.
  • Залучати людей тільки по тим запитам, на які сайт дає відповіді.
  • Чи не накручувати рейтинг штучно.

З точки зору користі для відвідувача, є два типи сторінок:

  • Обслуговуючі сторінки (utility pages).
  • Цільові сторінки (landing pages).

Обслуговуючі сторінки спрощують роботу з сайтом, але самі по собі відвідувачеві не потрібні. Найчастіше це елементи інтерфейсу і сторінки без унікального контенту. Забороніть пошуковикам індексувати допоміжні сторінки: забороніть індексацію в robots.txt або пропишіть мета-тег "noindex, follow". Не вказуйте їх в XML-карті.

Цільові сторінки. Це сторінки, які відвідувач шукає цілеспрямовано: каталог товарів, тематичні статті і т. Д. Не блокуйте їх в robots.txt або мета-тегом "noindex". Обов'язково вкажіть їх в XML-карті.

Припустимо, є сайт на 1000 сторінок, 10 з яких - цільові. Якщо пошуковик відправить відвідувача на одну з 10 сторінок, то швидше за все відвідувач піде на одну з 990 сторінок, де немає корисної інформації. Відвідувач піде з сайту і не вирішить проблему. Навіщо пошуковику відправляти відвідувача на такий сайт?

Тепер уявімо, що цільових і обслуговуючих сторінок на сайті порівну:

  • 500 цільових сторінок
  • 500 допоміжних сторінок

Сторінки, які ви вкажете в XML-карті, пошуковики розцінять як цільові. Можуть скластися дві ситуації:

Ситуація 1: ВXML-карті вказані тільки цільові сторінки.

Пошуковик з радістю просуне сайт у видачі, адже для нього сайт складається з 500 корисних сторінок. 500 допоміжних сторінок не беруть участь в індексації та не позначаються на якості сайту.

Ситуація 2: вXML-карті вказані і цільові, і обслуговуючі сторінки.

Пошуковик не захоче просувати такий сайт. Він як і раніше добре оцінить цільові сторінки, але якість сайту постраждає: обслуговуючі сторінки пошуковик розцінить як цільові. Оскільки обслуговуючі сторінки не несуть користь, пошуковик оцінить їх на «трійки» і «двійки». Якість сайту постраждає, його позиція у видачі буде нижче.

Сторінки, які не вказані в XML-карті, все одно можуть індексуватися, тому може повторитися друга ситуація.

Щоб побачити індексовані сторінки, вбийте в Яндексі або Гуглі «site: search». Ви швидко знайдете допоміжні сторінки: як правило вони йдуть в кінці видачі. Якщо таких сторінок трохи, заблокуйте їх мета-тегом «noindex, follow» або в robots.txt.

Xml-карти що таке і як їй користуватися - блог adventum

А ось виявлена ​​сторінка, яка не несе користі для відвідувача:

Як пользоватьсяRobots.txtі мета-тегомrobots

Тут блокуються сторінки, які є скриптами: ми не хочемо, щоб такі сторінки передавали контрольний вагу іншим сайтам і індексувалися як цільові сторінки.

Можна прописати «disallow: / scripts /», тоді всі скрипти в папці «scripts" не будуть індексуватися.

Щоб окремі сторінки не індексувалися, але передавали вага, пропишіть мета-роботів "noindex, follow".

Xml-карти що таке і як їй користуватися - блог adventum

Сторінка «Зв'яжіться з нами» - обслуговує сторінка, але у неї великий контрольний вагу: на неї часто клікають. Оскільки це обслуговуюча сторінка, ми не хочемо її індексувати, але хочемо, щоб вона передавала свою вагу інших розділів сайту. Щоб заборонити індексацію і не втратити контрольний вагу, ми прописуємо для цієї сторінки "noindex, follow".

Є тонкість: не використовуйте robots.txt для того, щоб заховати особисту інформацію користувачів. На цю інформацію можуть вести сторонні посилання, і інформація буде висвітлена в пошуковій видачі. Пропишіть мета-тег "noindex, follow" в шапці сторінки.

Якщо сайт великий, пошуковики можуть постійно його індексувати. Це може вплинути на швидкість роботи сайту.

Як вирішити проблеми з індексацією

У цьому прикладі в XML-карті перераховано 2698 сторінок, але Гугл проіндексував лише 1155.

Xml-карти що таке і як їй користуватися - блог adventum

Google Search Console покаже число проіндексованих сторінок, але не самі сторінки.

Ви відправляєте XML-карту на 125 000 сторінок, але пошуковик індексує тільки 87 000 сторінок. Як знайти непроіндексовані сторінки?

Проблеми можуть бути такими:

Ваша мета - виявити проблемні елементи, які заважають індексації. Використовуйте загальний відсоток індексації кожної XML-карти для виявлення проблемних елементів.

Припустимо, сторінки не індексуються через опису: всього 100 000 сторінок, і одна п'ята частина, 20 000 сторінок, містить занадто короткий опис. Розширте опис або забороніть індексацію через "noindex, follow". Якщо сторінки не приваблюють багато трафіку, а опис ви берете з сайту виробника, то не витрачайте час на опис для всіх 20 000 сторінок. Приберіть їх з індексації: пошуковик все одно їх не проиндексирует, а вони тільки погіршать якість сайту. Не забудьте виключити ці сторінки з XML-карти.

Як автоматично обновлятьXML-карти

Якщо у вас сайт на 100 000 сторінок, як постійно відстежувати: чи треба додати або виключити сторінку з XML-карти?

XML-карти не зобов'язані бути статичними файлами або мати розширення .xml. Використовуйте автоматичний генератор XML-карт.

У генераторі ви можете задати правила, за якими сторінка потрапить в XML-карту або їй присвоїти "noindex, follow". Повертаючись до нашого прикладу: як тільки ви збільшите опис з 50 слів до 200, сторінка автоматично потрапить в XML-карту і їй присвоїти вже "index, follow".

Що в підсумку: