Шукаємо дублі за допомогою нового яндекс вебмастера

Зовсім недавно Яндекс запустив бета тестування оновленого сервісу для веб-майстрів.

В Яндекс Вебмайстер були додані нові звіти, істотно поліпшено візуалізація даних, змінився інтерфейс і багато іншого.

Нововведень досить багато, але сьогодні хотілося б зупинитися на звіті «Статистика індексування», і як з його допомогою можна виявити дублі і сміттєві сторінки.

На багатьох сайтах є неінформативні сторінки, які сканують пошукові системи, але не додають в свій індекс, тому що розуміють що вони з'явилися в результаті технічних помилок. Робота seo фахівця як раз таки полягає в тому, щоб усунути всі проблеми в скануванні та індексування ресурсу.

Якщо ми усунемо десятки, а то і сотні сміттєвих сторінок, на сканування яких витрачають час пошукові системи, ми зможемо збільшити частоту сканування та індексування корисних сторінок сайту, а отже і поліпшити ранжування ресурсу в пошукових системах.

На сторінці звіту «Статистика індексування» ми зможемо дізнатися:

  • Які сторінки сайту сканує робот;
  • Які сторінки робот виключив з пошуку;
  • Які сторінки проіндексовані і знаходяться в індексі пошукової системи Яндекс.

Шукаємо дублі за допомогою нового яндекс вебмастера

У підсумку ми отримуємо файл у форматі .tsv, відкрити який можна через Excel, Libre Office або простим блокнотом.

Шукаємо дублі за допомогою нового яндекс вебмастера

Файл також містить наступні дані:

  • Коди відповіді сервера.
  • Дату останнього сканування в форматі Unix time. перетворити можна, задавши в консолі запит виду date -r.
  • Проіндексованості сторінок.
  • У стовпці «Double» знаходяться посилання на дублікати сторінки, якщо вони є.

Приклади знайдених помилок на сайтах завдяки даним про завантажених сторінках роботами Яндекса:

Сайт asteria.ua:

Були виявлені наступні сторінки:

Це повні дублікати сторінок сайту, вони не проіндексовані, але регулярно скануються Яндексом, отже їх потрібно якомога швидше усунути.

Ще кілька сторінок дублікатів:

Сайт novebti.ua:

Були знайдені дублікати головної сторінки сайту:

З цих сторінок потрібно написати link rel = "canonical» на головну сторінку сайту.

Сторінки такого типу найкраще закривати за допомогою мета тегу robots = "noindex, follow».

Сайт asiamshop.com.ua:

Використовуючи інструмент «Статистика індексування» в новому Яндекс вебмайстрів можна протягом 30 хвилин проаналізувати сторінки, які відвідує робот, виявити проблеми та продумати варіанти їх вирішення.

Якщо ви знайшли помилку, виділіть фрагмент тексту і натисніть Ctrl + Enter або скористайтеся посиланням. щоб повідомити нам.