Правила апорт!

1. ЯК ДОДАТИ САЙТ В АПОРТ

Реєстрація сайту в Апорт

Що потрібно і що не потрібно додавати

Сайтом, в розумінні Апорта, може бути як цілий сервер (наприклад, www.agama.com), так і самостійна за змістом частина сервера (наприклад, www.company.ru/

З моменту додавання сайту в Апорт до моменту його появи в пошуковій базі проходить від двох-трьох днів до двох тижнів. В окремих випадках, наприклад, у разі нестабільного зв'язку з доданим сайтом, цей час може виявитися трохи більше.

2. ЯК ОНОВИТИ ІНФОРМАЦІЮ ПРО ВЖЕ ЗАРЕЄСТРОВАНОГО САЙТІ

Апарат періодично перевіряє вже наявні в його базі сайти і призводить свою базу у відповідність з що відбулися там змінами. Період перевірки в значній мірі залежить від конкретного сайту (враховується його популярність, динамічність поновлення за даними зібраним Апортом при попередніх заходах на сайт і ряд інших чинників).

3. ЯК ЗРОБИТИ, ЩОБ АПОРТ ЯКІСНО проіндексованих САЙТ

Які документи на сервері індексує Апорт

Документи, що містять в Url символ "?", Індексуються Апортом вибірково, з використанням квотування кількості таких документів для кожного сайту. Розмір квоти обчислюється автоматично в залежності від ряду умов, зокрема від індексу цитованості сайту, і може, зокрема, бути для деяких сайтів нульовим.

Які частини документа індексує Апорт

4. СОРТИРОВКИ РЕЗУЛЬТАТІВ ВИДАЧІ


Завдання ранжирування результатів пошуку є визначальною з точки зору якості роботи пошукової системи. Розробка хорошою функції ранжирування вельми непросте завдання, зокрема, через велику неоднорідності ранжируваних документів і через спроби свідомого спотворення результатів пошуку за допомогою пошукового спаму. Потужним засобом підвищення якості ранжирування є облік гіпертекстової структури Інтернету: ранжирування посилань і індекс цитованості дозволяють (хоча і не завжди) відрізнити якісний контент від схожого за змістом "сміття", а також (що особливо важливо для власників сайтів) оригінальні матеріали від їх копій. Однак і тут доводиться мати справу з тими ж проблемами: неоднорідністю посилальної структури і її свідомим перекручуванням спамерами.

Принциповим моментом в ранжируванні результатів пошуку в Апорт є прагнення до обліку максимальної кількості критеріїв ранжирування в їх взаємозв'язку. Зокрема, помітну перевагу отримують документи, що мають високий вага відразу по декількох незалежних критеріям (наприклад, по частотності слів запиту в тексті і посилальному ранжирування).

Ранжування проводиться виключно автоматичними методами, ми не здійснюємо спеціальної коригування результатів пошуку для будь-яких запитів або сайтів.


Враховується як абсолютна, так і відносна частота слова в тексті документа.

І для тієї і для іншої величини існують порогові значення, після досягнення яких подальше збільшення частоти не впливає на вагу документа. Для невеликих документів, розмір яких (в словах) менше заданої константи, відносна частота розраховується не в їхній фактичного розміру, а від цієї константи.

У заголовку, мета-тегах, а також в назві і описі сайту з каталогу частота слів не враховується.


Алгоритми посилання ранжирування в Апорт враховують не більше одного посилання з кожного домена другого рівня для окремого запиту (тобто, для різних запитів можуть враховуватися різні посилання).

Вага кожного посилання залежить (крім її тексту) від зваженого індексу цитування, що посилається.

Зважений індекс цитування


Алгоритм обчислення зваженого індексу цитованості є модифікацією класичного алгоритму PageRank. В якості однієї з найбільш істотних особливостей слід зазначити, що враховується не більше однієї посилання на документ з кожного домена другого рівня.

Індексом цитування сайту вважається зважений індекс цитування сторінки, найвищий серед усіх сторінок сайту (в більшості випадків це буває зважений індекс цитування головної сторінки сайту).

Мета-теги "keywords" і description "


Ключові слова (meta keywords) враховуються Апортом навіть в разі їх відсутності в тексті документа. Індексується не більше 16 ключових слів для кожного документа. Мета-тег description також враховується при ранжируванні, однак, в більшості випадків, має дуже невелику вагу.