На службі вебмастера, фарма блог №1
Archive.org на службі вебмастера
70 мільйонів).
4. Даний ресурс входить в 250 найбільших відвідують сайтів світу (згідно з даними Alexa.com).
Archive.org може стати корисним для кожного веб-майстра, якщо навчитися його використовувати в своїх цілях. Виходячи з усього написаного, можна зробити висновок, що Архів досить трастова майданчик для отримання лінків і створення доров. Також її можна використовувати за своїм основним напрямку, адже це величезний ресурс для отримання різного контенту.
Почнемо з самої цікавою та актуальною на сьогоднішній день теми - створення доров на сайті Archive.org. В Google ви без проблем знайдете багато прикладів класичних «профільних» доров на Archive .org по різним НЧ ключовим фарма - словами (для прикладу запит Buy Tadalafil Prescription Supplement Cost - перевірка по aol.com):





Ці ж огляди (Reviews) допоможуть отримати зірочки в сниппета Googla, що підвищить увагу у видачі до дору:


Перейдемо до наступного сервісу від Archive.org. а саме - Web.Archive або WayBack Machine. Пошукові роботи даного сервісу обходять сайти і архівують їх на своїх серверах, створюючи копії для історії. Природно, що сайти досить часто перестають існувати, і копії в web архіві залишаються єдиним нагадуванням про них.
Дані сайти можна відновлювати і використовувати для своїх потреб. Можна використовувати їх як сателіти, як майданчика для посилань на свої ресурси або продаж, можна монетизувати за допомогою Adsense або партнерських програм. Для початку необхідно визначиться з тим, який саме сайт відновлювати. Це досить складне питання і існують кілька основних варіантів його рішення:

Після того як ми визначилися ЩО відновлювати, знадобляться інструменти для цього. Коли домен і його наявність в Веб.Архіве є відомими факторами, можна відразу приступати до відновлення. Але в разі, якщо ви використовуєте списки віддалених доменів, спочатку необхідно перевірити чи є історія для них в Архіві. Отримати списки таких доменів можна різними способами: існує величезна кількість online сервісів для deleted domains, як платних, так і безкоштовних, чокерів і програм.

Відзначаємо чекбокс - Вік по Web.Archive, натискаємо кнопку «Завантажити», і якщо у сайту є історія в архіві, ви отримаєте його вік там, якщо немає - значення n / f. Потім робите експорт в файл Exel, сортуєте і вибираєте необхідні для роботи дані.

Тепер є список вільних доменів, які можуть бути перехоплені кіберсквотерами. Але це не страшно, адже в 90% випадків, якщо не більше, ці люди вішають домени на парковку або сторінку продажу, абсолютно не цікавлячись контентом з минулого життя сайтів з існуючою історією в Архіві.
Для парсинга результатів Архіву та їх локального збереження існує багато різного софту, і вибір залежить виключно від вас. Пошук потрібно робити по терміну - Web Archive Downloader / graber / parser. Розглянемо процес роботи на прикладі досить дешевого варіанта - Web Archive Downloader. Качаємо, купуємо ключ і запускаємо (без ключа можна зберігати до 20 сторінок з сайту). Вибираєте року, які цікавлять:

Вставляєте URL і натискаєте Get Url List:

Як же ще можна застосувати архів сайту в роботі? Archive.org - це величезний архів текстової та медіа інформації. Наприклад, можна парсити книги, статті та інший текстовий матеріал для подальшої обробки та генерації в дорвейний технологіях або сплоги. Вбиваєте в пошук, наприклад, health і отримуєте список публікацій про здоров'я:

Практично у кожного результату будуть варіанти в .txt файлі, які легко зберігати і парсити для подальшого використання. Щоб дістатися до файлу в цьому форматі, необхідно натиснути на HTTPS лінк навпроти All files.


Або health AND mediatype: movies і отримати ролики на тему здоров'я. Правильне їх використання може сильно підвищити поведінкові фактори на ваших ресурсах.