Завантаження сайту програмою wget
Завантаження сайту програмою WGET
Про що тут взагалі йде мова
Далі ми спробуємо розібратися, як це можна зробити ціною відносно малій крові.
Трагедія «чайника»
О, звичайно, як я вас розумію. Майже на всіх сайтах, коли ви натискаєте на картинку "Завантажити всю книгу", то отримуєте її в архивированном вигляді. Ми стикалися з подібним рішенням настільки часто, що вже встигли звикнути вважати це єдино правильним рішенням. Усвідомлюючи це, я розумію, що швидше за все засмучу вас, бо - ТУТ ВСЕ БУДЕ ІНАКШЕ! На жаль, але ми не можемо собі дозволити, формуючи сайт, закачувати одну і ту ж інформацію по кілька разів, нехай навіть і в архівному вигляді. Зате ми можемо дати вам невелику програмку, яка вміє якісно робити локальну копію з будь-якого сайту в інтернеті (або майже будь-якого). Однак, вона, будучи для вас абсолютно нової, зажадає часу і уваги, щоб вам до неї звикнути і з нею подружитися.
Втіха «чайника»
Розуміючи ті складності (швидше за психологічні, ніж технічні), з якими вам доведеться зіткнутися, мені тут подумалось максимально спростити ваше перше знайомство з цією програмою. Хоча, можливо, це все одно буде складніше, ніж завантажити архів, але, сподіваюся, все ж досить просто (принаймні вам не доведеться вивчати архіватори ;-)).
Це треба зробити тільки в самий перший раз
Для початку, скачайте міні-дистрибутив програми Wget (296 Кб). БЕЗ ЦІЄЇ ПРОГРАМИ ВСЕ описано далі ПРАЦЮВАТИ НЕ БУДЕ. Якщо згодом ви захочете трохи краще розібратися, як ця програма працює, щоб її використовувати, то документацію англійською можна знайти тут (120 Кб).
Завантаживши файл програми, його треба запустити (це ще часто називається "Відкрити файл" або "Запустити файл"). Програма мовчки встановиться на ваш комп'ютер. Може навіть здатися, що нічого не сталося. (Інформація для особливо цікавих - це буде каталог: \ Program Files \ unx \. Де - це ваш системний диск, на якому встановлена Windows.).
Як скачувати інформацію з даного сайту
Це робиться досить просто. Коротенько це звучить так: клікнувши на коробку з бантиків, ви можете завантажити файл з розширенням BAT. Запустивши його (точно так само як всі інші програми) ви почнете закачування обраної частини сайту в каталог, де цей батник знаходиться.
Далі розписуємо по кроках:
Прошу вибачення за в'їдливі, але досвід показав, дуже багато навіть дуже розумні люди не розуміють часто найпростіших речей. Тому довелося говорити не про просте, а про примітивне.
Ааааааааа. У мене нічого не виходить!
Хоча мені і важко уявити, ЩО тут може не вийти, але люди все різні, і досвід теж різний. Найкраще, що можна зробити в такій ситуації - це надіслати лист, в якому описати: що ви зробили, що очікували побачити, і що вийшло. Обов'язково надішліть мені файл wget.log. який буде лежати там же, де і скачав файл. Ми спробуємо розібратися, вирішити задачу і підправити цей текст, щоб слідом-йде було простіше. Самим неконструктивним з усіх можливих дій буде образитися, мовчати, нічого не робити, а заодно надати всім іншим наступати на ті ж граблі.
А як мені тепер все таки скачати книжечку?
Якщо ви тільки що намагалися завантажити частину сайту, то просто поверніться на сторінку і спробуйте ще раз. Тільки на цей раз натисніть кнопку "ОК". І пам'ятайте про те, що тільки що прочитали.
Коротка інформація про програму Wget (не для «чайників»)
Програма wget.exe призначена для того, щоб без вашого особливого участі завантажувати великі кількості файлів з інтернету. Внизу запропоновані два варіанти її використання на даному сайті (хоча існують ще десятки інших): за допомогою першого можна викачати весь сайт; і за допомогою другого можна викачати обрану книгу з бібліотеки. В останньому випадку, вкажіть сторінку змісту обраної вами книги. Виконувати цю команду треба з каталогу на вашому комп'ютері, в який ви хочете викачати сайт. За оканчании в файлі wget.log буде знаходиться інформація про те, які сторінки були закачані, і які помилки виникли в процесі. Якщо ці варіанти викачування вас з яких-небудь причин не влаштовують, то прочитайте опис прапорів і спробуйте самостійно придумати, як налаштувати роботу цієї програми під вашу задачу (переважно) або пишіть - розберемося разом.
Сторінки сайту будуть вирячені з банерами. Якщо ви хочете від них позбутися, то з вирячених файлів треба видалити все що варто до рядка " "І все, що стоїть після рядка" ". Процес видалення може бути автоматизований (якщо вам дозволяє це зробити ваш досвід), і тут не розглядається.
Інформація для допитливих:
Недоотримувати частково отримані файли (якщо був обрив зв'язку під час предудущей закачування).