Як парсити дані з сайтів в таблицю google

  • Усе
  • DevShow
  • Loftcast
  • Loftnews
  • LoftSchool
  • LoftVlog
  • інтерв'ю
    • # 23: ІГРИ ДЛЯ ПРОГРАМІСТІВ!

    • NIMAX. Екскурсія в Діджитал світ. Інтерв'ю з Микитою Міхеенковим

    • # 23: ІГРИ ДЛЯ ПРОГРАМІСТІВ!

    • # 23: Як шукати роботу веб-розробником?

    • # 22: Кращі попап, зринаючі підказки і модальні вікна

    • # 21: Музика для програмістів - що слухати, коли пишеш код?

    • Loftcast # 3 - browsersync, marksheet, sublime text vs atom vs brackets

    • Loftcast # 2 - Responsive Patterns, Atom, PostCssков

    • Loftcast # 1 - dotdotdot.js. webpack, plainjs.com

    • Samsung S8, Apple Pay, Made by Google, Samsung Pay, PPAP

    • iPhone 8, YouTube Go, Android plus Chrome OS, React

    • Samsung вибухає, Bootstrap Deprecated, iPhone 7, Apple Watch, iOS 10

    • LoftNews # 30 - Fiat 124 Spider Sport, auto.ru, Google Maps

    • Як програмісту провести зимівлю в Таї?

    • Як IT-фахівця заробляти віддалено і жити в будь-якій точці світу?

    • Upwork - стратегії входу, мова, профіль і подача заявок

    • Як пройти випробувальний термін? Топ рад від засновників LoftSchool

    • Москва Сіті, LoftSchool на фотосесії, підготовка до LBMM

    • З Пітера в Москву. В гостях у Авито. Готуємо MeetUp!

    • Де працює Loft Team

    • NIMAX. Екскурсія в Діджитал світ. Інтерв'ю з Микитою Міхеенковим

    • Гліб Кушедов, засновник Epic Skills: Освіта в IT

      Завдання збору інформації не так вже й рідкісні, як здається. Буває потрібно отримати якусь статистику по розділах / темах / рубриками на сайті, доступу до адмінки якого у нас немає, або зібрати дані про фірми в каталозі, де всі ці дані розкидані по сторінках, і якщо робити це руками, то піде не один день. Для автоматизації такого завдання можна скористатися скриптами в Google таблицях.

      Щоб працювати з таблицею, потрібно використовувати клас SpreadsheetApp. який дозволяє досить зручно звертатися до таблиці. Для роботи з активним листом ми використовуємо функцію getActiveSheet (). в даному інтерфейсі.
      Все оперування всередині листа можливо тільки всередині діапазонів. Навіть якщо вам потрібно буде працювати з якоюсь конкретною осередком, для неї спочатку потрібно задати діапазон. В обраному листі задати діапазон можна методом getRange ( "A1: B2"). Аргументом цього методу можна передати рядок, що містить діапазон комірок в звичній нам з Excel вигляді. Усередині заданого діапазону вибір осередку здійснюється методом getCell (row, col). де row і col це номер рядка і стовпця комірки всередині діапазону, відповідно.

      Для отримання веб сторінки ми використовуємо клас UrlFetchApp. у якого є потрібний для нас метод fetch (url). Щоб можна було працювати з результатом роботи цього методу, потрібно привести його до виду тексту, за допомогою функції getContentText (). Після виконання цієї функції в змінної буде збережений вихідний код сторінки, з яким можна працювати так, як вам хочеться. В принципі, ніхто не забороняє побудувати за отриманою сторінці DOM дерево і працювати з ним, але, як мені здається, робота з рядком в невеликих завданнях, де можна в тексті вичленувати потрібні дані буде простіше і швидше.

      Код скрипта для Google Spreadsheet