Big data (біг дата)
Сьогодні спостерігається великий інтерес до технологій класу BIG DATA, пов'язаний з постійним зростанням даних, якими доводиться оперувати великим компаніям. Накопичена інформація для багатьох організацій є важливим активом, однак обробляти її і отримувати від неї користь з кожним днем стає все складніше і дорожче.

Мал. 1. Динаміка запитів по «Big Data» від Google
Так в чому ж секрет популярності цих технологій і що означає термін «Big Data»?
В першу чергу, під термінами "Big Data", "Великі дані" або просто "біг дата" ховається величезний набір інформації. Причому обсяг її настільки великий, що обробка великих обсягів даних стандартними програмними і апаратними засобами представляється вкрай складною. Іншими словами, Big Data - це проблема. Проблема зберігання та обробки гігантських обсягів даних.
З іншого боку, обробка великих обсягів інформації - це тільки частина «айсберга». Як правило, коли говорять про термін "біг дата", то використовують найбільш популярне визначення трьох «V», що означає Volume - обсяг даних, Velocity - необхідність обробляти інформацію з великою швидкістю і Variety - різноманіття і часто недостатню структурованість даних. Наприклад, час операції з перевірки балансу на карті при знятті готівки обчислюється в мілісекундах. Саме такі вимоги диктує ринок. Третя сторона питання - це різноманітність і неструктурованість інформації. Все частіше і частіше доводиться оперувати медіа контентом, записами в блогах, слабо структурованими документами і т.д.
Таким чином, коли ми говоримо про big data, ми розуміємо, що це пов'язано з трьома аспектами: великим обсягом інформації, її різноманітністю або необхідністю обробляти дані дуже швидко. З іншого боку, під цим терміном часто розуміють абсолютно конкретний набір підходів і технологій, покликаних вирішити ці завдання. В основі одного з таких підходів лежить система розподілених обчислень, де обробка великих обсягів даних вимагає для себе не одну високопродуктивну машина, а цілу групу таких машин, об'єднаних в кластер.
Компанія DIS Group розвиває напрямок з впровадження технологій класу big data. Фахівці компанії опрацьовують різні рішення в даній області, включаючи детальне опрацювання технічних аспектів застосування біг дата технологій і позиціонування їх в інфраструктурі замовників: