Big Data дегеніміз не?

Біздің ортамызда Big Data термині немесе «үлкен деректер» деген түсінік белгілі. «Үлкен деректер» термині — ағылшын тілді терминнен алынған сөздің көшірмесі. Үлкен деректер түсінігінің нақтылы бір анықтамасы жоқ. Оларға 10 терабайт немесе 10 мегабайт деп шектеу жасай алмаймыз. Жалпы атаудың өзі субъективті. Алайда қалыптасқан түсінік бар, үлкен деректер — үш операция орындауға арналған технологиялар жиынтығы. Біріншіден, ауқымды деректердің «қалыпты» сценариймен салыстырғанда үлкен деректерді өңдеу. Екіншіден, өте үлкен ауқымда түсетін ақпараттармен өте тез жұмыс істеу. Себебі деректер үнемі өсіп отырады. Үшіншіден, олар әртүрлі аспектіде құрылымдық және әлсіз құрылымдық ақпаратпен параллель жұмыс істей алу қажет. Үлкен деректер алгоритмге кіргенде үнемі құрылымды ақпарат алмайды және одан бір идеядан көп идея не ақпарат алуға болады.

Үлкен деректердің қарапайым мысалы — әртүрлі физикалық тәжірибе қондырғыларынан алынатын ақпарат, — мысалы, Үлкен адрондар соқтығыстырушысы үнемі үлкен көлемде ақпарат шығарады. Қондырма үзіліссіз үлкен көлемде ақпарат көрсетеді, соның арқасында параллельді көптеген міндеттерді шешуге мүмкіндік береді. Қоғамдық кеңістікте үлкен көлемді деректер пайда болуына байланысы, бұл деректер барлық адамдарға қатысты болды. Бұрынғыдай тек ғалымдар емес, кез келген адам үлес қосады. Қоғамдық технология салаларына Big Data планетамызда адамдар санына нақты келгенде қолданыла бастады. 7 миллиард адамды әлеуметтік желі және басқа жобаларда кездесетін жерлер жинайтын болды.

Big Data

YouTube, Facebook,ВКонтакте, адам саны миллиардтап есептелді, ал алар орындайтын операциялар өсе берді. Бұл жерде деректер ағыны — бұл қолданушы қызметтері. Мысалы, YouTube хостингінің ақпараттары, өңдеу түсінігінде тек интерпретация емес сонымен бірге әрбір әрекетті дұрыс өңдеуді болжайды – ақпаратты дұрыс жерге орналастырып әрбір қолданушыға тез жетімді ету, себебі әлеуметтік желілірде ақпарат алмасу өте тез жүреді. Алайда үлкен деректер түсінігі, және оларды сараптауда тәсілдер бұрыннан бері бар. Мысалы, бақылау камерасынан алынған суреттерді өңдеу, бұл тек бір сурет емес деректер ағыны болған жағдай. Немесе роботтар навигациясы. Бұл технологиялар бұрыннан бері бар, алайда қазіргі кезде ақпаратты өңдеу міндеттері көптеген адамдар мен идеяларды қамтыды. Көптеген өңдеушілер статикалық обьектілермен жұмыс істеуге және категориялар бойынша ойлауға үйренген. Үлкен деректерде басқа парадигма. Сіз үздіксіз деректер ағынымен жұмыс істей алуыңыз қажет және ол қызықты. Ол күннен күнге көптеген салаларды қамтып жатыр. Қазірде көптеген заттар үлкейіп жатыр. 

Мысалы, полиция жүйесінде барлық камералардан алынған ақпарат сізге кез келген машинаны табуға мүмкіндік береді. Соңғы кезде фитнес білезік, GPS-трекер және басқа заттар адам және бизнес міндеттерін орындап жатыр. Бұрын біз үлкен деректерді міндет ретінде қарамадық, себебі оларды сақтайтын орын және беретін желі болмады. Бұл мүмкіндіктер пайда болғаннан кейін деректер барлық оларға берілген көлемді толтырды. Бірақ деректер өткізетін жолдар мен сақтау мүмкіншіліктері болғанмен, әрқашан өткізе алатын ақпараттан көп ақпарат шығаратын дереккөздер пайда болады, мысалы, физикалық тәжірибе, қанаттың аэродинамикасын модельдейтін тәжірибелер және т.б. Мур заңы бойынша, қазіргі заманғы параллель есептеу жүйелерінің өнімділігі ұдайы өсуде, және деректерді беру желілерінің жылдамдығы артуда.

Ғылым 23.06.2015 жариялады
116,053 сұрақ
294,506 жауап
152,845 пікір
60,451 қолданушы