Big data – nadzieją dla cyberbezpieczeństwa? [ANALIZA]

Piątek, 06 Października 2017, 15:09
Piątek, 06 Października 2017, 15:09
Piątek, 06 Października 2017, 15:09
Piątek, 06 Października 2017, 15:09

W związku z rozwojem systemów informatycznych stale rośnie ilość i stopień skomplikowania sieci IT, a wraz nim poziom zaawansowana działań hakerów, którzy wykorzystują coraz bardziej rozwinięte metody ataków. Według ekspertów codziennie powstaje milion nowych rodzajów złośliwego oprogramowania. Nawet najbardziej zaawansowani atakujący zostawiają jednak cyfrowe ślady, które mogę zostać odkryte za pomocą odpowiednich metod analitycznych. Przeszkodą jest jednak stale rosnąca liczba danych. Pomóc w tym kontekście może big data. Dzięki wykorzystaniu takiego narzędzia istnieje możliwość usprawnienia systemu cyberbezpieczeństwa.

Już dzisiaj mamy do czynienia z coraz większą liczbą urządzeń końcowych, które generują ogromne ilości informacji. Nadchodząca rewolucja związana z internetem rzeczy jeszcze bardziej pogłębi ten problem. Jednocześnie rośnie liczba ataków oraz stale zwiększa się ilość złośliwego oprogramowania. Przykładowo analitycy jednej z firm muszą przebadać ponad 300 tys. nowych próbek wirusów, robaków i innych szkodliwych programów. Proces automatycznej analityki prowadzi do generowania ogromnych zbiorów metadanych, które nie mogą zostać zanalizowane przy użyciu klasycznych narzędzi i infrastruktury.

Ponadto hakerzy doskonalą metody wykradania danych, dlatego też coraz ważniejsze stają się narzędzia analizy informacji oraz ich zabezpieczeń. Zdaniem Daniela Cohena z firmy RSA nie należy zastanawiać się czy systemy bezpieczeństwa nie zostaną złamane, tylko kiedy to się stanie. Dlatego należy skupić się na wykrywaniu włamań. Wzrost liczby ataków utrudnia jednak ich wykrycie.

Czytaj więcej: Firmy nie umieją zarządzać informacjami z Big Data

Również agencje federalne mają poważne problemy z analizą danych. Według badania przeprowadzonego przez firmę MeriTalk, 88 proc. agencji federalnych przyznało, że w przeciągu ostatnich dwóch lat analiza danych i uzyskanie szerszego obrazu z nich stały się o wiele trudniejsze. 59 proc. agencji, że co najmniej jedno włamanie miesięcznie wynika z niemożliwości przeanalizowania wszystkich danych.

Często przyczyną jest nadmiar danych, który utrudnia ich przepływ. Prowadzi to do sytuacji, że informacje spływają do analityków za późno i tracą aktualność. Co więcej agencje federalne nie dysponują właściwymi systemami umożliwiającymi zbieranie informacji o cyberbezpieczeństwie. Duże trudności sprawia też integracja informacji pochodzących z różnych systemów.

Fot. Camelia.boban/Wikipedia Commons/CC 3.0

Co to jest Big Data?

Big data polega na szukaniu, pobieraniu, gromadzeniu i przetwarzaniu bardzo dużych ilości danych w celu znalezienia korelacji i zauważenia pewnych zjawisk oraz zmiennych, które na nie wpływają. Są one pobierane z bardzo różnych źródeł, a następnie analizowane i wykorzystywane do konkretnych celów.

Termin „big data” jest relatywnie nowy, jednak zbieranie dużych ilości danych było praktykowane od dawna. Podobna koncepcja pojawiła się na początku 2000 roku, kiedy analityk Doug Laney przedstawił definicję big data, która opiera się na tzw. trzech „V”: volume (ilość), velocity (szybkość) i variety (różnorodność).

Ilość: zbieranie danych z różnorodnych źródeł jak np. media społecznościowe, informacje z sensorów czy transakcji biznesowych. Obecnie nowe technologie ułatwiły przechowywanie danych;

Szybkość: powstające dane muszę być obsługiwane z odpowiednim reżimem czasowym. Bardzo duże ilości informacji są przetwarzane w czasie zbliżonym do rzeczywistego;

Różnorodność: określa rodzaj danych. Możemy mieć do czynienia z ustrukturyzowanymi informacjami, jak np. bazy danych lub arkusze kalkulacyjne. Ich odpowiednikiem są niestrukturyzowane dane takie jak dokumenty tekstowe, emaile video czy audio.

Coraz trudniej jest zaplanować odpowiednie działania, opierając się jedynie na dobrych praktykach, strategiach oraz doświadczeniach. Big data ma pomóc w przygotowaniu się na przyszłe niebezpieczeństwa zanim staną się one realnym zagrożeniem, również w kontekście cyberbezpieczeństwa.

Czytaj więcej: Big Data receptą na cyberzagrożenia

Big data a cyberbezpieczeństwo

Big data daje szereg możliwości wzmocnienia cyberbezpieczeństwa, w szczególności w obszarze analizy, ochrony danych oraz przeciwdziałania przyszłym atakom w cyberprzestrzeni. Pozwala na zwiększenie ochrony przed zagrożeniami zewnętrznymi, wewnętrznymi oraz zmniejszenie czasu potrzebnego na wykrycie incydentów, tym samym umożliwiając szybszą reakcję na nie. Stosowanie big data może też prowadzić do zmniejszenia liczby fałszywych alarmów w sieci.

Bardzo ważnym elementem cyberbezpieczeństwa jest posiadanie narzędzi, które analizują dane, w szczególności w sposób automatyczny. Dzięki temu informacje są dostępne o wiele szybciej i mogą być wysłane odpowiednim ludziom na czas. Stosowanie big data umożliwia szybką analizę danych, „otwierając drogę” do sklasyfikowania i skategoryzowania rodzaju zagrożeń, a tym samym uniknięcia opóźnień, prowadzących często do dezaktualizacji informacji o zagrożeniu.

Na pierwszy rzut oka zabezpieczenie danych może wydawać się stosunkowo proste. Kiedy jednak spojrzy się na ilość danych, które trzeba przejrzeć i zanalizować w celu zapobiegnięcia cyberatakom, okazuje się to o wiele trudniejsze. Przykładowo badacze z Uniwersytetu w San Diego podają, że sieć średniej wielkości złożona z 20 tys. urządzeń transmituje ponad 50 terabajtów danych w przeciągu 24 godzin. Oznacza to, że 5 gigabitów musi być analizowane co sekundę, aby wykryć cyberatak, potencjalne zagrożenie lub złośliwe oprogramowanie oraz móc przypisać autorstwo konkretnej osobie lub grupie osób.

Fot. BalticServers.com/Wikipedia Commons/CC 3.0

Tradycyjnie wykorzystywane technologie i narzędzia używane do zbierania danych tworzą dużą liczbę błędnych wzorców, które odwracają uwagę od faktycznych zagrożeń. Ponadto nie posiadają one odpowiedniej przepustowości, żeby radzić sobie z dużymi zbiorami informacji. W celu wykrywania cyberataków konieczne jest tworzenie modeli danych, które minimalizują fałszywe alarmy oraz zmniejszają liczbę niewykrytych zagrożeń do absolutnego minimum. Takie zdolności zapewniają systemy oparte o koncepcje big data.

Big data umożliwia ekspertom cyberbezpieczeństwa analizowanie różnych typów danych pochodzących z wielu źródeł i odpowiadanie na zaistniałe problemy w czasie rzeczywistym. Jest to bowiem narzędzie nie tylko do zbierania informacji, ale również tworzenia korelacji i połączeń, które w innym wypadku mogłyby zostać przeoczone.  Tym samym daje możliwość skuteczniejszego wykrywania oszustw komputerowych.

Big data można również wykorzystać do analizy danych historycznych, na przykład do utworzenia bardzo szerokiej bazy danych, na podstawie której można zidentyfikować stan normalny np. działania sieci czy systemów. Dzięki temu łatwiej będzie zidentyfikować jakiekolwiek odstępstwa od normy. Czasami w trakcie analizy danych w czasie rzeczywistym, pewne anomalie nie są dostrzegane.

Czytaj więcej: Instytut związany z GCHQ rekrutuje do badań nad etyką big data

Są one identyfikowane dopiero po zbadaniu również szerszej bazy danych zawierających informacje historyczne. Wykorzystanie danych historycznych daje nowe możliwości dla modeli statystycznych, prognozujących czy systemów uczących się (machine learning). Dzięki temu są one zdolne do „przewidzenia” części zagrożeń w przyszłości.

Big data pomaga również analitykom w lepszej wizualizacji cyberataków, które na podstawie obszernych zbiorów danych z danymi technicznymi mogą zostać przedstawione w prosty sposób. Dzięki temu można w łatwiejszy sposób zademonstrować zagrożenia płynące z cyberprzestrzeni bez używania skomplikowanych pojęć technicznych.

Big data może odegrać znacząca rolę w zwiększeniu bezpieczeństwa IoT. Biorąc pod uwagę, że do 2020 roku liczba urządzeń podłączonych do internetu przekroczy 20 miliardów to właśnie to narzędzie będzie niezbędne do wykrycia podatności i innych zagrożeń dla internetu rzeczy.

Obecnie big data już jest wykorzystywane przez sektor prywatny i agencje rządowe. Z badań przeprowadzonych przez MeriTalk 81 proc. agencji federalnych używa w swojej pracy analitycznej w obszarze cyberbezpieczeństwa big data. Dla 53 proc. jest wbudowane w kompleksową strategię cyberbezpieczeństwa.

Najczęściej big data w sektorze federalnym wykorzystywane jest do wykrywania podatności w środowisku IT, wykrywania ingerencji hakerów, która ma miejsce w danym momencie oraz analizowania i tworzenie korelacji pomiędzy danymi z różnymi źródeł. Doświadczenia agencji federalnych pokazują, że stosowanie big data ma faktycznie przełożenie na poprawę cyberbezpieczeństwa.

Dostępne informacje wskazują, że 90 proc. agencji federalnych dzięki wdrożeniu systemów opartych na big data zadeklarowało spadki w naruszeniach bezpieczeństwa. Zmniejszyła się liczba ataków z wykorzystaniem złośliwego oprogramowania i inżynierii społecznej oraz liczba ataków DDoS. Ponadto ograniczono ryzyko wynikające z zagrożeń insiderskich.  84 proc. agencji federalnych poinformowało, że dzięki wykorzystaniu big data udało się zapobiec chociaż jednemu atakowi.  

Czytaj więcej: Problemy służb wywiadowczych z Big Data

T-Mobile Fraud Detection System – wykrywanie zagrożeń wewnętrznych

Fot. Geralt/Pixabay

Big Data nie tylko zwiększa efektywność cyberbezpieczestwa, ale również umożliwia zwalczanie zagrożeń insiderskich. Aby zagwarantować tak wyjątkową skuteczność systemu T-Mobile musiał wybrać technologię, która pozwala na wykorzystywanie różnych źródeł i formatów danych. To był jeden z kluczowych powodów, dla których firma zdecydowała się na wybranie rozwiązań opartych o big data, a nie gotowego produktu. Każda firma generuje bardzo duże ilości informacji, ale my postanowiliśmy skupić się nie tylko na nich, ale także na zewnętrznych źródłach informacji takich jak reklamacje od klientów, jak rozmowy z klientami. Założyliśmy, że połączenie zewnętrznych i wewnętrznych źródeł danych zwiększy skuteczność systemu.

System jest w dużej mierze zautomatyzowany. Na podstawie stworzonych scenariuszy i algorytmów, wyliczany jest scoring, który określa prawdopodobieństwo nadużycia w poszczególnych obszarach biznesowych firmy.

Jesteśmy tu w stanie nałożyć na siebie wiele wskaźników, których korelacje mogą świadczyć o tym, że mamy do czynienia z niepokojącym scenariuszem jak na przykład reklamacje składane przez klientów. Aplikacja wyłapuje słowa kluczowe czy pewne sentencje, które mogą świadczyć o zaistnieniu nadużycia. Później te dane są porównywane z informacjami w bazie, na temat jakości sprzedaży konkretnego handlowca, czy na temat tego co się stało z danym kontraktem, czy był spłacany czy nie Analizowanych równolegle jest wiele różnych czynników jak wysokość wypłacanych prowizji, nagłe wzrosty w sprzedaży lub struktura sprzedawanych produktów. Oprócz standardowych metod statystycznych gdzie wykrywane są odchylenia od normy dla danego segmentu sprzedaży, mamy możliwość weryfikacji działań użytkowników w systemach informatycznych.

Kiedy mamy przypadek, w którym system szacuje wysokie prawdopodobieństwo dokonania nadużycia i listę zdarzeń, które są pewną anomalią, wówczas podejmujemy decyzję o wszczęciu postępowania wyjaśniającego i dopiero na tym etapie możemy stwierdzić, że faktycznie doszło do nadużycia.

Podsumowanie

Część ekspertów uważa, że big data będzie w stanie szybko rozwiązać większość problemów cyberbezpieczeństwa. Należy jednak pamiętać, że dostarcza ona tylko informacje, a nie gotowe rozwiązania. Dopiero na ich podstawie muszą zostać podjęte konkretne decyzje zwiększające cyberbezpieczeństwo. Ze względu na swoją wartość dla analizowania danych, big data powinno być nieodłączną częścią kompleksowej, wszechstronnej strategii  na rzecz cyberbezpieczeństwa. Zastosowanie big data może więc być warunkiem koniecznym, ale nie wystarczającym dla stworzenia skutecznego systemu cyberbezpieczeństwa.



Dziękujemy! Twój komentarz został pomyślnie dodany i oczekuje na moderację.

Dodaj komentarz