Mi az a Big Data? Mire használjuk jelenleg?
A klasszikus - Gartner elemző cégtől származó – definíció szerint Big Data-ról akkor beszélünk, amikor nagy mennyiségű, nagy sebességű (azaz valós idejű, folyamatosan érkező) és nagy változatosságú (azaz sokféle tartalmú és formátumú) adatokkal dolgozunk.
A Big Data tulajdonképpen döntési szabályok gyűjteménye és alkalmazása - az adatfeldolgozás egy olyan módja, ahol nagy mennyiségű, sokrétű és strukturálatlan adat tárolásáról és feldolgozásáról van szó.
Napról napra egyre több adatot generálunk – fotó: Pexels
Hogyan lehet alkalmazni? Mire való egyáltalán?
A Big Data fontossága nem abban rejlik, hogy mennyi adatunk van, hanem abban, hogy mire használjuk. Ez utóbbi minden szervezetben vagy üzleti vállalkozásban eltérő lehet, de általánosságban elmondható, hogy a fő cél, hogy az adatok elemzésével olyan válaszokat találjunk, amelyek
lehetővé teszik a költségek, a folyamatok és a feldolgozási idők csökkentését, új termékek, szolgáltatások fejlesztését, a kínálat optimalizálását, a jobb döntéshozatalt.
Mikortól beszélhetünk ennek a folyamatnak az elindulásáról?
A mai értelemben használt Big Data feldolgozás és elemzés fogalma 2005 óta létezik, Roger Mougalas (O'Reilly Media) használta először, nem sokkal azután, hogy cége megalkotta a Web 2.0 fogalmát, amely a közösségekre építő internetes szolgáltatásokat takarja.
Szintén ebben az évben hozta létre a Yahoo! a Hadoopot, amelyet azóta számos vállalat alkalmaz hatalmas mennyiségű adat kezelésére. Az ezt követő években napról napra egyre több adatot generáltunk, ehhez alkalmazkodva pedig a vállalatok is megkezdték a különféle Big Data megoldások implementálását.
Mi jellemzi? Milyen részei vannak? Hogyan áll fel a rendszer?
A Big Data kifejezés tulajdonképpen olyan adathalmazokat foglal magába, amelyekre igaz, hogy nagyon nagy mennyiségű adatból állnak, komplex felépítésűek, az adatokat folyamatosan, általában automatikusan gyűjtjük és tároljuk.
A GDPR az Európai Unió által az adatok védelme érdekében bevezetett átfogó szabályozás – fotó: Pexels
Az ilyen adathalmazok meghaladják a hagyományos adatbázis-kezelő rendszerek képességeit, így a Big Data új technikák, eszközök, illetve technológiák iránt teremtett igényt, amelyre a válasz többek között a gépi tanuláson alapuló technológiák, az üzleti intelligencia (BI), valamint a felhőalapú számítástechnika.
Okozhat problémát a jelenléte?
A Big Data megjelenése és térhódítása kétségkívül felvet néhány kihívást, amelyek problémák potenciális forrásai lehetnek, ha rosszul kezeljük őket. Ilyen például az adatvédelem kérdése. Milyen adatokat gyűjthetünk és tárolhatunk a felhasználóinkról? Bizalmasan kezeljük-e a begyűjtött adatokat?
Ezzel kapcsolatban a kormányok sorra hozzák a különböző szabályozásokat, az utóbbi időben talán a legátfogóbb ilyen rendelkezés az Európai Unió által bevezetett GDPR. Ezen kívül technikai szempontból is ütközhetünk akadályokba, például a hatékonyság terén, hiszen az adathalmazunkkal méreténél fogva igen nehéz úgy bánni, hogy az az üzleti igényeknek, elvárásoknak megfeleljen.
Mi köze a Big Datának a mezőgazdasághoz? Mire használhatjuk ott ezt a dolgot?
Napjainkban már a mezőgazdaságban is lehetőségünk van a különböző folyamatok során keletkező adatok folyamatos rögzítésére, illetve tárolására. Gondoljunk csak a szenzorokkal felszerelt munka- és erőgépekre, műholdfelvételekre, drónfelvételekre, topográfiai adatokra, meteorológiai tény- és előrejelzés-adatokra, vállalatirányítási rendszerekből származó pénzügyi adatokra.
Poldermann Béla szerint a Big Data rendszerek lehetővé teszik az okos döntések meghozatalát – fotó: KITE Zrt.
Mindezek együtt egy olyan adathalmazt alkotnak, amely mind méretében, mind összetettségében illeszkedik a Big Data kereteibe, érdemi elemzésükhöz pedig Big Data megoldásokra van szükség. Néhány példa, mire is használhatjuk ezeket a komplex elemzéseket:
• Hozamoptimalizálás
A Big Data rendszerek az eddiginél sokkal pontosabb és részletesebb adatokat szolgáltatnak a csapadékmintákról, a vízciklusokról, a növénykultúra állapotáról, műtrágyaigényéről, egyebekről. Ez lehetővé teszi mezőgazdasági vállalatok számára okos döntések meghozatalát, például azt, hogy az egyes területeken milyen hibridet vessenek, milyen műtrágyát használjanak, és hogy ezeket hogyan alkalmazzák differenciáltan a nagyobb hozamok és optimális jövedelmezőség érdekében.
• Növényvédő szerek etikus használata
A növényvédő szerek fokozott használatának az ökoszisztémára gyakorolt mellékhatásai kimutathatók. A Big Data megoldások lehetővé teszik a növényvédelem optimalizálását a kijuttatott dózis differenciálása, valamint pontosabb időzítése révén. A növényvédő szerek alkalmazásának szoros figyelemmel kísérésével a gazdák könnyebben betarthatják a kormányzati rendeleteket és elkerülhetik a vegyi anyagok túlzott felhasználását az élelmiszer-előállítás során.
• A mezőgazdasági eszközök optimalizálása
Ma már vannak olyan erő- és munkagépek, amelyek beépített érzékelőkkel folyamatosan gyűjtik a felhasználási adatokat, és továbbítják ezeket egy Big Data platformra. A gépüzemi adatok részletes elemzése elősegíti a munkagép-flották jobb kezelését: az egyes gazdaságoknak mindig naprakész információ áll rendelkezésére a gépek kihasználtságáról, rendelkezésre állásáról, a szervizek esedékességéről vagy akár nem megfelelő üzemeltetési riasztásokról.
Mi a jövője? Van határa az adatok folyamatos gyűlésének?
A Big Data jövőjével kapcsolatban számos jóslatot, előrejelzést lehet hallani, ami viszont biztos, az az, hogy a térhódításának üteme nem fog lassulni az elkövetkező években, így mind az adatgenerálás, mind az adatgyűjtés volumene várhatóan tovább fog növekedni. Ezt pedig a technológiák fejlődése is támogatni fogja.
Az IDC előrejelzése szerint 2025-re mintegy 463 exabyte, azaz 463 milliárd gigabyte-nyi adat generálódik majd naponta!
A rendelkezésre álló adatok feldolgozása révén információkhoz jutunk – fotó: KITE Zrt.
Mit jelent ebben a környezetben az adat és az információ? Mi a kettő közötti kapcsolat?
Az adat általában számokat, karaktereket, szimbólumokat foglal magába, amelyeket rendszerint emberek vagy gépek értelmeznek, mivel önmagukban nincs különösebb jelentésük. Ezzel szemben az információ már feldolgozott, tehát értelmezett adatokon alapul, strukturált, illetve egy adott kontextusban kerül megjelenítésre, tehát bír jelentéstartalommal. A kettő közötti kapcsolat ezek alapján a feldolgozás folyamata, amely során a nyers adatból jelentéstartalommal bíró információ lesz.
Milyen módon lehet összefüggéseket keresni a különböző adatkomponensek között?
Az adatfeldolgozás egy fontos lépése, hogy a különböző forrásokból származó információkat közös dimenziók mentén tároljuk, ami lehetővé teszi az összefüggések keresését komplex statisztikai algoritmusokkal.
Ha egy mezőgazdasági példát veszünk: a rendelkezésünkre álló térinformatikai adatok révén az egyes mezőgazdasági táblákon meg lehet vizsgálni többek között, hogy milyen összefüggés van a korábbi hozamok és a csapadékellátottság, vagy a különböző inputanyag-felhasználások között. Mindez akkor lehetséges, ha a geokoordináták alapján össze tudjuk rendelni az egyazon táblához tartozó betakarítási, anyagkijuttatási, meteorológiai és egyéb adatainkat.
Ha rendelkezünk a megfelelő eszközökkel, akkor értékes tudásra tehetünk szert – fotó: Pexels
Big Databól big information… Ez mit takar?
Ez a kifejezés elsőre azt sejteti, hogy a sok adat egyben sok információ is. Azonban ahhoz, hogy ez igaz legyen, a rendelkezésünkre álló adatmennyiséget megfelelően kell kezelni és feldolgozni, hiszen csak így kaphatunk releváns, érdemi információkat,
amelyek valóban elősegítik üzleti problémáink megoldását, illetve a hatékony döntéshozatalt.
Megfelelő technológiák hiányában tehát az óriási adathalmazunk mit sem ér, ha viszont megvannak az eszközeink hozzá, akkor aranyat érő tudásnak vagyunk a birtokában.
|
A PREGA kiemelt szakmai támogatója a KITE Zrt.