Hol tart ma az AI felhasználhatósága a BIG DATA elemzésben? | Dmlab

Hol tart ma az AI felhasználhatósága a BIG DATA elemzésben?

2019.06.13. • olvasási idő:

A Big Data az a nyers input, amelyet meg kell tisztítani, strukturálni és integrálni, mielőtt hasznosítanánk, míg a mesterséges intelligencia a feldolgozott adatokból származó eredmény, intelligencia. A két dolog természetében különbözik.

A Big Data és az AI ma a két legnépszerűbb és leghasznosabb technológia. A mesterséges intelligencia több mint egy évtizede létezik, míg a Big Data csak néhány évvel ezelőtt jött létre. A számítógépek segítségével több millió rekordot és adatot tárolhatunk, de a BIG DATA erejét adatok elemzése biztosítja.

 

Az adat hajtja az AI-t

Azt mondhatjuk, hogy a Big Data és az AI együttesen két csodálatos, modern technológiát tartalmaz, amelyek lehetővé teszik a gépi tanulást, folyamatosan megismétlik és frissítik az adatbankokat, és ugyanezt segítik az emberi beavatkozás és rekurzív kísérletek segítségével. Az MI modellek gyakorta merítenek inspirációt a biológiai tanulás modelljeiből, fontos tulajdonságuk az adatokban rejlő mintázatok önálló felismerése, egyfajta „tapasztalati tanulás”.

A MI három esetben tud optimálisan működni, ha van valamilyen adat, melyek nem teljesen specifikusak a problémánkra nézve – például képek az internetről, rengeteg kép, rengeteg témában – ez elég ahhoz, hogy elég erős általános modelleket építsünk fel. Itt kifejezetten szükséges, hogy erős analógia álljon fenn az általános modell és a saját alkalmazási területünk között. A másik eset, amikor nincsenek jelen nagy tömegben általános adatok, ilyenkor meg kell mutatni a gépi rendszernek az adott folyamatokból származó adatokat, ez a specifikus machine learning; a harmadik eset, amikor valaki, aki a modelleket szolgáltatja (például egy népszerű, „cloudon keresztül” elérhető szolgáltatás) kiválóan ismeri az adott területet, nem kell tréningezni, csak testre szabni a folyamatokat, hiszen minél több az adat annál könnyebben tanul a deep learning rendszer.

 

Mesterséges intelligenciát a kisvállalatoknak is!

Nem csak a nagyvállalatoknak jelent növekedési potenciált a MI, hiszen a legkisebb cégben is méretes adatmennyiség halmozódik fel, a bevételekről, a kiadásokról, kommunikációról, annak tartalmáról, a kapcsolati hálózatokról, az alkalmazotti rutinról, a gyártás folyamatáról, a raktározásról, a vásárlásokról. Ebből a feltáratlan adatbányából építkezhet és tanulhat a MI.

Három alapvető dologra van szüksége a vállalatvezetőknek, döntéshozóknak, hogy a MI-ban rejlő lehetőségeket, alkalmazási területeket, alternatívákat megismerjék és integrálhassák: az üzleti probléma meghatározására KPI-szinten, például 3%-os üzemanyag költség csökkentés, mert ezzel egy data scientist tud mit kezdeni; adatra, mert ezek a rendszerek adat nélkül nem működnek és modellre, ami kimondja, hogy mire van szükség.

HÁROM ALAPVETŐ DOLOGRA VAN SZÜKSÉG A MI-HOZ: KPI SZINTEN MEGHATÁROZOTT ÜZLETI PROBLÉMÁRA, RENGETEG ADATRA ÉS EGY MODELLRE.

A vállalatok, KKV-k, cégek az adatvagyon menedzsmenttel tudják hatékonyan elkezdeni a MI-beépítését a cégükbe. Fel kell tárni, hogy hol termelődnek adatok a cégen belül, ezt kell összegyűjteni, feldolgozni és felhasználni.

 

Honnan gyűjtsünk adatot?

Az ipar 4.0 alapját mind olcsóbb és gyakoribb szenzorok hálózata, a mesterséges
intelligencia és az azon alapuló gépi tanulás alkotja és mindezt az adatok hajtják meg,
amikből a neurális hálózaton betanulja a gép, hogy mi az optimális, hatékony.

A legtöbben használnak olyan eszközt (pl. közösségi oldal, chatbot, spotify, netflix), aminek működése mögött már ott a mesterséges intelligencia, a gyárakban pedig a megrendelés
előrejelzésétől kezdve a prediktív karbantartásig megjelenik. Akik pedig nem fektetnek ezekbe az új technológiába, lemaradnak a globális versenyben, sőt eltűnnek, mint a
lámpagyújtogató az áram bevezetése után.

Két irányba lehet elindulni, ha adatgyűjtésről van szó: ami már elérhető adat, tudjuk, hogy van, azokat csoportosítani kell, de általában sokkal több adat létezik, mint amennyit ismernek vagy, amit ésszerűen ki lehet használni. Másik lehetőség, hogy minden létező adatot gyűjteni kezdenek. Nagyon fontos, hogy az adatkereslet és az adatkínálat összeérjen, meg kell tanítani a vállalatvezetőket, döntéshozókat arra, hogy lehet ezeket az adatokat használni, meg kell mutatni, hogy milyen lehetőségek vannak az adatelemzésben.

 

Adatok profitra váltása

Neuronhálózati mintákon alapuló mesterséges intelligencia használatának egyik fontos területe a prediktív analízis, ami során kizárólag historikus adatokra támaszkodva, mintázatok elemzéséből von le szabályszerűségeket.

Ma már minden iparágban gyűjtik az adatokat a gyártást érintő folyamatok során legyen szó termelésről, beszerzésről, megrendelésekről, értékesítésről vagy ügyfélszolgálatról. Ezek az adatok táplálják a gépi tanulást, a mesterséges intelligencia technológiájával felvértezett rendszereket. Adatok nélkül ezek nem tudnának tanulni, fejlődni, sőt létrejönni sem. Az adatok üzleti döntéseket támogatnak, a stratégia kialakításától a napi működésig.

EL KELL TERJESZTENI AZ ADATOS GONDOLKODÁST!

“A Dmlab, amellett, hogy segítjük a vállalatokat abban, hogy eljussanak az adatalapú döntéshozatalig, zászlónkra  tűztük, hogy megtanítjuk az érdekelteket, hogy mire és hogyan használhatók az adatok. Olyan vállalati programokat nyújtunk, amiben a vállalat munkatársaival közösen építjük meg egy adatos projekt prototípusát, és így a cégek munkavállalói valós problémákra keresnek megoldást a vállalat saját adatvagyonában és így tanulhatják meg a szükséges data science, gépi tanulás, AI vagy big data ismereteket, amelyeket a képzést követően egyből tudnak a napi munkájukban kamatoztatni.” – foglalja össze Nagy-Rácz István, a Dmlab vezetője azon célkitűzésünk lényegét, ami a tudásátadásban rejlik.

 

A leíró adatoktól a gépi tanuláson át a bevétel növekedésig

Az adatok döntéshozatalhoz, előrejelzésekhez való felhasználásáig eljutni bonyolult folyamat, amihez sokrétű tudásra van szükség, és az üzlet adatait ismerő és értő csapatra. Egy átlagos magyar szervezet ott tart, hogy standard leíró riportokat és kérdések esetén adhoc riportokat használ, esetleg már vannak statisztikai elemzések, beállított figyelmeztetések. A következő szint, hogy online platformon elérhető real time riportokat lássunk.

Ezek alapján készülhetnek aztán előrejelzések, amik segítenek a jövőbe látni. Az adatvezérelt vállalatoknál pedig nem csak pontos előrejelzések működnek, hanem a teljes szolgáltatást működését is algoritmusok optimalizálják. A mérési pontok meghatározása és kialakítása az alappillére, ami után a vállalati data scientistek olyan kimutatásokat, előrejelzéseket készítenek, amik mentén adatokra támaszkodó döntéseket lehet hozni,
optimalizálni vagy épp automatizálni lehet a folyamatokat, ahol már jelen van a gépi tanulás.

“Ahhoz, hogy egy szervezet adatvezéreltté válhasson, olyan kollegákra van szükség, akik értik és használják az adatokat, bíznak bennük. A legtöbb esetben úgy dolgozunk, hogy miután felmértük, hogy az elemzés melyik szintjén áll egy szervezet, közösen építünk egy prototípust a következőszinthez. Utána éles teszttel bizonyítjuk, hogy egy jó adatelemzési módszerrel elérhetőaz üzleti előrelépés, és csak ezután lépünk tovább. Ez egy evolúciós folyamat, ahol végig kell járni a lépcsőket függetlenül attól, hogy a kihívás a folyamatokban, a pénzügyekben, az értékesítésben vagy az emberi erőforrásokban van.” – jelzi Nagy-Rácz, hogy a gépi tanulásos módszerek milyen széles spektrumon használhatók egy szervezeten belül.

 

Gépi tanulás és mély neurális hálózatok

A machine learning egy alkalmazott statisztikai modellezés tág területe, mely során van egy ipari vagy üzleti probléma, rendelkezésünkre áll valamennyi adat, amelyeket – kis túlzással élve – „rádobálunk a gépre, és kérjük a megoldást”. Tehát nem adunk meg szabályszerűségeket, a géptől várjuk, hogy az összes rendelkezésre álló adatból kihozza a megfejtést. A gépi tanulás területén belül az elmúlt évek egyik legígéretesebb technológiája a fent említett mélytanulás- (deep learning) alapú modellalkotás. A deep learning úgy különbözteti meg nagy biztonsággal a kutyát a macskától (vagy önvezető autó esetén a járdát az úttesttől), hogy közben nem magyarázza el a rendszernek senki, hogy mit jelent a kutya és a macska. A deep learning nem utánozza az embert, nem tudása van, hanem tudáselsajátítási képessége.

A deep learning az idegrendszer által inspirált gépi tanuló modell. Egy mély neurális hálózat, akár több száz rétegben keresi a mélyebb összefüggéseket az adatokban az automatizált döntéshozatalhoz. Sokkal többről szól, mint egyszerű adatbányászat, megtalálja az adatok mély összefüggéseit, esetenként címkézetlen, nyers adatokkal is tud dolgozni, és nagy dimenziószámmal is könnyen elbánik. A neurális hálózatok és a deep learning rengeteg eddig nehéznek minősülő problémára képes megoldást adni. A megfigyelések alapján történő modellezés leghatékonyabb eszközévé vált ez a terület. A neuronhálók mély rétegei képesek a folyamatok összefüggéseinek kinyerésére, az események osztályozására, sőt, predikcióra is.