Doktori témák-Információs rendszerek: adatelemzés, autonóm rendszerek, adatvédelem

2018.05.30.
Doktori témák-Információs rendszerek: adatelemzés, autonóm rendszerek, adatvédelem

A nagyméretű és nagymennyiségű adatok elemzési módszereinek és szemantikai modellek összehangolásának vizsgálata

A korszerű adatelemzés, adatbányászat, a nagyméretű adatok elemzése akkor vezet értelmezhető eredményre, ha az adatok, információk között feltárt összefüggéseket egy fogalmi háttér, szerkezet segítségével lehet értelmezni. A jelenlegi informatikai eszköztár az ontológiákat tartalmazza mint a fogalmi szerkezet ábrázolásának egyik lehetséges módját. Az adatokban fellelhető összefüggéseket komplex hálózatokkal, gráfokkal lehet ábrázolni. Az értelmezésükhöz szemantikus technológiákra, ontológiákra van szükség. A kihívás, a kutatási probléma az, hogy az adattudományi elemzésekre támaszkodva a nagy mennyiségű és nagyméretű, nyers adatokból felépíthető komplex hálózatok (“complex networks”), milyen modellek segítségével értelmezhetők, szemantikailag milyen modellek, pl. ontológiák nyújthatnak támogatást az eredmények operacionalizálására, továbbá következtetések és adatfeldolgozások elvégzésére.

Kutatási feladat:

- Olyan az általánosság különböző szintjeihez tartozó ontológiák kialakítása, amelyek értelmezést adnak és összekapcsolják a különböző célokat kiszolgáló adatokat, megfogalmazzák azokat a folyamtokból adódó célokat, amelyek az adatok, információk kinyerését a nagyméretű adatok és komplex hálózatok kontextusában értelmezhetővé teszi.

- A kialakítandó ontológiáknak segítséget kell nyújtaniuk a különböző forrásokból származó adatok transzformálásához, az adatelemzés és az adatok közötti összefüggéseket leíró komplex hálózatok (Big Data Analytics & Complex Networks) értelmezéséhez szükséges modellek előállításához.

- Az általános ontológia, szakterület specifikus és tényadat szintű ontológiáknak olyanoknak kell lenniük, hogy illeszkedjenek a nagyméretű adatok elemzéséhez alkalmazott módszerek, technikák és eszközök sajátosságaihoz.

- Viszonylag új terület a kognitív technológiák és a kognitív informatika, amelyek területén kifejlesztett módszerek alkalmazhatók a nagyméretű adatok elemzéséhez és a keletkező eredmények, adatok, adatszerkezetek modellezéséhez és értelmezéséhez. Ezek a technológiák túllépnek a már „hagyományosnak” tekinthető nagyméretű adatok elemzésére szolgáló és a számítógépes intelligencia területéhez tartozó technológiákon. E módszerek lehetővé teszik az adatok, komplex hálózatok és az ontológiákban megtestesülő modellek ember számára értelmezhető formába öntését.

Ismeret-bázis alapú támogatás nyújtása az autonóm rendszert vezetők/irányítók (pl. gépjárművek) számára

Közlekedési forgalmi helyzetek leírása és a kialakult forgalmi szituációk releváns jellemzőinek elemzése

Az autonóm járművek sajátosságaihoz igazodó „Gépjármű vezetést támogató rendszer” kialakítása szükséges.

A rendszer alapvető célja az , hogy a kombinált humán-autonóm vezetési rendszer helyzetekben is minimalizálja a közúti baleseteket.

A gépjármű vezetőket segítő, „helyettesítő” rendszerek komoly fejlődésen menetek keresztül, de a baleseti statisztikák ezt nem tükrözik vissza (pl. fék rásegítők, sávelhagyás figyelmeztetés, alkoholos illetve egyéb befolyásoltság stb.)

A félig-autonóm vezetés esetében a vezető figyelmének időben történő visszanyerése, terelése is egy fontos kérdés. A vezető kiemelése a vezérlési és visszacsatolási körből komoly problémákat vet fel, annak ellenére, hogy a vezetésre szánt időt esetleg másként, hasznosabban szeretnék kiaknázni a vezetők.

A közlekedési forgalom pillanatnyi helyzetének megértése létfontosságú elem a gépjárművek vezetésben. A felfogott, strukturálatlan információt, adatot értelmezhető információvá kell alakítani. A gépjármű vezetés vezérlési szerkezetében ezek az értelmezhető információk alkotják az előrejelzés, tervezés, döntés hozatal és cselekvés végrehajtásának az alapját.

A kutatás tárgya az volna, hogy egy olyan általános leírási módszert, keretrendszert alakítson ki, amely képes volna a vezetést támogató rendszerek számára a lényeges információk átadására, a pillanatnyi forgalmi és vezetési helyzetről, a gépjárműről és annak környezetéről.

Egy ilyen segítő rendszernek olyan funkciókat kell nyújtania, amely potenciálisan balesetmentes közlekedést tesz lehetővé, a legkülönbözőbb vezetési helyzetekben, beleértve az autonóm vezetési szintek mindegyikét, lényeges segítséget tud nyújtani.

Ez a cél olyan követelményeket támaszt, amelyek azt jelentik, hogy bonyolult forgalmi helyzeteket, beleértve még teljesen ismeretlen helyzeteket is , amely a gépjármű környezetének és a pillanatnyi szituációnak jelentős megértését követeli meg.

Az ontológiák az ismeret reprezentáció alapját jelentik és egy olyan formalizmust adnak, amellyel a „dolgokat” strukturálni lehet, a dolgokat leíró fogalmakat, azok közötti kapcsolatokat, jellemzőiket, továbbá logikai következtetések hajthatók végre. Ezért az ontológiák különösen alkalmasak, a több szereplős, több elemet tartalmazó közlekedési forgalmi szituációk modellezésére. A logikai következtetésekkel mind a szituációt leíró ontológiák, mind a bemenő adatok konzisztenciáját lehetne ellenőrizni. Továbbá a „dolgok” között feltárt kapcsolatok segítségével pl. a közlekedési szabályok betartásának lehetőségére lehetne következtetéseket, logikai elemzést elvégezni.

Az szituációs ontológiák felépítésére és szituációs szabály rendszerek feltárására a nagymennyiségű és nagyméretű adatok elemzését („Big Data”), a komplex hálózatok segítségével lehetne kiaknázni. A gyűjtött forgalmi adatok és az adatelemek közötti kapcsolatok feltárása, a kapcsolatok leképezése komplex hálózatokra, gráfokra és az ilyen struktúrák elemzése mintázatok és szabályrendszerek feltárása érdekében volna a kutatás egyik feladata.

A jelenleg divatos és sikeresnek tűnő „mély tanuló algoritmusok” („Deep learning”), a komplex hálózatok segítségével kialakított szituációs ontológiák összekapcsolása volna egy következő feladat.

A végrehajtási hatékonyság („performance”) a valós idejű rendszereknél kritikus fontosságú probléma terület. Ezért az olyan megoldások és algoritmusok kialakítása, amely az autonóm vezetés, gépjárművek által meghatározott műszaki informatikai környezetben életképesek lehetnek a fentebb felvázolt célok megvalósítása érdekében ismét egy kutatási területet jelent.

Pletyka alapú algoritmus és diofantikus aritmetika alkalmazása a kibertérbéli magánszféra védelmére

A pletyka alapú algoritmusok lényeges tulajdonsága, hogy a tényleges társadalmi pletykához hasonlóan, nem igényli a teljes pontosságot, nagy megbízhatóságot, illetve aszinkron információ továbbítást is megenged.

Számítás közben titkosak a részeredmények, még a résztvevő csomópontok sem tudnak többet, mint saját adataikat. Hamisítani is mindenki csak a saját adatainak manipulálásával tud.

Az adatokat különböző csomópontokon tárolják. Minden csomópont valamilyen átlagolást, aritmetikai műveleteket végez, esetleg olyan zajokat tesznek hozzá a számításokhoz, valószínűségi változókat, eloszlásokat, amelyek aritmetikai műveletekkel, illetve alkalmasan definiált „diofantikus aritmetikai” műveletekkel kiszűrődnek a végeredményből.

A pletyka alapú átlagolással, azt lehet megvalósítani, hogy az átlag nyilvánosan látható lesz, szimmetrikusan minden helyen, amelyik részt vett a feldolgozásban, például nagy mennyiségű és nagyméretű, de bizalmas, és kényes adatokat feldolgozó egészségügyi, bio-medikai, demográfiai stb. adattárházak, adatbázisok

A kutatási feladat az, hogy valószínűség számítás, -elmélet, a diofantikus aritmetika (Burgin) kombinációjával, hogyan lehet megvalósítani, nyílt hálózatokon, biztonságos adatcserét, amely megakadályozza, azt, hogy egyedi szereplőkre vonatkozóan következtetéseket lehessen levonni. Adattárházak, nagymennyiségű adatok adatfeldolgozási folyamatai során, nagyméretű elosztott hálózatokban.

Információs rendszerek tervezésének és modellezésének félig-formális és formális módszereinek kutatása szervezeti architektúra alapú megközelítések figyelembevételével

A vállalati, üzleti, közigazgatási és egyéb jelentős információrendszerek technológiai értelemben egyre inkább a Web illetve Internet technológiákra támaszkodnak (Web-based Information Systems, WIS). Az információrendszer szolgáltatások végső célja az üzleti, szervezeti folyamatok kiszolgálása. A történetileg kialakult rendszerelemzési, tervezési és megvalósítási módszerek – strukturált, objektum-orientált stb. – , és ezeknek a módszereknek a formalizált változatai új technológiai környezetbe kerültek. A Web szolgáltatások mint információrendszer szolgáltatások, a szervezeti, üzleti folyamatok (Business processes), a munkafolyamatok (workflow) egy gyorsan változó, dinamikus környezetben kapcsolódnak össze, ahol az üzleti, szervezeti, informatikai, technológiai és architekturális döntések visszacsatolása rövid idejű és a módosítások az információrendszer állapotainak jelentős változtatásával járnak mind tervezési mind működtetési, üzemeltetési időben.

A vizsgálandó kérdések:

– Az információrendszerek és a szervezeti architektúra, szoftver architektúra kapcsolata, formális leíró eszközök alkalmazása (process algebra).

o Egyes alap, szoftver architektúra mintázatok formális leírása, amelyek eredményesen használhatok a Web alapú információrendszerek architektúrájának formális leírására (process algebrai, pi-algebrai megközelítések).

– Az üzleti folyamatok, munkafolyamatok szabványosodó leíró módszerei (folyamatmenedzsment, Business Process Management / Modelling, BPMN, BPML, BPEL stb.), és velük kapcsolatos formális megközelítések, process algebra, pi-algebra, dinamikus logika, szemantikai megközelítések, leíró logika.

o Átfogó modellek egy egységes folyamat és adat modell kialakítására: üzleti tárgyi elemek (Business artifacts) és formalizálási lehetőségei, elsőrendű logika és egyéb folyamat és adat modellezési megközelítések.

o BPM (Business Process Management) és pi-algebrai megközelítések a folyamatok leírására, verifikálására és validálására.

o Web szolgáltatások, tervezési módszereke, formális módszerek.

– A vállalatirányítási rendszerek (ERP) technológiai átalakulása, fejlődése milyen modellezési megközelítéseket igényel. A Web szolgáltatások, szervezeti architektúra, szemantikus Web, szolgáltatás-orientált architektúra, a folyamat menedzsment milyen modellezési módszereket igényel. Milyen formális megközelítések alkalmazhatók a szabatosabb tervezési, modellezések érdekében. Mely formális módszerek illeszkednek jobban az egyes részterültekhez, milyen mértékben lehet összekapcsolni illetve párhuzamosan felhasználni a különböző formális leíró módszereket:

o Folyamat algebra (process algebra;

o Pi-algebra (π-algebra);

o dinamikus logika (dynamic logic);

o leíró logika (description logic);

o kategória elmélet;

o szoftver architektúra formális módszerei és alkalmazhatósága a szervezeti architektúra területén.

– A tervezési módszerek, elvi iránymutatások és a dokumentum centrikus megközelítések formális modelljei milyen alkalmazott matematikai megközelítésekkel írhatók le vizsgálhatók:

o Az információrendszer formális és félig formális leírásainak ábrázolása egységes leíró nyelvtanokban (XML, UML);

o Gráf ábrázolások és a modellek (XML, JSON stb.) összeillesztése;

▪ Hipergráf;

▪ Meta-gráf;

▪ A gráfok specifikus tulajdonságainak jellemzésére szolgáló matematikai tulajdonságok használhatósága a modellek, a tervezési eredmények, a rendszer dinamikus és statikus viselkedésének vizsgálatára, a modellek tervek jóságának, és egyéb nem-funkcionális tulajdonságainak mérésére, jellegzetességeinek megragadására.

o Axiomatikus tervezés elveinek alkalmazása az Információs rendszer, Web Információs rendszer, SzOA (Szolgáltatás orientált architektúra, SOA , Service Oriented Architecture) környezetben:

▪ A rendszer modellek gráfokban történő ábrázolásainak lineáris algebrai, mátrix alakú formalizálásainak vizsgálata.

▪ A lineáris algebrai eszközkészlet felhasználásával a modellezési, finomítási folyamat, ellentmondás-mentességének, peremfeltételek és korlátok megőrzésének, biztonsági tulajdonságok matematikai eljárásokkal történő ellenőrizhetőségének vizsgálata.

▪ Az alkalmazott matematikai, információrendszer, szervezeti, rendszer és szoftver architektúra modellek összeillesztése egységes keretrendszerbe az elképzelések helyességének bizonyítására.

Témavezető: Molnár Bálint

További információ

Jelentkezési határidő a Doktori Iskolába: 2018. május 31.

Informatika Doktori Iskola az Országos Doktori Tanács honlapján