Automatsko pronalaženje podudarnosti u ontologijama primjenom metoda umjetne inteligencije


Količina dostupnih podataka ubrzano raste zbog napretka u informacijskoj i komunikacijskoj tehnologiji. Zato nastaje sve veći broj heterogenih izvora podataka koji opisuju istu domenu interesa te ih je često potrebno povezati. Ontologija obogaćuje znanje o izvorima podataka jer detaljno opisuje entitete i njihove relacije unutar domene interesa te time olakšava integraciju heterogenih izvora podataka koji opisuju istu domenu interesa. Kako bi se ontologije iskoristile za što bolju integraciju opisanih heterogenih izvora podataka, potrebno je napraviti sustav za pronalaženje podudarnosti između ontologija. Pronalaženje podudarnosti između ontologija je proces pronalaženja podudarnosti između entiteta različitih ontologija. Pronalaženje podudarnosti između ontologija ključan je izazov u integraciji heterogenih izvora podataka koji su opisani ontologijama. Ako se izvrši kvalitetno pronalaženje podudarnosti između ontologija, olakšava se upravljanje podacima iz različitih izvora podataka. Također, potrebno je automatizirati proces pronalaženja podudarnosti jer se time olakšava korištenje sustava za pronalaženje podudarnosti koji bi u budućnosti trebao biti upotrebljiv za široki krug korisnika.

U prethodnim istraživanjima implementiran je sustav za automatsko pronalaženje podudarnosti između ontologija (CroMatcher sustav). Izvršena je i evaluacija tog sustava tako da su se rezultati pronalaženja podudarnosti između ontologija dobiveni izvršavanjem istog usporedili s rezultatima pronalaženja podudarnosti dobivenih izvršavanjem aktualnih programskih sustava. Usporedba dobivenih rezultata pokazala je značajnu kvalitetu izgrađenog prototipa programskog sustava kao i kvalitetu predstavljenih metoda koje su dio tog sustava. CroMatcher sustav sadrži devet osnovnih metoda grupiranih u dvije sekvencijalno povezane paralelne kompozicije osnovnih metoda. Za dobivanje agregiranih rezultata podudarnosti iz paralelne kompozicije osnovnih metoda koristi se težinska agregacija unutar koje je implementirana metoda za automatsko određivanje težinskih faktora osnovnih metoda koji su određeni s obzirom na kvalitetu rezultata podudarnosti tih metoda. Kako svaka osnovna metoda prilikom pronalaženja podudarnosti koristi informacije iz određenih komponenti ontologije, kvaliteta rezultata podudarnosti dobivena pomoću pojedine osnovne metode ovisi o implementaciji ontologija za koje se pronalaze podudarnosti. Tada je važno da se tijekom izvršavanja procesa težinske agregacije prepozna one osnovne metode koje su pronašle kvalitetnije podudarnosti između trenutnih ontologija za koje se pronalaze podudarnosti. Rezultati podudarnosti onih osnovnih metoda koje su kvalitetnije odredile podudarnosti moraju više utjecati na konačni rezultat podudarnosti između ontologija. Stoga je agregacija rezultata podudarnosti pojedinih metoda unutar kompozicije ključna za kvalitetno pronalaženje podudarnosti u cjelokupnom sustavu.

Cilj ovog istraživanja je implementirati i evaluirati dvije nove metode za automatsko određivanje odgovarajućih težinskih faktora osnovnih metoda za pronalaženje podudarnosti u težinskoj agregaciji paralelne kompozicije tih osnovnih metoda koje će utjecati na povećanje kvalitete pronalaženja podudarnosti u sustavu. Prva metoda koristit će genetički algoritam za dobivanje što boljih težinskih faktora. Ova metoda trebala bi povećati kvalitetu pronađenih podudarnosti između entiteta uspoređivanih ontologija na način da se poveća pouzdanost pronađenih podudarnosti. Što je veća vrijednost pojedine podudarnosti između dva entiteta uspoređivanih ontologija, to je veća vjerojatnost da ti entiteti predstavljaju isti objekt ili atribut nekog objekta u realnom svijetu. Rezultati podudarnosti dobiveni prvom metodom poslužit će za učenje umjetne neuronske mreže koja će se koristiti kao dio druge metode za automatsko određivanje težinskih faktora osnovnih metoda te koja bi trebala, uz zadržavanje kvalitete pronalaženja podudarnosti, ubrzati proces pronalaženja podudarnosti unutar sustava. Ovako unaprijeđeni sustav s novim metodama za automatsko određivanje težinskih faktora osnovnih metoda poboljšat će integraciju heterogenih izvora podataka koji opisuju istu domenu interesa, neovisno koju domenu interesa opisuju ti podaci. Stoga se ovakav sustav može primijeniti i na integraciju heterogenih izvora podataka u inteligentnim prometnim sustavima.

 


Istraživački tim
Rene Prenc rprenc@riteh.hr
Marko Valčić mvalcic@pfri.hr

dr.sc. Marko Gulić dipl. ing.

Pomorski fakultet

e-pošta: marko.gulic@pfri.hr
prostorija: Pomorski fakultet kabinet broj 217


MEĐUNARODNA VIDLJIVOST:
CITATIH-INDEXI10-INDEX
CROSBI
Google scholar 48 4 2