{"id":947,"date":"2016-07-20T00:00:00","date_gmt":"2016-07-20T00:00:00","guid":{"rendered":"https:\/\/qulto.eu\/uj-szemelynev-adatbazis-epitese-intelligens-algoritmusok-hasznalataval\/"},"modified":"2021-07-06T06:58:48","modified_gmt":"2021-07-06T06:58:48","slug":"uj-szemelynev-adatbazis-epitese-intelligens-algoritmusok-hasznalataval","status":"publish","type":"post","link":"https:\/\/qulto.eu\/hu\/uj-szemelynev-adatbazis-epitese-intelligens-algoritmusok-hasznalataval\/","title":{"rendered":"\u00daj szem\u00e9lyn\u00e9v adatb\u00e1zis \u00e9p\u00edt\u00e9se intelligens algoritmusok haszn\u00e1lat\u00e1val"},"content":{"rendered":"<p>A Pet\u0151fi Irodalmi M\u00fazeum \u00e9s a Qulto c\u00e9gcsoport tagjak\u00e9nt m\u0171k\u00f6d\u0151 Monguz Kft. r\u00e9szv\u00e9tel\u00e9vel lezajlott \u00faj, szemantikus alap\u00fa, szem\u00e9lyn\u00e9v besorol\u00e1si \u00e1llom\u00e1nyt felt\u00e1r\u00f3 adatb\u00e1zisfejleszt\u00e9si projekt eredm\u00e9nyeir\u0151l adtunk sz\u00e1mot a Code 4Lib Journal has\u00e1bjain.<\/p>\n<p>A k\u00fcl\u00f6nb\u00f6z\u0151 forr\u00e1sokb\u00f3l sz\u00e1rmaz\u00f3 adatelemek kezel\u00e9se a Pet\u0151fi Irodalmi M\u00fazeumban sz\u00e1mos kih\u00edv\u00e1st rejtett mag\u00e1ban.\u00a0Nem csup\u00e1n a k\u00fcl\u00f6nb\u00f6z\u0151 forr\u00e1sokb\u00f3l sz\u00e1rmaz\u00f3 szem\u00e9lyn\u00e9v rekordok egyszer\u0171 \u00a0\u00f6sszevon\u00e1s\u00e1r\u00f3l volt sz\u00f3 egy \u00faj adatb\u00e1zis keretei k\u00f6z\u00f6tt. Meg kellett tiszt\u00edtani \u00e9s egys\u00e9ges\u00edteni kellett azokat a besorol\u00e1si rekordokat melyek elt\u00e9r\u0151 adattartalommal b\u00edrnak ugyan, de ugyanazon szem\u00e9lyhez kapcsol\u00f3dnak. Fontos szempont volt emellett az adatveszt\u00e9s kik\u00fcsz\u00f6b\u00f6l\u00e9se is. Els\u0151 l\u00e9p\u00e9sk\u00e9nt 2013-ban mintegy 80000 rekord szem\u00e9lyn\u00e9v adatait kellett \u00f6sszevonni. A m\u00e1sodik l\u00e9p\u00e9sben egy sokkal \u00f6sszetettebb algoritmus seg\u00edts\u00e9g\u00e9vel zajlott tov\u00e1bb az adatok tiszt\u00edt\u00e1sa, a rekordok \u00e9s a m\u00f6g\u00f6tt\u00fck \u00e1ll\u00f3 szem\u00e9lyek megfeleltet\u00e9se. A m\u00e1sodik k\u00f6rben mintegy 36 ezer rekord lett \u00e9rintett az adatok \u00f6sszevon\u00e1s\u00e1ban. A besorol\u00e1si adatok automatikus meghat\u00e1roz\u00e1s\u00e1ra szolg\u00e1l\u00f3 algoritmus az emberi intelligencia mint\u00e1j\u00e1ra m\u0171k\u00f6dik. Az adatb\u00e1zis parancssorok mintegy 20 f\u00e9le k\u00fcl\u00f6nb\u00f6z\u0151 adatelemet vizsg\u00e1ltak meg \u00e9s normaliz\u00e1ltak. Ezek az adatelemek d\u00e1tumokhoz, f\u00f6ldrajzi helyekhez, foglalkoz\u00e1sokhoz \u00e9s szem\u00e9lyn\u00e9v v\u00e1ltozatokhoz kapcsol\u00f3dnak. Az adatb\u00e1zis besorol\u00e1si rekordjaib\u00f3l p\u00e1rokat k\u00e9pezve azonos\u00edtott\u00e1k be a lehets\u00e9gesen redund\u00e1ns elemeket. Ezekb\u0151l az elemekb\u0151l fel lehetett \u00e9p\u00edteni egy gr\u00e1fot, illetve egy faszerkezet\u0171 strukt\u00far\u00e1t a m\u00fazeum kur\u00e1torainak seg\u00edts\u00e9g\u00e9vel. Ezen a l\u00e9p\u00e9seknek a megt\u00e9tel\u00e9vel \u00e9rt\u00fcnk az automatiz\u00e1lhat\u00f3 m\u0171veletek hat\u00e1r\u00e1hoz. A tov\u00e1bbi adattiszt\u00edt\u00e1shoz m\u00e1r a sz\u00e1m\u00edt\u00f3g\u00e9pes algoritmusok \u00e1ltal seg\u00edtett szakemberi beavatkoz\u00e1sra van sz\u00fcks\u00e9g. Az automatiz\u00e1lt m\u0171veletek \u00e9s a muzeol\u00f3gusok munk\u00e1j\u00e1nak eredm\u00e9nyek\u00e9nt l\u00e9trej\u00f6tt egy olyan ny\u00edlt kapcsolt adatokat tartalmaz\u00f3, a szemantikus weben publik\u00e1lhat\u00f3 adatb\u00e1zis mely 620 ezer szem\u00e9lyn\u00e9v alap\u00fa besorol\u00e1si rekordot tartalmaz. Ez az adatb\u00e1zis az egyik alapja lehet egy k\u00e9s\u0151bb kialak\u00edtand\u00f3 egys\u00e9ges nemzeti besorol\u00e1si \u00e1llom\u00e1nyegy\u00fcttesnek (n\u00e9vt\u00e9rnek). A cikk azt a folyamatot mutatja be, hogy mik\u00e9pp siker\u00fclt a szem\u00e9lyn\u00e9v adatokat \u00f6sszevonni s az adatt\u00f6meg redundanci\u00e1j\u00e1t kik\u00fcsz\u00f6b\u00f6lni.<\/p>\n<p><a href=\"http:\/\/journal.code4lib.org\/articles\/11765\">A r\u00e9szletek angol nyelven itt \u00e9rhet\u0151k el.<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>A Pet\u0151fi Irodalmi M\u00fazeum \u00e9s a Qulto c\u00e9gcsoport tagjak\u00e9nt m\u0171k\u00f6d\u0151 Monguz Kft. [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":1227,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"field_type":[],"news_category":[20],"acf":[],"_links":{"self":[{"href":"https:\/\/qulto.eu\/hu\/wp-json\/wp\/v2\/posts\/947"}],"collection":[{"href":"https:\/\/qulto.eu\/hu\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/qulto.eu\/hu\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/qulto.eu\/hu\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/qulto.eu\/hu\/wp-json\/wp\/v2\/comments?post=947"}],"version-history":[{"count":2,"href":"https:\/\/qulto.eu\/hu\/wp-json\/wp\/v2\/posts\/947\/revisions"}],"predecessor-version":[{"id":2954,"href":"https:\/\/qulto.eu\/hu\/wp-json\/wp\/v2\/posts\/947\/revisions\/2954"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/qulto.eu\/hu\/wp-json\/wp\/v2\/media\/1227"}],"wp:attachment":[{"href":"https:\/\/qulto.eu\/hu\/wp-json\/wp\/v2\/media?parent=947"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/qulto.eu\/hu\/wp-json\/wp\/v2\/categories?post=947"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/qulto.eu\/hu\/wp-json\/wp\/v2\/tags?post=947"},{"taxonomy":"field_type","embeddable":true,"href":"https:\/\/qulto.eu\/hu\/wp-json\/wp\/v2\/field_type?post=947"},{"taxonomy":"news_category","embeddable":true,"href":"https:\/\/qulto.eu\/hu\/wp-json\/wp\/v2\/news_category?post=947"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}