Semantinio tinklo požymiai

Ruošiausi trumpai pakalbėti semantinio tinklo tema šiemetiniame BLOGin’e – deja, teko pakeisti planus. Tas pasiruošimas jau gerokai daugiau nei tris mėnesius dulka mano užrašų knygoje… Atsiprašau. Kaip ten bebūtų, čia pirmas, įžanginis įrašas apie tai. Kiek leis galimybės – po truputį skaldysiu ir skelbsiu toliau.

Apie interneto ir apskritai žmogui naudingų kompiuterizuotų įrenginių ateitį jau yra gerokai prirašyta – dalis tokių įrašų kalba apskritai svajonių ir fantastikos tonais, kita dalis kalba žmogui nesuprantamais techniniais terminais. Man, tuo tarpu, aktualu yra tai, kad semantinį tinklą sukurti gali tik žmonės, o kuo daugiau žmonių tai darys – tuo geriau. Todėl ateityje pasistengsiu aprašyti bent kelis esamus ir mažai resursų reikalaujančius būdus “pasemantinti” savo (firmos) svetainę.

Egzistuojanti informacija yra semantinio tinklo pagrindas

Aukštesnėje pastraipoje žodžių junginys “naujas tinklas” kabutėse yra ne atsitiktinai – semantinis tinklas yra senas geras internetas, tik su daugiau prasmės, kuri yra lengviau interpretuojama. Dabartinis WWW yra didelis dokumentų rinkinys, kuris iš esmės yra labai nestruktūrizuotas, t.y. ryšiai tarp įvairių dokumentų nėra labai aiškūs. HTML kalba suteikia keletą galimybių nurodyti tuos ryšius, tačiau neperteikia tų ryšių prasmės. Standartinis nuorodos elementas <a> gali būti interpretuojamas kaip tiesiog “susiijusi informacija”. Google tą elementą interpretuoja kaip “citatą” ir “atiduotą balsą” (žr. apie PageRank). Negana to, dėl visokiausio plauko netikėlių istorinių priežasčių vidinė dažno HTML dokumento struktūra taipogi neatspindi to dokumento dalių (o tuo labiau teksto) prasmės, sąryšių ir konteksto.

Nova Spivack apibūdina semantinį tinklą kaip žingsnį link “pasaulinės duomenų bazės“. Šiandien gi, internetas tėra vienas labai didelis BLOB tipo laukas. Tam, kad jį sutvarkyti ir pasiekti protingų įrenginių ateitį yra keletas būdų. Dalis jų visiškai nepriklauso nuo paprasto žmogaus (pvz. natūralios kalbos atpažinimo algoritmai), kita dalis yra šiek tiek paprastesnė – vietoj to, kad laukti kol “robotai” pradės suprasti žmones, galima jau dabar šiek tiek padėti jiems “rūšiuoti” informaciją.

Pavyzdys

Airijoje automobilių numeriai yra sudaryti naudojant principą NN-AA-NNNNN. Pirmieji du skaičiai reiškia pirmos registracijos metus, po to sekanti viena arba dvi raidės reiškia registracijos vietą, o likę skaičiai – registracijos tais metais eilės numerį. Pirmasis registracijos numeris kiekvienais metais Dubline yra rezervuojamas merui. Turint šią informaciją, galima palyginti du automobilius ir šiek tiek apspręsti, kuris iš jų yra naujesnis, kurio iš jų šeimininkas yra turtingesnis/reikšmingesnis visuomenėje. Tuos sprendimus yra gana nesunku aprašyti logine, kompiuteriui suprantama, kalba – todėl uždavus paprastą loginį klausimą, jis nesunkiai į jį atsakytų.

Lietuvoje anksčiau buvo įmanoma panašiai spėlioti, tačiau su paskutiniais pasikeitimais tai tapo iš esmės neįmanoma, neturint priėjimo prie pilnos, struktūrizuotos duomenų bazės. Kita vertus, Airijos kontekste, vietiniai automobilių numeriai yra logiškai “sužymėti”, tačiau globaliu požiūriu – jie yra visiškai nesuprantami, nors ir žmogui nuspėjami.

Norint sukurti vienareikšmišką bet kurio pasaulio automobilio numerių interpretaciją, reikia arba sukurti didelę ryšių duomenų bazę, arba standartizuoti numerius globaliai. Panašiai yra ir su semantinio tinklo kūrimu – arba visi žmonės, rašantys internete, privalo sužymėti savo tekstus prasmingai ir vienareikšmiškai, arba kažkas turi užsikrauti sau didžiulę naštą ir suinterpretuoti visas įmanomas variacijas.

Višta ar kiaušinis?

Šiame įraše beveik nepaliečiau kitos esminės “naujo tinklo” gimimo sudedamosios dalies – stebuklingųjų “agentų”. Tie, kas bando spėti ateitį, dažnai kalba tik apie juos. Jie yra gana teisūs, nes kol nėra tų agentų – semantinis informacijos žymėjimas iš dalies neturi prasmės. Negana to, tas žymėjimas kol kas yra beprotiškai nepatogus. Kas turi atsirasti pirmiau – semantinė informacija ar tos informacijos atvaizdavimo būdai? Geras klausimas. Apsvarstykite jį patys!

One Response to “Semantinio tinklo požymiai”

Komentarų RSS