Modularizācija

Pēdējais mainījis Administrator 2011-06-06 17:14

Modularizācija

Glabāt vārdnīcas datus (sarakstu ar vārdiem un to piederību gramatiskajām kategorijām) un morfoloģisko informāciju (locīšanas un vārddarināšanas paradigmas) vienā lielā RDF modelī jeb failā ir nepraktiski vairāku iemeslu dēļ:

  1. Pieaugot vārdnīcas datu apjomam, var rasties nopietnas grūtības ar modeļa uzturēšanu un vienlaicīgu izmaiņu sinhronizēšanu
  2. Vārdnīcas dati (it īpaši tādām vārdšķirām kā lietvārdi) var bieži mainīties, rodoties jauniem terminiem. Savukārt morfoloģiskā informācija jeb locīšanas paradigmas praktiski nemainās. Tādēļ šos modeļus ērtāk uzticēt rediģēt dažādiem cilvēkiem (attiecīgi terminoloģijas un gramatikas ekspertiem).
  3. Iespēja izvēlēties modeli atbilstoši vārdšķirai var padarīt efektīvākus dažus RDF pieprasījumus - it īpaši ja no vārda formas un sufiksiem/galotnēm var secināt, pie kādām vārdšķirām tas (teorētiski) varētu piederēt.
Lai RDF datus varētu efektīvi uzturēt, tas ir atjaunot, papildināt un uzlabot, tad vēlams RDF glabāt kā vairākus atsevišķus grafus. Šo nodrošina iespēju nodrošina, t.s. nosauktie grafi (named graphs), kuri aprakstīti RDF standarta paplašinājumā (14). Tas sniedz iespēju glabāt vairākus RDF grafus vienā dokumentā vai repozitorijā.

Morfoloģiska tipa datus varētu iedalīt vadoties pēc šo datu iespējamajām regularitātēm, piemēram, visus datus varētu iedalīt vairākos grafos, kur katrs grafs atbilstu vienai vārdšķirai, piemēram, lietvārdiem, darbības vārdiem, īpašības vārdiem un tamlīdzīgi. Datu apjomam tālāk pieaugot, varētu grafus tālāk iedalīt pēc gramatiskām kategorijām, piemēram, vīriešu dzimtes lietvārdi, trešās konjugācijas darbības vārdi, utt. (Atsevišķas vārdšķiras - vietniekvārdi, saikļi, prievārdi, partikulas - ir slēgtas vārdšķiras, t.i. attiecīgie saraksti jau no paša sākuma saturēs visus iespējamos attiecīgās vārdšķiras vārdus.)

#term("Nosaukto grafu", "named_graph") sintakse balstās uz RDF abstrakto sintaksi (15). Kopumā, identificētais grafs ir trijnieku (triple) kopa, kurus nosauc ar URI. URI var izmantot gan ārpus grafa, gan tā iekšienē, lai uz to atsauktos (14).

Atpakaļ uz saturu

Tagi:
Izveidojis MarisSteinbergs 2007-12-05 23:08
    
This wiki is licensed under a Creative Commons 2.0 license
XWiki Enterprise 6.4 - Documentation