Ievads

Valodas morfoloģijas rīki ir programmatūra, kas radīta dabīgo valodu tekstu apstrādei. Šīs sistēmas tiek lietotas dabīgo valodu morfoloģisko struktūru analizēšanai un radīšanai no jauna, kas definēta ar noteiktas valodas struktūru jeb morfoloģiju. Šīs valodu morfoloģiju formalizācijas ir salīdzinoši jauna un sarežģīta pieeja, kas risina dažas dabīgo valodu tekstu apstrādes problēmas. Ar šo sistēmu palīdzību var veikt vārdu formu morfoloģisko analīzi, struktūru apskati un radīšanu no jauna.

RDF ir elastīga tehnoloģija ar kuras palīdzību var risināt plašu problēmu diapazonu, tai skaitā valodu morfoloģiju attēlošanu. Valodu morfoloģiju RDF datus ir viegli uzturēt, jo, izņemot dažas vārdšķiras, piemēram, lietvārdus, tie ir samērā nemainīgi. Nav nepieciešams pierakstīt katru vārda formu, bet gan tikai tā pamata formu, atsaucoties uz jau esošajiem morfoloģiskajiem datiem. Tajā pašā laikā, morfoloģiskajiem datiem ir sarežģīta struktūra, kas savā starpā sasaista dažādas valodas morfoloģijas ontoloģijas daļas. Nav praktiski veidot tradicionālu relāciju modeli vai XML shēmu. Tā vietā, valodas morfoloģiju var aprakstīt izmantojot RDF un interesējošos datus iegūt veicot vaicājumus kādā no vaicājumu valodām, piemēram, SPARQL.

Darba mērķis ir noskaidrot vai ir iespējams izmantot RDF, SPARQL vaicājumu valodu un XWiki sadarbības vidi dabīgo valodu morfoloģijas rīkos. Darba gaitā tiks apskatīta katra no tehnoloģijām, kā arī, ar tām saistītās problēmas, kas jārisina izstrādājot valodu morfoloģijas rīkus un prasības, kas jāizvirza tehnoloģiju pielietojumiem atkarībā no izvirzītā mērķa. Tiks sniegti ieteikumi kā risināt noteiktus uzdevumus.

Darbs sastāv no vairākām nodaļām, kas veltītas RDF un SPARQL apskatei, kā arī, RDF datu modularizācijai, versionēšanai un serializācijai. Tiks aizskartas arī citas ar valodu morfoloģiju saistītas tēmas, tādas kā, gramatiskā tagošana, galīga stāvokļa automāti, pareizrakstības pārbaude, interaktīva valodu morfoloģiju pārlūkošana, teksta meklēšana un tīmekļa servisi valodu morfoloģijas rīkiem. Darbā arī tiks apskatītas iespējas, ko sniedz XWiki sadarbūbas vides izmantošana uz RDF datiem bāzētos valodu morfoloģijas rīkos.

Darba pamatā ir eksperimentālā kārtā iegūtas atziņas, apskatīto tehnoloģiju standarti un citu autoru darbos sniegtā informācija.

Atpakaļ uz saturu

Tagi:
Izveidojis Maris Steinbergs 2008-11-08 14:25
    
This wiki is licensed under a Creative Commons 2.0 license
XWiki Enterprise 6.4 - Documentation