Pareizrakstības pārbaudītaja dzinējs

Pēdējais mainījis Administrator 2011-06-06 17:14

Pareizrakstības pārbaudītaja dzinējs

Pastāv dažādi pareizrakstības pārbaudītāja dzinēji. Tiem ir dažāds darbības princips un vārdnīcas, kuri tie izmanto tiek uzglabātas dažādās formās.

Vienkāršākie no tiem ir tā dēvētie plakano vārdnīcu risinājumi. Šāda veida dzinējiem ir nepieciešams visu iespējamo valodas vārdu saraksts jeb vārdnīca. Pareizrakstības pārbaudītājs uzrādīs kā kļūdas tos vārdus, kas neatrodas tā vārdnīcā. Šāda veida pareizrakstības dzinēji ir efektīvi morfoloģiski vienkāršām valodām, piemēram, angļu. Vārdnīcas izveide un efektīva lietošana ir samēra grūts uzdevums morfoloģiski sarežģītām valodām, kurās vienam vārdam var būs vairāki desmiti vai pat vairāk formu. Kā plakano vārdnīcu risinājuma piemērus varētu minēt Aspell (86) un Jazzy (87).

Nedaudz sarežģītāki risinājumi ir tie, kuri izmanto optimizētas vārdnīcas, tas ir, vārdnīcas, kurās vārdu saraksts ir ievadīts kompaktā formā, kas sevī iekļauj arī iespējamās galotnes, un tamlīdzīgi. Šāda veida vārdnīcās vārds „viejs” varētu tikt pierakstīts šādi „viej(s|am|u|a)” – tiek pierakstīta vārda sakne un visas tā iespējamās galotnes. Šādus pareizrakstības pārbaudītāju dzinēju realizāciju varētu balstīt uz galīgu akceptoru (88) idejas.

Pareizrakstības dzinēju varētu izveidot arī uz valodas morfoloģijas ontoloģijas, atbilstošas vaicājumu valodas un vaicājumu izpildes mehānisma bāzes. Valodas morfoloģijas ontoloģijai būtu jāsatur visi nepieciešamie valodas morfoloģijas fakti: galotnes, priedēkļi, piedēkļi, vardu saknes un tamlīdzīgi. Atbildes iegūšanai varētu izmantot vienu un to pašu vaicājumu tikai ar dažādiem parametriem, tas ir, ar dažādiem meklējamajiem vārdiem. Pēc vaicājuma izpildes tiktu atgriezta atbilde vai dotā vārda forma ir ievadīta ontoloģijā vai nē. Vajadzības gadījumā varētu iegūt arī papildus informāciju par ontoloģijā meklēto vārdu, tas ir, tā skaitli, dzimti un tamlīdzīgi, protams, ja šāda veida dati tiktu glabāti ontoloģijā. Šis risinājums ir piemērots morfoloģiski sarežģītām valodām, jo nav jāievada visas vārdu formas, bet gan tikai vārdu saknes tām atbilstošie morfoloģiskie dati.

Atpakaļ uz saturu

Tagi:
Izveidojis Maris Steinbergs 2008-11-09 22:36
    
This wiki is licensed under a Creative Commons 2.0 license
XWiki Enterprise 6.4 - Documentation