Teksta meklēsanas rīki

Pēdējais mainījis Administrator 2011-06-06 17:14

Teksta meklēšanas rīki

Daļu no teksta meklēšanas rīkiem, piemēram, Lucene (61) var padarīt morfoloģiski jūtīgus, tas ir, tiek meklēti ne tikai lietotāja norādītie vārdi, bet arī visas iespējamās vai arī tikai norādītās locījumu formas. To var panākt izveidojot divus indeksus, kur pirmais saturētu vārdu saknes, bet otrais saturētu vārdu formas (62).

Līdzīgu rīku varētu izveidot izmantojot valodas morfoloģijas ontoloģiju un atbilstošu vaicājumu valodu. Morfoloģijas ontoloģijai jāsatur vārdu saknes un visas iespējamās vārdu darināšanas paradigmas kategorizētā formā, piemēram, iedalītiem vārdšķirās. Veicot vaicājumus ontoloģijā tiks izgūtas visas iespējamās vārdu formas. To varēs veikt visām vai katrai morfoloģiskajai kategorijai atsevišķi.

Atpakaļ uz saturu

Tagi:
Izveidojis Maris Steinbergs 2008-11-09 23:15
    
This wiki is licensed under a Creative Commons 2.0 license
XWiki Enterprise 6.4 - Documentation