Galīga stāvokļa leksikons

Pēdējais mainījis Administrator 2011-06-06 17:14

Galīga stāvokļa leksikons

Leksikons (lexicon) (70) ir vārdu repozitorijs. Pats vienkāršākais leksikons sastāvētu no visu valodas vārdu saraksta, ieskaitot abreviatūras, piemēram, „ADM”, un īpašvārdus, piemēram, „Jānis” un „Anna”.

Bieži vien izveidot pilnu sarakstu un to lietot ir diezgan neērti dažādu iuemeslu dēļ: izveidot visu valodas vārdu sarakstu un skaitļojamie leksikoni (computational lexicons) (71) parasti ir strukturēti sakņu, priedēkļu, piedēkļu un galotņu sarakstos kopā ar morfoloģijas likumiem (morphotactics) (73), kas nosaka attiecības starp tiem.

Pastāv daudz veidu kā modelēt morfoloģijas likumus. Viens no veidiem ir galīga stāvokļa automāts. Ļoti vienkāršu galīga stāvokļa automātu angļu valodas nomenu jeb lietvārdu locīšanai (nominal inflection) (72) varētu izskatīties kā 1. attēlā:

finite_state_automat.gif
1. attēls

1. attēlā attēlotais galīgu stāvokļu automāts pieļauj, ka leksikons iekļauj sevī parastus angļu valodas lietvārdus (reg-noun), kuru galotne daudz skaitlī ir „–s”, piemēram, „cat”, „dog”, „fox” un „aardvark”. Attēlotais galīgu stāvokļu ignorē to, ka dažiem lietvārdiem daudzskaitļa galotne ir cita, piemēram, vārdam „fox” daudzskaitļa galotne ir „-es”. Leksikons satur arī neregulāros lietvārdus, kuriem gtalotne nav „-s”, gan vienskaitlī (irreg-sg-noun), piemēram, „goose” un „mouse”, gan daudzskaitlī (irreg-pl-noun), piemēram, „geese” un „mice”.

1. attēlā attēlotais gadījums ir vienkāršots un ir viegli izprotams. Pilns valodas morfoloģisko struktūru attēlojums ar galīga stāvokļā automāta palīdzību būs daudz sarežģītāks.

Atpakaļ uz saturu

Tagi:
Izveidojis MarisSteinbergs 2007-12-30 18:33
    
This wiki is licensed under a Creative Commons 2.0 license
XWiki Enterprise 6.4 - Documentation