Mācību kurss: Datu analīze un valoda R

Pēdējais mainījis Kalvis Apsītis 2013-05-27 01:35

Kursa mājaslapa:http://ante.lv/xwiki/bin/view/TrainingDataProcessing/WebHome
Kursa faili: https://summerschool.googlecode.com/hg/dataproc/

Ievads: Datu analīze kā starpdisciplināra nozare. Saistība ar informātiku, dabaszinātnēm un citiem priekšmetiem. Kursa apraksts jeb syllabus (mērķi, priekšnoteikumi, tēmas, pasniegšanas formāti, pārbaudes darbi, mācību materiāli). Pārdomas - vidusskolas matemātika un datu analīzes saistība ar to.

Valodas R pārskats

(1) Valodas R vide: 
http://ante.lv/download/TrainingDataProcessing/WebHo/seqplot.png 
  1. Datu analīzes rīki 
  2. Valodas R pārskats
  3. R vides un RStudio uzstādīšana
  4. Demonstrāciju piemēri
  5. R arhitektūra
(2) Skaitļi un vektori: 
http://ante.lv/download/TrainingDataProcessing/WebHo/seqplot.png 
  1. Aritmētiskās darbības ar reāliem skaitļiem, īpašās vērtības NaN un Inf
  2. Dalīšana reālos skaitļos, dalījuma veselā daļa un atlikums
  3. Skaitliskās funkcijas
  4. Vektoru konstruēšana, c(), n:m, seq(), rep(), summas atrašana ar sum()
  5. Mājasdarbs: Naturālu skaitļu virkņu konstruēšana un daudzpunktu izteiksmes
(3) Apkopojošas funkcijas: 
http://ante.lv/download/TrainingDataProcessing/WebHo/seqplot.png 
  1. Darbības ar vektoriem, funkcijas max(), min(), cumsum(). Daudzpunktu izteiksmes
  2. Skaitļi un vektori izkliedes diagrammās (scatterplot)
  3. Atšķirība starp vidējo vērtību un mediānu. Vektora vērtību biežuma tabulēšana. Histogrammas
  4. Mājasdarbs: Daļskaitļu virknes, to locekļu saskaitīšana, parciālās summas
  5. Mājasdarbs: Vektoru vērtību kārtošana, filtrēšana, aritmētiskā vidējā un mediānas atrašana, kvantiles, utml.
(4) Vienkārši datu tipi: Reāli skaitļi datora atmiņā, peldošā punkta pieraksts, ļoti lieli un ļoti mazi skaitļi. Noapaļošanas kļūdas. Augstas precizitātes aritmētika - lielu veselo skaitļu vai augstas precizitātes daļskaitļu attēlošana un darbības ar tiem. 
http://ante.lv/download/TrainingDataProcessing/WebHo/LargeSpiral.png
Par šo bildi 
  1. Peldošā punkta pieraksts un noapaļošanas kļūdas
  2. Proporcijas, procenti un procentpunkti. 
  3. Joslu, sektoru, izkliedes diagrammas. Sastapto parametru vērtību biežuma atzīmēšana, histogrammas. 
  4. Vingrinājumi: Dažādu parametru attēlošana diagrammās - lineārā un logaritmiskā skala.
(5) Diagrammas: RGB krāsas. Noderīgas krāsu paletes (varavīksnes jeb krāsu apļa spektrs un funkcija rainbow(), paletes temperatūrām, augstumam virs jūras līmeņa, utml.). Citi diagrammu vizuālie aspekti, līniju platums un svītrojums, priekšmetapgabala un diagrammas mērvienības, mērogi. Mērvienību/iedaļu/režģa pievienošana grafikiem.
http://ante.lv/download/TrainingDataProcessing/WebHo/ChartPie.png 
  1. L1 Krāsu saskaitīšanas modelis, RGB koordinātas, krāsu kubs. Aukstas/siltas, piesātinātas/nepiesātinātas krāsas.
  2. L1 Pieejamās krāsu paletes, gada temperatūru diagramma, vulkāna diagramma.
  3. L1 Dažādu parametru konfigurēšana diagrammās - plot(), title(), text() u.c. funkcijas.
  4. L1 Vingrinājumi: Krāsoti laukumi, palešu zīmēšana skalas un apļa formā, krāsu gradienti.
  5. L2 Vingrinājumi: Līnijas, virsraksti, asu apzīmējumi, asu atzīmes un režģi. 
  6. L2 Vingrinājumi: Vairāki veidi, kā diagrammā attēlot skaitļu virkni, kuras vērtības identificē kārtas numuri vai vārdu iezīmes. 
(6) Datu ietvari (Data frames): Datu sagatavošana nolasīšanai statistiskās programmās. Dažādu tīmeklī sastopamu tabulveida datu ielasīšana Dataframe datu struktūrās. Operācijas ar Dataframe (rindu un kolonnu atlase; filtrēšana). Divu datu tabulu attiecināšana. 
http://ante.lv/download/TrainingDataProcessing/WebHo/FrameCarsBarchart.png 
  1. L1 Datu ietvara nolasīšana no lokāla vai tiešsaistes faila. Datu ietvara izveidošana no vektoriem.
  2. L1 Dažādu tabulveida datu pārveidošana mašīnlasāmā formā. 
  3. L1 Dažādas darbības ar datu ietvariem - fragmentu iegūšana, filtrēšana, kārtošana, u.c.
  4. L1 Vingrinājumi: Iebūvētās datubāzes cars attēlojums grafikos.
  5. L2 Vingrinājumi: Viena un divu metamo kauliņu, monētas mešanas eksperimentu iznākumu attēlošana tabulās. 
  1. (7) Dažādas datu manipulācijas
    1. Rindu un kolonnu vārdi datu ietvaros
    2. Datu pievienošana, c(), cbind(), rbind()
    3. Datu tipu nomaiņa, as.data.frame(), as.matrix(), as.character(), as.numeric()
    4. Lieko datu aizvākšana. 
    5. Darbības ar datumiem. 
    6. Sapludināšana un kārtošana. 
    7. Datu atlase (indexing, subset). 
  2. (8) Dati un to apkopošana
    1. Datu grupēšana
    2. Agregātfunkcijas
    3. Funkciju pielietošana. 
    4. Parciālsummas
  3. (9) Deskriptīvā statistika. 
    1. Deskriptīvās statistikas jēdzieni - parametra vidējā vērtība, mediāna, kvantiles, izkliede. 
    2. Mērījumu kļūdu novērtēšana, empīriskā vidējā vērtība, vidējā kvadrātiskā novirze, Stjūdenta koeficienti, kļūdu novērtēšana viena mērījuma gadījumā. 
  4. (10) Valodas R sintakses pārskats Valodas konstrukcijas, funkcijas, datu tipi, ievade un izvade.
    1. Anotācija
    2. Cikli un atkārtojumi, zarošanās, kā no tiem izvairīties
    3. Funkcijas valodā R, funkciju parametri, mainīgo redzamība
    4. Dažādas darbības ar vektoriem un funkcijām, apply() utml.
    5. Stringi un darbības ar tiem, regulāras izteiksmes. 
    6. Laiks valodā R - sistēmas laiks, laika salīdzinājumi un rēķini, ielasīšana un vizualizācija.
    7. Tipi valodā R, tipu pārbaudes un pārveidojumi
    8. Datu ietvari, tabulas un matricas. 
    9. Datu ievade no lokāliem failiem un URL valodā R.
    10. R datu saglabāšana uz diska TXT un XLS formātā.
    11. Attēlu saglabāšana no komandrindas.
    12. L2 Vingrinājumi: KNAB un CVK datu attiecināšana un vizualizācija.

R lietojumi matemātikā

  1. Dažādas statiskās diagrammas: Nokrišņu, vidējo/ekstremālo temperatūru u.c. klimata parametru attēlojums izkliedes diagrammās (scatter charts), joslu un sektoru diagrammās (bar charts, pie charts), laikrindu grafikos (time series), daudzkrāsu režģos (heatmaps), izkrāsotos mēnešu vai dienu kalendāros. Diagrammu leģendas.
    1. Vairāku diagrammu savietošana kopīgā bildē
    2. Vingrinājumi: Gaisa piesārņojuma mērījumi kā laikrindas. Diennakts vidējo temperatūru (vai arī vidējo temperatūru daudzu gadu garumā) attēlojums kalendāros. 
    3. Vingrinājumi: Nokrišņu daudzuma un sezonalitātes attēlojums sektoru diagrammās vai arī vairākposmu joslu diagrammās. 
    4. Vingrinājumi: Histogrammas vienai vai divām datu dimensijām. 
  2. Lieli un mazi skaitļi: Augošas un dilstošas ģeometriskās progresijas. Lineāra un logaritmiska skala. Atšķirība starp vienmērīgi sadalītiem parametriem (cilvēka augums centimetros) un nevienmērīgi sadalītiem parametriem (cilvēkam piederošā nauda). Progresiju vektoru attēlošana ar plot() funkciju.
    1. Ģeometriskās progresijas un logaritmiskā skala. Virkņu attēlošana vienkāršās izkliedes diagrammās.
    2. Maltusa teorijas pagātnē un mūsdienās. 
    3. Vingrinājumi: Cik ātri divkāršojas vai trīskāršojas kāds lielums, kam ir ikgadējs pieaugums procentos. Eksponentfunkcija – nepārtraukts un trepjveida grafiks. 
    4. Vingrinājumi: Priekšperioda un perioda atrašana racionālu skaitļu decimālpierakstā. 
  3. Matemātiskas pakotnes valodā R
    1. Iepazīt matemātikas jēdzienus (kompleksie skaitļi, trigonometriskas u.c. funkcijas, tuvinātās metodes, parametriski uzdotas līknes, nepārtrauktība).
    2. Prast zīmēt vienkāršas līknes (riņķa līnijas, elipses, parabolas, hiperbolas, cikloīdas, epicikloīdas, utml.), izmantojot parametriskos vienādojumus. 
(2) Kombinatorika: Izlases ar atkārtojumiem, izlases bez atkārtojumiem (kombinācijas), permutācijas. Funkcijas choice(), factorial(), sample(). Vienkāršu varbūtību skaitļošana.
Permutācijas un kombinācijas. Varbūtības. Monētas un metamie kauliņi. Varbūtiski sadalījumi un summas. Puasona sadalījums.
http://ante.lv/download/TrainingDataProcessing/WebHo/CombiPascalTriangle.png 
  1. L1 Dažas kombinatorikā bieži izmantotas funkcijas. 
  2. L2 Permutācijas un kombinācijas ar atkārtojumiem.
  3. L2 Kā iegūt visu iespējamo kombināciju/permutāciju atspoguļojumu vektora formā.
  4. L1 Vingrinājumi: Kombinatorikas pamatfunkciju lietošana vienkāršos uzdevumos.
  5. L1 Vingrinājumi: Iespējamo permutāciju un kombināciju attēlošana vektora pierakstā vai tabulā. 
(2) Zīmēšana bibliotēkā "grid": Dekarta koordinātu sistēma 2 dimensijās. Punktu, līniju, daudzstūru attēlošanas funkcijas. 
http://ante.lv/download/TrainingDataProcessing/WebHo/Grid2Mitten.png 
  1. L2 Taisnas un lauztas līnijas. Daudzstūri. Trigonometrisko funkciju izmantošana regulāru daudzstūru zīmēšanā.  Iekrāsošana pēc saskaitīšanas vai saskaitīšanas/atņemšanas likuma. 
  2. L2/L3 Vairāku grafiku sakārtošana tabulas formā, bibliotēka "lattice". 
  3. L1 Vingrinājumi: Rūtiņu ornamenta iegūšana, kombināciju/permutāciju attēlošana. 
  4. L3 Vingrinājumi: Punktu un figūru lineāri pārveidojumi - pārneses, ass simetrijas, pagriezieni, spiešana un šķiebšana. Homogēnās koordinātes.
  1. Matemātiskas funkcijas: Funkciju pētīšana un funkciju grafiki. Dažādi veidi, kā vizualizēt funkcijas. Punktu, līniju, pakāpienu grafiki. Histogrammas. Stabiņu un apļu diagrammas. Funkcijas plot(), grid() u.c. funkcijas grafiku attēlošanai. Elementāru funkciju grafiki, gabaliem definētu funkciju grafiki, u.c. Dažu diskrēto sadalījumu (Puasona u.c.) grafiska attēlošana.
    1. Parabolas, hiperbolas grafiki. Trigonometrisko un inversi trigonometrisko funkciju grafiki.
    2. Glīts funkcijas pārtraukuma punktu attēlojums, asimptotas, utml. palīglīnijas.
    3. L2 Vingrinājumi: Grafiku zīmēšana un zīmēšanai interesanta apgabala aprēķināšana.
    4. L2 Vingrinājumi: Grafiku pārklāšanās piemēri un grafiku krustpunktu noteikšana.
  2. Līknes: Parametriski uzdotas līknes. Apļi un Lisažū figūriņas. Sirds formas attēlošana. Pagriezienu matricas.
    1. Parametriski uzdotas līknes plaknē. Līknes krāsas mainīšana. 
    2. Zīmēšana ar punktiem, bifurkācijas diagrammas. 
    3. Zīmēšana polārajās koordinātēs. Spirāļu zīmēšana. Vēju roze. 
    4. L2 Vingrinājumi: Konisko šķēlumu zīmēšana. 
    5. L2 Vingrinājumi: Dažādu citu līkņu zīmēšana - cikloīdas, spirāles, Lisažū figūriņas, sirds forma u.c. Zīmēt līknes, nomainot parametrus, bet atstājot to pašu algoritma paraugu. Dotajai Lisažū figūriņai (cikloīdai) eksperimentāli piemeklēt parametrus, ar kuriem to var izveidot. 
    6. L2 Vingrinājumi: Vienkārši animēti attēli - ķermeņa kustība daudzstūra pārtapšana par apli. 
    7. Zīmēt parametrizētas līknes, nomainot parametrus, bet atstājot to pašu algoritma paraugu. Dotajai Lisažū figūriņai piemeklēt parametrus, ar kuriem to var izveidot.
  3. Lineāri uzdevumi: Masas centri. Mobilo sakaru tarifu salīdzinājums. Gabaliem lineāras funkcijas. Lineārā optimizācija.
    1. L2 Vingrinājumi: Trīs pozitīvu lielumu proporcijas attēlošana ar masas centru vienādmalu trijstūrī. Vienādmalu trijstūra punktu izkrāsošana atbilstoši dažādo proporciju īpašībām.
  4. Grafi Grafu teorijas piemēri un uzdevumi.
    1. L2 Grafa uzdošana ar matricu un šķautņu sarakstu. 
    2. L2 Plūsmu uzdevumi grafos.
  5. Skaitliskās metodes:
    1. Prast konstruēt funkciju tuvinājumus - interpolācijas polinomus un splainus. 
    2. Tuvināti risināt vienādojumus un vienādojumu sistēmas (pieskaru metode, u.c.)
    3. Tuvinātā skaitliskā integrēšana ar intervālu metodi. 
    4. Tuvināta lineāru vienādojumu sistēmu risināšana. 

Matemātiskās statistikas ievads

  1. Varbūtiskie sadalījumi: Azartspēļu rezultātu attēlošana (spēles ar monētām, metamiem kauliņiem, spēļu kārtīm). Diskrētie varbūtiskie sadalījumi (Bernulli, Puasona). Nepārtrauktie sadalījumi (vienmērīgais, normālais). Centrālā robežteorēma.
    1. Vingrinājumi: Empīriski un ideāli sadalījumi; to attēlošana sadalījuma funkcijās un histogrammās. 
  2. Iteratīvi procesi: Kredīti un līzings. Aizdevumu procenti un kapitāla pieaugums. Tuvinātās metodes – funkciju interpolācija, tuvināta vienādojumu risināšana. Lielumu summēšana un priekšstats par integrāļiem. 
  3. Statistikas hipotēzes:
    1. Medicīnisko, socioloģisko u.c. datu apstrāde. Lineārā regresija.
    2. Nulles hipotēzes pieņemšanas vai noraidīšanas kritēriji. Hī kvadrāta kritērijs. 

R lietojumi astronomijā un Zemes zinātnēs

  1. R ģeogrāfisko lietojumu ievads
  2. Kartogrāfiskās projekcijas: Sfēriskās koordinātes. Kontūrkartes veidošana cilindriskajā (Merkatora), transversajā Merkatora, koniskajā, Mollveides (eliptiskajā) u.c. projekcijās. Loksodromas (konstants kurss pret debesspusēm), ģeodēziskās līnijas (īsākais ceļš starp diviem punktiem) un to attēlošana dažādās karšu projekcijās. Laukumu saglabāšanās vai deformēšanās projicējot.
    1. Vingrinājumi: Liela mēroga (piemēram, pasaules) kartes attēlošana dažādās projekcijās. 
    2. Vingrinājumi: Loksodromas attēlojums no dotā punkta dotajā virzienā. 
    3. Vingrinājumi: Ģeodēziskās līnijas attēlojums starp diviem punktiem. 
    4. Vingrinājumi: Vienādu sārtu aplīšu formas/laukuma atšķirīgā deformēšanās vai laukuma maiņa, projicēšanas gaitā.
(2) Astronomiski dati: Astronomiskie novērojumi atkarībā no ģeogrāfiskā platuma. Saules, Mēness u.c. debess spīdekļu redzamā kustība pie debesīm. Mēness fāzes. Zvaigžņu kartes.  
http://ante.lv/download/TrainingDataProcessing/WebHo/AstroSunPosition.jpeg 
  1. L1 Vingrinājumi: Saullēkti, saulrieti, mēness redzamā kustība, mēness diska apgaismotā daļa, diennakts garums, krēsla, u.c. - atkarībā no ģeogrāfiskās vietas. Diagrammas, kas parāda saules un mēness lēktus un rietus, dienas garumu. Novērojumu dati un aprēķini pēc formulām.
  2. L2/L3 Vingrinājumi: Mēness lēkts, riets, pievienotas mēness fāžu bildītes. 
  3. L3 Vingrinājumi: Saules redzamais novietojums pie debesu sfēras dažādos pulksteņlaika momentos, saules pulksteņi un saules pulksteņa korekcija, ko rada Zemes eliptiskā orbīta.
  4. L3 Dienas-nakts līnijas kustība pa karti (normālā Merkatora projekcija) dažādos gadalaikos. Krēslas josla un krēslas ilgums atkarībā no ģeogrāfiskā platuma. 
(3) Karšu veidošana no vektoru formātiem: Publiski resursi ar ģeogrāfiskiem datiem – tiešsaistes kartes, atmosfēriski, hidrosfēriski, ģeosfēriski dati. ESRI Shapefile datu formāts; laukumu (daudzstūru), līniju un punktu attēlojums kartēs. Skaitliskas informācijas attēlošana Shapefile kartēs. 
http://ante.lv/download/TrainingDataProcessing/WebHo/ColmpDensity.jpg 
  1. Kartes vektoru formātos. ESRI Shapefile. Ģeometriskie dati apvienojumā ar skaitliskajiem datiem. 
  2. Polygon un tam radniecīgie datu objekti; str() funkcija un piekļuve dažādiem datu laukiem. 
  3. Paralēļu un meridiānu norādīšana kartēs. Reģionu iekļaujošā taisnstūra (bounding box) noteikšana. Vektoru karšu kombinēšana.
  4. L2/L3 Vingrinājumi: Igaunijas, Latvijas un Lietuvas administratīvais iedalījums; atsevišķu provinču izcelšana kartē, iedzīvotāju blīvuma kartes, utml. 
  5. L2/L3 Vingrinājumi: Izkrāsotu karšu saglabāšana rastra un vektorgrafikas formā.  
  6. L2 Vingrinājumi: Vēlēšanu rezultātu un demogrāfisku datu attēlošana.
  7. L3 Vingrinājumi: Kontūru un laukumu iekrāsošana atbilstoši datu tabulām. Rastra grafiku iegūšana. Ģeogrāfiski nosaukumi attēlos. Vektorgrafikas attēli ar interaktīvu palīdzību. 
  1. Miksējumi (mash-up) ar tīmekļa kartēm: Anotācijas - punktveida objektu kā arī līniju un laukumu atzīmēšana kartē. Google Maps servisos – pieejamie karšu slāņi, punktu ģeogrāfiskās koordinātes, meklēšana ar atslēgvārdiem, navigācijas norādījumi no punkta uz punktu. Google Maps karšu papildināšana ar ārējām datu tabulām.
    1. L3 Vingrinājumi: Kājāmgājēju un velotūristu maršrutu atzīmēšana. 
    2. L3 Vingrinājumi: Kā atrast fotoattēlus par kādu ģeogrāfisku vietu, vai pievienot savējos. 
    3. L3 Vingrinājumi: Google kartes savākšana tiešsaistē un papildināšana ar aplīšiem. 
    4. L3 Vingrinājumi: Google kartes (Google Maps vai Google Earth servisa) apvienošana ar KML (Keyhole Markup Language) datiem. 
    5. Pievienot Google Maps attēliem jaunus punktveida objektus, līnijveida objektus (teiksim, velomaršrutus) vai daudzstūrveida objektus (lielākas ēkas vai teritorijas). Jaunos objektus un to koordinātes ņemt no tabulveida datu kolekcijas.
  2. Meteoroloģisko datu vizualizācija: Klimata parametru atzīmēšana ar iekrāsojumu. Klimata tipi, Koppena u.c. klimata klasifikācijas (atkarībā no vidējās temperatūras un nokrišņu daudzuma dažādos gadalaikos, utml.).
    1. Vingrinājumi: Meteoroloģisko staciju attēlošana ar krāsainiem aplīšiem atkarībā no novērojumu rezultātiem. 
    2. Vingrinājumi: Izotermu, utml. līniju ievilkšana kartēs, ja pieejams liels skaits meteoroloģisko staciju un to datu. 
    3. Vingrinājumi: Augu un dzīvnieku izplatības areālu iezīmēšana kartēs. Dati, ko iegūst no putnu gredzenošanas. 
  3. Seismiskā aktivitāte, reljefa un okeanogrāfijas dati: Dati par zemes garozas svārstībām; zemestrīču un vulkāniskās aktivitātes novērojumu dati.  Reljefa kontūru līnijas; reljefa profils. Reljefa datu iegūšana no tiešsaistes servisiem. Jūru dziļums, straumes.
    1. Vingrinājumi: Zemes svārstību dati no tiem zemeslodes punktiem, kur novērojumi veikti ilgstošā laika sprīdī. 
    2. Vingrinājumi: Cunami riski atkarībā no tektoniskajām svārstībām. 
    3. Vingrinājumi: Reljefa attēlošana ar kontūrlīnijām (piemēram, kalnu grēdas, vulkāni, utml.). 
    4. Vingrinājumi: Okeānu reljefs un okeānu straumju intensitāte.
  4. Vides mērījumi, ilglaicīgās klimata izmaiņas: Zemes un tās atmosfēras evolūcija. Dati par temperatūras un CO2 izmaiņām ilgstošā laika posmā. Hipotēze par cilvēku darbības ietekmi uz klimatu. Gaisa un ūdens piemaisījumu dati. "Klimatgeita" un klimata novērojumu negodprātīgas interpretācijas. Cilvēka izraisīto klimata izmaiņu hipotēzes formulējums un tās ticamība.
    1. Vingrinājumi: O2 un CO2 koncentrācija atmosfērā dažādos ģeoloģiskajos periodos. 
    2. Vingrinājumi: Ledāju pētījumu dati. 
    3. Vingrinājumi: Pēdējo gadsimtu meteoroloģiskie novērojumi. 

R lietojumi sociālajās zinātnēs

  1. Demogrāfiski dati: Svarīgākie demogrāfiskie rādītāji. Depopulācijas problēma. Demogrāfisku datu attēlošana kartēs. Iedzīvotāju blīvuma diagrammas – iedzīvotāju blīvuma attēlojums ar punktiem, tekstūrām un krāsām. Demogrāfisko procesu modelēšana – kā pārveidojas demogrāfiskās eglītes pie zināmas dzimstības/mirstības/migrācijas. Pensiju aprēķināšana. Demogrāfijas tendences globālā skatījumā – salīdzinājums. Globālie veselības dati (bērnu mirstība, AIDS, narkomānija, u.c.).
    1. Vingrinājumi: Dzimumu/vecumu struktūras piramīdas (demokgrāfiskās “eglītes”) zīmēšana. 
    2. Vingrinājumi: Apgādājamības attiecība (dependency ratio) un tās aprēķināšana. 
    3. Vingrinājumi: Demogrāfiskās attīstības prognozēšana, pieņemot noteiktus dzimstības, mirstības, migrācijas koeficientus. 
  2. Vēlēšanu dati: Latvijas vēlēšanu dati. Dažādas specializētas un jaukta veida infografikas; kartes papildināšana ar papildu diagrammām.
    1. Vingrinājumi: Vēlētāju aktivitāte, partiju atbalsts un referendumi rajonu/pagastu vai novadu griezumā. 
    2. Vingrinājumi: No Shapefile eksportētas pārskata kartes (piemēram, SVG) papildināšana ar detalizētākiem grafikiem (piemēram, sektoru vai joslu diagrammām) par katru teritoriālo vienību.
  3. Plūsmu grafiska attēlošana: Grafi ar šķautņu kapacitātēm.  Transporta plūsmu analīze. Enerģētika – elektrības, gāzes, naftas plūsmas kartēs.
    1. Vingrinājumi: Maksimālās plūsmas atrašana transporta grafā. 
    2. Vingrinājumi: Atsevišķas valsts enerģijas avotu un patēriņa attēlojums Sankeja (Sankey) diagrammā.
  4. Tekstu klasifikācijas algoritmi: Naivais Beijess (Naive Bayes). N-grammas un Markova ķēdes. Atbalsta vektoru mašīnas.
    1. L3 Vingrinājumi: Simbolu virknes ģenerēšana atbilstoši esošajos paraugos atrastajām N-grammām. 
    2. L3 Vingrinājumi: Teksta fragmentu klasificēšana - spama meklēšana komentāros. 
    3. L3 Vingrinājumi: Lielu pārkopētu fragmentu meklēšana - N-grammu pieeja. 

Dažādas vizualizācijas

  1. Animētas diagrammas: Hansa Roslinga burbuļdiagrammas – www.gapminder.org u.c.
    1. L3 Vingrinājumi: Valstu vai teritoriju skaitlisko datu salīdzināšana.
    2. L3 Vingrinājumi: HTML5, SVG un Adobe Flash izmantošana dinamisku diagrammu veidošanā. Dinamisku diagrammu veidošanas servisi 
  2. Telpiski attēli: Dekarta un sfēriskās koordinātes.  
    1. LL2 Vingrinājumi: Kā uzzīmēt dažas vienkāršas figūras (daudzskaldņus, utml.) izometriskajās projekcijās. Klucīšu konfigurācijas.
  3. Fraktāļi: Hilberta līkne, Koha sniegpārsliņa. Histogrammas un demogrāfiskās eglītes.
    1. L2 Vingrinājumi: Hilberta līkne (vai vairāku līkņu superpozīcija) - atkarībā no iterācijas numura. Citu līkņu iegūšana ar ģeneratoru.
  4. Vizualizāciju publiskošana: Attēlu pārveidošana vajadzīgās izšķirtspējas rastra vai vektorgrafikā. Publiskošanas iespējas statiskos dokumentos un tīmeklī. Diagrammu periodiska atjaunināšana.
    1. L2 Vingrinājumi: Rastra attēlu eksports un publiskošana. 
    2. L3 Vingrinājumi: Vektorgrafikas attēlu eksports un publiskošana. 
    3. L3 Vingrinājumi: Citi mēdiju formāti.
  5. R darbināšana servera pusē:
    1. Interaktivitātes nodrošināšana tīmekļa lietotājiem bez R programmatūras.
    2. Drukājamu dokumentu ģenerēšana.

Iedvesmas avoti

[R-bloggers]
R dienraksti (en:R bloggers)
[R客]
R viesis (zh:R客/R-Kè)
[Revolution Analytics]
Revolūcijas analītika (en: Revolution Analytics)
[Stack Overflow]
Atbilžu serviss 'Steka pārpilde' (en: Stack Overflow)
[Chinese Academy of R Software]
R programmatūras akadēmija CARS
[IDRE institute at UCLA]
Kalifornijas universitāte (Losandželosā) - par statistiku un R
Tagi:
Izveidojis Kalvis Apsītis 2012-12-24 20:05
    
This wiki is licensed under a Creative Commons 2.0 license
XWiki Enterprise 6.4 - Documentation