Opintojakso

Näytä opetustapahtumat
3622351 Tilastollinen data-analyysi, 6 op 
Tunniste 3622351  Voimassaolo 01.01.1950 -
Nimi Tilastollinen data-analyysi  Lyhenne TDA 
Laajuus6 op  Vanhenemisaika  
TyyppiAineopinnot Oppiaine0390 Tilastotiede 
LajiOpintojakso  Tuntimäärä  
Opinto-oikeus   Arvostelu0-5 
Suositeltu suoritusaika 
   
Vastuuyksikkö Tietojenkäsittelytiede (J,K) 

Kuvaus:
Osaamistavoitteet 

Opiskelija hallitsee lineaarisen mallin ja sen tärkeimpien yleistysten perusteet sekä osaa toteuttaa ne R-ohjelmalla

 
Sisältö 

Yhden selittäjän lineaarinen regressio ja usean selittäjän lineaarinen regressio matriisilaskennan merkinnöin, kun jäännökset ovat riippumattomia ja niillä on vakiovarianssi. Luokitteluasteikollisten ja jatkuvien selittävien käyttö mallissa ja parametrien tulkinta. Muunnosten käyttö. Pienimmän neliösumman (PNS) estimointi ja PNS estimaattorien ominaisuudet. Hypoteesien testaus, mallin diagnostiikka ja ennustaminen. t-testit, varianssianalyysi ja kovarianssianalyysi regressiomallin erikoistapauksina. Lineaarisen mallin muotoilu kun vakiovarianssi- ja riippumattomuusoletukset eivät toteudu (ns. yleinen lineaarinen malli). Yleistetty pienemmän neliösumman menetelmä (GLS), suurimman uskottavuuden menetelmä (ML) ja rajoitettu suurimman uskottavuuden menetelmä (REML). Katsaus yleistettyihin lineaarisiin malleihin (GLM, esim. binäärinen logistinen regressio).

 
Suoritustavat 

Luennot (36 h), harjoitukset (18 h), välikokeet (2+2h), omatoiminen opiskelu ja harjoitustehtävien tekeminen (104 h). Kurssi voidaan suorittaa vaihtoehtoisesti tenttimällä kurssimateriaali yleisenä tenttipäivänä.

 
Toteutustavat 

Viikoittain on neljä tuntia luentoja sekä 2 tuntia harjoituksia 9 viikon ajan. Opiskelijan tulisi varata kontaktiopetuksen lisäksi n. 8 h/viikko aikaa omatoimiseen opiskeluun ja harjoitustehtävien tekemiseen

 
Oppimateriaalit 

Fahrmeir, L., Kneib, T., Lang, S. and Marx, Brian 2013. Regression models, methods and applications. Springer. Luvut 3-5.

 
Arvosteluperusteet 

Arvosana 0-5. Arvosana perustuu tenttiin (joko 2 välikoetta tai loppukoe). Harjoituksilla voi korottaa arvosanaa.

 
Edellytykset 

Tilastotieteen peruskurssi, R- kieli. Vahvasti suositellaan myös kursseja Data-analyysin todennäköisyyspäättely 1 ja 2. Matriisilaskennasta järjestetään tarvittaessa erillisiä ohjaustilaisuuksia.,

 
Ajankohta 

Syyslukukausi.

 
Tarjontatieto 

Opintojakso on avoin kaikille. Osanottajamäärää ei ole rajoitettu. Soveltuu jatko-opiskelijoille, jotka käyttävät tilastomenetelmiä tutkimuksessaan.

 
Lisätietoja 

Opetuksen kieli: Suomi ja englanti. Luennot suomeksi. Harjoitustilaisuudet tarvittaessa englanniksi. Materiaali englanninkielistä. Luennoista on katsottavissa englanninkieliset videotallenteet edellisvuodelta

 


Kirjainlyhenne opetustapahtuman nimen edessä tarkoittaa kampusta, jolla opetus tai tentti järjestetään: J = Joensuu, K = Kuopio.

Meneillä oleva ja tuleva opetus
Toiminnot Nimi Tyyppi op Opettaja Aikataulu
  (JOENSUU): Tilastollinen data-analyysi  Luento- ja harjoituskurssi    19.10.20 -05.02.21
  (KUOPIO): Tilastollinen data-analyysi  Luento- ja harjoituskurssi    19.10.20 -05.02.21

Tulevat tentit
Toiminnot Nimi Tyyppi op Opettaja Aikataulu
Ilmoittaudu (JOENSUU): Tilastollinen data-analyysi  Yleinen tentti  Lauri Mehtätalo 
20.08.20to 12.00-16.00
Ilmoittaudu (KUOPIO): Tilastollinen data-analyysi  Yleinen tentti  Lauri Mehtätalo 
20.08.20to 12.00-16.00