Datan esikäsittelyLaajuus (4 op)
Opintojakson tunnus: TTC8030
Opintojakson perustiedot
- Laajuus
- 4 op
- Opetuskieli
- suomi
- Vastuuhenkilö
- Antti Häkkinen
Osaamistavoitteet
Opintojakson jälkeen ymmärrät data-analytiikka prosessin ja sen tuomat haasteet. Osaat tunnistaa erilaiset dataformaatit, yleisimmät rajapintaratkaisut ja datan esikäsittelyssä käytetyt työkalut ja menetelmät. Lisäksi osaat soveltaa datan esikäsittelyssä tarvittavia menetelmiä.
EUR-ACE-osaamiset:
Tieto ja ymmärrys
Tekniikan soveltaminen käytäntöön
Sisältö
o Erilaiset datalähteet ja -formaatit, JSON, APIt, SQL:stä taulujen haku jne
o Muuttujatyypit
o Datan esikäsittely ennen analysointiohjelmaan tuomista
o Datan esikäsittely Pandasissa (Pandasin/DataFramen perusteet)
o Eri datalähteiden yhdistäminen
Esitietovaatimukset
Tietotekniikan peruskäyttätaidot, ohjelmoinnin perusosaaminen, Python-ohjelmointikielen tunteminen ja osaaminen.
Arviointikriteerit, tyydyttävä (1)
Tyydyttävä 2: Hallitset datan hakemisen valitusta lähteestä. Osaat toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä. Osaat arvioida omia ratkaisujasi datan esikäsittelyssä.
Välttävä 1: Tiedät ja ymmärrät datan merkityksen ja sen tuomat edut. Tiedät datan esikäsittelyn merkityksen ja yleisimmät menetelmät. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä.
Arviointikriteerit, hyvä (3)
Kiitettävä 4: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä laajasti. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.
Hyvä 3: Hallitset datan hakemisen useammasta lähteestä. Osaat suunnitella ja toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.
Arviointikriteerit, kiitettävä (5)
Erinomainen 5: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä erittäin laajasti. Osaat kriittisesti arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.