Datan esikäsittelyLaajuus (3 op)
Tunnus: TTVD0100
Laajuus
3 op
Opetuskieli
- suomi
Osaamistavoitteet
Opiskelija ymmärtää data-analytiikka prosessin ja sen tuomat haasteet Opiskelija osaa tunnistaa erilaiset dataformaatit, yleisimmät rajapintaratkaisut ja datan esikäsittelyssä käytetyt työkalut ja menetelmät. Opiskelija osaa soveltaa datan esikäsittelyssä tarvittavia menetelmiä.
Sisältö
- Erilaiset IoT lähteet/formaatit, JSON, APIt, SQL:stä taulujen haku jne
- Muuttujatyypit
- Datan esikäsittely ennen analysointiohjelmaan tuomista
- Datan esikäsittely Pandasissa (Pandasin/DataFramen perusteet)
- Eri datalähteiden yhdistäminen
- Datan enkoodaus
Esitietovaatimukset
Tietotekniikan peruskäyttö taidot, ohjelmoinnin perusosaaminen ja Python-ohjelmointikielen tunteminen ja osaaminen.
Arviointikriteerit, tyydyttävä (1)
Hylätty 0: Opiskelija ei hallitse aihealuetta
Välttävä 1: Opiskelija tietää ja ymmärtää datan merkityksen ja sen tuomat edut. Opiskelija tietää datan esikäsittelyn merkityksen ja yleisimmät menetelmät. Opiskelija osaa soveltaa samaansa dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä.
Tyydyttävä 2: Opiskelija hallitsee datan hakemisen tietystä lähteestä. Opiskelija osaa toteuttaa datan esikäsittelyn datajoukoille. Opiskelija osaa soveltaa samaansa dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä. Opiskelija osaa arvioida omia ratkaisujaan datan esikäsittelyssä.
Arviointikriteerit, hyvä (3)
Hyvä 3: Opiskelija hallitsee datan hakemisen useammasta lähteestä. Opiskelija osaa suunnitella ja toteuttaa datan esikäsittelyn datajoukoille. Opiskelija osaa soveltaa datan esikäsittelyssä käytettyjä menetelmiä. Opiskelija osaa arvioida ja perustella omia ratkaisujaan datan esikäsittelyssä.
Kiitettävä 4: Opiskelija hallitsee datan hakemisen erilaisista lähteistä. Opiskelija osaa suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Opiskelija osaa soveltaa datan esikäsittelyssä käytettyjä menetelmiä laajasti. Opiskelija osaa arvioida ja perustella omia ratkaisujaan datan esikäsittelyssä.
Arviointikriteerit, kiitettävä (5)
Erinomainen 5: Opiskelija hallitsee datan hakemisen erilaisista lähteistä. Opiskelija osaa suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Opiskelija osaa soveltaa datan esikäsittelyssä käytettyjä menetelmiä erittäin laajasti. Opiskelija osaa kriittisesti arvioida ja perustella omia ratkaisujaan datan esikäsittelyssä.