Skip to main content

Data preprocessingLaajuus (3 cr)

Code: TTVD0100

Credits

3 op

Teaching language

  • Finnish

Objective

Opiskelija ymmärtää data-analytiikka prosessin ja sen tuomat haasteet Opiskelija osaa tunnistaa erilaiset dataformaatit, yleisimmät rajapintaratkaisut ja datan esikäsittelyssä käytetyt työkalut ja menetelmät. Opiskelija osaa soveltaa datan esikäsittelyssä tarvittavia menetelmiä.

Content

- Erilaiset IoT lähteet/formaatit, JSON, APIt, SQL:stä taulujen haku jne
- Muuttujatyypit
- Datan esikäsittely ennen analysointiohjelmaan tuomista
- Datan esikäsittely Pandasissa (Pandasin/DataFramen perusteet)
- Eri datalähteiden yhdistäminen
- Datan enkoodaus

Qualifications

Tietotekniikan peruskäyttö taidot, ohjelmoinnin perusosaaminen ja Python-ohjelmointikielen tunteminen ja osaaminen.

Assessment criteria, satisfactory (1)

Hylätty 0: Opiskelija ei hallitse aihealuetta

Välttävä 1: Opiskelija tietää ja ymmärtää datan merkityksen ja sen tuomat edut. Opiskelija tietää datan esikäsittelyn merkityksen ja yleisimmät menetelmät. Opiskelija osaa soveltaa samaansa dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä.

Tyydyttävä 2: Opiskelija hallitsee datan hakemisen tietystä lähteestä. Opiskelija osaa toteuttaa datan esikäsittelyn datajoukoille. Opiskelija osaa soveltaa samaansa dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä. Opiskelija osaa arvioida omia ratkaisujaan datan esikäsittelyssä.

Assessment criteria, good (3)

Hyvä 3: Opiskelija hallitsee datan hakemisen useammasta lähteestä. Opiskelija osaa suunnitella ja toteuttaa datan esikäsittelyn datajoukoille. Opiskelija osaa soveltaa datan esikäsittelyssä käytettyjä menetelmiä. Opiskelija osaa arvioida ja perustella omia ratkaisujaan datan esikäsittelyssä.

Kiitettävä 4: Opiskelija hallitsee datan hakemisen erilaisista lähteistä. Opiskelija osaa suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Opiskelija osaa soveltaa datan esikäsittelyssä käytettyjä menetelmiä laajasti. Opiskelija osaa arvioida ja perustella omia ratkaisujaan datan esikäsittelyssä.

Assessment criteria, excellent (5)

Erinomainen 5: Opiskelija hallitsee datan hakemisen erilaisista lähteistä. Opiskelija osaa suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Opiskelija osaa soveltaa datan esikäsittelyssä käytettyjä menetelmiä erittäin laajasti. Opiskelija osaa kriittisesti arvioida ja perustella omia ratkaisujaan datan esikäsittelyssä.