Datan esikäsittely (3 cr)
Code: TTVD0100-3001
General information
- Enrollment
-
03.08.2020 - 30.08.2020
Registration for the implementation has ended.
- Timing
-
31.08.2020 - 30.10.2020
Implementation has ended.
- Number of ECTS credits allocated
- 3 cr
- Local portion
- 0 cr
- Virtual portion
- 3 cr
- Mode of delivery
- Online learning
- Unit
- School of Technology
- Teaching languages
- Finnish
- Seats
- 0 - 60
- Teachers
- Antti Häkkinen
- Teacher in charge
- Antti Häkkinen
- Groups
-
ZJA20STIDAAvoin amk, tekniikka, ICT, Data-analytiikka ja tekoäly
- Course
- TTVD0100
Evaluation scale
0-5
Objective
Opiskelija ymmärtää data-analytiikka prosessin ja sen tuomat haasteet Opiskelija osaa tunnistaa erilaiset dataformaatit, yleisimmät rajapintaratkaisut ja datan esikäsittelyssä käytetyt työkalut ja menetelmät. Opiskelija osaa soveltaa datan esikäsittelyssä tarvittavia menetelmiä.
Content
- Erilaiset IoT lähteet/formaatit, JSON, APIt, SQL:stä taulujen haku jne
- Muuttujatyypit
- Datan esikäsittely ennen analysointiohjelmaan tuomista
- Datan esikäsittely Pandasissa (Pandasin/DataFramen perusteet)
- Eri datalähteiden yhdistäminen
- Datan enkoodaus
Location and time
Opintojakso toteutetaan verkkototeutuksena.
Materials
Opintojakson verkkosivut (luentomateriaali, harjoitukset, harjoitustyöohjeistus)
Teaching methods
Opintojakso sisältää harjoituksia eri aihealueilta sekä opintojakson aihepiirejä yhdistävän harjoitustyön.
Student workload
Harjoitukset 60 h ja harjoitustyö 21 h. Yhteensä 81 h
Assessment criteria, satisfactory (1)
Hylätty 0: Opiskelija ei hallitse aihealuetta
Välttävä 1: Opiskelija tietää ja ymmärtää datan merkityksen ja sen tuomat edut. Opiskelija tietää datan esikäsittelyn merkityksen ja yleisimmät menetelmät. Opiskelija osaa soveltaa samaansa dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä.
Tyydyttävä 2: Opiskelija hallitsee datan hakemisen tietystä lähteestä. Opiskelija osaa toteuttaa datan esikäsittelyn datajoukoille. Opiskelija osaa soveltaa samaansa dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä. Opiskelija osaa arvioida omia ratkaisujaan datan esikäsittelyssä.
Assessment criteria, good (3)
Hyvä 3: Opiskelija hallitsee datan hakemisen useammasta lähteestä. Opiskelija osaa suunnitella ja toteuttaa datan esikäsittelyn datajoukoille. Opiskelija osaa soveltaa datan esikäsittelyssä käytettyjä menetelmiä. Opiskelija osaa arvioida ja perustella omia ratkaisujaan datan esikäsittelyssä.
Kiitettävä 4: Opiskelija hallitsee datan hakemisen erilaisista lähteistä. Opiskelija osaa suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Opiskelija osaa soveltaa datan esikäsittelyssä käytettyjä menetelmiä laajasti. Opiskelija osaa arvioida ja perustella omia ratkaisujaan datan esikäsittelyssä.
Assessment criteria, excellent (5)
Erinomainen 5: Opiskelija hallitsee datan hakemisen erilaisista lähteistä. Opiskelija osaa suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Opiskelija osaa soveltaa datan esikäsittelyssä käytettyjä menetelmiä erittäin laajasti. Opiskelija osaa kriittisesti arvioida ja perustella omia ratkaisujaan datan esikäsittelyssä.
Qualifications
Tietotekniikan peruskäyttö taidot, ohjelmoinnin perusosaaminen ja Python-ohjelmointikielen tunteminen ja osaaminen.