Datan esikäsittely (3 op)
Toteutuksen tunnus: TTVD0100-3001
Toteutuksen perustiedot
- Ilmoittautumisaika
-
03.08.2020 - 30.08.2020
Ilmoittautuminen toteutukselle on päättynyt.
- Ajoitus
-
31.08.2020 - 30.10.2020
Toteutus on päättynyt.
- Opintopistemäärä
- 3 op
- Lähiosuus
- 0 op
- Virtuaaliosuus
- 3 op
- Toteutustapa
- Verkko-opetus
- Yksikkö
- Teknologiayksikkö
- Opetuskielet
- suomi
- Paikat
- 0 - 60
- Opettajat
- Antti Häkkinen
- Vastuuopettaja
- Antti Häkkinen
- Ryhmät
-
ZJA20STIDAAvoin amk, tekniikka, ICT, Data-analytiikka ja tekoäly
- Opintojakso
- TTVD0100
Arviointiasteikko
0-5
Tavoitteet
Opiskelija ymmärtää data-analytiikka prosessin ja sen tuomat haasteet Opiskelija osaa tunnistaa erilaiset dataformaatit, yleisimmät rajapintaratkaisut ja datan esikäsittelyssä käytetyt työkalut ja menetelmät. Opiskelija osaa soveltaa datan esikäsittelyssä tarvittavia menetelmiä.
Sisältö
- Erilaiset IoT lähteet/formaatit, JSON, APIt, SQL:stä taulujen haku jne
- Muuttujatyypit
- Datan esikäsittely ennen analysointiohjelmaan tuomista
- Datan esikäsittely Pandasissa (Pandasin/DataFramen perusteet)
- Eri datalähteiden yhdistäminen
- Datan enkoodaus
Aika ja paikka
Opintojakso toteutetaan verkkototeutuksena.
Oppimateriaalit
Opintojakson verkkosivut (luentomateriaali, harjoitukset, harjoitustyöohjeistus)
Opetusmenetelmät
Opintojakso sisältää harjoituksia eri aihealueilta sekä opintojakson aihepiirejä yhdistävän harjoitustyön.
Opiskelijan ajankäyttö ja kuormitus
Harjoitukset 60 h ja harjoitustyö 21 h. Yhteensä 81 h
Arviointikriteerit, tyydyttävä (1)
Hylätty 0: Opiskelija ei hallitse aihealuetta
Välttävä 1: Opiskelija tietää ja ymmärtää datan merkityksen ja sen tuomat edut. Opiskelija tietää datan esikäsittelyn merkityksen ja yleisimmät menetelmät. Opiskelija osaa soveltaa samaansa dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä.
Tyydyttävä 2: Opiskelija hallitsee datan hakemisen tietystä lähteestä. Opiskelija osaa toteuttaa datan esikäsittelyn datajoukoille. Opiskelija osaa soveltaa samaansa dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä. Opiskelija osaa arvioida omia ratkaisujaan datan esikäsittelyssä.
Arviointikriteerit, hyvä (3)
Hyvä 3: Opiskelija hallitsee datan hakemisen useammasta lähteestä. Opiskelija osaa suunnitella ja toteuttaa datan esikäsittelyn datajoukoille. Opiskelija osaa soveltaa datan esikäsittelyssä käytettyjä menetelmiä. Opiskelija osaa arvioida ja perustella omia ratkaisujaan datan esikäsittelyssä.
Kiitettävä 4: Opiskelija hallitsee datan hakemisen erilaisista lähteistä. Opiskelija osaa suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Opiskelija osaa soveltaa datan esikäsittelyssä käytettyjä menetelmiä laajasti. Opiskelija osaa arvioida ja perustella omia ratkaisujaan datan esikäsittelyssä.
Arviointikriteerit, kiitettävä (5)
Erinomainen 5: Opiskelija hallitsee datan hakemisen erilaisista lähteistä. Opiskelija osaa suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Opiskelija osaa soveltaa datan esikäsittelyssä käytettyjä menetelmiä erittäin laajasti. Opiskelija osaa kriittisesti arvioida ja perustella omia ratkaisujaan datan esikäsittelyssä.
Esitietovaatimukset
Tietotekniikan peruskäyttö taidot, ohjelmoinnin perusosaaminen ja Python-ohjelmointikielen tunteminen ja osaaminen.