Siirry suoraan sisältöön

Datan esikäsittely (4 op)

Toteutuksen tunnus: TTC8030-3011

Toteutuksen perustiedot


Ilmoittautumisaika
18.11.2024 - 09.01.2025
Ilmoittautuminen toteutukselle on päättynyt.
Ajoitus
20.01.2025 - 16.02.2025
Toteutus on päättynyt.
Opintopistemäärä
4 op
Lähiosuus
0 op
Virtuaaliosuus
4 op
Toteutustapa
Verkko-opetus
Yksikkö
Teknologiayksikkö
Opetuskielet
englanti
Paikat
0 - 35
Koulutus
Tieto- ja viestintätekniikka (AMK)
Bachelor's Degree Programme in Information and Communications Technology
Opettajat
Antti Häkkinen
Ryhmät
TTV22S5
Tieto- ja viestintätekniikka (AMK)
TTV22S2
Tieto- ja viestintätekniikka (AMK)
TTV22S3
Tieto- ja viestintätekniikka (AMK)
TIC22S1
Bachelor's Degree Programme in Information and Communications Technology
TTV22S1
Tieto- ja viestintätekniikka (AMK)
TTV22SM
Tieto- ja viestintätekniikka (AMK)
TTV22S4
Tieto- ja viestintätekniikka (AMK)
TTV22SM2
Tieto- ja viestintätekniikka (AMK)
ZJA25KTIDA1
Avoin amk, Data-analytiikka 1, Verkko
Opintojakso
TTC8030

Toteutuksella on 1 opetustapahtumaa joiden yhteenlaskettu kesto on 1 t 0 min.

Aika Aihe Tila
To 23.01.2025 klo 16:30 - 17:30
(1 t 0 min)
Data Preprocessing [Opening lecture]
Muutokset varauksiin voivat olla mahdollisia.

Arviointiasteikko

0-5

Tavoitteet

Opintojakson jälkeen ymmärrät data-analytiikka prosessin ja sen tuomat haasteet. Osaat tunnistaa erilaiset dataformaatit, yleisimmät rajapintaratkaisut ja datan esikäsittelyssä käytetyt työkalut ja menetelmät. Lisäksi osaat soveltaa datan esikäsittelyssä tarvittavia menetelmiä.

EUR-ACE-osaamiset:
Tieto ja ymmärrys
Tekniikan soveltaminen käytäntöön

Sisältö

o Erilaiset datalähteet ja -formaatit, JSON, APIt, SQL:stä taulujen haku jne
o Muuttujatyypit
o Datan esikäsittely ennen analysointiohjelmaan tuomista
o Datan esikäsittely Pandasissa (Pandasin/DataFramen perusteet)
o Eri datalähteiden yhdistäminen

Aika ja paikka

Opintojakso toteutetaan verkkototeutuksena (ei kontaktiopetusta). Opiskelija voi edetä toteutuksella omaan tahtiin.

Oppimateriaalit

Opintojakson verkkosivut (luentomateriaali, harjoitukset, muu ohjeistus).

Opetusmenetelmät

Opintojakso sisältää harjoitustehtäviä opintojakson eri aihealueilta.

Opiskelijan ajankäyttö ja kuormitus

Ympäristön valmistelut, harjoitukset ja materiaaliin tutustuminen 108 h. Yhteensä 108 h

Arviointikriteerit, tyydyttävä (1)

Tyydyttävä 2: Hallitset datan hakemisen valitusta lähteestä. Osaat toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä. Osaat arvioida omia ratkaisujasi datan esikäsittelyssä.

Välttävä 1: Tiedät ja ymmärrät datan merkityksen ja sen tuomat edut. Tiedät datan esikäsittelyn merkityksen ja yleisimmät menetelmät. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä.

Arviointikriteerit, hyvä (3)

Kiitettävä 4: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä laajasti. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Hyvä 3: Hallitset datan hakemisen useammasta lähteestä. Osaat suunnitella ja toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Arviointikriteerit, kiitettävä (5)

Erinomainen 5: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä erittäin laajasti. Osaat kriittisesti arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Esitietovaatimukset

Tietotekniikan peruskäyttätaidot, ohjelmoinnin perusosaaminen, Python-ohjelmointikielen tunteminen ja osaaminen.

Siirry alkuun