Skip to main content

Datan esikäsittely (4 op)

Toteutuksen tunnus: TTC8030-3010

Toteutuksen perustiedot


Ilmoittautumisaika

01.08.2024 - 22.08.2024

Ajoitus

02.09.2024 - 06.10.2024

Opintopistemäärä

4 op

Virtuaaliosuus

4 op

Toteutustapa

Verkko-opetus

Yksikkö

Teknologiayksikkö

Opetuskielet

  • Suomi

Paikat

0 - 35

Koulutus

  • Tieto- ja viestintätekniikka (AMK)

Opettaja

  • Antti Häkkinen

Ryhmät

  • TTV22S5
    Tieto- ja viestintätekniikka (AMK)
  • TTV22S2
    Tieto- ja viestintätekniikka (AMK)
  • TTV22S3
    Tieto- ja viestintätekniikka (AMK)
  • TTV22S1
    Tieto- ja viestintätekniikka (AMK)
  • TTV22SM
    Tieto- ja viestintätekniikka (AMK)
  • TTV22S4
    Tieto- ja viestintätekniikka (AMK)
  • TTV22SM2
    Tieto- ja viestintätekniikka (AMK)
  • ZJA24STIDA1
    Avoin amk, Data-analytiikka 1, Verkko

Objectives

Opintojakson jälkeen ymmärrät data-analytiikka prosessin ja sen tuomat haasteet. Osaat tunnistaa erilaiset dataformaatit, yleisimmät rajapintaratkaisut ja datan esikäsittelyssä käytetyt työkalut ja menetelmät. Lisäksi osaat soveltaa datan esikäsittelyssä tarvittavia menetelmiä.

EUR-ACE-osaamiset:
Tieto ja ymmärrys
Tekniikan soveltaminen käytäntöön

Content

o Erilaiset datalähteet ja -formaatit, JSON, APIt, SQL:stä taulujen haku jne
o Muuttujatyypit
o Datan esikäsittely ennen analysointiohjelmaan tuomista
o Datan esikäsittely Pandasissa (Pandasin/DataFramen perusteet)
o Eri datalähteiden yhdistäminen

Time and location

Opintojakso toteutetaan verkkototeutuksena (ei kontaktiopetusta). Opiskelija voi edetä toteutuksella omaan tahtiin.

Learning materials and recommended literature

Opintojakson verkkosivut (luentomateriaali, harjoitukset, muu ohjeistus).

Teaching methods

Opintojakso sisältää harjoitustehtäviä opintojakson eri aihealueilta.

Student workload

Ympäristön valmistelut, harjoitukset ja materiaaliin tutustuminen 108 h. Yhteensä 108 h

Evaluation scale

0-5

Evaluation criteria, satisfactory (1-2)

Tyydyttävä 2: Hallitset datan hakemisen valitusta lähteestä. Osaat toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä. Osaat arvioida omia ratkaisujasi datan esikäsittelyssä.

Välttävä 1: Tiedät ja ymmärrät datan merkityksen ja sen tuomat edut. Tiedät datan esikäsittelyn merkityksen ja yleisimmät menetelmät. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä.

Evaluation criteria, good (3-4)

Kiitettävä 4: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä laajasti. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Hyvä 3: Hallitset datan hakemisen useammasta lähteestä. Osaat suunnitella ja toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Evaluation criteria, excellent (5)

Erinomainen 5: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä erittäin laajasti. Osaat kriittisesti arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Prerequisites

Tietotekniikan peruskäyttätaidot, ohjelmoinnin perusosaaminen, Python-ohjelmointikielen tunteminen ja osaaminen.