Siirry suoraan sisältöön

Datan esikäsittelyLaajuus (4 op)

Tunnus: TTC8030

Laajuus

4 op

Opetuskieli

  • suomi

Vastuuhenkilö

  • Antti Häkkinen

Osaamistavoitteet

Opintojakson jälkeen ymmärrät data-analytiikka prosessin ja sen tuomat haasteet. Osaat tunnistaa erilaiset dataformaatit, yleisimmät rajapintaratkaisut ja datan esikäsittelyssä käytetyt työkalut ja menetelmät. Lisäksi osaat soveltaa datan esikäsittelyssä tarvittavia menetelmiä.

EUR-ACE-osaamiset:
Tieto ja ymmärrys
Tekniikan soveltaminen käytäntöön

Sisältö

o Erilaiset datalähteet ja -formaatit, JSON, APIt, SQL:stä taulujen haku jne
o Muuttujatyypit
o Datan esikäsittely ennen analysointiohjelmaan tuomista
o Datan esikäsittely Pandasissa (Pandasin/DataFramen perusteet)
o Eri datalähteiden yhdistäminen

Esitietovaatimukset

Tietotekniikan peruskäyttätaidot, ohjelmoinnin perusosaaminen, Python-ohjelmointikielen tunteminen ja osaaminen.

Arviointikriteerit, tyydyttävä (1)

Tyydyttävä 2: Hallitset datan hakemisen valitusta lähteestä. Osaat toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä. Osaat arvioida omia ratkaisujasi datan esikäsittelyssä.

Välttävä 1: Tiedät ja ymmärrät datan merkityksen ja sen tuomat edut. Tiedät datan esikäsittelyn merkityksen ja yleisimmät menetelmät. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä.

Arviointikriteerit, hyvä (3)

Kiitettävä 4: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä laajasti. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Hyvä 3: Hallitset datan hakemisen useammasta lähteestä. Osaat suunnitella ja toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Arviointikriteerit, kiitettävä (5)

Erinomainen 5: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä erittäin laajasti. Osaat kriittisesti arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Enrollment

18.11.2024 - 09.01.2025

Timing

20.01.2025 - 16.02.2025

Number of ECTS credits allocated

4 op

Virtual portion

4 op

Mode of delivery

Online learning

Unit

School of Technology

Teaching languages
  • English
Seats

0 - 35

Degree programmes
  • Bachelor's Degree Programme in Information and Communications Technology
  • Bachelor's Degree Programme in Information and Communications Technology
Teachers
  • Antti Häkkinen
Groups
  • TTV22S5
    Tieto- ja viestintätekniikka (AMK)
  • TTV22S2
    Tieto- ja viestintätekniikka (AMK)
  • TTV22S3
    Tieto- ja viestintätekniikka (AMK)
  • TIC22S1
    Bachelor's Degree Programme in Information and Communications Technology
  • TTV22S1
    Tieto- ja viestintätekniikka (AMK)
  • TTV22SM
    Tieto- ja viestintätekniikka (AMK)
  • TTV22S4
    Tieto- ja viestintätekniikka (AMK)
  • TTV22SM2
    Tieto- ja viestintätekniikka (AMK)
  • ZJA25KTIDA1
    Avoin amk, Data-analytiikka 1, Verkko

Objective

After the course, you will understand the data analytics process and the challenges it brings. You can identify different data formats, the most common interface solutions and the tools and methods used in data preprocessing. In addition, you know how to apply the methods necessary for data preprocessing.

EUR-ACE Competences:
Knowledge and Understanding
Engineering Practice

Content

o Various data sources and data formats, JSON, APIt, retrieval of tables from SQL
o Types of variables
o Data preprocessing before bringing it into analysis program
o Data preprocessing in Pandas (basics of Pandas/DataFrames)
o Connecting various data sources

Location and time

The course is implemented online (no contact teaching). The student can proceed at his own pace during the course.

Oppimateriaali ja suositeltava kirjallisuus

Course website (lecture material, exercises, other instructions).

Teaching methods

The course includes assignments from different subject areas of the course.

Student workload

Environment preparations, exercises and familiarisation with the material 108 h. Total 108 h

Evaluation scale

0-5

Arviointikriteerit, tyydyttävä (1-2)

Satisfactory 2: The student masters data retrieval from a selected source. You are able to implement data preprocessing to datasets. You are able to apply simple methods used in data preprocessing to his/her data. You can assess your own solutions for data preprocessing.

Sufficient 1: You know and understand the significance of data and its advantages. You know the significance of data preprocessing and its most common methods. You are able to apply simple methods obtained and used in data preprocessing.

Arviointikriteerit, hyvä (3-4)

Very good 4: You master the retrieval of data from various sources. You are able to plan and implement data preprocessing for various datasets. You are able to apply the methods used in data preprocessing widely. You can assess and justify your own solutions for data preprocessing.

Good 3: You master data retrieval from several sources. You are able to plan and implement data preprocessign for datasets. You are able to apply methods used in data preprocessing. You can to assess and justify your own solutions for data preprocessing.

Assessment criteria, excellent (5)

Excellent 5: You master the retrieval of data from various sources. You are able to plan and implement data processing for various datasets. You are able to apply the methods used in data preprocessing. You can critically assess and justify your own solutions for data preprocessing.

Qualifications

Basic skills of computer use, basic skills in programming, knowledge of Python programming language.

Ilmoittautumisaika

01.08.2024 - 22.08.2024

Ajoitus

02.09.2024 - 06.10.2024

Opintopistemäärä

4 op

Virtuaaliosuus

4 op

Toteutustapa

Verkko-opetus

Yksikkö

Teknologiayksikkö

Opetuskielet
  • Suomi
Paikat

0 - 35

Koulutus
  • Tieto- ja viestintätekniikka (AMK)
Opettaja
  • Antti Häkkinen
Ryhmät
  • TTV22S5
    Tieto- ja viestintätekniikka (AMK)
  • TTV22S2
    Tieto- ja viestintätekniikka (AMK)
  • TTV22S3
    Tieto- ja viestintätekniikka (AMK)
  • TTV22S1
    Tieto- ja viestintätekniikka (AMK)
  • TTV22SM
    Tieto- ja viestintätekniikka (AMK)
  • TTV22S4
    Tieto- ja viestintätekniikka (AMK)
  • TTV22SM2
    Tieto- ja viestintätekniikka (AMK)
  • ZJA24STIDA1
    Avoin amk, Data-analytiikka 1, Verkko

Tavoitteet

Opintojakson jälkeen ymmärrät data-analytiikka prosessin ja sen tuomat haasteet. Osaat tunnistaa erilaiset dataformaatit, yleisimmät rajapintaratkaisut ja datan esikäsittelyssä käytetyt työkalut ja menetelmät. Lisäksi osaat soveltaa datan esikäsittelyssä tarvittavia menetelmiä.

EUR-ACE-osaamiset:
Tieto ja ymmärrys
Tekniikan soveltaminen käytäntöön

Sisältö

o Erilaiset datalähteet ja -formaatit, JSON, APIt, SQL:stä taulujen haku jne
o Muuttujatyypit
o Datan esikäsittely ennen analysointiohjelmaan tuomista
o Datan esikäsittely Pandasissa (Pandasin/DataFramen perusteet)
o Eri datalähteiden yhdistäminen

Aika ja paikka

Opintojakso toteutetaan verkkototeutuksena (ei kontaktiopetusta). Opiskelija voi edetä toteutuksella omaan tahtiin.

Oppimateriaali ja suositeltava kirjallisuus

Opintojakson verkkosivut (luentomateriaali, harjoitukset, muu ohjeistus).

Opetusmenetelmät

Opintojakso sisältää harjoitustehtäviä opintojakson eri aihealueilta.

Opiskelijan ajankäyttö ja kuormitus

Ympäristön valmistelut, harjoitukset ja materiaaliin tutustuminen 108 h. Yhteensä 108 h

Arviointiasteikko

0-5

Arviointikriteerit, tyydyttävä (1-2)

Tyydyttävä 2: Hallitset datan hakemisen valitusta lähteestä. Osaat toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä. Osaat arvioida omia ratkaisujasi datan esikäsittelyssä.

Välttävä 1: Tiedät ja ymmärrät datan merkityksen ja sen tuomat edut. Tiedät datan esikäsittelyn merkityksen ja yleisimmät menetelmät. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä.

Arviointikriteerit, hyvä (3-4)

Kiitettävä 4: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä laajasti. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Hyvä 3: Hallitset datan hakemisen useammasta lähteestä. Osaat suunnitella ja toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Arviointikriteerit, kiitettävä (5)

Erinomainen 5: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä erittäin laajasti. Osaat kriittisesti arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Esitietovaatimukset

Tietotekniikan peruskäyttätaidot, ohjelmoinnin perusosaaminen, Python-ohjelmointikielen tunteminen ja osaaminen.

Enrollment

20.11.2023 - 04.01.2024

Timing

15.01.2024 - 18.02.2024

Number of ECTS credits allocated

4 op

Virtual portion

4 op

Mode of delivery

Online learning

Unit

School of Technology

Teaching languages
  • English
Seats

0 - 30

Degree programmes
  • Bachelor's Degree Programme in Information and Communications Technology
  • Bachelor's Degree Programme in Information and Communications Technology
Teachers
  • Antti Häkkinen
Groups
  • TTV21S3
    Tieto- ja viestintätekniikka (AMK)
  • TTV21S5
    Tieto- ja viestintätekniikka (AMK)
  • TTV21SM
    Tieto- ja viestintätekniikka (AMK)
  • TIC21S1
    Bachelor's Degree Programme in Information and Communications Technology
  • TTV21S2
    Tieto- ja viestintätekniikka (AMK)
  • ZJA24KTIDA1
    Avoin amk, Data-analytiikka 1, Verkko
  • TTV21S1
    Tieto- ja viestintätekniikka (AMK)

Objective

After the course, you will understand the data analytics process and the challenges it brings. You can identify different data formats, the most common interface solutions and the tools and methods used in data preprocessing. In addition, you know how to apply the methods necessary for data preprocessing.

EUR-ACE Competences:
Knowledge and Understanding
Engineering Practice

Content

o Various data sources and data formats, JSON, APIt, retrieval of tables from SQL
o Types of variables
o Data preprocessing before bringing it into analysis program
o Data preprocessing in Pandas (basics of Pandas/DataFrames)
o Connecting various data sources

Location and time

The course is implemented online (no contact teaching). The student can proceed at his own pace during the course.

Oppimateriaali ja suositeltava kirjallisuus

Course website (lecture material, exercises, other instructions).

Teaching methods

The course includes assignments from different subject areas of the course.

Student workload

Environment preparations, exercises and familiarisation with the material 108 h. Total 108 h

Evaluation scale

0-5

Arviointikriteerit, tyydyttävä (1-2)

Satisfactory 2: The student masters data retrieval from a selected source. You are able to implement data preprocessing to datasets. You are able to apply simple methods used in data preprocessing to his/her data. You can assess your own solutions for data preprocessing.

Sufficient 1: You know and understand the significance of data and its advantages. You know the significance of data preprocessing and its most common methods. You are able to apply simple methods obtained and used in data preprocessing.

Arviointikriteerit, hyvä (3-4)

Very good 4: You master the retrieval of data from various sources. You are able to plan and implement data preprocessing for various datasets. You are able to apply the methods used in data preprocessing widely. You can assess and justify your own solutions for data preprocessing.

Good 3: You master data retrieval from several sources. You are able to plan and implement data preprocessign for datasets. You are able to apply methods used in data preprocessing. You can to assess and justify your own solutions for data preprocessing.

Assessment criteria, excellent (5)

Excellent 5: You master the retrieval of data from various sources. You are able to plan and implement data processing for various datasets. You are able to apply the methods used in data preprocessing. You can critically assess and justify your own solutions for data preprocessing.

Qualifications

Basic skills of computer use, basic skills in programming, knowledge of Python programming language.

Ilmoittautumisaika

01.08.2023 - 24.08.2023

Ajoitus

11.09.2023 - 15.10.2023

Opintopistemäärä

4 op

Virtuaaliosuus

4 op

Toteutustapa

Verkko-opetus

Yksikkö

Teknologiayksikkö

Opetuskielet
  • Suomi
Paikat

0 - 30

Koulutus
  • Tieto- ja viestintätekniikka (AMK)
Opettaja
  • Antti Häkkinen
Ryhmät
  • TTV21S3
    Tieto- ja viestintätekniikka (AMK)
  • TTV21S5
    Tieto- ja viestintätekniikka (AMK)
  • TTV21SM
    Tieto- ja viestintätekniikka (AMK)
  • TTV21S2
    Tieto- ja viestintätekniikka (AMK)
  • ZJA23STIDA1
    Avoin amk, Data-analytiikka 1, Verkko
  • TTV21S1
    Tieto- ja viestintätekniikka (AMK)

Tavoitteet

Opintojakson jälkeen ymmärrät data-analytiikka prosessin ja sen tuomat haasteet. Osaat tunnistaa erilaiset dataformaatit, yleisimmät rajapintaratkaisut ja datan esikäsittelyssä käytetyt työkalut ja menetelmät. Lisäksi osaat soveltaa datan esikäsittelyssä tarvittavia menetelmiä.

EUR-ACE-osaamiset:
Tieto ja ymmärrys
Tekniikan soveltaminen käytäntöön

Sisältö

o Erilaiset datalähteet ja -formaatit, JSON, APIt, SQL:stä taulujen haku jne
o Muuttujatyypit
o Datan esikäsittely ennen analysointiohjelmaan tuomista
o Datan esikäsittely Pandasissa (Pandasin/DataFramen perusteet)
o Eri datalähteiden yhdistäminen

Aika ja paikka

Opintojakso toteutetaan verkkototeutuksena (ei kontaktiopetusta). Opiskelija voi edetä toteutuksella omaan tahtiin.

Oppimateriaali ja suositeltava kirjallisuus

Opintojakson verkkosivut (luentomateriaali, harjoitukset, muu ohjeistus).

Opetusmenetelmät

Opintojakso sisältää harjoitustehtäviä opintojakson eri aihealueilta.

Opiskelijan ajankäyttö ja kuormitus

Ympäristön valmistelut, harjoitukset ja materiaaliin tutustuminen 108 h. Yhteensä 108 h

Arviointiasteikko

0-5

Arviointikriteerit, tyydyttävä (1-2)

Tyydyttävä 2: Hallitset datan hakemisen valitusta lähteestä. Osaat toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä. Osaat arvioida omia ratkaisujasi datan esikäsittelyssä.

Välttävä 1: Tiedät ja ymmärrät datan merkityksen ja sen tuomat edut. Tiedät datan esikäsittelyn merkityksen ja yleisimmät menetelmät. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä.

Arviointikriteerit, hyvä (3-4)

Kiitettävä 4: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä laajasti. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Hyvä 3: Hallitset datan hakemisen useammasta lähteestä. Osaat suunnitella ja toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Arviointikriteerit, kiitettävä (5)

Erinomainen 5: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä erittäin laajasti. Osaat kriittisesti arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Esitietovaatimukset

Tietotekniikan peruskäyttätaidot, ohjelmoinnin perusosaaminen, Python-ohjelmointikielen tunteminen ja osaaminen.

Ajoitus

13.02.2023 - 26.03.2023

Opintopistemäärä

4 op

Toteutustapa

Lähiopetus

Yksikkö

Teknologiayksikkö

Opetuskielet
  • Suomi
Koulutus
  • Tieto- ja viestintätekniikka (AMK)
Opettaja
  • Antti Häkkinen
Ryhmät
  • ZJA23KTIDA1
    Avoin amk, Data-analytiikka 1, Verkko

Tavoitteet

Opintojakson jälkeen ymmärrät data-analytiikka prosessin ja sen tuomat haasteet. Osaat tunnistaa erilaiset dataformaatit, yleisimmät rajapintaratkaisut ja datan esikäsittelyssä käytetyt työkalut ja menetelmät. Lisäksi osaat soveltaa datan esikäsittelyssä tarvittavia menetelmiä.

EUR-ACE-osaamiset:
Tieto ja ymmärrys
Tekniikan soveltaminen käytäntöön

Sisältö

o Erilaiset datalähteet ja -formaatit, JSON, APIt, SQL:stä taulujen haku jne
o Muuttujatyypit
o Datan esikäsittely ennen analysointiohjelmaan tuomista
o Datan esikäsittely Pandasissa (Pandasin/DataFramen perusteet)
o Eri datalähteiden yhdistäminen

Aika ja paikka

Opintojakso toteutetaan verkkototeutuksena (ei kontaktiopetusta). Opiskelija voi edetä toteutuksella omaan tahtiin.

Oppimateriaali ja suositeltava kirjallisuus

Opintojakson verkkosivut (luentomateriaali, harjoitukset, harjoitustyöohjeistus).

Opetusmenetelmät

Opintojakso sisältää harjoituksia eri aihealueilta sekä opintojakson aihepiirejä yhdistävän harjoitustyön.

Opiskelijan ajankäyttö ja kuormitus

Harjoitukset 80 h ja harjoitustyö 28 h. Yhteensä 108 h

Arviointiasteikko

0-5

Arviointikriteerit, tyydyttävä (1-2)

Tyydyttävä 2: Hallitset datan hakemisen valitusta lähteestä. Osaat toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä. Osaat arvioida omia ratkaisujasi datan esikäsittelyssä.

Välttävä 1: Tiedät ja ymmärrät datan merkityksen ja sen tuomat edut. Tiedät datan esikäsittelyn merkityksen ja yleisimmät menetelmät. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä.

Arviointikriteerit, hyvä (3-4)

Kiitettävä 4: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä laajasti. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Hyvä 3: Hallitset datan hakemisen useammasta lähteestä. Osaat suunnitella ja toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Arviointikriteerit, kiitettävä (5)

Erinomainen 5: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä erittäin laajasti. Osaat kriittisesti arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Esitietovaatimukset

Tietotekniikan peruskäyttätaidot, ohjelmoinnin perusosaaminen, Python-ohjelmointikielen tunteminen ja osaaminen.

Ilmoittautumisaika

01.11.2022 - 05.01.2023

Ajoitus

13.02.2023 - 26.03.2023

Opintopistemäärä

4 op

Virtuaaliosuus

4 op

Toteutustapa

Verkko-opetus

Yksikkö

Teknologiayksikkö

Toimipiste

Lutakon kampus

Opetuskielet
  • Suomi
Paikat

0 - 30

Koulutus
  • Tieto- ja viestintätekniikka (AMK)
Opettaja
  • Antti Häkkinen

Tavoitteet

Opintojakson jälkeen ymmärrät data-analytiikka prosessin ja sen tuomat haasteet. Osaat tunnistaa erilaiset dataformaatit, yleisimmät rajapintaratkaisut ja datan esikäsittelyssä käytetyt työkalut ja menetelmät. Lisäksi osaat soveltaa datan esikäsittelyssä tarvittavia menetelmiä.

EUR-ACE-osaamiset:
Tieto ja ymmärrys
Tekniikan soveltaminen käytäntöön

Sisältö

o Erilaiset datalähteet ja -formaatit, JSON, APIt, SQL:stä taulujen haku jne
o Muuttujatyypit
o Datan esikäsittely ennen analysointiohjelmaan tuomista
o Datan esikäsittely Pandasissa (Pandasin/DataFramen perusteet)
o Eri datalähteiden yhdistäminen

Aika ja paikka

Opintojakso toteutetaan verkkototeutuksena (ei kontaktiopetusta). Opiskelija voi edetä toteutuksella omaan tahtiin.

Oppimateriaali ja suositeltava kirjallisuus

Opintojakson verkkosivut (luentomateriaali, harjoitukset, harjoitustyöohjeistus).

Opetusmenetelmät

Opintojakso sisältää harjoituksia eri aihealueilta sekä opintojakson aihepiirejä yhdistävän harjoitustyön.

Opiskelijan ajankäyttö ja kuormitus

Harjoitukset 80 h ja harjoitustyö 28 h. Yhteensä 108 h

Arviointiasteikko

0-5

Arviointikriteerit, tyydyttävä (1-2)

Tyydyttävä 2: Hallitset datan hakemisen valitusta lähteestä. Osaat toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä. Osaat arvioida omia ratkaisujasi datan esikäsittelyssä.

Välttävä 1: Tiedät ja ymmärrät datan merkityksen ja sen tuomat edut. Tiedät datan esikäsittelyn merkityksen ja yleisimmät menetelmät. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä.

Arviointikriteerit, hyvä (3-4)

Kiitettävä 4: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä laajasti. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Hyvä 3: Hallitset datan hakemisen useammasta lähteestä. Osaat suunnitella ja toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Arviointikriteerit, kiitettävä (5)

Erinomainen 5: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä erittäin laajasti. Osaat kriittisesti arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.

Esitietovaatimukset

Tietotekniikan peruskäyttätaidot, ohjelmoinnin perusosaaminen, Python-ohjelmointikielen tunteminen ja osaaminen.