Data Quality

Preparation:

Exercise 1: Par-øvelse

  • Observer følgende dataset

    • http://www.sufoi.dk/obs/obs-2019/obs19-k1.php

  • Besvar:

    • Hvad er indholdet i datasettet?

    • Hvilke kvalitetskriterier overskrider datasettet?

    • Beskriv observationer og hvordan kvalitetskriterier overskrides

  • Udforsk:

    • Hvordan er dataen indsamlet?

    • Hvem kan lave indberetninger?

    • Er der en sammenhæng mellem indsamling og kvalitet?

  • Reflekter:

    • Hvordan kan datakvaliteten hæves?

Exercise 2: Par-øvelse

  • Opret en database og remove SAFE UPDATE

  • Data Exploration:

    • Hvordan ser datasettet ud? Hvad beskriver det?

    • Identificer kolonner med NULL værdier?

    • Hvilke kolonner har problemer med fejlværdier (ifht. deres skala / "umulige" værdier - fx. en tidslængde mindre end 0)

  • Data Exploration & Data Cleaning

    • Ret 3 NULL fejl i datasettet vha. UPDATE

    • Beskriv:

      • Hvordan fandt i fejlen?

      • Hvordan rettede i fejlen?

      • Hvordan perspektiverer det sig til jeres viden omkring data quality

  • Data Exploration & Data Cleaning

    • Ret 3 umulige værdier () i datasettet vha. UPDATE

    • Beskriv:

      • Hvordan fandt i fejlen?

      • Hvordan rettede i fejlen?

      • Hvordan perspektiverer det sig til jeres viden omkring data quality

Last updated