data/01

Data

Introductie tot data

Wat       data?

IS

Wat begrijp je onder

data

NIET:
Dappere Avonturen en Triviale Anekdotes

OOK NIET:

meervoud van data

question Created with Sketch.

data

Data zijn feitelijke informatie of ruwe feiten die worden verzameld, opgeslagen en geïnterpreteerd. Het kan bestaan uit cijfers, woorden, geluiden, afbeeldingen of andere vormen. Data op zichzelf heeft geen betekenis; de betekenis ontstaat pas wanneer de data worden geanalyseerd en geïnterpreteerd. Data vormen de basis voor informatie en kennis, en spelen een cruciale rol in besluitvormingsprocessen en het begrijpen van de wereld om ons heen. Het proces van het omzetten van ruwe data in bruikbare informatie wordt data-analyse genoemd.

voorbeelden

Numerieke Data:

  • 10 (getal)
  • 3.14 (decimaal getal)
  • 2023 (jaartal)

voorbeelden

Tekstuele Data:

  • "Hallo, wereld!" (zin)
  • "GPT-3.5" (alfanumerieke tekenreeks)

voorbeelden

Geluidsdata:

  • Audiobestand van een lied
  • Opname van spraak

voorbeelden

Visuele Data:

  • Afbeelding van een landschap
  • Grafiek met verkoopcijfers

voorbeelden

Tijdgebonden Data:

  • Tijdstip van een gebeurtenis (bijv. 14:30 uur)
  • Datum van een afspraak

voorbeelden

Geografische Data:

  • GPS-coördinaten van een locatie
  • Kaart met markeringspunten

voorbeelden

Binaire Data:

  • 01001001 (binair getal)
  • Machinecode in binaire vorm

voorbeelden

Categorische Data:

  • Kleuren (bijv. rood, blauw, groen)
  • Productcategorieën (bijv. elektronica, kleding)

voorbeelden

Sensordata:

  • Temperatuurmetingen
  • Bewegingssensorgegevens

voorbeelden

Sociale Media Data:

  • Tweets op Twitter X
  • Foto's op Instagram

of complexer...

Genomische Data:

  • DNA-sequenties
  • Genexpressieprofielen

Financiële Data:

  • Hoogfrequente handelsgegevens
  • Derivatenprijzen en -transacties

of complexer...

Medische Beeldvorming:

  • MRI-scans
  • CT-beelden

Klimaatmodellering:

  • Klimaatmodellen met diverse parameters
  • Atmosferische gegevens over een lange periode

of complexer...

Linguïstische Data:

  • Corpus van teksten voor natuurlijke taalverwerking
  • Semantische analyse van grote tekstcorpora

Machine Learning Training Data:

  • Enorme datasets voor beeldherkenning
  • Uitgebreide datasets voor natuurlijke taalverwerking

 

of complexer...

Simulatiegegevens:

  • Data van simulaties in de luchtvaartindustrie
  • Moleculaire dynamica-simulaties in de chemie

Ruimtelijke Data:

  • GIS-data (Geografisch Informatiesysteem) met verschillende lagen zoals bodemsoorten, landgebruik, enz.
  • 3D-kaarten van steden met details over gebouwen en infrastructuur

of complexer...

Social Media Analytics:

  • Big data van sociale platforms met miljoenen gebruikersinteracties
  • Sentimentanalyse van enorme hoeveelheden tekstuele gegevens

Fysica-experimentgegevens:

  • LHC (Large Hadron Collider) gegevens van deeltjesfysica-experimenten
  • Astrofysica-waarnemingsgegevens van telescopen

Waar wordt data bewaard?

Data bewaren

Data kunnen op verschillende manieren worden bewaard, afhankelijk van de aard van de informatie en het doel van opslag

Meest voorkomende:

  • databases
  • bestandssystemen
  • harde schijven & servers, geheugenkaarten
  • cloud opslag (online server)
  • blockchain

Veel keuze

De keuze van de opslagmethode hangt af van factoren zoals de aard van de gegevens, de toegankelijkheidsvereisten, de beveiliging, en de schaalbaarheid.

In de praktijk worden vaak meerdere methoden gecombineerd om aan verschillende behoeften te voldoen.

Database

  • Een georganiseerde verzameling
    van informatie.
  • Gestructureerd en opgeslagen op een computer of server.
  • Databases maken gebruik van tabellen om gerelateerde gegevens weer te geven.
  • Gegevens efficiënt organiseren, beheren en doorzoeken.
  • Opslag en ophalen van gegevens in softwaretoepassingen.
  • Relationele databases zijn een veelvoorkomend type, waarin gegevens in tabellen met onderlinge relaties worden georganiseerd.
  • SQL (Structured Query Language) wordt vaak gebruikt voor het beheren en bevragen van gegevens in databases.

Databaseschema

Bestandssystemen

Een bestandssysteem is een door het besturingssysteem verzorgde, softwarematige indeling van een opslagmedium (zoals een harde schijf). Het besturingssysteem (bijvoorbeeld van de computer of smartphone) gebruikt deze indeling om toegang tot een opslagmedium te verzorgen voor applicaties en voor zijn eigen gebruik, zodat data in de vorm van bestanden op het opslagmedium weggeschreven kan worden en ook weer teruggelezen.

Bestandssystemen

Opslag op schijven / kaartjes

Harde schijf

  • Magneettechnologie: Harde schijven slaan gegevens op door magnetische deeltjes op een draaiende schijf te oriënteren.
  • Lees- en schrijfkoppen: Kleine componenten bewegen over de schijf om gegevens te lezen of te schrijven.
  • Binair systeem: Gegevens worden omgezet in binaire code (0 en 1) en opgeslagen als magnetische patronen.
  • Bestandsysteem: Harde schijven zijn georganiseerd in sectoren en clusters met een bestandsysteem voor logische toegang tot gegevens.
  • Opdeling in partities: Schijven kunnen worden verdeeld in afzonderlijke secties voor georganiseerd beheer van gegevens.

Schema met harde schijf

Cloudopslag

  • Online Opslag: "opslaan van gegevens op externe servers via internet."
  • Toegankelijk en schaalbaar: overal toegankelijk en uitbreidbaar"
  • Gedeelde Bronnen: Servers worden gedeeld met anderen
  • Veiligheid: Gegevens zijn vaak versleuteld
  • Services: Backups, samenwerken ....
  • Populaire Providers: Voorbeelden zijn AWS, Google Cloud, Microsoft Azure, Dropbox, en iCloud.
  • Diverse Toepassingen: Gebruikt voor het opslaan van bestanden, het hosten van websites, het uitvoeren van applicaties, en meer.

Cloud Storage services

Cloud Storage services

  • Dropbox: 2GB
  • Google Drive: 15GB
  • OneDrive: 5GB
  • Amazon Loud Drive: 5GB
  • Mega: 50GB
  • Mediafire: 10GB
  • Baidu: 2TB
  • Box: 10GB
  • Yandex: 10GB
  • 4shared: 15GB
  • Mail.com: 2GB
  • Hidrive: 5GB
  • Pcloud: 10GB

Blockchain

Blockchain

  • Gedecentraliseerd: Gegevens worden opgeslagen op meerdere computers in een netwerk in plaats van op één centrale locatie.
  • Blokketens: Informatie wordt vastgelegd in "blokken" die aan elkaar worden geketend, waardoor een onveranderlijke reeks ontstaat.
  • Consensusmechanisme: Een overeenstemming tussen deelnemers in het netwerk wordt gebruikt om de geldigheid van transacties te waarborgen.

auteur

DigExp - DATA/01 - Data Introductie

By Lecturer GDM

DigExp - DATA/01 - Data Introductie

Introductie over data Auteur: Frederick Roegiers

  • 293