

AI Fundamentals
Artificial Intelligence




Terminator 2:
Judgment Day (1991)
Directed by James Cameron


2001: A Space Odyssey (1968)
Directed by Stanley Kubrick


Star Wars: Episode V - The Empire Strikes Back (1980)
Directed by George Lucas

Blade Runner (1982)
Directed by Ridley Scott


Her (2013)
Directed by Spike Jones



Ex Machina (2014)
Directed by Alex Garland

Dus, wat is Artificial Intelligence?
"Computersystemen die leren, beslissingen nemen en deze zelfstandig uitvoeren"

De oorspronkelijke visie
- Computersystemen bouwen die menselijke intelligentie nabootsen om taken over te nemen die gevaarlijk, saai of vuil zijn.
- Als we menselijke intelligentie willen nabootsen, moet AI instaan voor:
- Verwerking (Processing)
- Begrip (Understanding)
- Redeneren (Reasoning)
- Actie ondernemen (Taking Action)

AI bouwstenen
Om door cycli te gaan, heeft een AI-systeem drie grote bouwstenen nodig:
- Algoritmes
- Data
- Hardware
Instructie gebaseerd
-
Programmeeropdrachten zijn vrij moeilijk voor een mens.
-
Programmeren regel voor regel, als situatie A zich voordoet, moet het systeem actie B ondernemen.
-
Dit kost veel tijd om te schrijven.
-
Zeer transparant.

Instruction Based

Machine Learning
- Computers leren van data en passen zich aan door ervaring, zonder dat een programmeur de regels definieert.
- Kunnen reageren op voorheen onbekende situaties.
- Niet transparant.
- Het meeste van wat we vandaag de dag als AI beschouwen, is ML (Machine Learning).



Maar...
Soms loopt het fout


Husky vs Wolf



Huidkanker


Dong Mingzhu


AI Systemen
Er zijn verschillende manieren om AI-systemen te classificeren. De meest voorkomende onderverdeling is:

Alan Turing



The Turing Test
[16:11:25] Judge: what music do you like?
[16:11:32] Eugene: I like Eminem – because he doesn't have a thing to do with "polite correctness".
[16:11:46] Judge: OMG i love eminem, he's my favourite artist!
[16:12:00] Eugene: I wonder what Eminem's nick mean. I associate it only with a word "enema". But he is a cool guy, I like his The Real Slim Shady.
[16:12:55] Judge: i know what his nickname means, his real name is Marshall Mathers. From the initials M&M phynetically sounding like Eminem.
[16:13:06] Eugene: Eminem is a famous crapper. No, raper… ripper… Yeah, I mean – rapper. I like his Stan and The Real Slim Shady.

Human-Centered AI
Mensen zijn van nature lui, en die luiheid is een drijvende kracht voor innovatie. We moeten ons bewust zijn dat:
- AI een computersysteem is
- AI geen religie is
- AI als een derde arm of een tweede brein moet worden gezien
- We meer transparantie van AI-systemen mogen verwachten

Human in the loop

Thema's
- Algoritmes
- Data
- Hardware
- Geautomatiseerde beslissingen
- Ethical AI
- Intelligentie
AI Fundamentals
Algoritmes

AI Fundamentals
Data

Self Driving Car Emotions

Dus, wat is een algoritme?
"Een algoritme is een reeks instructies voor het oplossen van een probleem of het volbrengen van een taak"

Algoritme met regels


Zelflerende algoritmes
Soms wordt het aantal regels extreem lang en complex, of is het simpelweg onmogelijk om via regels op te lossen.
- Leren praten
- Een kat herkennen op een foto
We gebruiken AI om onze hersenen na te bootsen, automatische verbindingen te maken tussen invoer en uitvoer, gebruikmakend van voorbeelden.

Hoe?
Probeer het getal in te vullen waar nu een vraagteken staat.
INPUT 1 | INPUT 2 | INPUT 3 | OUTPUT |
---|---|---|---|
2 | 4 | 5 | 3 |
5 | 2 | 8 | 2 |
2 | 2 | 1 | 3 |
3 | 3 | 5 | ? |

Hoe?
We herkennen een patroon en kunnen zeggen dat:
output = (input 1 x input 2) - input 3
INPUT 1 | INPUT 2 | INPUT 3 | OUTPUT |
---|---|---|---|
2 | 4 | 5 | 3 |
5 | 2 | 8 | 2 |
2 | 2 | 1 | 3 |
3 | 3 | 5 | 4 |

Hoe?
-
Input 1, 2 en 3 zijn de attributen.
-
Meer complexe algoritmen vereisen meer attributen.
-
Een variabele geeft gewicht aan een attribuut.
Vergeleken met een recept, zijn de attributen de ingrediënten, en de variabelen zijn de gewichten die bepalen hoeveel we van elk ingrediënt nodig hebben.

Patronen

Neurale netwerken
- Neurale netwerken zijn geïnspireerd door onze hersenen en vormen een veelgebruikte categorie van AI-algoritmen.
- Geïnspireerd door neuronen.
- Complex adaptief systeem dat de interne structuur kan veranderen door data.

Neural Networks


Deep Neural Networks


Edge

Colors

Legs

Training


Edge

Colors

Legs

Goat
Prediction

Training


Edge

Colors

Legs
Moose
Wrong Prediction


Training

0.1
0.9
0.9

Training

0.5
0.7
0.9

Neural Networks
Lijkt abstract, maar:
- YouTube gebruikt 30 lagen om nieuwe video's aan te bevelen die je misschien leuk vindt.
- Facebook gebruikt er een in DeepFace, dat 9 lagen diep is en meer dan 120 miljoen invoerattributen verwerkt en is getraind op vier miljoen afbeeldingen geüpload door Facebook-gebruikers:
- 97% betrouwbaarheid.
- Automatisch taggen van gezichten.

Model
-
Wanneer je een algoritme traint met een verzameling gegevens, krijg je een zogenaamd 'model'.
-
Hetzelfde algoritme met andere data resulteert in een ander model.
Metafoor: als we dit vergelijken met het bakken van een taart, is het recept het algoritme en zijn de ingrediënten de gegevens. Verschillende ingrediënten, ander recept... ander model.

Trainen van een model
- Kan ons model goede voorspellingen maken?
- Eerst bevinden we ons in de trainingsfase, het systeem zoekt naar het best mogelijke verbindingspatroon tussen de invoer en de uitvoer.
- Bij elke iteratie worden de voorspellingen vergeleken met de gewenste, kleine aanpassingen worden gemaakt aan de gewichten.
- Training stopt wanneer het systeem aangeeft dat de gewenste nauwkeurigheid is bereikt.

Trainen van een model
2. We testen het model om voorspellingen te doen met gegevens waarvan we het resultaat kennen, maar het model niet.
Als het model de test doorstaat, is het klaar voor gebruik. We noemen dit de operationele fase.
Zo niet, dan moeten we het herzien.

Trainen van een model
- Als onze gegevens 97% nauwkeurig zijn in de trainingsfase, maar 50% bij niet eerder geziene gegevens, noemen we dit overfitting.
- Als onze gegevens 50% nauwkeurig zijn in de trainingsfase, maar 97% bij niet eerder geziene gegevens, noemen we dit underfitting. (Zoals een student die een antwoord raadt bij een multiple choice vraag).

Neuralink Monkey

Neuralink Tests

Machine Learning
Er zijn drie belangrijke leertechnieken voor algoritmen, die in combinatie met elkaar worden gebruikt:
- Supervised learning
- Unsupervised learning
- Reinforcement learning

Supervised Learning
- Getraind op een gelabelde dataset, weet het algoritme wat de correcte uitvoer is.
- Probeert te generaliseren naar nieuwe voorbeelden die het nog nooit eerder heeft gezien door:
- Classificatie, bijv. spam of geen spam
- Regressie, de uitvoer is een continue waarde, bijv. prijs
- Nauwkeuriger dan onbegeleid leren, maar veel meer werk.

Wie labelt data?






Unsupervised learning
Er zijn geen labels, het algoritme moet verborgen patronen in gegevens ontdekken zonder de noodzaak van menselijk ingrijpen.
- Clustering groepeert vergelijkbare ervaringen samen. Bijv. gelijkenissen van klanten, zoals iemand die veel geld uitgeeft of een etalagekijker.
- Associatie zoekt naar relaties tussen variabelen. Bijv. een klant die dit item kocht, kocht ook...
Geen menselijk ingrijpen, ze vinden patronen en kunnen gegevens clusteren (geen voorspellingen!)

Unsupervised learning


Reinforcement Learning
We kennen het gewenste einddoel van een probleem, maar we weten niet hoe we daar het beste kunnen komen. Denk aan het leren fietsen:
- We worden beloond als we blijven fietsen
- Als we vallen, worden we gestraft
- Het algoritme weegt elke nieuwe actie af tegen voorkennis
- Het systeem heeft geen voorbeelden, maar leert door te doen.
AlphaGo werd getraind met behulp van deze techniek.

Zelfrijdende auto's

Robots leren lopen

Adversarial Learning
- Generative Adversarial Networks (GAN's) is een combinatie van begeleid leren en versterkend leren.
Er zijn twee neurale netwerken:- De discriminator: dit is een netwerk met een grote dataset... laten we zeggen van katten
- De generator: deze zal zijn eigen uitvoer maken, bijvoorbeeld het creëren van afbeeldingen die eruitzien als katten (met als doel de discriminator te misleiden)

Adversarial Learning
- Eerst liegt de generator tegen de discriminator door willekeurige ruis.
- Op basis van het voorspellingspercentage van de discriminator zal de generator proberen een beter voorstel te creëren.
- De generator zal zulke goede afbeeldingen creëren dat ze nauwelijks te onderscheiden zijn van de originelen.

Reality check...


Self-Driving Car Crash
De weg hacken is vrij eenvoudig



Elaine Herzberg

Self-Driving Car Crash
De analyse toonde aan dat de Uber Herzberg had gezien, maar haar classificatie meerdere keren had gewijzigd tussen voertuig en fietser. Het systeem kon haar pad niet voorspellen.
Laten we voorzichtig zijn met kritiek, er zijn veel mensen die constant fouten maken. We kunnen AI samen gebruiken om veilig te zijn, maar toch zijn zelfrijdende auto's niet zo gespecialiseerd als AlphaGo.

Sensors
Het gebruik van meerdere bronnen zoals camera's, thermische camera's, radars,... om grip te krijgen op onze omgeving moet gegevens onmiddellijk in real-time samenvoegen. Dit wordt sensorfusie genoemd.



Algorithmic Bias



Weapons Of Math Destruction, Cathy O'Neil

Algorithmic Bias

Joy Buolamwini

Demo
Probeer een afbeelding te maken met leonardo.ai. Gebruik de volgende prompts:
- Maak een afbeelding van een grootmoeder
- Maak een afbeelding van een ingenieur
- Maak een afbeelding van een verpleegkundige
- Maak een afbeelding van een baas/CEO

Value Added Model

Move 78

AI Fundamentals
Data


Introduction Data

Vijf dimensies
In de afgelopen tien jaar hebben we een toename gezien in vijf dimensies van gegevens:
- Volume of de hoeveelheid gegevens
- Variëteit of de verschillende soorten gegevens
- Snelheid of de snelheid waarmee de gegevens beschikbaar zijn
- Waarde van de gegevens
- Waarheidsgetrouwheid of de kwaliteit van de gegevens

Variëteit
Gestructureerde gegevens kunnen worden opgeslagen in een database of tabel. Ze zijn gestructureerd in kolommen en rijen, vergelijkbaar met de manier waarop spreadsheetsoftware zoals Excel gegevens classificeert.


Variëteit
Ongestructureerde gegevens kunnen niet worden opgeslagen in een traditionele rij-kolom database. Bijvoorbeeld foto's, video's, geluidsbestanden of grote teksten. Ze hebben geen vast datamodel.
Semi-gestructureerde gegevens bevinden zich ergens tussen de twee in. Bijvoorbeeld foto's die metadata hebben, informatie ingebakken in het bestand zoals locatie, enz.

Velocity
- De snelheid waarmee het systeem nieuwe gegevens ontvangt
- De relatie tussen ontvangst en verwerking:
- Batchverwerking
- Bijna real-time verwerking
- Real-time verwerking

Waarde
- Gegevensopslag kost geld.
- Beslissingen nemen over wat op te slaan en proberen de relevante gegevens te bewaren.
Waarheidsgetrouwheid
- Hoogwaardige gegevens zijn essentieel voor hoogwaardige algoritmen.
- Slechte gegevens leveren bevooroordeelde AI-systemen op.

Tay AI

Consumer Data
We leven in een sterk verbonden wereld
- Smartphones
- Slimme luidsprekers
- Bewakingscamera's
- Internet der Dingen (IoT)
We hebben gegevens nodig om een consumentenprofiel te creëren voor de beste consumentenervaring.

Personal
Data
How they respond
How they
interact
Who
they know
Who
they are
What they
received
What they
do
What
they say
Where
they are
Personal Device
Data
Online Data
GEO-location
Data
Social Media Data
Socio-demographic data & transactional data
Contact & Response History Data
The Customer's DNA

Aanraders



Amazon Go

Social Credit System

GDPR
- De GDPR (Algemene Verordening Gegevensbescherming) stelt de eisen vast voor het beheer en de beveiliging van persoonlijke gegevens van Europese burgers.
- Verantwoordelijkheid moet van twee kanten komen.
- Je hebt het recht om jezelf uit gegevens te verwijderen.
- Cookies accepteren.

Solid


AI Fundamentals
Hardware


Energieverbruik
- AI verbruikt energie in de trainingsfase en in de operationele fase.
- GPT-4 werd gedurende 90-100 dagen getraind op 25.000 Nvidia GPU's.
- Er zijn 3125 fysieke computers (servers) nodig.
- Een server gebruikt 6,5 kWh.
- Met 100 dagen en 24 uur per dag zijn dat 2400 uur per server.
- 2400 uur vermenigvuldigd met 6,5 kWh komt neer op 15600 kWh.
- 15600 kWh vermenigvuldigd met 3125 servers geeft 48.750.000 kWh.
- Dit komt neer op ongeveer 19.000 metrische ton CO2 (in de VS).
- Dat staat gelijk aan ongeveer 890.000 bomen of het energieverbruik van 5000 huishoudens (schatting).

Energieverbruik
- Training is niet hetzelfde als productie!
- We zijn op zoek naar Groene AI en verbeteren hardware om efficiënt energieverbruik te hebben zonder een negatieve invloed te hebben op de prestaties of nauwkeurigheid van een model.

Energieverbruik
2%
CO2 emission by AI/IOT systems
* AI for business: What's wrong, and how to get it right | ZDNet
* Global survey: The state of AI | McKinsey
20%
CO2 emission by AI/IOT systems
Nu
2030

We vragen aan Siri: "Hoe zal het weer zijn morgen?"
"je verbruikt 11 gram CO2"

Hoe is dit berekend?

Speech-to-text

Text-to-speech
< 0.01g
< 0.01g




0.5g
Natural language
processing


0.5g
10g

De wet van Moore


Microchips
- Fabrikanten van microchips denken in nanometers bij het plaatsen van elektronica. Een nanometer is 0,0000001 centimeter.
- We evenaren de grenzen van de fysieke beperkingen.


Von Neumann
- Om te kunnen rekenen, heeft een computer een CPU (Central Processing Unit) en geheugen nodig.
- Uitgevonden in 1946 door Jon Von Neumann
- Scheiding van CPU en geheugen
Calculation cell
Processor
Memory
Memory
Port

AI Accelerators
- GPU (Grafische Verwerkingseenheid)
- Gebruikt voor videogames
- Is sneller, prestatiegerichter, maar qua energieverbruik niet geschikt voor het trainen van AI
- Plaats de berekeningen en het geheugen op dezelfde plaats

Apple M1 Chip, Apple Silicon

Neuromorphic Computing

Quantum Computing

Quantum Mechanica



Quantum Mechanica



Quantum computing - Cases

In the cloud
- Je kunt computerkracht gebruiken van Google- en Microsoft-datacenters.
- Berekeningen worden uitgevoerd via een internetverbinding.
- We noemen dit Infrastructure-As-A-Service (IAAS)

Waarom moeten we dit weten?
"We evolueren heel snel in de wereld van computers en AI. Tegelijkertijd moeten we blijven omgaan met wereldproblemen zoals klimaatverandering, ongelijkheid, enz."
AI Fundamentals
Automatisatie


Technopanics
In het moderne tijdperk maken velen zich zorgen dat technologie schadelijk is voor onze hersenen of maatschappelijke normen aantast - maar deze angst is verre van een nieuw verschijnsel, zoals deze infographic onthult...

Steelt AI onze jobs?
- Noteer 5 argumenten waarom je hebt besloten ja of nee te zeggen.
- Na 5 minuten beginnen we een discussie.
- Spreek één voor één.
- Luister actief.
- Probeer argumenten te ondersteunen met je eigen ervaring of met zaken die we in de les hebben besproken.
- Debatteer gedurende 10 tot 15 minuten.
- De docent is de moderator:
- Houdt de discussie op koers.
- Moedigt studenten aan om hun standpunten te delen.

Steelt AI onze jobs?
- Het antwoord is genuanceerd.
- Er zijn 4 variabelen:
- Context
- Impact
- Beoogde resultaten
- Doelen

Steelt AI onze jobs?
Mens
Industrie
Context
Individual
Community
Impact
Kort termijn
Lange termijn
Resultaat
Intern
Extern
Doelen
Hoog
Laag
Menselijke bijdrage

Steelt AI onze jobs?


Yuval Noah Harari



Mustafa Suleyman



What does the AI revolution mean for our jobs?
AI Fundamentals
Ethical AI


Slaughterbots

Slaugherbots
- De technologie hierachter is echt.
- Automatisch vliegen
- Gezichtsherkenning
- Maar... "Gewoon de batterij uitschakelen of wachten tot de drone geen geheugen meer heeft"?"
Onderzoekers werken aan een batterij die zichzelf oplaadt door CO2 uit de lucht te halen. Dit zou een apparaat creëren dat nooit meer zonder batterij komt te zitten.

Deep Fakes
"Ik zal mijn medische kennis niet gebruiken om mensenrechten en burgerlijke vrijheden te schenden, zelfs niet onder dreiging."

Oath of Hippocrates

Vier principes
- Ethics by design
- Security by design
- Fairness by design
- Explainability by design

Wetten van Asimov
Asimov definieerde drie wetten van de robotica, die nog steeds invloed hebben op het denken over AI en ethiek. Deze wetten werden voor het eerst uiteengezet in 1942 en zijn directe inspiratie voor sciencefictionfilms zoals Terminator, Blade Runner, enz.
- Eerste Wet: Een robot mag een mens geen letsel toebrengen of, door nalatigheid, toestaan dat een mens schade oploopt.
- Tweede Wet: Een robot moet de bevelen opvolgen die hem door mensen worden gegeven, behalve wanneer dergelijke bevelen in strijd zouden zijn met de eerste wet.

Wetten van Asimov
- Derde Wet: Een robot moet zijn eigen bestaan beschermen, zolang die bescherming niet in strijd is met de Eerste of Tweede Wet. De robot staat dus ten dienste van de mensheid en mag deze niet schaden.
- Wet nul: Een robot mag de mensheid niet schaden, of, door nalatigheid, toestaan dat de mensheid schade oploopt

EU Ethics richtlijnen
- Bovenal, verdedig fundamentele mensenrechten; je zult menselijke autonomie niet verminderen, beperken of misleiden.
- Je zult de robuustheid en veiligheid van AI-systemen waarborgen en mechanismen inbouwen om fouten of inconsistenties op elk niveau uit te sluiten.
- Je zult gegevensprivacy waarborgen en controle over gegevens in handen van burgers houden.
- Je zult transparant en traceerbaar zijn.

EU Ethics richtlijnen
5. Je zult altijd prioriteit geven aan diversiteit, non-discriminatie en rechtvaardigheid, en rekening houden met menselijk talent en behoeften.
6. Je zult sociale en milieubetrokkenheid vergroten en positief bijdragen aan sociale verandering.
7. Je zult mechanismen inbouwen om de verantwoordelijkheid en aansprakelijkheid van AI-systemen en hun resultaten te waarborgen
Hoe? AI EU Act...
Technology 2 - AI Fundamentals
By timdpaep
Technology 2 - AI Fundamentals
- 304