Vad är egentligen AI – och varför är det så svårt att förklara?

1. Datavetenskap – grunden allt vilar på

Innan något kan kallas AI måste det finnas ett datorprogram. Datavetenskap är disciplinen som handlar om hur man lagrar, bearbetar och kommunicerar information med maskiner. Algoritmer, datastrukturer, programmeringsspråk – allt detta är datateknikens byggstenar.

AI är i grunden datavetenskap med ett specifikt mål: att skriva program som kan lösa problem som normalt kräver mänsklig intelligens. Schack, bildtolkning, översättning, sjukdomsdiagnos. Utan datavetenskap, ingen AI.

2. Maskininlärning – när datorn lär sig av data

Det klassiska sättet att programmera: du skriver regler. "Om x, gör y." Det fungerar för enkla problem. Men hur programmerar du en regel för att känna igen en hund i ett foto?

Maskininlärning (Machine Learning, ML) löste det problemet. Istället för att skriva regler matar du datorn med tusentals exempel – foton av hundar, foton av katter – och låter den hitta mönstren själv. Datorn "lär sig" utan att någon skrivit "detta är en hund"-regler.

Det är grunden till modern AI. Netflix som rekommenderar filmer, bankens bedrägeridetektor, Spotify som hittar din nästa favoritlåt – allt bygger på maskininlärning.

3. Djupinlärning – neurala nätverk inspirerade av hjärnan

Djupinlärning (Deep Learning, DL) är en underkategori av maskininlärning – men en så kraftfull sådan att den förtjänar en egen rubrik. Metoden bygger på artificiella neurala nätverk: lager av matematiska noder som grövt sett imiterar hur neuroner i hjärnan kopplas ihop.

Fördelen: nätverken kan hitta extremt komplexa mönster i enorma datamängder. Det är djupinlärning som driver igenom ChatGPT, bildigenkänning i telefoner, röststyrning och medicinsk bildanalys. GPT-4, Gemini, Claude – alla är djupinlärningsmodeller.

Nackdelen: de är energikrävande, kräver enorma mängder träningsdata och är svåra att förstå inifrån. De är kraftfulla men ogenomskinliga.

4. Naturlig språkbehandling – att förstå och producera text

Hur läser en dator en mening och förstår vad den betyder? Det är problemet som naturlig språkbehandling (Natural Language Processing, NLP) löser.

NLP inkluderar allt från stavningskorrigering och maskinöversättning till sentimentanalys och frågebesvaringssystem. Moderna stora språkmodeller (LLM:er) som ChatGPT är i grunden NLP-system på steroider – tränade på i princip hela internet.

NLP är det som gör det möjligt att skriva naturlig svenska till en AI och få ett vettigt svar. Det är också det som analyserar kundrecensioner, sammanfattar juridiska dokument och flaggar hatfullt innehåll på sociala plattformar.

5. Datorseende – när maskinen tolkar bilder och video

Datorseende (Computer Vision) handlar om att låta datorer tolka visuell information – foton, video, medicinska bilder, satellitbilder.

Det låter enkelt. Men att "se" är kognitivt extremt komplext – vi vet det först nu när vi försökt lära maskiner att göra det. Datorseende driver ansiktsigenkänning i telefonen, självkörande bilar som identifierar fotgängare, röntgenbilder som analyseras för cancerdetektering, och industrirobotar som sorterar produkter med kameraögon.

En undergren är bildgenerering: modeller som DALL-E och Midjourney skapar bilder från textbeskrivningar. Det är datorseende baklänges – istället för att tolka en bild genererar systemet en.

6. Robotik – AI som rör sig i världen

De fem tidigare disciplinerna lever i datorn. Robotik är det som händer när AI tar steget ut i den fysiska världen.

En robot är ett system som kan uppfatta sin omgivning (med sensorer), fatta beslut (med AI) och agera (med motorer och mekanik). Det kräver att maskininlärning, datorseende och planering integreras i ett system som måste hantera en oförutsägbar verklighet i realtid.

Robotik spänner från industrirobotar som svetsar bilar och plockar paket på lager, till kirurgirobotar, jordbruksrobotar och de humanoidrobotar – Boston Dynamics, Tesla Optimus – som nu börjar kliva ut ur laboratoriet.

7. Förstärkningsinlärning – AI som lär sig av konsekvenser

Den sjunde disciplinen är kanske den mest fascinerande. Förstärkningsinlärning (Reinforcement Learning, RL) bygger på en enkel princip: låt AI:n prova saker, ge belöning för rätt beteende och straff för fel. Upprepa miljarder gånger.

Det är ungefär som att träna en hund – fast oerhört mycket snabbare. Googles AlphaGo lärde sig spela det kinesiska brädspelet Go på den här principen och besegrade världsmästare 2016. AlphaFold använde liknande metoder för att lösa proteinfällningsproblematiken – ett av biologins svåraste problem.

Förstärkningsinlärning driver också moderna LLM:er: efter grundträningen finjusteras modellerna med mänsklig feedback (RLHF, Reinforcement Learning from Human Feedback), vilket gör dem mer hjälpsamma och mindre benägna att producera skadligt innehåll.

Så hänger allt ihop

Dessa sju discipliner är inte separata silor – de vävs ihop. ChatGPT är djupinlärning + NLP + förstärkningsinlärning. En självkörande bil kombinerar datorseende + maskininlärning + robotik + planering. En läkarrobot blandar robotik + datorseende + expertsystem.

AI är inte ett ting. Det är ett landskap av verktyg, alla med olika styrkor, svagheter och tillämpningar. Det som gör 2020-talets AI exceptionellt är att dessa discipliner nu blivit tillräckligt kraftfulla för att kombineras i system som löser problem som bara för tio år sedan verkade omöjliga.

---

Källor: - GeeksforGeeks. Top 10 branches of Artificial Intelligence. Länk - AI Accelerator Institute. What are the top 7 branches of artificial intelligence? Länk - UF Faculty Handbook. Areas of Artificial Intelligence. Länk - ScienceDirect (2023). Artificial intelligence, machine learning and deep learning in advanced robotics. Länk

Nervceller från skrivaren pratar med hjärnan

Det mest datadrivna kriget i historien

Sverige har allt AI vill ha — utom strömmen

Vad är egentligen AI – och varför är det så svårt att förklara?

1. Datavetenskap – grunden allt vilar på

2. Maskininlärning – när datorn lär sig av data

3. Djupinlärning – neurala nätverk inspirerade av hjärnan

4. Naturlig språkbehandling – att förstå och producera text

5. Datorseende – när maskinen tolkar bilder och video

6. Robotik – AI som rör sig i världen

7. Förstärkningsinlärning – AI som lär sig av konsekvenser

Så hänger allt ihop

Har du frågor eller synpunkter?

Läs också

Ditt jobb försvinner inte — det förvandlas

Skärmar och psykisk ohälsa: samband eller syndabock?

Självkörande bilar: löftet som tog längre tid än vi trodde