En definition av ett AI-system utifrån matematiska modeller av inlärning

Av Boris Melvås, jurist på Pensionsmyndigheten men har även en bakgrund inom teoretisk filosofi, logik och klassiska språk.

En samling grönfärgade matematiska ikoner i en cirkel, mot en svart bakgrund, digital illustration. — Illustrasjon: Colourbox.com

Definitionen av ett AI-system enligt 3.1 rättsakten om AI är:^{(1)https://www.europarl.europa.eu/doceo/document/TA-9-2024-0138_SV.html[Besökt 2024-08-17]}

AI-system: ett maskinbaserat system som är utformat för att fungera med varierande grad av autonomi, som kan uppvisa anpassningsförmåga efter införande och som, för uttryckliga eller underförstådda mål, på grundval av de indata det tar emot, drar slutsatser om hur utdata såsom förutsägelser, innehåll, rekommendationer eller beslut som kan påverka fysiska eller virtuella miljöer ska genereras.

Definitionen är formulerad med hjälp av ett vardagligt språk så att även de som helt saknar fackkunskaper ska kunna förstå vad som menas. Men en sådan målsättning är på det aktuella rättsområdet i varje fall till viss del illusorisk, eftersom en definition utifrån vardagsspråket i praktiken ändå måste översättas till ett på IT-marknaden gångbart fackspråk innan definitionen kan appliceras på en verklig situation. Skälet till detta är att IT-system benämns utifrån de namn man har gett olika datavetenskapliga lösningar och inte med hjälp av de väldigt oprecisa beskrivningar, av hur dessa lösningar fungerar, som kan genereras med hjälp av vardagsspråket. Att i väldigt allmänna ordalag beskriva hur t.ex. ett datorprogram fungerar är ju trots allt något helt annat än att referera till etablerade konstruktioner såsom subprogram, algoritmer eller matematiska modeller. Således finns det ett behov av en översättning av definitionen av ett AI-system i rättsakten om AI till ett fackspråk. I det följande redogör jag för ett försök att ge en sådan gångbar definition, utifrån ett modellteoretiskt tankesätt, som ändå är förhållandevis lätt att förstå för lekmän.

I det följande redogör jag för ett försök att ge en sådan gångbar definition, utifrån ett modellteoretiskt tankesätt, som ändå är förhållandevis lätt att förstå för lekmän.

En modellteoretisk definition bygger på termen modell, med vilken avses ett förenklat sätt att återge en del av verkligheten med hjälp av någon form av medium. En fysisk modell av ett hus eller ett skepp kan t.ex. vara konstruerat av trä medan en modell av ett trafikflöde bättre återges med en matematisk funktion.^{(2)Edwards D. & Hamson M. (2007) Guide to Mathematical Modelling. 2 ed. Industrial Press Inc och OECD:s Explanatory Memorandum från mars 2024 som finns här: https://www.oecd-ilibrary.org/science-and-technology/explanatory-memorandum-on-the-updated-oecd-definition-of-an-ai-system_623da898-en}Även andra symbolspråk än matematiska används. Lambdakalkyl kan t.ex. användas för att modellera en av flera möjliga metoder för hur en dator utför beräkningar och en predikatlogisk modell kan användas för att beskriva ett språks semantik.^{(3)Fernández M. (2009) Models of Computation – An Introduction to Computability Theory. Springer samt Portner P.H. (2005) What is Meaning? – Fundamentals of Formal Semantics. Blackwell} Men vilken typ av modell bör man använda för att definiera ett AI-system? Jag hävdar i denna artikel att definitionen av ett AI-system i rättsakten om AI är logiskt ekvivalent med följande definition utifrån matematiska modeller av inlärning:

Ett AI-system är en fysisk maskin som implementerar minst en matematisk modell av inlärning eller minst en matematisk modell av kunskap som har genererats med hjälp av en matematisk modell av inlärning.

Med frasen en fysisk maskin som implementerar minst en matematisk modell menas varje lyckat försök att skapa en fysisk maskin som utför den uppgift, närmare bestämt den beräkning, som den matematiska modellen anger.^{(4)Gabbrielli M. & Martini S. (2010) Programming Languages: Principles and Paradigms. Springer} Med frasen enmatematisk modell menas här varje matematiskt baserad definition av ett fenomen i världen, t.ex. inlärning eller kunskap.^{(5)Guttag J.V. (2016) Introduction to Computation and Programming Using Python – With Application to Understanding Data. MIT} Med frasen en matematisk modell av kunskapsom hargenereratsmed hjälp av en matematisk modell av inlärning menas en matematisk modell av kunskap som framgår av en programkod som har genererats av ett annat program, som i sin tur är en implementering av en matematisk modell av inlärning. En implementering av en modell av kunskap som i denna mening inte har genererats med hjälp av en matematisk modell av inlärning, utan har skapats manuellt, utgör därmed inte ett AI-system. Det ska avslutningsvis noteras att jag med kunskap här menar såväl praktisk kunskap om hur man gör något (eng. knowledge how) som kunskap om hur något förhåller sig (eng. knowledge that).^{(6)https://plato.stanford.edu/entries/knowledge-how/[Besökt 2024-06-10.]}

För att visa att definitionen ovan av ett AI-system kan härledas från definitionen i rättsakten om AI går jag igenom den senare definitionen fras för fras.

Ett maskinbaserat systemär en agent, d.v.s. något som agerar. En sådan agent kan besitta ett antal förmågor så som förmågan att i någon mening veta något eller kunna uppfatta sin omvärld, kommunicera med andra, röra sig i världen, utföra rörelser med extremiteter etc.^{(7)Russel S. & Norvig P. (2016) Artificial Intelligence – A Modern Approach. Pearson} Att agenten är maskinbaserad betyder i detta sammanhang att agentens förmågor i grunden härrör från en beräkningsmaskin.^{(8)Gabbrielli M. & Martini S. (2010) Programming Languages: Principles and Paradigms. Springer} Visserligen är även en bensindriven gräsklippare av äldre modell en maskin, men det är i sammanhanget förhållandevis klart att man, liksom inom datavetenskapen i övrigt, avser en beräkningsmaskin när man talar om en maskin.^{(9)Se preambel 12 till rättsakten om AI enligt denna https://www.europarl.europa.eu/doceo/document/TA-9-2024-0138_SV.html[besökt 2024-05-31]} En modern beräkningsmaskin kallas för en dator. Ett maskinbaserat system är således en dator med ett antal anslutna enheter (som kan vara ytterligare datorer) som förser datorn med t.ex. ljud, bild, text m.m. och ser till så att den kan kommunicera och eventuellt också förflytta sig etc. Ett sådant AI-system kan vara fristående, normalt med en bildskärm och ett tangentbord etc. för kommunikation, eller utgöra en komponent i en större produkt och då antingen vara fysiskt inbyggt eller vara sådant att det på annat sätt ”tjänar produktens funktioner”.^{(10)Se preambel 12 till rättsakten om AI.} Av det faktum att systemet är maskinbaserat, d.v.s. körs på en maskin, drar jag dock slutsatsen att det krävs en fast kommunikationsväg mellan datorn och enheterna för att de ska utgöra delar av samma AI-system. Bara det faktum att en dator och ett program har använts för att en gång i tiden generera ett program som används på en annan dator bör därför inte innebära att de är en del av samma AI-system, d.v.s. en del av samma maskin.

Att systemet ska fungera med varierande grad av autonomi betyder att programmet är konstruerat för att självständigt dra vissa betydelsefulla slutsatser, även om dessa slutsatser inte behöver utgöra beslut i en mer strikt mening.^{(11)Se preambel 12 till rättsakten om AI.} Därmed blir också frågan om t.ex. en knapptryckning i enlighet med en dators förslag från en livrädd stridsvagnsförare med en beslutstid som understiger en sekund räknas som ett ej automatiserat beslut mindre relevant.^{(12)Liljefors M., Noll G. & Steuer D. (2019) War and Algorithm. Rowman & Littlefield samt Hänold S. Profiling and Automated Decision-Making: Legal Implications and Shortcomings i Corrales, Fenwick & Forgó (ed) (2018) Robotics, AI and the future of Law. Springer} Det räcker med att systemet är konstruerat för att självständigt lämna åtgärdsförslag för att autonomikravet ska vara uppfyllt.

Att systemet kanuppvisa anpassningsförmåga innebär att systemets programkod kan utvecklas under driftstiden genom att det finns en förmåga till självlärande. Dock verkar detta, speciellt inte enligt OECD, vara ett nödvändigt villkor för att något ska vara ett AI-system, utan mer en egenskap som många AI-system har. Frasen ”kan uppvisa” verkar således betyda just en möjlig förmåga hos ett AI-system. Detta följer också av att t.ex. program för bildigenkänning kan sakna inlärningsförmåga även om det är uppenbart att även sådana program är tänkta att regleras av rättsakten om AI.^{(13)Se preambel 12 till rättsakten om AI och https://www.oecd.org/digital/artificial-intelligence/.} Frasen får därmed anses utgöra ett förtydligande av att inlärningsförmåga är något som gör något till ett AI-system, men att det även finns andra typer av AI-system.

Att systemet är konstruerat för att uppnå uttryckliga eller underförstådda mål betyder att målen antingen kan vara hårdkodade, d.v.s. permanent definierade mål som inte kan ändras, eller sådana mål som systemet kan lära sig efterhand utifrån regler som den tillämpar, t.ex. genom att läsa av trafikskyltar.^{(14)Se OECD:s hemsida https://oecd.ai/en/wonk/ai-system-definition-update. [besökt 2024-05-31]}

Avslutningsvis kan tyckas att frasen ”drar slutsatser om hur utdata […] ska genereras” borde betyda att systemet kan lära sig hur utdata ska genereras. Men speciellt OECD verkar istället mena att även en klassificeringsmodell, t.ex. ett vanligt bildigenkänningsprogram, som saknar inlärningsförmåga drar slutsatser om hur utdata ska genereras. Detta följer av att OECD beaktar såväl AI-systems ”build phase” som dess ”use phase” när man bedömer om det deduktiva kravet ovan är uppfyllt.^{(15)https://oecd.ai/en/wonk/ai-system-definition-updateochOECD:s Explanatory Memorandum från mars 2024} Även i preambel 12 rättsakten om AI verkar man mena att maskininlärning antingen ska ha varit en del av systemets ”build phase” eller vara en del av systemets ”use phase” för att systemet ska vara ett AI-system. Däremot utgör rena s.k. logiska agenter, d.v.s. agenter vars programkod enbart bygger på grundläggande logiska samband och ingen mer avancerad matematik, inte AI-system.^{(16)Russel S. & Norvig P. (2016) Artificial Intelligence – A Modern Approach. Pearson} Att AI-system delvis kan baseras på ”logik- och kunskapsbaserade strategier” är en annan sak.^{(17)Se preambel 12 till rättsakten om AI}

Sammanfattningsvis är ett AI-system således:

En beräkningsmaskin, till vilken ett antal assisterande enheter (t.ex. ytterligare en dator) har anslutits,
som har en förmåga att lära sig ett beteende eller uppvisar ett inlärt beteende
som innebär att systemet, för uttryckliga eller underförstådda mål, från indata genererar utdata, oavsett om denna utdata kan påverka en fysisk eller en virtuell miljö.

Från dessa premisser kan man nu härleda den modellteoretiska definition som jag nämnde i inledningen. Av a-b ovan följer att ett AI-system till att börja med är en viss typ av fysisk maskin med förmågan att lära sig ett beteende eller att följa ett inlärt beteende. Det är dock irrelevant hur maskinen är uppbyggd så länge den har någon av de förmågor som nämns i b, eftersom den då också måste bestå av en beräkningsmaskin med assisterande enheter. En sådan fysisk maskin är en fysisk implementering av en matematisk modell av inlärning eller en fysisk implementering av en matematisk modell av kunskap som har genererats med hjälp av en sådan matematisk modell av inlärning. Del c av definitionen tillför i min mening däremot ingenting ytterligare av följande skäl. Att indata ska medföra utdata är en del av definitionen av ett datorprogram, vars existens är en förutsättning för en fysisk implementering av en matematisk modell.^{(18)Med ”program” menar jag här såväl en implementering genom ”hardware”, ”firmware” som ”software”, jfr Gabbrielli M. & Martini S. (2010) Programming Languages: Principles and Paradigms. Springer. I praktiken är det dock ”software” som det handlar om.} Vidare innebär det faktum att målet med detta program antingen kan vara uttryckligt definierat eller underförstått, samt att utdata ska kunna påverka en fysisk eller en virtuell miljö, inte mer än att beräkningsmaskinen är konstruerad för att på något sätt kunna ha en betydelsefull effekt på sin omgivning. Varje implementering av en modell av inlärning eller en modell av kunskap kan dock ha en sådan effekt utifrån uttryckliga eller underförstådda mål. Därmed följer det att kriteriet c är uppfyllt om kriterierna a-b är uppfyllda. Definitionen av ett AI-system kan då förkortas till:

En fysisk maskin som implementerar minst en matematisk modell av inlärning eller minst en matematisk modell av kunskap som har genererats med hjälp av en matematisk modell av inlärning.

Definitionen i rättsakten om AI kan således översättas till en modellteoretisk definition enligt 1 och 2 ovan utifrån matematiska modeller av inlärning. Att denna definition inte bara är möjlig, utan även är lätt att förstå och använda, förklaras dock bäst med ett exempel.

Anta att följande, påhittade, matematiska modell av förmågan att kunna skilja falska hyreskontrakt från äkta hyreskontrakt är genererad genom maskininlärning:

f(x₁, x₂) = 1, om x₂ < (x₁- 2) * 3
annars f(x₁, x₂) = 0

Modellen för inlärning antas vara en s.k. SVM (Support Vector Machine). Jag förklarar inte här hur en sådan modell fungerar men ger en länk till en grafisk beskrivning för den intresserade.^{(19)Bilden används i enlighet med Creative Commons Attribution-Share Alike 3.0 Unported license, se https://commons.wikimedia.org/wiki/File:Svm_separating_hyperplanes_(SVG).svg. (I och II motsvaras av den röda linjen i denna bild.)} Den SVM som i detta fall har använts för att generera modellen av kunskap är därmed en matematisk modell av inlärning. Vad gäller modellen av kunskap behöver den bara två mätvärden, x₁ och x₂, vilket är helt orealistiskt men pedagogiskt. Modellen ska läsas så att ett hyreskontrakt bedöms som äkta om f (x₁, x₂) = 1. Detta gäller t.ex. om mätvärdena är x₁ = 5 och x₂ = 6, eftersom (5 - 2) * 3 = 9, vilket är större än 6. Den matematiska modellen ovan är därmed en matematisk modell av kunskap som har genererats med hjälp av en matematisk modell av inlärning. Således är varje implementering, i form av en fysisk maskin, av den modell av kunskap som definieras genom I och II ett AI-system. Även varje implementering, i form av en fysisk maskin, av den SVM som har använts för att generera denna modell av kunskap är ett AI-system.

I min mening visar detta att det utifrån den definition av ett AI-system som jag här har föreslagit är ganska enkelt att avgöra om en fysisk maskin är ett AI-system eller inte. Detta beror i sin tur på att det finns klara matematiska definitioner av vad som menas med en matematisk modell av inlärning. Exempel på sådana modeller är förutom SVM, Linear Regression, Random Forest Classifier, CNN (Convolutional Neural Network), GAN (Generative Adversarial Network) etc. Vad som menas med en modell av kunskap som har genererats med hjälp av en modell av inlärning samt vad som menas med en fysisk implementering av någon av dessa modeller är också glasklart. Definitionen som jag här har föreslagit är därmed mycket lättare att förstå och använda än den definition i rättsakten om AI från vilken jag har härlett den.

Sammanfattningsvis anser jag mig ha goda grunder för att definitionen i rättsakten om AI är logiskt ekvivalent med den definition utifrån matematiska modeller av inlärning som jag här har givit.

Sammanfattningsvis anser jag mig ha goda grunder för att definitionen i rättsakten om AI är logiskt ekvivalent med den definition utifrån matematiska modeller av inlärning som jag här har givit. Jag anser mig även ha visat att den härledda definitionen är mycket lätt att förstå och använda. Men jag överlämnar till läsaren att avgöra om detta stämmer även efter närmare granskning.

Noter

https://www.europarl.europa.eu/doceo/document/TA-9-2024-0138_SV.html[Besökt 2024-08-17]
Edwards D. & Hamson M. (2007) Guide to Mathematical Modelling. 2 ed. Industrial Press Inc och OECD:s Explanatory Memorandum från mars 2024 som finns här: https://www.oecd-ilibrary.org/science-and-technology/explanatory-memorandum-on-the-updated-oecd-definition-of-an-ai-system_623da898-en
Fernández M. (2009) Models of Computation – An Introduction to Computability Theory. Springer samt Portner P.H. (2005) What is Meaning? – Fundamentals of Formal Semantics. Blackwell
Gabbrielli M. & Martini S. (2010) Programming Languages: Principles and Paradigms. Springer
Guttag J.V. (2016) Introduction to Computation and Programming Using Python – With Application to Understanding Data. MIT
https://plato.stanford.edu/entries/knowledge-how/[Besökt 2024-06-10.]
Russel S. & Norvig P. (2016) Artificial Intelligence – A Modern Approach. Pearson
Gabbrielli M. & Martini S. (2010) Programming Languages: Principles and Paradigms. Springer
Se preambel 12 till rättsakten om AI enligt denna https://www.europarl.europa.eu/doceo/document/TA-9-2024-0138_SV.html[besökt 2024-05-31]
Se preambel 12 till rättsakten om AI.
Se preambel 12 till rättsakten om AI.
Liljefors M., Noll G. & Steuer D. (2019) War and Algorithm. Rowman & Littlefield samt Hänold S. Profiling and Automated Decision-Making: Legal Implications and Shortcomings i Corrales, Fenwick & Forgó (ed) (2018) Robotics, AI and the future of Law. Springer
Se preambel 12 till rättsakten om AI och https://www.oecd.org/digital/artificial-intelligence/.
Se OECD:s hemsida https://oecd.ai/en/wonk/ai-system-definition-update. [besökt 2024-05-31]
https://oecd.ai/en/wonk/ai-system-definition-updateochOECD:s Explanatory Memorandum från mars 2024
Russel S. & Norvig P. (2016) Artificial Intelligence – A Modern Approach. Pearson
Se preambel 12 till rättsakten om AI
Med ”program” menar jag här såväl en implementering genom ”hardware”, ”firmware” som ”software”, jfr Gabbrielli M. & Martini S. (2010) Programming Languages: Principles and Paradigms. Springer. I praktiken är det dock ”software” som det handlar om.
Bilden används i enlighet med Creative Commons Attribution-Share Alike 3.0 Unported license, se https://commons.wikimedia.org/wiki/File:Svm_separating_hyperplanes_(SVG).svg. (I och II motsvaras av den röda linjen i denna bild.)