Projektguide
Her finder du (næsten) alt, hvad du behøver at vide, når du skal styre et AI-projekt. Vejledningen har sit udgangspunkt i Region Syddanmark, men mange af problemstillingerne og løsningerne gælder alle AI-projekter uanset geografi.
Lovgivning som databeskyttelsesforordningen og sundhedsloven udgør en ramme af regler og bestemmelser, som påvirker AI-projekter. Overholdelse af reglerne om datasikkerhed er nemmere, når data gøres anonyme og/eller data administreres i egne datacentre.
Overvej altid:
- Er data personlige?
Personoplysninger er enhver information, der kan forbindes med en bestemt person. Dette gælder stadig, selvom personen kun er identificerbar, hvis oplysningerne er i kombination med andre former for oplysninger, f.eks. tilgængelig for den praktiserende læge.
Hvis en privat virksomhed er en del af projektet, kan en databehandleraftale, dataoverførselsaftale for tredjemandsland, risikovurdering og en Data Protection Impact Analysis (DPIA) være påkrævet. -
Skal du bruge et ejet datacenter eller en cloud-løsning?
Så længe data er i Region Syddanmarks datacenter, er det nemmere at overholde de formelle krav om at sikre persondata. Syddansk Universitet kan også hjælpe med datahåndtering i forskningsprojekter. Men det bliver mere og mere kompliceret, hvis du samarbejder med en leverandør, der har behandlet data i skyen. Det er altid tilrådeligt at vurdere mulighederne for hvert projekt.
Det er både nemmere og hurtigere, hvis projektet kan placere både data og softwaren, der skal behandle dataene, i regionens eget datacenter. Det gælder både træning, udvikling og bearbejdning af en algoritme. Derfor anbefaler Region Syddanmark at afdække, om data og algoritme kan placeres i Region Syddanmarks eget datacenter.
Kontakt informationssikkerhed@rsyd.dk hvis du har spørgsmål til håndtering af persondata og behov for behandlingsevne i datacentret (gælder kun personale i Region Syddanmark).
I Region Syddanmark kan du tilgå data til analyser på flere måder - den ene er regionens afdeling for Dokumentation og Ledelsesinformation. Afdelingen administrerer et omfattende datavarehus af patientdata og afdelingen kan hjælpe med at udvælge og organisere specifikke datatabeller med både kode og tekst.
Kontakt sundhedsdokumentation@rsyd.dk, hvis du har spørgsmål vedrørende patientdata – ikke billeder (gælder kun personale i Region Syddanmark).
Denne del vil illustrere pointer om data og projektets forløb.
Maskinlæring med overvåget læring er et populært AI-værktøj. Ideen er at bygge et datasæt med et antal inputvariable (A) og én udfaldsvariabel (B) - ideelt set har B kun to-tre mulige værdier.
Dataanalyse (BI) kan vise sammenhængene i historiske data, f.eks. at en bestemt gruppe af årsagsvariable har den største betydning for B. Problemstillingen er at lave en hypotese om sammenhænge i data, og det hjælper med at definere datasættet anvendt i projektet. Med maskinlæring trænes en algoritme ud fra hypoteserne til at forudsige værdien af B.
Deep learning opererer også med A og B, men forskellen er, at forudsigelsen af B kommer fra A gennem selvfremstillede neuroner. Det er relevant for billedgenkendelse. Resultatet kan være sværere at forklare, og det kan resultere i nogle ulemper med hensyn til validering og accept fra både klinikere og patienter.
For begge ovennævnte tilgange er det en fordel med:
- masser af A-data (årsager) og simple resultater af B (resultater)
- en letforklarlig model
Når hypotesen og datasættene er klar, kan projektet forvente udfordringer med datakvaliteten:
- datasættet er ikke fuldt
- registrering er uens på tværs af personer, afdelinger eller over tid
Det tager meget tid at validere data, og data skal fornyes flere gange i løbet af projektperioden.
Nedenfor er nogle råd til faserne af et AI-projekt.
- Kvalificering af ideen
Find den særlige del af beslutningsprojektet, hvor ekstra information sætter dig i stand til at træffe bedre og hurtigere beslutninger. Hvordan ser skærmbilledet ud, som angiver dine mulige tiltag. Det skal være værdifuldt for organisationen og/eller patienten. - Design af en test
- Angiv hvilke tiltag løsningen skal give slutbrugeren.
- Lav hypoteser om sammenhænge i data.
- Udled behovet for data og datakilde.
- Vær så specifik som muligt på de enkelte datafelter.
- Start med en simpel model.
- Valider data gennem flere iterationer. - IT-opsætning
- Søg på markedet for IT-tjenester til at håndtere de relevante data.
- Der er mange open source-ressourcer.
- Tegn hvordan data flyder, håndteres og præsenteres for slutbrugeren.
- Cast delene, herunder data scientist, eksperter i den aktuelle sag og slutbrugeren af resultatet af algoritmen. - Projektforslag
Beskriv projektet gennem formål, sigte, aktivitetsplan, rask ledelse, organisering, budget og vurdering. Forankring projektet, så det kan formidles, hvis det lykkes. - Gennemførelse af projektet
Det er slet ikke kedeligt at gå igennem med et AI-projekt. Forvent at bruge en betydelig mængde tid på databehandling og udvikling af algoritmer. Dataudfordringer er ofte tidskrævende. Afslut vurderingen med en plan for en fremtidig opskalering. - Formidling af løsningen fra projekt til drift
Skiftet fra innovation eller forskning til drift medfører en masse udfordringer og opgaver, bl.a.
- organisatorisk accept
- procedure for løbende validering af datakvalitet
- krav om realtidsbehandling af data
- CE-mærkning
- Regler om automatisk beslutningstagning
- informationssikkerhed
- information til patienter
Kunstig intelligens træffer beslutninger anderledes end mennesker. Resultatet af en algoritme kan derfor give nogle udfordringer med bias og transparens.
- Partiskhed
Generelt er algoritmer bygget til at foreslå de beslutninger, som historiske data viser at have været resultatet i fortiden. Så der er en historisk genrelisering og inerti, når man skifter til nye retningslinjer for korrekte beslutninger. For at håndtere dette skal algoritmen løbende valideres og f.eks. nulstil dataene, hvilket skaber skævhed fra nutidens retningslinjer. - Forklaring
Hvis vi ikke forstår algoritmen, kan vi ikke diskutere den, forbedre den og måske ikke engang acceptere den. Af den grund anbefales det at arbejde med:
- simple modeller (f.eks. beslutningstræer)
- sammenligning af algoritmens evner med menneskelige evner
WHO guidance on Ethics & Governance of Artificial Intelligence for Health fra WHO (World Health Organization).
Ethics Guidelines for Trustworthy AI fra EU Kommissionen.