Hoe AI de wereld ‘ziet’ – wat er gebeurde toen we een deep learning-model trainden om armoede te identificeren

Hoe AI de wereld ziet wat er gebeurde toen

Rijkdom en armoede in beeld brengen met behulp van AI. Auteurs, CC BY-SA

Om zo effectief mogelijk hulp te bieden om armoede te verlichten, moet je weten waar de mensen zijn die de hulp het hardst nodig hebben. In veel landen wordt dit vaak gedaan met enquêtes onder huishoudens. Maar deze zijn meestal onregelmatig en bestrijken beperkte locaties.

Recente ontwikkelingen op het gebied van kunstmatige intelligentie (AI) hebben de manier waarop armoede en andere indicatoren voor menselijke ontwikkeling worden gemeten, ingrijpend veranderd. Ons team heeft een type AI gebruikt dat bekend staat als een diep convolutioneel neuraal netwerk (DCNN) om satellietbeelden te bestuderen en sommige soorten armoede te identificeren met een nauwkeurigheid die dicht in de buurt komt van die van enquêtes onder huishoudens.

Het gebruik van deze AI-technologie zou bijvoorbeeld kunnen helpen in ontwikkelingslanden waar het landgebruik snel is veranderd. De AI zou toezicht kunnen houden via satelliet en mogelijk gebieden kunnen opsporen die hulp nodig hebben. Dit zou veel sneller gaan dan grondonderzoek.

Bovendien geven de dromerige beelden die ons deep learning-model heeft geproduceerd ons een uniek inzicht in hoe AI de wereld visualiseert.

Twee dorpen met verschillende welvaartscijfers gezien vanuit de ruimte. Het ‘arme’ dorp staat links, het ‘rijke’ rechts.
Auteurs/Google, CC BY

Een DCNN is een type geavanceerd AI-algoritme dat vaak wordt gebruikt bij het verwerken en analyseren van visuele beelden. Het “diepe” in de naam verwijst naar de meerdere lagen waardoor gegevens worden verwerkt, waardoor het deel uitmaakt van de bredere familie van deep learning-technologieën.

Eerder dit jaar deed ons team een belangrijke ontdekking met behulp van het DCNN. Dit netwerk werd in eerste instantie getraind op de enorme hoeveelheid gelabelde afbeeldingen uit de ImageNet-repository: een enorme dataset met afbeeldingen van objecten en levende wezens die wordt gebruikt om algoritmen te trainen. Na deze eerste fase, waarin het netwerk leerde om verschillende objecten te herkennen, hebben we het verfijnd met behulp van daglichtsatellietbeelden van bewoonde plaatsen.

Onze bevindingen toonden aan dat het DCNN, versterkt door deze gespecialiseerde training, de menselijke prestaties kon overtreffen bij het nauwkeurig beoordelen van armoedeniveaus op basis van satellietbeelden. Het AI-systeem bleek met name in staat om het armoedeniveau nauwkeuriger af te leiden uit satellietbeelden met een lage resolutie overdag dan mensen die beelden met een hoge resolutie analyseerden.

Een dergelijke vaardigheid doet denken aan de bovenmenselijke prestaties van AI op andere gebieden, zoals de schaak- en Go-machines die menselijke spelers consequent te slim af zijn.

Nadat de trainingsfase was voltooid, gingen we op onderzoek uit om te proberen te begrijpen welke kenmerken het DCNN herkende in de satellietbeelden als indicatief voor “grote rijkdom”. Dit proces begon met wat we een “blanco lei” noemden – een beeld dat volledig bestond uit willekeurige ruis, verstoken van waarneembare kenmerken.

Stap voor stap “past” het model dit ruisbeeld aan. Elke aanpassing is een stap in de richting van wat het model beschouwt als een satellietbeeld van een meer welvarende plaats dan het vorige beeld. Deze aanpassingen worden gestuurd door het interne begrip van het model en het leren van de trainingsgegevens.

Naarmate de aanpassingen doorgaan, verandert het aanvankelijk willekeurige beeld geleidelijk in een beeld dat het model met vertrouwen classificeert als een beeld met een hoge rijkdom. Deze transformatie was onthullend omdat het de specifieke kenmerken, patronen en elementen onthulde die het model associeert met rijkdom in satellietbeelden.

Dergelijke kenmerken zijn bijvoorbeeld (maar niet beperkt tot) de dichtheid van wegen, de lay-out van stedelijke gebieden of andere subtiele aanwijzingen die tijdens de training van het model zijn geleerd.

Satellietbeeld (links) van ‘arm’ dorp, gaat dan van links naar rechts en voegt tekenen van rijkdom toe, zoals wegen, op weg naar wat de AI ‘ziet’ als rijkdom.
Auteurs/Google, CC BY

De reeks afbeeldingen hierboven dient een cruciaal doel in ons onderzoek. Het begint met een basissatellietbeeld van een dorp in Tanzania, dat door ons AI-model als “arm” wordt gecategoriseerd, waarschijnlijk vanwege de schaarse aanwezigheid van wegen en gebouwen.

Om deze hypothese te testen en te bevestigen, passen we geleidelijk elke volgende afbeelding in de reeks aan, waarbij we ze methodisch verbeteren met extra kenmerken zoals gebouwen en wegen. Deze toevoegingen vertegenwoordigen toegenomen rijkdom en ontwikkeling zoals waargenomen door het AI-model.

Deze visuele progressie laat zien hoe de AI “rijkdom” visualiseert naarmate we zaken als meer wegen en huizen toevoegen. De kenmerken die we afleiden uit het “ideale” rijkdombeeld van het model (zoals wegen en gebouwen) zijn inderdaad van invloed op de beoordeling van rijkdom door het model.

Deze stap is essentieel om ervoor te zorgen dat de kenmerken waarvan wij denken dat ze belangrijk zijn in het besluitvormingsproces van de AI, ook daadwerkelijk overeenkomen met hogere voorspellingen van rijkdom.

Dus door het beeld herhaaldelijk aan te passen, evolueert de resulterende visualisatie geleidelijk naar hoe het netwerk “denkt” dat rijkdom eruit ziet. Deze uitkomst is vaak abstract of surrealistisch.

Hoe een neuraal netwerk ‘denkt’ dat rijkdom eruit ziet.
Auteurs, CC BY

De afbeelding hierboven werd gegenereerd vanuit een lege lei toen we het DCNN vroegen wat het associeerde met “hoge rijkdom”. Deze beelden hebben een etherische kwaliteit en lijken niet erg op typische satellietfoto’s voor overdag. Toch suggereert de aanwezigheid van “blobs” en “lijnen” clusters van huizen die onderling verbonden zijn door wegen en straten. De blauwe tint zou zelfs kunnen verwijzen naar kustgebieden.

Dromerige beelden

Inherent aan deze methode is een element van willekeur. Deze willekeur zorgt ervoor dat elke poging tot visualisatie een uniek beeld oplevert, hoewel ze allemaal verankerd zijn in hetzelfde onderliggende concept zoals begrepen door het netwerk.

Het is echter belangrijk op te merken dat deze visualisaties eerder een weerspiegeling zijn van het “denkproces” van het netwerk dan een objectieve weergave van rijkdom. Ze worden beperkt door de training van het netwerk en komen mogelijk niet nauwkeurig overeen met menselijke interpretaties.

Het is cruciaal om te begrijpen dat hoewel AI-kenmerkvisualisatie intrigerende inzichten biedt in neurale netwerken, het ook de complexiteit en beperkingen van machinaal leren bij het weerspiegelen van menselijke waarneming en begrip benadrukt.

Het begrijpen van armoede, vooral in zijn geografische of regionale context, is een complexe onderneming. Terwijl traditionele studies zich meer richtten op individuele aspecten van armoede, heeft AI, gebruikmakend van satellietbeelden, aanzienlijke vooruitgang geboekt in het benadrukken van de geografische patronen van regionale armoede.

Dit is waar de echte waarde van AI in armoedetoetsing ligt, in het bieden van een ruimtelijk genuanceerd perspectief dat een aanvulling vormt op bestaand armoedeonderzoek en helpt bij het formuleren van meer gerichte en effectieve interventies.

Ola Hall ontvangt financiering van Stiftelsen Riksbankens Jubileumsfond, Swedish Research Council en Formas.

Hamid Sarmadi ontvangt financiering van Riksbankens Jubileumsfond.

Thorsteinn Rögnvaldsson ontvangt financiering van de Knowledge Foundation en van Riksbankens Jubileumsfond.

Mobiele versie afsluiten