Computer leert spelletje te winnen door u te zien spelen

Wetenschappers tonen aan dat een computer door te kijken hoe u een spelletje speelt, kan leren hoe het spel werkt en u vervolgens keer op keer kan inmaken.

Voor ons mensen is het heel gewoon om te leren door te kijken. Onze ouders laten ons als kinderen zien hoe mes en vork te gebruiken en hoe we een toren moeten bouwen. Door te kijken, kunnen we het later zelf ook.

Wenselijk
Het is wenselijk dat ook robots en computers over die gave gaan beschikken, zo schrijft onderzoeker Łukasz Kaiser in zijn paper. Alleen zo kunnen uiteindelijk werkelijk autonome robots ontstaan.

Het kan
Maar computers in staat stellen om op die manier te leren, is nog niet zo eenvoudig. Kaiser toont met zijn experimenten echter aan dat het wel kan.

Laptop
Hij gebruikte voor zijn experimenten een vrij eenvoudige laptop. De laptop ‘bekeek’ filmpjes waarop te zien was hoe mensen het spel ‘vier op een rij’ speelden. De computer keek wat er elke keer op het bord veranderde en in het bijzonder hoe het bord eruit zag wanneer een mens gewonnen had. Zo leerde hij welke handelingen waren toegestaan, welke handelingen leidden tot winst en wanneer er sprake was van winst.

Boven: vier situaties die leiden tot winst en vier situaties die leiden tot verlies. Onder: links een actie die wel mag. Rechts een zet die niet is toegestaan (en ook niet kan). Afbeeldingen: Łukasz Kaiser.

Spelen maar!
Met die kennis kon de computer vervolgens gaan spelen. De laptop achterhaalde wanneer deze aan de beurt was welke zetten mogelijk waren en welke van deze acties de kans op winst het sterkst vergrootten.

Bijzonder
Uiteindelijk kon de computer door te kijken niet alleen vier op een rij leren spelen. Hij kreeg bijvoorbeeld ook het spel Gomoku onder de knie. En dat is best bijzonder, zo schrijft Kaiser. “De afgelopen jaren zijn er verschillende systemen voorgesteld die de regels van een simpel kaart- of bordspel enkel door visuele demonstraties leren. Deze systemen werden voor specifieke spellen ontwikkeld en vertrouwden op substantiële achtergrondinformatie. Wij introduceren een algemeen systeem voor het leren van de regels van bordspellen aan de hand van video’s. Het gepresenteerde algoritme heeft slechts enkele demonstraties en minimale achtergrondinformatie nodig. En wanneer het de regels kent, kan het het spel competitief spelen.”

Op dit moment werkt het algoritme dus uitstekend als het gaat om bordspellen. Maar: “Er is sterk theoretisch bewijs dat het ook andere problemen kan oplossen.”

Bronmateriaal

"Learning Games from Videos Guided by Descriptive Complexity" - Jussieu.fr
De foto bovenaan dit artikel is gemaakt door DizDau (cc via Flickr.com).

Fout gevonden?

Voor jou geselecteerd