Hoe weet een politie-agent wanneer een hooligan of agressieve treinreiziger andere mensen lastig valt? Natuurlijk zijn er al camera’s met afluisterapparatuur en camera’s die abnormaal gedrag herkennen, maar een nieuw computermodel is in staat om asociaal gedrag te spotten door te luisteren. Het computermodel is van Dirkjan Krijnders van de Rijksuniversiteit Groningen.

Wandelend door de stad ondervind je als mens weinig problemen om een gesprek te voeren. Bijna feilloos ben je in staat de stem van je gesprekspartner uit de brij van stadsgeluiden te halen. Dergelijke bijgeluiden zijn daarentegen fnuikend voor computers, want een spraakherkenner ziet die ook als spraak, met onzinnige uitvoer als gevolg. Om geluidsherkenning te kunnen gebruiken voor alarmsystemen, moet er dus nog veel gebeuren. De modellen van Krijnders zijn een grote stap voorwaarts.

Geluid bestaat uit drie delen: resonantie, botsing en ruis. In het model van Krijnders wordt geluid opgedeeld in objecten, op basis van verschillende fysische processen. Elk proces wordt apart verwerkt en van elk proces wordt een aantal cruciale kenmerken vastgesteld. Op basis van deze kenmerken wordt vervolgens gezocht naar bekende voorbeelden die vergelijkbare kenmerken hebben. Zo kan de computer bepalen wat de bron is van welk geluid. Een dataset, dat gebruikt wordt als vergelijkingsmateriaal, bestaat uit verschillende opnamen, zoals een normale stationsscene (een begroeting) en een abnormale scene (agressief gedrag van hooligans).

Door deze dataset te combineren met een videodetectiesysteem, die agressie detecteert op basis van de hoeveelheid beweging in het beeld, neemt het aantal goede alarmsignalen toe met 78 procent, zonder dat het aantal valse signaleringen toeneemt. Een mooie prestatie dus!