GOOGLE CLOUD VISION: BEKIJK DE WERELD DOOR DE OGEN VAN GOOGLE

Een kleine robot, gemaakt van slechts twee wielen en vier kabels, beweegt over een tafel. Hij rijdt langs de mensen die aan de tafel zitten, stopt voor iemand die glimlacht en zegt met zijn blikken stem: “Je ziet er gelukkig uit, vertel me waarom je gelukkig bent!”. Aan iemand die ongelukkig kijkt, vraagt hij: “Je ziet er verdrietig uit, wat is er aan de hand?”

EMPATHYBOT: DE ROBOT DIE JOUW EMOTIES LEEST

Hoe kan zo'n simpel apparaat menselijke emoties herkennen? Waar zijn de krachtige processoren en de gigantische databanken verborgen die nodig zijn om dit te kunnen?

Kracht uit de cloud

In werkelijkheid zit deze enorme rekenkracht niet in het machientje, maar in de cloud van Google, het geheel aan externe computers die het bedrijf beschikbaar stelt aan gebruikers en ontwikkelaars.

De empathische robot gebruikt de kracht van de cloud om gezichtsuitdrukkingen te herkennen. Dit wordt mogelijk gemaakt door een van de meest innovatieve toepassingen van de technologische reus uit Mountain View: Google Cloud Vision.

Dankzij dit product kunnen programmeurs en hackers de kracht van de algoritmes van Google Afbeeldingen gebruiken voor hun projecten. De mogelijkheden van het oog van Google zijn eindeloos: van het raden van een hondenras tot het tellen van hoeveel mensen er op een schoolfoto staan; van het onderscheiden van een pompoen van een bal tot het bepalen waar het meer ligt dat op een oude foto is vereeuwigd.

Bewegende afbeeldingen

Google Cloud Vision is nog maar één jaar oud, maar op 9 maart heeft Google al een nieuwe ontwikkeling gepresenteerd Google Cloud Video Intelligence. Het systeem past enkele functies van Vision toe op bewegende afbeeldingen. Zodoende groeit de mogelijkheid om audiovisuele content te doorzoeken met sprongen.

Het is dan ook geen toeval dat een van de eerste bedrijven met interesse voor Google Cloud Vision AeroSense was. Dit dronebedrijf registreert duizenden afbeeldingen per vlucht. Het is verboden om ze te bekijken om de gefotografeerde objecten te identificeren. In zulke situaties kan het geautomatiseerde zicht van Google onmisbaar zijn.

Algoritmes die leren van data

Het geheim van Google Cloud Vision zit in de algoritmes voor “machine learning”, het grote succes van de zoekmachine. Google gebruikt de enorme hoeveelheid data om zijn algoritmes te trainen.

Als we zoeken op het woord “hond”, geeft Google Afbeeldingen miljoenen plaatjes van honden. Dit gebeurt niet omdat het algoritme het basale idee van hond kent, maar omdat het heeft geleerd om dit dier te herkennen door enorme hoeveelheden afbeeldingen te vergelijken.

Het bedrijf heeft een simulator, ter beschikking gesteld aan zijn gebruikers, waarmee je het universum aan afbeeldingen kunt verkennen en de werking van Google Cloud Vision kunt leren begrijpen. Het bedrijf uit Mountain View is niet de enige die deze weg is ingeslagen. Amazon heeft bijvoorbeeld voor dezelfde markt ook een product gelanceerd: Amazon Rekognition.

Tekst en afbeeldingen

Beeldherkenning kan op verrassende manieren toegepast worden. In de volgende video zien we een robot, die gemaakt is met Rasperry Pi, Google Cloud Vision gebruiken om Halloweensnoepjes onder te verdelen in lekker en minder lekker. De software is in staat om het snoepmerk te herkennen dankzij het algoritme om tekst uit afbeeldingen te filteren.

ROBOT ALS SNOEPJESKEURDER

Google Cloud Vision kan afbeeldingen op veel verschillende manier herkennen:

Voor hackers en onderzoekers

Google Cloud Vision maakt verrassende hacks mogelijk. Je kunt het bijvoorbeeld combineren met Google Translate om te leren hoe je 'glas' zegt in het Chinees, door simpelweg een glas te fotograferen met je telefoon.

DE NAAM VAN DINGEN

Als je de software combineert met de samenwerking van verschillende mode-experts, kun je een systeem creëren dat automatisch herkent bij welke urban group een excentriek geklede voorbijganger hoort.

STIJLHERKENNING

Disney heeft het programma gebruikt in een augmented reality app waarmee de draak van hun nieuwste film bij je thuis op de bank verschijnt. De onderzoeker Kalev Leetaru heeft het programma weer gebruikt om de meest voorkomende situaties in verkiezingsspotjes te analyseren of de meest gefotografeerde plaatsen in de internationale pers.

En misschien bedenk jij wel de volgende toepassing, want het oog van Google belooft om ook de manier waarop jij de wereld ziet te veranderen.

License: Creative Commons Attribution No Derivatives 4.0