Microsoft erklärt, wie das „Gehirn“ seines neuen Sensors funktioniert. Dabei wird erklärt, wie der neue Sensor seine Umgebung wahrnimmt, wie er Personen und Gesten erfasst und welche Möglichkeiten in der Technologie stecken.

Kinect - Microsoft seziert das Gehirn des Kinect-Sensors

alle Bilderstrecken
Wischen für nächstes Bild, klicken um Infotext ein- / auszublendenBild 1/20Bild 19/381/38
Microsoft enthüllt ein wenig von der "Magie" die hinter Kinect steckt.
mehr Bildersteckenalle Bilderstrecken

Damit es möglich wird, Körperteile, Bewegungen und Gesten zu erfassen und zu verfolgen, muss man sich zunächst klar machen, dass wir in einer analogen Welt leben. In der digitalen Welt, in alles anders - und ein wenig einfacher. Alles basiert lediglich auf den Werten „Ja“ oder „Nein“. 1 und 0 können dabei auf äußerst komplexe Arten und Weisen miteinander in Wechselbeziehung geraten aber letztlich bleibt es bei einer Frage des „Entweder-Oder“. Für die analoge Welt in der wir leben ist diese Herangehensweise nicht oder nur selten praktikabel. In unserer analogen Welt ist es vielmehr ein „vielleicht“, dass eine Rolle spielt. Es geht nicht um wahr oder falsch, sonder vielmehr um die Möglichkeit.

Die Grundlage für Kinect stellt ein CMOS-Infrarotsensor dar, mit dem der Sensor seine Welt wahrnimmt - völlig unabhängig von der Umgebungsbeleuchtung oder Ähnlichem. Dieses Bild wird monochrom erzeugt, wobei schwarze Punkte unendlich weit weg und weiße Punkte unendlich nah sind. Das Grau zwischen diesen Extremen stellt die physikalische Entfernung eines Objekts zum Sensor dar. Dabei erzeugt das Systeme einen Strom aus Tiefen-Bildern von 30 Bildern pro Sekunde, um eine Echtzeit 3-D-Abbildung der Umgebung zu erschaffen.

Kinect erfasst den Spieler dabei Pixel für Pixel. Da es keine klaren ja/nein-Strukturen gibt, hat jeder Pixel, der erfasst wird, hat jeder Pixel eine gewisse Wahrscheinlichkeit für seine Position. So hat ein Pixel z. b. eine 80% Chance dafür, zu einem Fuß zu gehören, eine 60% Chance zu einem Bein zu gehören und eine 40% Chance zur Hüfte zu gehören.

Das System schafft es ein gesamtes Skelet zu erkennen, die Bewegungen zuzuordenen und Gesten zu verfolgen. Die dazu nötigen Daten sind immens. Das Gehirn kommt mit einem Grundstock an Informationen auf die Welt und lernt aus diesen nach und nach Körper und Bewegungen zu differenzieren. Kinect musste auf eine ähnliche Art und Weise lernen, den Körper zu erkennen. Diese so erzeugten Daten umfassen mehrere Terrabyte und sind mittlerweile allgemein genug, um schablonenartig auf jeden beliebigen Menschen angewandt werden zu können. Der Vorteil an der Tatsache, dass der Sensor mit den Daten von Menschen gefüttert wurde, ist, dass er in der Lage ist, den Körper von beispielsweise Katzen, Stühlen oder anderen Gegenständen im Bild zu unterscheiden. Die Erkennung würde also durch ein Tier, welches durch das Bild läuft, nicht gestört werden.