Golem pur

Golem.de ohne Werbung nutzen
Mehrseitige Artikel auf einer Seite lesen
RSS-Volltext-Feed für Artikel
Ab 3,00 € pro Monat

Ad-Hoc-Cloud

Handys verschlagworten Fotos mit Umgebungssensoren

Forscher der Duke Universität im US-Bundesstaat North Carolina haben eine Methode entwickelt, mit der das lästige Verschlagworten von Fotos per Hand durch automatische Methoden ergänzt wird. Sie nutzen Sensoren in Handys und binden sogar die der fotografierten Personen mit ein.

Artikel veröffentlicht am 30. Juni 2011, 8:14 Uhr, Andreas Donath

Schlagworte (Bild: Duke Universität/Universität South Carolina)

Bei dem Verschlagwortungssystem Tagsense sorgt eine Gesichtserkennung dafür, dass die fotografierten Personen erkannt werden. Sind sie schon mit Namen bekannt, werden - auf freiwilliger Basis - deren Mobiltelefone dazu genutzt, die Fotos besser zu kategorisieren.

So kann zum Beispiel durch die Auswertung eines Beschleunigungsmessers erkannt werden, ob sich die Person zum Aufnahmezeitpunkt bewegte. Auch die Uhrzeit, der Standort über GPS oder das Wetter kann in die Kriterien einfließen, mit denen das Foto einsortiert wird.

Tagsense - erstellte Schlagworte (Bild: Duke Universität/Universität South Carolina)

Informatiker Xuan Bao und Chuan Qin haben die App zusammen mit Romit Roy Choudhury an der Duke Pratt School of Engineering entwickelt. Qin und Bao absolvieren derzeit ein Sommerpraktikum bei Microsoft, hob die Uni ausdrücklich hervor.

Mobiltelefone haben zahlreiche Sensoren, die man nutzen kann, sagte Qin. Sie sammeln Informationen wie Töne, Bewegungen, Orte und den Lichteinfall. Diese Informationen gilt es auszuwerten und geschickt zu verknüpfen, um die Fotos zu beschreiben und Attribute zu finden, die etwas über ihren Inhalt aussagen.

Durch die Umgebungsinformationen wollen die Studenten genauere Beschreibungen von Fotos erzielen, als sie alleine durch eine Gesichtserkennung möglich sind. Je genauer die Fotos beschrieben werden, desto besser lassen sie sich später auch wieder über eine Stichwortsuche auffinden.

Beispielsweise kann man über den Beschleunigungsmesser erkennen, ob eine Person still steht oder tanzt. Lichtsensoren in der Kamera erkennen, ob die Aufnahme im Freien bei Sonnenschein, Bewölkung oder im Gebäude gemacht wurde. Wetterinformationen für den Standort können auch übers Internet abgefragt werden. Über das Mikrofon kann erkannt werden, ob eine Person lacht oder still ist. Zusammen lässt sich schon ziemlich gut beschreiben, was während der Aufnahme passierte.

Tagsense ist darauf angewiesen, nicht nur das Handy des Fotografen zu nutzen, sondern auch die der Fotomotive. Wenn sich die Gruppe kennt, dürfte es natürlich leichter sein, die Personen zu überreden, ihre Handys ebenfalls mit Tagsense auszurüsten und die gewonnenen Sensorinformationen zu teilen, meint Bao.

Tagsense wurde von Studenten der Duke Universität und der Universität South Carolina entwickelt und auf der Konferenz Computing Machinery International Conference on Mobile Systems, Applications and Services (Mobisys) vorgestellt. Die Experimente des Teams wurden auf acht Google Nexus One mit rund 200 Fotos vorgenommen. Die derzeitige App ist ein Prototyp - ein kommerzielles Produkt ist erst in einigen Jahren zu erwarten, teilten die Forscher mit. Die Veröffentlichung "Tagsense: A Smartphone-based Approach to Automatic Image Tagging" kann als PDF heruntergeladen werden.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de

ohne Werbung
mit ausgeschaltetem Javascript
mit RSS-Volltext-Feed

Themenseiten:

Kommentarübersicht

Würde ich gerne mal ausprobieren.

Missingno. 30. Jun 2011

Ich habe aber nur das hier gefunden: http://www.tagsense.com/

Re: Wortverschlag

Rainer Tsuphal 30. Jun 2011

Hat jemand etwas anderes behauptet?

Artikel

Startrampe Set

Lego bietet Milchstraße und Nasa-Rakete Artemis als Bausatz

Lego hat zwei neue Sets vorgestellt, die für Weltraumenthusiasten gedacht sind: das Nasa-Artemis-Startrampen-Set und das Milchstraßen-Galaxie-Set.
So geht KI-Bildverarbeitung und -Objekterkennung mit Python

Neuronale Netze sind die Grundlage moderner KI-Technologien, die das Erkennen und Klassifizieren von Bildern ermöglichen. Ein Intensiv-Workshop führt Devs in die Besonderheiten des Modelltrainings mithilfe von Python ein.
Sponsored Post von Golem Karrierewelt
Tarifrunde

Montag erneut Streiktag bei der Deutschen Telekom

Beim letzten Warnstreik bei der Telekom waren 12.500 Beschäftigte beteiligt. Diesmal wird breiter mobilisiert. Die Telekom versucht Schadensbegrenzung.

Schnäppchen, Rabatte und Top-Angebote

Die besten Deals des Tages

Daily Deals • Asus OLED-Monitor zum Tiefstpreis • Gigabyte GeForce RTX 4070 Ti im Sale • MediaMarkt: Asus Gaming-Laptop 999€ statt 1.599€ • Gamesplanet Spring Sale [Werbung]

Themen
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
#