PixelNN: Mit Machine Learning unscharfe Bilder erkennbar machen

PixelNN kann unscharfe oder unvollständige Bilder rekonstruieren. Der Algorithmus sei dabei präziser als ähnliche Projekte. Die Entwickler nutzen ein neuronales Netz, um bereits jetzt relativ genaue Ergebnisse zu liefern.

Artikel veröffentlicht am ,
Aus wenig Informationen erstellt PixelNN erkennbare Bilder.
Aus wenig Informationen erstellt PixelNN erkennbare Bilder. (Bild: Carnegie Mellon University)

Drei Forscher an der Carnegie Mellon University im US-Bundesstaat Pennsylvania haben einen Bilderkennungsalgorithmus entwickelt, der aus verpixelten, verwaschenen oder unvollständigen Aufnahmen ein klares Bild rekonstruiert. Die Forscher Aayush Bansal, Yaser Sheikh und Deva Ramanan stellen das Projekt PixelNN auf einer entsprechenden Seite vor.

  • PixelNN errechnet Bilder schrittweise aus unscharfen Quellen. (Bild: cs.cmu.edu/~aayushb)
  • PixelNN errechnet Bilder schrittweise aus unscharfen Quellen. (Bild: cs.cmu.edu/~aayushb)
  • Der Algorithmus fürgt weitere Pixel hinzu. (Bild: cs.cmu.edu/~aayushb)
  • Auch Gegenstände werden berechnet.  (Bild: cs.cmu.edu/~aayushb)
  • PixelNN vergleicht sich mit Pix-to-Pix. (Bild: cs.cmu.edu/~aayushb)
  • PixelNN kann verschiedene Quelldaten verarbeiten. (Bild: cs.cmu.edu/~aayushb)
PixelNN vergleicht sich mit Pix-to-Pix. (Bild: cs.cmu.edu/~aayushb)

Der Machine-Learning-Algorithmus nutzt ein Convolutional Neural Network (CNN), um Quellmotive schrittweise zu filtern und schließlich in mehrere mögliche Ausgaben zu wandeln. Das Modell verwendet einen Nearest-Neighbor-Ansatz, um zu Ergebnissen zu kommen. Bei diesem berechnet der Algorithmus Wahrscheinlichkeiten anhand der benachbarten Knoten - in diesem Fall Bildpixel. Danach springt das Programm zum nächstgelegenen Knoten und wiederholt den Vorgang rekursiv.

Software, die ähnliche Ergebnisse erreichen soll, gibt es bereits. Laut den Entwicklern seien jedoch zwei Punkte bei Alternativen nicht gegeben: Zum einen kann PixelNN viele verschiedene Ergebnisse gleichzeitig ausgeben. Das sei bei anderen Algorithmen - etwa Pix-to-Pix - nicht der Fall. Zum anderen seien Ergebnisse anderer Algorithmen nicht interpretierbar.

Unschärfemasken in Google Street View rückgängig machen

Bisher funktioniert PixelNN auf Motiven wie Katzen, Hunden, menschlichen Gesichtern und einigen Modestücken. Das Team zeigt Schuhe und Handtaschen. Bilder können aus mehreren Szenarien rekonstruiert werden. Die Quelle kann einfach nur unscharf oder niedrigpixelig sein oder nur die Konturen zeigen. Auch generelle Bildfehler und fehlende Informationen sollen rekonstruiert werden können.

  • PixelNN errechnet Bilder schrittweise aus unscharfen Quellen. (Bild: cs.cmu.edu/~aayushb)
  • PixelNN errechnet Bilder schrittweise aus unscharfen Quellen. (Bild: cs.cmu.edu/~aayushb)
  • Der Algorithmus fürgt weitere Pixel hinzu. (Bild: cs.cmu.edu/~aayushb)
  • Auch Gegenstände werden berechnet.  (Bild: cs.cmu.edu/~aayushb)
  • PixelNN vergleicht sich mit Pix-to-Pix. (Bild: cs.cmu.edu/~aayushb)
  • PixelNN kann verschiedene Quelldaten verarbeiten. (Bild: cs.cmu.edu/~aayushb)
Auch Gegenstände werden berechnet. (Bild: cs.cmu.edu/~aayushb)

In Beispielen zeigt das Entwicklerteam auch erste Ergebnisse des Algorithmus, die dem Originalbild relativ ähnlich sehen. PixelNN könnte dadurch eventuell Material von Videokameras oder fehlerhafte Fotos verbessern. Aber auch gewollte Unschärfemasken könnten in der Theorie so entfernt werden. Eine solche Technik nutzt etwa Google Street View, um die Identitäten von Passanten zu schützen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Intel Core i9-14900KS
Intel ist wahnsinnig geworden - zum Glück!

Um den Core i9-14900KS zur schnellsten Allround-CPU zu machen, hat Intel den Weg der Vernunft scheinbar vollständig verlassen. Doch dahinter stecken gute Neuigkeiten für Intel-Kunden.
Ein IMHO von Martin Böckmann

Intel Core i9-14900KS: Intel ist wahnsinnig geworden - zum Glück!
Artikel
  1. Streaming: Twitch verbietet Popos als Leinwand
    Streaming
    Twitch verbietet Popos als Leinwand

    Auf Hinterteile projizierte Streams sind auf Twitch künftig verboten: Der zu Amazon gehörende Dienst geht gegen einen absurden Trend vor.

  2. FTX-Gründer: Sam Bankman-Fried zu 25 Jahren Haft verurteilt
    FTX-Gründer
    Sam Bankman-Fried zu 25 Jahren Haft verurteilt

    Der Richter betonte die Dreistigkeit der Handlungen von Bankman-Fried. Doch die Haftstrafe für den früheren Chef der Kryptobörse FTX liegt weit unter der Forderung der Anklage.

  3. Truth Social: Warum Trumps kleines Netzwerk Milliarden wert wurde
    Truth Social
    Warum Trumps kleines Netzwerk Milliarden wert wurde

    Donald Trumps verlustbringender Twitter-X-Klon Truth Social wird nach seinem Börsengang mit 9 Milliarden US-Dollar bewertet. Es ist eine Spekulationsblase - und eine Investition in eine potenzielle Trump-Präsidentschaft.
    Ein Bericht von Achim Sawall

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Palit 4070 Super 579,95€ • Xbox-Controller ab 39,99€ • AVM Fritzbox + Repeater -30% • DVDs & Blu-rays -31% • EA -75% • Ubisoft -50% • MindStar: AMD Ryzen 9 7900 339€, MSI RTX 4080 Super Ventus 3X OC 1.099€ • Gratis-Zugaben PS5 Slim & Nintendo Switch OLED beim TV-Kauf [Werbung]
    •  /