Bug im Linux-Kernel: Keine Panik!

Wenn der frische Kernel gleich nach dem Start das System zum Absturz bringt, werden Admins nervös. Denn oft beginnt nun die langwierige Suche nach dem Bug. Ein Erfahrungsbericht.

Artikel von Martin Loschwitz veröffentlicht am
Wenn das Kernel-Update fehlschlägt - ein Erfahrungsbericht.
Wenn das Kernel-Update fehlschlägt - ein Erfahrungsbericht. (Bild: Screenshot / Hanno Böck)

Es gibt einige Gründe für Admins, ein Kernel-Update durchzuführen. Meist handelt es sich um Sicherheitsupdates, manchmal verspricht ein neuer Kernel auch aktuelle Treiber, die mehr leisten als der Vorgänger. So oder so gilt: Der Vorgang ist eine Standardprozedur, und Admins erwarten, dass alles funktioniert. Entsprechend unruhig werden sie, wenn etwas danebengeht. Wenn zum Beispiel wegen eines Fehlers einzelne - womöglich zentrale - Bauteile des Systems den Dienst verweigern.

Ist der Fehler in einem wichtigen Teil des Kernels, etwa in der Speicherverwaltung, lässt sich unter Umständen das System gezielt zum Absturz bringen. Selbst ein Fehler in einer exotischen Komponente, die nur auf wenigen Systemen aktiv ist, kann so zum Sicherheitsproblem werden: Durch sie lässt sich womöglich eine große Zahl an Systemen gezielt angreifen. Dieser Text berichtet von der Suche nach einem solchen Bug, die sich über mehrere Monate hinzog und nur durch das Zusammenspiel mehrerer Entwickler erfolgreich war.

Die Ausgangssituation

Das Setting ist schnell erklärt: Mehrere aktuelle, sehr leistungsfähige HP-Maschinen (DL380 Gen. 9) und Ubuntu 14.04 bilden die Basis. Openstack betreibt auf ihnen virtuelle Maschinen, im Hintergrund wird die verteilte Speicherlösung Quobyte eingesetzt. Sie ist auf allen beteiligten Hosts als Server wie als Client aktiv. Die Server-Komponente macht aus den einzelnen Festplatten der einzelnen Hosts einen großen, logischen Datenspeicher, der per zentraler Schnittstelle ansprechbar ist. Obendrein steuert Quobyte für die Daten des Netzwerkspeichers automatisch Redundanz bei. Per Treiber für Fuse (Filesystem in Userland) binden die Hosts das Dateisystem aus der Ferne ein. Die virtuellen Festplatten der Openstack-Systeme liegen auf jenem Fuse-Mount.

Weil die genannten HP-Server viel aktuelle Hardware nutzen, fiel schon anfangs die Wahl auf die LTS-Kernel (LTS steht für Long Term Support) von Canonical. Anders als Red Hat und SUSE bietet Canonical einen Weg, um auch auf Systemen mit Langzeit-Unterstützung aktuelle Kernels zu verwenden.

Der Deal ist simpel: Canonical portiert die Kernel der aktuellen Releases auf die jeweils letzte LTS-Version zurück. Für Ubuntu 14.04, die bei Erscheinen dieses Artikels aktuelle LTS-Version von Ubuntu, stehen etwa die Kernels von Ubuntu 14.10, 15.04 und 15.10 als LTS-Kernel zur Verfügung. Beim Erscheinen der nächsten LTS-Version von Ubuntu, also 16.04, fängt das Spiel von vorne an. Für 16.04 wird es dann die Kernel späterer Ubuntu-Versionen geben und für Ubuntu 14.04 wird wenigstens der Kernel von Ubuntu 16.04 als Backport zur Verfügung stehen. Der Support für ältere Kernel auf Ubuntu 14.04 läuft allerdings bald nach der Veröffentlichung von 16.04 aus. Wer sich für die LTS-Kernels auf Ubuntu 14.04 entscheidet, muss zumindest dann zwangsläufig ein Update einspielen.

Insgesamt erscheint die Lösung deutlich eleganter als die anderer Hersteller, die Kernel-Version auf dem Stand von vor mehreren Jahren zu belassen und den Kernel selbst mit schier unendlich vielen Patches aufzupolstern. Beim Erscheinen des LTS-Kernel 4.2 im Februar 2016 fiel die Entscheidung, auf diesen zu setzen. Denn viele Updates versprachen bessere Performance auf mehreren Ebenen des Systems.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Das Problem 
  1. 1
  2. 2
  3. 3
  4. 4
  5.  


madkiss 15. Apr 2016

Ich halte die Aussage, 4 Monate seien "zu lang", in dieser Pauschalität für irrig...

grumpfel 15. Apr 2016

Weil ich kein Freund von Benchmark bin, weil die wenig den Echtzeit Betrieb wieder...

Mr Miyagi 14. Apr 2016

Das System war nicht lange gestört... Die Problematische Software ist zeitnah...

Phreeze 13. Apr 2016

der Fehler wurde also binnen 1h repariert, und dazu schreibt man dann einen 4 Seiten...



Aktuell auf der Startseite von Golem.de
Windows
Smart-TV bringt Computer zum Absturz

Über Jahre sind bei der Sound-Designerin Priscilla Snow immer mehr Funktionen ihres PCs ausgefallen, bis er fast unbrauchbar war. Als Übeltäter hat sich ihr Hisense-Fernseher herausgestellt.

Windows: Smart-TV bringt Computer zum Absturz
Artikel
  1. Teamführung: Methodenkoffer für Engineering Manager
    Teamführung
    Methodenkoffer für Engineering Manager

    Plötzlich Führungskraft Ein Team zu führen, ist für viele neue Engineering Manager extrem herausfordernd. Mit diesen einfachen Methoden können sie ihr Team aber schnell für sich gewinnen.
    Ein Ratgebertext von Franziska Hauck

  2. Fire TV Omni QLED bei Amazon jetzt mit 330 Euro Rabatt
     
    Fire TV Omni QLED bei Amazon jetzt mit 330 Euro Rabatt

    Aktuell sind die beliebten Fire TVs bei Amazon im Sonderangebot. Der Fire TV Omni QLED mit 55 Zoll ist derzeit um 330 Euro reduziert.
    Ausgewählte Angebote des E-Commerce-Teams

  3. Elektroauto: Opel Grandland mit 700 km Reichweite vorgestellt
    Elektroauto
    Opel Grandland mit 700 km Reichweite vorgestellt

    Opel hat den neuen Grandland vorgestellt, der erstmals das neue Opel-Logo trägt und mit einem Akku für bis zu 700 km Reichweite ausgerüstet ist.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Galaxy S23 400€ günstiger • MindStar: Radeon-Grafikkarten zu Tiefstpreisen • Alternate: Asus Gaming-Laptop 899€ statt 1.599€ • Anker USB-Ladegeräte -45% • MSI MEG 342CDE OLED 999€ • Gamesplanet Spring Sale [Werbung]
    •  /