Die 10 wichtigsten Fehler, die Ingenieuren bei der Problembehandlung unterlaufen | enterprise.netscout.com

Die 10 wichtigsten Fehler, die Ingenieuren bei der Problembehandlung unterlaufen

Es gibt einige Fallen, in die man bei der Fehlerbehebung von Netzwerk- und Anwendungsproblemen leicht gehen kann.
Dieses Whitepaper beschreibt 10 dieser Fallen und wie man sie vermeidet.

  • INHALT
  • Annahmen treffen
  • Neustart durchführen
  • Aktualisieren
  • Validieren
  • Keine Baseline
  • WLAN-Herausforderungen
  • Mangelhafte Überwachung
  • Verständnis von Kerntechnologien
  • Laptop-Grenzen
  • Fazit
 

100 % Betriebszeit? Geprüft.

10 Gbit/s zum Desktop? Anreise.

Problemloses Netzwerk und Anwendungen? Ha! Davon kann man nur träumen.

Bis wir Netzwerk-Vollkommenheit erreichen (was, wenn wir ehrlich sind, nie wirklich passieren wird), werden Ingenieure Probleme mit Netzwerksystemen und den Anwendungen haben, die sie unterstützen. Ob das Problem in langsamer Leistung, schlechter Voice-/Video-Qualität, unterbrochenen Verbindungen oder anderen Ereignissen besteht, die die Netzwerke von heute plagen, die Ingenieure sind gezwungen, ihre Problembehandlungsfähigkeiten ständig zu verbessern, um diese Geschäftseffizienz-Killer unter Kontrolle zu halten. Darüber hinaus müssen sie die häufigsten Fallstricke vermeiden, in denen sich zu viele Netzwerk-Ingenieure bei der Fehlerbehebung verfangen.

Schauen wir uns einige Beispiele an.

1. Annahmen über die zugrunde liegende Ursache eines Problems machen.

Seien wir ehrlich: Wir Menschen machen Annahmen basierend auf dem was wir meinen zu wissen. Wenn ein Problem auftritt, ist es ganz natürlich, dass wir voreilige Schlüsse ziehen, vor allem, wenn wir Zeit und Erfahrung in einer bestimmten Netzwerk-Umgebung haben. Annahmen zu machen, kann jedoch ein großer Fehler sein. Sie können zu unsinnigen Netzwerkänderungen, kostspieligen Upgrades und grundlosen „Verbesserungen“ führen – alle mit gedrückten Daumen in der Hoffnung, dass das Problem verschwindet. Dieser Fehler bei der Problembehandlung sollte unter allen Umständen vermieden werden. Stattdessen sollte man Fakten über das Problem sammeln, bevor man derartige reflexartige Entscheidungen trifft. Man muss das Warum, Wo, Was und Wie des Problems vollständig verstehen, bevor man etwas ändert. Lassen Sie sich in jeder Entscheidung von Fakten leiten.

 

2. „Diese Behebung hat schon einmal funktioniert, probieren wir es nochmal“ als Fehlerbehebung

Ähnlich wie bei Fehler Nummer eins basiert diese gemeinsame Reaktion auf Netzwerkprobleme auch auf Annahmen. Wir sind alle Opfer unserer eigenen Erfahrungen, so dass es einfach ist, sich auf unser Wissen dessen zu verlassen, was das letzte Mal funktioniert hat, in der Hoffnung, dass das Gleiche wieder eintritt. In vielen Fällen kann ein neues Problem dieselben Symptome wie ein vorhergehendes zeigen, aber die eigentliche Ursache könnte eine ganz andere sein.

Bevor etwas geändert wird, stellen Sie sicher, die Problemdomäne auf das Netzwerk, den Server, die Anwendung oder den Client zu isolieren. Identifizieren Sie definitiv die schuldige Komponente, bevor Sie die Strategie "Raten und Austauschen" versuchen. Mit Tools, die SNMP, NetFlow und Packet Capture verwenden, muss das Problem eindeutig auf eine Schicht isoliert werden, bevor man mit der Lösung beginnt.

3. Probleme durch Neustart beheben

Fast alle elektronischen Geräte, von Home-Routern bis zu 10G-Switches, müssen hin und wieder neu gestartet werden. So funktionieren die Dinge heute nun einmal. In manchen IT-Umgebungen ist jedoch das Neustarten eines Geräts zum Standard für den ersten Schritt der Fehlerbehebung geworden. Dies gilt insbesondere, wenn ein Geräte- oder Server-Neustart in der Vergangenheit funktioniert hat.

Wenn der Neustart eines Geräts ein Problem behebt, ist die Behebung vielleicht nur temporär, und in naher Zukunft kann ein weiterer Neustart nötig sein. Natürlich könnte ein Neustart nach einem Software- Update, Patch oder einer Konfigurationsänderung erforderlich werden. Jedoch wird das wiederholte Neustarten als erste Reaktion auf ein Netzwerkproblem nur die wirkliche Ursache maskieren. Vor dem Neustart eines Geräts sammeln Sie so viele Informationen wie möglich. Beispielsweise: Reagiert der Access Point weiterhin auf aktuelle Benutzer? Akzeptiert der Server neue TCP-Verbindungen? Ist die Switch-CPU 100 % ausgelastet? Diese Informationen können die Ingenieure auf die wirkliche Ursache hinlenken, statt zu einer vorübergehenden Lösung.

 

4. Probleme durch Aktualisierung beheben

Eine Aufrüstung von 1 Gbit/s auf 10 Gbit/s sollte eine 10-fache Leistungssteigerung ergeben, stimmt's?

Nein.

Nur selten ist dies der Fall. Allzu oft sind Netzwerktechniker bei Netzwerkproblemen - vor allem denjenigen mit geringer Leistung - versucht, die WAN-Bandbreite zu erhöhen, Switches oder Router aufzurüsten oder Beschleunigungs-Technologien zu implementieren. Es ist kein Geheimnis, dass keine dieser „Aufrüstungen“ kostenlos ist. In der Tat kann ein Upgrade als erste Reaktion auf ein Problem das Budget schädigen, Manager frustrieren, die Unternehmensproduktivität reduzieren und im schlimmsten Fall den Netzwerkingenieur den Job kosten (Autsch!).

Vor der Implementierung einer neuen Technologie oder der Aktualisierung eines/einer Systems/Geräts/Verbindung müssen einige wichtige Fragen beantwortet werden: Warum sind wir überzeugt, dass diese Verbesserung von Gerät oder Technologie das Problem behoben wird? Was IST das ursprüngliche Problem? Ist das Problem wirklich in Netzwerkkapazität oder Latenz verwurzelt?

Während es schön ist, neue Geräte auf dem Netzwerk zu haben, ist es nicht angenehm dem Manager ins Auge zu sehen, wenn eine teure Lösung das Problem nicht löst. Die Aktualisierung von wichtigen Systemen ist von Zeit zu Zeit gerechtfertigt, aber Vorsicht ist angebracht, wenn Sie ein Gerät als Schritt zur Problembehandlung aktualisieren.


 

5. Benutzern neue Verbindungen liefern, ohne diese zu validieren

Wir haben es alle tausendmal getan. Einen neuen Switch auspacken und konfigurieren, installieren, in das Uplink einstecken, mit dem Benutzeranschluss verbinden und das Licht blinken sehen.

Fertig, oder?

Nein. Es gibt mehrere Dinge, die sich auf die Leistung, die Benutzer erfahren, auswirken können, sobald sie eine Verbindung herstellen und an die Arbeit gehen. Verbindungsaushandlung, Kabelprobleme, Interface-Hardwareprobleme und andere Durchsatz-Killer können die Verbindung beeinträchtigen.

Bevor offiziell ein Link an einen Benutzer geliefert wird, muss es getestet und validiert werden. Dazu gehören Messen von Wartezeit und Durchsatz für jede Verbindung zurück zum Kern/Rechenzentrum. Wie wir bereits erwähnt haben, werden die meisten Techniker ein Link anschließen, auf eine Verbindungsanzeigeleuchte achten, einen Ping senden und das Link als getestet betrachten. Aber alle zuvor beschriebenen Probleme würden diese Prüfung bestehen. Nur ein kompletter Performance-Test würde die Verbindung validieren und diese Probleme aufdecken, bevor Benutzer sie erleben.

 

6. Fehler beim Erstellen einer Baseline bei normaler Netzwerkleistung

Bei der Behandlung eines Problems verwenden Techniker oft Überwachungs-Tools zum Sammeln und Interpretieren von Informationen über das Netzwerk. Obwohl diese Tools eine beeindruckende Menge an statistischen Daten anzeigen können, ist es leicht, sich in den Details zu verlieren, wenn keine „normale“ Baseline vorhanden ist.

Bevor ein Problem auftritt, sollte man sich bemühen, eine ordnungsgemäße Baseline des Netzwerks zu erstellen. Dazu gehören das Sammeln von Verkehrsauslastungs- und Latenzstatistiken über wichtige Netzwerkverbindungen, Reaktionszeitmessungen bei geschäftskritischen Anwendungen, Paketerfassungs-Proben einschließlich typischer Gespräche und Protokolle sowie eine komplette Drahtlos-Bewertung. Diese Berichte helfen den Netzwerktechnikern, wenn ein Problem auftritt, da sie wissen, was „Normal“ ist.


 

7. Mangel an Wireless-Tools und Erfahrung

Wireless kann echt lästig sein, zumal weitere Benutzergeräte das Kabel aufgeben und 100% Wi-Fi gehen. Dieser Trend hat ebenso wie die Vermehrung von Voice- und Video-Anwendungen, die diese Geräte verlangen, den Umfang und die Komplexität der drahtlosen Umgebungen stark gehoben. Auch wenn diese Systeme implementiert und von erfahrenen RF-Experten verwaltet werden, können Kunden weiterhin schlechte Performance, Netzwerk-Unterbrechungen und andere frustrierende Probleme erleben.

Da die drahtlose Umgebung leicht anfällig gegen Performance-Probleme ist, wird sie oft als erstes beschuldigt, wenn ein neues Ereignis eintritt. Viele Netzwerkingenieure zeigen mit dem Finger auf das Wi-Fi, einfach weil es ein Bereich des Netzwerks ist, den sie nicht vollständig verstehen oder weil sie nicht über die Werkzeuge verfügen, um es zu analysieren. Statt einen riesigen Netzwerk-blinden Fleck zu haben, sollten Netzwerkmanager in Tools und Training für Ingenieure investieren, damit sie mit Wireless auf den neuesten Stand kommen und die Probleme in diesem Bereich angehen können.

 

8. Mangelnde Überwachung des Netzwerks.

Probleme, mit denen Ingenieure heute zu tun haben, sind komplex, treten zeitweilig auf und können sich in den Schattenbereichen des Systems verbergen. Früher war Up/Down-Ping-Tool alles, was man zum Überwachen des Netzwerks benötigte. Dies hat sich drastisch geändert.

Das Lösen der Probleme von heute erfordert die Überwachung von Systemen, die netzwerk- und anwendungsbewusst sind, die von SNMP, NetFlow und Paketerfassung Gebrauch machen, damit nichts unversucht gelassen wird. Diese Systeme benötigen Watchdog-Anwendungen 24/7/365 um sicherzustellen, dass sporadisch auftretende Probleme auf frischer Tat erwischt werden, anstatt das Ereignis zu verpassen, wenn die Überwachung der Systeme gerade woanders hinschaut.

 

9. Mangelndes Verständnis des Betriebs von Kerntechnologien

Was haben Spanning-Tree, ARP, Autonegotiation, ICMP-Weiterleitungen und IP-Fragmentierung gemeinsam?

Sie sind alle alt (jeweils 20+ Jahre) und absolut entscheidend für den Netzbetrieb. Nun, vielleicht nicht IP-Fragmentierung in jedem Fall, aber es war die Erwähnung wert. Netzwerk-Ingenieure müssen sicherstellen, dass sie die Kerntechnologien verstehen, auf denen ihre State-of-the-Art-Systeme basieren. Bei der Vorbereitung für die nächste Anbieter-Zertifizierungsprüfung lassen Sie die Protokolle und Technologien nicht aus, die noch daran beteiligt sind, die Dinge in diesem Jahr und darüber hinaus am Laufen zu halten.


 

10. Verwendung von Laptops, um Pakete zu erfassen

Packet Capture- und Trace-Datei-Auslegung sind der Goldstandard für Deep-Dive-Detail, wenn Sie ein Problem untersuchen. Diese Analysemethode ist entscheidend für die Suche nach der Ursache des Problems, anstatt nur das Netzwerk freizusprechen und das Problem über die Mauer zu werfen.

In Sachen Paketsammlung ist ein häufiger Fehler von Netzwerkingenieuren, die Grenzen der Hardware, die sie zur Erfassung verwenden, misszuverstehen. Nehmen wir zum Beispiel Wireshark. Dieses Open-Source-Tool ist bei Ingenieuren weltweit bekannt und beliebt und ist das am häufigsten heruntergeladene Networking-Tool. Jedoch verwenden die meisten Menschen dieses Tool auf Laptops oder ungetesteter Hardware, die nicht mit Datenverkehrsströmen hoher Geschwindigkeit mithalten können. In der Tat haben die meisten Standard-Laptops Probleme, nahtlos bei Geschwindigkeiten über 100 Mbit/s zu erfassen!

Informieren Sie sich über die Grenzen der Hardware, die zum Sammeln der Pakete verwendet wird, bevor sie in der Rechenzentrum-Umgebung erfasst werden. Fehlende Pakete von Trace-Dateien können einen Ingenieur leicht in die Irre führen und die Zeit bis zur Lösung eines quälenden Problems verlängern.

 

Fazit

Dies ist keine vollständige Liste - es gibt weitere Fallstricke, in denen sich Ingenieure aller Erfahrungsstufen von Zeit zu Zeit verstricken. Mit ein wenig Vorbereitung und Bewusstsein für einige häufig auftretende Fehler können Ingenieure die Lösungszeit verkürzen, Frustration einschränken, Kosten und unnötige Ausgaben reduzieren und die Kopfschmerzen vermeiden, die mit der Behebung von Netzwerkproblemen kommen.

 
 
Powered By OneLink