anleitungen:troubleshooting

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
Nächste ÜberarbeitungBeide Seiten der Revision
anleitungen:troubleshooting [13.08.2019 - 09:08] Wilhelmanleitungen:troubleshooting [22.10.2019 - 08:55] Wilhelm
Zeile 4: Zeile 4:
  
  
 +==== Für die Kommandozeile ====
 +
 +  * 25 Befehle für Anfänger in Linux [[https://www.pcsuggest.com/basic-linux-commands/|anfänger]]
 +  * wavemon - WLAN-Monitoring [[https://github.com/uoaerg/wavemon|wavemon]]
 +  * glances - System-Monitoring [[https://nicolargo.github.io/glances/|glances]]
 +  * atop - System-Monitoring [[https://github.com/Atoptool/atop|atop]]
 +  * bmon - Netzwerk-Monitoring [[https://github.com/tgraf/bmon|bmon]]
 +  * nethogs - Bandbreite pro Prozess [[https://github.com/raboof/nethogs|nethogs]]
 +  * speedtest - Bandbreitenmessung [[https://github.com/sivel/speedtest-cli|speedtest-cli]]
 +  * wget - Download [[http://www.gtkdb.de/index_7_451.html|wget-befehle]]
  
 ===== Knoten in Betrieb nehmen ===== ===== Knoten in Betrieb nehmen =====
Zeile 25: Zeile 35:
   * Routen zu anderen Segmenten sind nicht möglich? Überprüfen, ob die Präfix-Länge limitiert ist. "sysctl -a | grep accept_ra_rt_info_max_plen" (>=64?)   * Routen zu anderen Segmenten sind nicht möglich? Überprüfen, ob die Präfix-Länge limitiert ist. "sysctl -a | grep accept_ra_rt_info_max_plen" (>=64?)
  
 +
 +===== Bandbreite und Latenz =====
 +
 +Ein Einblick was die Geschwindigkeit beeinflusst und vielleicht auch was eher nicht.
 +
 +Die Geschwindigkeit von TCP hängt von der Bandbreite, von der Latenz und der Verbindungsqualität (Paketverlust) ab.
 +
 +== A) Die Latenz steigt mit jedem Punkt auf dem Weg zum Ziel ==
 +  - Nummerierter Listenpunkt Client - Node 
 +    * Hier via WLAN
 +    * rtt min/avg/max/mdev = 1.233/2.834/23.875/2.692 ms,
 +  - Node - Node (Mesh, eventuell viele Hops)
 +    * Hier bei zwei Nodes über 100 Pakete:
 +    * round-trip min/avg/max = 1.680/4.135/29.468 ms
 +  - Node VPN - GW
 +     - Lokaler Internetanschluss
 +        * Hier Vodafone, VDSL, 30ms bis zur Gegenstelle
 +     - Internetprovider Backbone
 +        * Hier Vodafone, 7ms bis zum nächsten Provider
 +     - Transfer zum Gatewayprovider
 +        * Sind wohl direkt verbunden, peeren in Düsseldorf, 0ms
 +     - Gateway Rechenzentrum
 +        * gw05n03, steht irgendwo bei Düsseldorf, 1ms
 +  - GW - Ziel
 +     - Gateway Rechenzentrum
 +        * Lokal, 0ms
 +     - Transfer zum Zielprovider
 +        * Frankfurt, wohl DECIX, 5ms
 +     - Zielprovider Rechenzentrum
 +        * heise.de, stehl wohl am DECIX, 0ms extra
 +
 +Meine Erfahrung sagt Glasfaser direkt bringen:
 +    * Stuttgart-München: 8ms
 +    * Stuttgart-Karlsruhe: 4ms
 +
 +Wenn ich hier die Spielekiste an mache, dann sagt mir mein System, direkt,ohne Freifunk, 55ms zu den battle.net-Servern. Das ist die in der Applikation angezeigte Latenz. Die ist normalerweise schlechter als 'ICMP echo'. Auch das muss bei Vergleichen berücksichtiogt werden.
 +Die großen Teile der Latenz sind 
 +  * der lokale Internetzugang
 +  * der Weg vom GW zum Ziel, abhängig vom Ziel, Content Delivery Networks sind potentiell immer nah am GW, egal wo das steht.
 +Relativ irrelevant ist der Weg zum GW. gw08n01 ist von mir 7ms weiter
 +weg als bei gw05n03. Der Ping durch das Freifunk-Netz zu eu.battle.net ist
 +aber nur <6ms langsamer.
 +
 +via gw08n01:
 +  * round-trip min/avg/max = 42.433/45.260/70.966 ms
 +  * lokal direkt ohne Freifunk:
 +     * rtt min/avg/max/mdev = 34.735/39.851/127.069/15.251 ms
 +
 +== B) Bandbreite im Freifunknetz ==
 +
 +Diese resultiert aus der kleinsten Bandbreite aller beteiligten Hops zum Ziel. 
 +
 +Normalerweise ist die geringste Bandbreite der lokale Internetzugang oder die WLAN/Mesh-on-WLAN-Strecke. Da muss jeder lokal selbst nach einer Optimierung suchen. Bekannte Methoden sind z.B. Mesh-on-LAN und getrennte Client/Mesh-Netzeauf unterschiedlichen Kanälen
 +
 +== C) Packet Loss == 
 +Wenn TCP Pakete verliert, wird meistens mit einer Reduzierung der Bandbreite reagiert. Paketverlust tritt in Deutschland im festen Internet heute nur sehr wenig auf, in WLAN-Netzen aufgrund von Störungen aber doch recht häufig. Hier kann der Client und der Serverbetreiber eventuell durch lokale Einstellungen die Auswirkungen lindern. Die Serverbereiber werden wir kaum erreichen, die Clients sind die User selbst.
 +
 +Zentral können wir nur an A drehen und auch da nur am Standort der GWs. Die sollten so nah wie möglich an den Clients (Internetprovider) und an den Zielen liegen. Die Ziele sind uns nicht bekannt. Die Provider selbst recht gut angebunden. Wir können natürlich pauschal GWs ablehnen, die nicht an großen deutschen Austauschpunkten sind, aber selbst nach Paris sind es nur 7ms mehr, ich glaube nicht dass das den Durchsatz erhöht. Selbst eine Verbindung nach Shanghai (250ms Latenz) schafft anständige Bandbreiten wenn die Leitung nicht gerade überlastet ist.
 +
 +Die größten Einsparungen an der Latenz bringen lokale, direkt ausleitende GWs an Leitungen die nicht DSL-Latenzen bringen. Aber auch das wird kaum
 +eine Auswirkung auf die Bandbreite haben. Dicke Internetanbindungen und gut aufgesetze WLAN-Installationen bringen da bis zur Kapazitätsgrenze der GWs sicher am meisten. Letzere lassen sich mit lokalen Ausleitungen umgehen, dafür gibt es aber noch keine einfache Möglichkeit.
 +
 +Wenn die Bandbreite zum User trotz sauberer lokaler Installation mit ausreichend starkem VPN-Node noch gering ist, kann es auch an einem ausgelasteten GW liegen. Das läßt sich unter https://netinfo.freifunk-stuttgart.de/grafana/d/000000008/gateways?orgId=1 an der Abwesenheit von Kurven beim eth0-Traffic erkennen. Wenn das
 +morgens hoch geht und dann den Tag über eher flach ist, am Abend wieder runter geht, dann ist das GW ausgelastet. Prinzipiell haben wir ausreichend Kapazitäten auf den GWs, aber wir haben derzeit keine Möglichkeit Nodes auf andere GWs zu schicken um die verfügbare Bandbreite besser zu verteilen. Das Gateway wird derzeit bei der Verbindung von den Nodes zufällig gewählt.
 +
 +Stand: Mo 21. Okt 10:23:04 CEST 2019
  
 ==== Weitere Probleme ===== ==== Weitere Probleme =====
  • anleitungen/troubleshooting.txt
  • Zuletzt geändert: vor 4 Tagen
  • von Wilhelm