Platzhalter

 
Platzhalter PlatzhalterPlatzhalter

Wie aussagekräftig sind Logfiles?

Platzhalter
 
  Startseite
  eBook-Projekt
  Web-Lexikon
  Bücher bestellen
   
  Design-Theorie
  Design-Praxis
  Promotion
  HTML/XML-Praxis
  Projekt-Management
  Webmaster-Praxis
  Fragen & Antworten
  Technik-Ecke
   
  Portal/Links
  Buch-Rezensionen
  Software
  Impressum
PlatzhalterPlatzhalter







 

Platzhalter Die Logfile-Analyse, so heißt es oft, ist essenziell bei der Analyse des Besucherverhaltens. Dagegen lässt sich nichts sagen: schließlich sind die Logfiles objektive Protokolle, die festhalten, was von den Surfern an Ihren Server geschickt wurde.

Was dagegen oft verschwiegen wird: so unverzichtbar Logfiles auch sind, mit den Ergebnissen von Logfile-Analysen und daraus folgenden Interpretationen sollte man zunächst einmal vorsichtig umgehen. Denn: die in Logfiles gespeicherten Daten sind selbst nicht immer korrekt bzw. vollständig, und auch den Programmen können Fehler bei der Datenanalyse unterlaufen. Nicht zuletzt ist da auch noch der Faktor Mensch, der aus den Ergebnissen Schlüsse ziehen muss.

Fehler/Ungenauigkeiten in Logfiles selbst


Man kann davon ausgehen, dass all das, was direkt vom Server ins Logfile geschrieben wird, auch korrekt ist: Datum und Zeit eines Abrufs, abgerufenes Objekt, übertragene Datenmenge etc.

Kritisch wird es dagegen bei den Bereichen, die vom Browser geschickt werden: der User-Agent-Bereich und der Referrer.

User-Agent


User-Agent-Angaben zum Beispiel lassen sich leicht fälschen. Sie denken, das tut keiner? Irrtum: Alternative Browser z.B. geben sich schon mal gerne als Internet Explorer aus, um Probleme zu vermeiden. Gleiches gilt für automatisierte Saug-Programme, die alle Unterseiten Ihrer Homepage auf einmal herunterladen. Und wenn dann ungünstige Bedingungen zusammentreffen, können daraus ziemlich ärgerliche Konsequenzen entstehen. Stellen Sie sich beispielsweise das Szenario vor, dass Ihre Site sehr häufig komplett heruntergeladen wird und dass sich die meisten dieser Saug-Programme als Netscape 4.x ausgeben. Ihre Logfile-Analyse wird Sie dann zum Schluss führen, dass sehr viele Ihrer Besucher alte Browser verwenden, und Sie werden als Reaktion darauf mehr - unnötige? - Zeit auf die Optimierung Ihrer Seitendarstellung verwenden.

Referrer


Noch schöner wird's beim Referrer, der ja die zuletzt besuchte Seite angibt. Theoretisch lässt sich so ermitteln, welche Sites freundlicherweise einen Link auf die eigene Seite gesetzt haben. Auch die Effizienz von Linktausch-Programmen lässt sich so abschätzen.

Jedoch: die Übertragung des Referrers kann von spezieller Software abgeblockt werden. Manche Anwender machen davon regen Gebrauch. Auch die Verwendung seltsamer Navigationsmethoden (z.B. bestimmte Java-Menüs) kann dazu führen, dass der Referrer nicht übermittelt wird.

Und die Moral von der Geschicht': der Referrer sagt uns zwar, wer uns linkt, wer uns nicht linkt, das sagt er aber nicht.

Caching


Caching macht alles nur noch schlimmer: dadurch kann es passieren, dass Surfer zwar Ihre Seite sehen, aber trotzdem keine Spuren in Ihren Logfiles hinterlassen. Zumindest sind die Effekte hier nicht so negativ: schlimmstenfalls glauben Sie, Sie hätten weniger Besucher als das wirklich der Fall ist. Und das ist doch immerhin besser als umgekehrt...

Analyse-Meister


Auch perfekte Logfiles würden noch längst nicht zur perfekten Analyse führen, denn dazu müssten die dafür verantwortlichen Programme erst einmal perfekt arbeiten.

Da sind zum einen natürlich die kaum vermeidbaren Bugs, die Programm-Fehler. Sie können jederzeit und unerwartet auftreten und zu völlig falschen Resultaten führen. Bei Software, die schon länger verfügbar ist, sind solch gravierende Fehler aber kaum zu erwarten. Klammern wir sie daher aus unseren Überlegungen aus.

Interessant ist dann beispielsweise, wie Ihr Analyseprogramm einen "Visit" definiert. Oft wird davon ausgegangen, dass ein Visit alle Seitenabrufe von einer IP-Adresse innerhalb von 30 Minuten umfasst. Damit ist schon klar, dass die Zahl der Visits etwas ganz anderes ist als die der tatsächlichen unterschiedlichen Benutzer. Und was ist, wenn diese Visit-Definition auf Sie überhaupt nicht zutrifft?

Ein anderer Bereich ist die Erkennung von Browsern und Suchmaschinen-Spidern. Manche Programme (z.B. WebSuxess 4) definieren jeden Browser, den sie nicht kennen, als "Unbekannt". Nur woher soll der Anwender wissen, dass sein Programm den IE 6 nicht kennt? Regelmäßige Updates sind also Pflicht. Ähnliches gilt für Suchmaschinen-Spider: richtig wäre, die von Spidern verursachten Seitenabrufe zumindest irgendwo von den Gesamt-Seitenabrufen abzuziehen. Kann Ihr Programm das bzw. tut es das? Je nachdem verändert das den Kontext, in dem die Analyse-Ergebnisse interpretiert werden müssen, massiv.

Der Faktor Mensch


Und zum Schluss bleibt noch der Mensch, der immer auch falschen Schlüsse ziehen kann. Seien Sie sich der Fehlbarkeit Ihrer Logfile-Analyse immer bewusst, und versuchen Sie, dort gewonnene Erkenntnisse mit Umfragen zu bekräftigen. Auf der Basis solch doppelter Bestätigung lohnen sich tiefgreifende Veränderungen und Umstellungen schon viel eher.

Autor: Alexander Dilthey | Erstmalig veröffentlicht: 02.01.2003 | Einen Artikel schreiben?

 

Neue Artikel

Rezension: Entwurfsmuster von Kopf bis Fuß
Rezension: Webdesign mit CSS
AJAX - XML und JavaScript in Schönheit vereint?
Rich Email - Flash im Newsletter
Screen Reader Usability
Comment Spam und CAPTCHAs
Logfile-Analyse selbst gemacht - ein Perl-Beispiel

Partnerprogramm




Kommentar

Ist die Freiheit der Informationsgesellschaft in Gefahr?
Derzeit leben wir in einer relativ freien Welt. Doch sind derzeit Tendenzen erkennbar, die Freiheit des Individuums den Interessen der Großindustrie zu opfern. Ein Kommentar.

Druckversion
Sie wollen diese Seite ausdrucken? Dafür haben wir eine spezielle Druckversion ohne grafische Elemente entwickelt!



Einführung in CSS bei HTMLWorld.