Wer die Statistiken mehrerer Tracking- und Analysemethoden miteinander vergleicht, wird feststellen, dass kein Ergebnis dem anderen gleicht und sich bei größeren Websites schnell einmal unerklärliche Differenzen von vielen Tausend Sessions für ein und denselben Zeitraum ergeben. Es drängt sich die berechtigte Frage auf, ob eine Besucherstatistik überhaupt völlig korrekt sein kann. Die Antwort ist: nein. Exemplarisch soll einmal am Beispiel von Google Analytics nach möglichen Gründen für Fehler und Ungenauigkeiten gesucht werden.
1. Google Analytics schließt systemisch alle Nutzer aus der Statistik aus, die JavaScript deaktiviert haben.
Wer in seinem Browser den JavaScript-Code nicht ausführt, wird folglich nicht gezählt. Verschiedene Studien gehen davon aus, dass zwischen 6 und 12 Prozent der Nutzer ohne JavaScript browsen.
2. JavaScript-Tags werden bewusst unterdrückt, um die Erfassung und mögliche Nutzerprofil-Erstellung durch Google zu umgehen.
JavaScript-Tags wie derjenige, den Google Analytics verwendet, zielen darauf ab, Session- und Systeminformationen abzufragen. Solche Tags werden oft über Personal Firewalls ("Stealth") oder dedizierte Tools (lokal, Netzwerk) unterdrückt und der JavaScript-Code wird nicht ausgeführt. Hier gehen die Werte stark auseinander: Die Angaben zur Verwendung liegen zwischen 2 und 12 Prozent.
Es besteht Uneinigkeit darüber, inwieweit diese beiden Werte kumuliert werden können, da über Schnittmengen kaum etwas bekannt ist. Häufig deaktivieren allerdings vor allem Firmen JavaScript aus Sicherheitsgründen grundsätzlich und/oder filtern zusätzlich explizit nach Tracking-Mechanismen schon über die Firewall, die den HTML-Code säubert, und/oder zusätzlich lokal.
3. Ein weitere Problemquelle ist die Verfügbarkeit der Google-Server.
Grundsätzlich ist diese sehr hoch. Nichtsdestotrotz dürfte der Abruf einer Datei von einem dritten Server zwangsläufig zu (weiteren) Fehlern führen; insbesondere dann, wenn es sich nicht um einige wenige, sondern um tausende Abrufe (von tausenden Anwendern, die Google Analytics in ihre Websites integriert haben) handelt.
Keine aktuelle Tracking- und Analysemethode arbeitet einwandfrei. An dieser Situation wird sich höchstwahrscheinlich auch nichts ändern, im Gegenteil: Mehr Zugriffsarten führen eben zu mehr Fehlern, Pageviews für AJAX- und Flash-Applikationen lassen sich kaum ermitteln usw.
Auch die Statistiken von Google Analytics sind und bleiben somit (wenn auch relevante) Trends, die immer der Interpretation bedürfen. Über verifizierbare Nutzerdaten für seine Website – soviel steht fest – verfügt niemand. Wie bei allen Statistiken bleiben Längsschnitte, etwa Trends im Vorjahresvergleich, die einzig relevante Messgröße. Querschnitte, das "Hier und Heute", sind und bleiben mit Vorsicht zu genießende Annäherungen.
Mehr über die Creative-Commons-Lizenz erfahren
Wenn man genaue Resultate will, sollte man mit einem anderen Webtrack-Programm arbeiten. GA zeigt deutlich weniger Besucher an.
Nicht nur Firewalls sind ein Problem mit JS: https://addons.mozilla.org/de/firefox/addon/722
Wenn man relevante und valide Daten haben möchte, sollte man vielleicht nicht mit kostenfreien Tools arbeiten, die noch nicht einmal den europäischen oder deutschen Datenschutz einhalten, sondern mit Tools und Anbietern, die auf europäischer Ebene durch die führenden Zertifizierungs-Institute wie ABC Electronic, OJD oder KIA akkreditiert sind.
Ich bin nur einer von tausenden dummen usern, die nicht wirklich mitbekommen wie ihr surfverhalten analysiert und in datenbanken gesammelt wird.
Ich kann nur sagen, wie dermaßen angenervt ich von diesen webdiensten wie google-analytics bin. Zum einen sind die Datenschutzrichtlinien bei GA so dermaßen schwammig, daß ich versuche jeder Seite auszuweichen, die damit verlinkt ist.
Zum anderen habe ich festgestellt, daß sich der Seitenaufbau dadurch erheblich verlangsamt.
Außerdem:
“1. Google Analytics schließt systemisch alle Nutzer aus der Statistik aus, die JavaScript deaktiviert haben.”
“2. JavaScript-Tags werden bewusst unterdrückt, um die Erfassung und mögliche Nutzerprofil-Erstellung durch Google zu umgehen.”
Und sicherlich sind das mittlerweile mehr als 12% der Internetuser.
Wenn die Betreiber kommerzieller Webseiten so darauf brennen ihre Webpräsens zu optimieren, können sie die Webseitenbesucher direkt fragen (Kritik/Anregungen…).
Sie würden schnell feststellen, daß die meisten Besucher von animierten Bildern und dauerlächelnden Clon-Gesichtern die Nase voll haben.
Denn eigentlich geht es ihnen doch wirklich nur darum Nutzerprofile anzulegen (Amazon,etc.).
Vielen Dank für diese durchaus kritischen Anregungen. Wie kommen Sie darauf, dass 12% der User Java-Script deaktiviert haben. Diese Zahl zu messen, ist meines Wissens sehr komplex und schwierig. Eine fundierte Messung wäre hier wirklich hilfreich. Ich freue mich auf einen Hinweis.
Nicht alle Anbieter sind in Tracking- und Profil-Erstellungsmethoden verliebt. Und es finden sich auch zahlreiche Nutzer, die die Vorschläge und die Profilerstellung bei Amazon gut finden und begrüßen.
Den Hinweis für die 12% hat Gerrit Eicker (siehe oben) gegeben und bezieht sich dabei auf folgenden link:
http://www.w3schools.com/browsers/browsers_stats.asp
Die Statistik bezieht sich allerdings nur auf die Jahre 2000 bis 2008. Wie man eine solche Statistik erstellt, ist mir als Laie schleierhaft.
@”Und es finden sich auch zahlreiche Nutzer, die die Vorschläge und die Profilerstellung bei Amazon gut finden und begrüßen.”
Das mag ja sein. Ich denke nur, daß die meisten User keine Ahnung haben, daß diese Daten über Jahre hinweg bei Amazon gespeichert werden und es auch keine Möglichkeit gibt als registrierter Amazon-Nutzer entsprechende Daten zu löschen oder sich dem zu verweigern.
Interessant wäre mal eine Umfrage zu diesem Thema…
JavaScript Statistics: There are no absolute trends about the use of JavaScript. Some users have scripting turned off. Some browsers don’t support scripting.
Und für 2008 wird ein Wert von 5% ausgegeben, der das angeblich deaktiviert hat. Zumindest mal etwas …
Die Messung ist zum Beispiel über den -HTML-Tag möglich. Die Ergebnisinterpretation ist durchaus herausfordernd, weshalb es zu sehr unterschiedlichen Angaben über die Verfügbarkeit von JavaScript kommt.
Regelmäßig wird vom Einzelnen auch nicht pauschal für alle Seiten deaktiviert, was zu weiteren Mess- respektive: Vergleichsproblemen zwischen Websites führt. So erlaubt etwa ein sehr beliebtes PlugIn für Firefox (fast 60 Millionen Downloads) das Ausführen “nur bei vertauenswürdigen Domains”. Wahrscheinlicher: dort, wo der Einzelne nicht auf Funktionalität verzichten möchte.