Hält man im Web nach Informationen über Reichweiten von Websites Ausschau, wird man schnell fündig und stößt auf Übersichten, die auf Daten des Dienstes Alexa, einer Amazon-Tochter, basieren.
Das Alexa-Konzept ist schnell erklärt: Der Dienst zählt die Besucher jeder Website und ermittelt aus diesen Daten und mithilfe von Hochrechnungen ein Ranking nach Reichweite. Die Website, die am meisten Traffic generiert, kommt auf den ersten Platz, hat also den Alexa-Rank 1. Im Drei-Monats-Rhythmus wird aus diesen Daten eine Liste der reichweitenstärksten 100.000 Websites im Netz generiert.
Sehen wir uns zunächst einmal die aktuellen Alexa-Top-40 an. Auf den ersten Blick entspricht die Liste den Erwartungen: Google.com, Facebook.com und YouTube.com landen auf dem Siegerpodest, illustre Domains wie z.B. Yahoo.com oder Wikipedia.org rangieren auf vorderen Plätzen, die guten Positionen von Baidu und Yandex zeigen, wer in China und in Russland suchmaschinentechnisch das Sagen hat, etc.
Abb.: Ausriss aus dem Alexa-Ranking (Stand Januar 2010)
Doch einige Namen würde man unter den Top-40 der Welt vielleicht nicht unbedingt erwarten: Auf Platz 7 ist die Domain Blogger.com aufgeführt, auf Rang 18 (und noch vor Amazon.com) die Domain WordPress.com. RapidShare.com landet auf Platz 26 und damit nur zwei Ränge hinter eBay. An 32. Stelle und einen Platz vor Flickr.com entdecken wir eine ominöse Domain namens FC2.com.
Seltsam ist das schon und regt einige Fragen an: Blogger.com unter den besten Zehn? Interessieren sich also doch weitaus mehr Leute für Weblogs und dafür, aktiv zu bloggen, als es uns repräsentative Studien zur Web-2.0-Nutzung weismachen wollen? WordPress ist ohne jeden Zweifel eine phantastische Software für den Betrieb professioneller Blogs, doch sollte sich das so weit herumgesprochen haben, dass die entsprechende Website Amazon.com die Schau stiehlt? Beim File-Hoster RapidShare sind die Internet-Nutzer dieser Welt fast ebenso gerne wie auf Schnäppchensuche bei eBay? Und wer oder was ist FC2.com?
Wir könnten die Liste weiter durchgehen und würden auf weitere etwas verwunderliche Beispiele stoßen. Wo sind also die Haken?
Datenerhebung nur von Alexa-Toolbar-Nutzern
Da Alexa freilich nicht auf die Log-Dateien sämtlicher Server zugreifen kann, wird ein Umweg genommen: Damit ein Besuch auf einer Website gezählt wird, muss der Nutzer die Alexa-Toolbar (oder ein anderes Tool bzw. Plugin, das den Alexa-Rank von Websites anzeigt) im Browser installiert haben. Diese User senden automatisch Nutzungsdaten an Alexa, auf deren Basis das Ranking dann berechnet wird. Echten Traffic kann also Alexa nicht messen.
Und wer hat die Alexa-Toolbar installiert? Leider sind konkrete Zahlen Mangelware. Offenbar ist Alexa im englischsprachigen Raum und auch in Teilen Asiens deutlich bekannter als in Deutschland, aber es ist wohl nicht unrealistisch, zumindest hierzulande von Werten im Promille-Bereich auszugehen, was die Verbreitung in der Web-Gemeinde angeht.
(Erschwerend kommt hinzu, dass die Alexa-Toolbar unter Sicherheitsaspekten wahrlich nicht unumstritten ist: Offenbar stufen mehrere weit verbreitete Sicherheits-Programme die Toolbar als Spyware ein und behandeln sie auch als solche, was der ohnehin schon sehr geringen Akzeptanz kaum zuträglich sein dürfte.)
Die dramatische Beschränkung auf Toolbar-Nutzer hat Alexa immer wieder Kritik eingebracht und erhebliche Zweifel an der Validität des Rankings geweckt. Inzwischen hat Alexa den Ranking-Algorithmus einigen Überarbeitungen unterzogen und erfasst nach eigenen Angaben nun auch „data obtained from other, diverse traffic data sources“. Um welche Quellen es sich dabei handeln soll, wird jedoch leider verschwiegen. Man geht davon aus, dass die mittels Toolbar erhobenen Daten nach wie vor die wesentliche Grundlage für den Alexa-Rank bilden.
Daten sind nicht repräsentativ
Nun würden sicherlich Daten, die von 0,1% aller Web-Nutzer erhoben werden, vollkommen ausreichen, um ein repräsentatives Bild zu schaffen – wenn diese Nutzer die gesamte Web-Gemeinde auch tatsächlich repräsentieren würden. Davon kann jedoch keine Rede sein.
Es liegt in der Natur der Sache, dass sich vor allem Technologie-affine Anwender für Informationen wie das Alexa-Ranking interessieren. Dementsprechend dürfte die Toolbar unter erfahrenen Anwendern und Web-Experten prozentual deutlich weiter verbreitet sein als unter Gelegenheits- bzw. Durchschnitts-Surfern. Man wird davon ausgehen können, dass das Gros der Gelegenheitsnutzer Alexa gar nicht kennt – geschweige denn nutzt. Die Alexa-Toolbar wird also nicht nur von einer sehr kleinen User-Gruppe verwendet, sondern darüber hinaus von einer nicht repräsentativen.
Vor diesem Hintergrund lassen sich die oben angeführten Beispiele bereits erklären: Blogger.com, WordPress.com oder RapidShare.com sind allesamt Websites, die sich an versierte, Technologie-affine Kreise richten, in denen die Verbreitung der Alexa-Toolbar aller Wahrscheinlichkeit nach überdurchschnittlich hoch ist.
Auf der anderen Seite müssen unter diesem Ungleichgewicht Web-Angebote leiden, die kein Publikum mit großer Expertise ansprechen. Jenseits der Mega-Websites wie Google & Co. ist die Gleichung klar: Keine Technologie-Inhalte im weiteren Sinne, keine Besucher mit installierter Alexa-Toolbar, kein guter Alexa-Rank. Hinter der tatsächlichen Aussagekraft des Alexa-Rankings muss also ein dickes Fragezeichen stehen, besser noch setzt man das Wort „Aussagekraft“ gleich in Anführungszeichen.
Der Alexa-Rank ist manipulierbar
Das Alexa-Ranking ist eine Spielwiese für SEO-Cracks und Marketing-Leute, die auf höhere Werbe- und Affiliate-Erlöse durch gute Einstufungen spekulieren. Und die geringe Anzahl von Usern, von denen Nutzungsdaten erhoben werden, öffnet der Manipulierbarkeit des Rankings Tür und Tor.
So helfen offensichtlich schon eigene Besuche auf der eigenen Website, um den Alexa-Rank signifikant zu verbessern: Allein die Tatsache, so ein Blogger, der Optimierungsvorschläge gesammelt hat, dass man selbst über ein Alexa-taugliches Tool verfügt, würde innerhalb eines Zeitraums von wenigen Wochen den Alexa-Rank auf etwa Platz 150.000 oder besser ansteigen lassen, sofern man der eigenen Website tägliche Besuche abstattet.
Gut, das ist ebenso legitim wie die Bitte an Freunde und Kollegen, mittels Toolbar regelmäßig die betreffende Website ansteuern. Doch einschlägige Blogs und Foren sind prall gefüllt mit Tipps zur ernsthaften Manipulation, beispielsweise mithilfe von in die Website eingebundenen JavaScripts, die unzählige eindeutige Besucher mit Alexa-Toolbar simulieren.
Und anders als Google, das unlautere SEO-Maßnahmen rigoros sanktioniert, scheinen bei Alexa solche Aktivitäten folgenlos zu bleiben. Könnte damit vielleicht auch die Frage beantwortet sein, wie eine Website wie FC2.com unter die Top-40 der angeblich reichweitenstärksten Websites der Welt gelangen konnte? Wer weiß.
Was taugt das Alexa-Ranking nun?
Trotz aller Kritik wird gerne angeführt, dass das Alexa-Ranking sich immerhin dazu eignen würde, eine Website mit thematisch ähnlichen Konkurrenzseiten zu vergleichen. Doch wie beschrieben ist auch das mit Vorsicht zu genießen: Bei Websites ohne technischen Hintergrund werden wahrscheinlich kaum genügend Daten generiert, die wirklich einen Vergleich zulassen, eine Handvoll Klicks hat bereits signifikante Auswirkungen, die Manipulierbarkeit ist nachgewiesen.
Der KI-Wissenschaftler Peter Norvig, seines Zeichens Direktor der Forschungsabteilung von Google, hat schon vor Jahren anhand exemplarischer Beispiele gezeigt, dass sich das Alexa-Ranking von den tatsächlichen Reichweiten teilweise um den Faktor 50 unterscheidet und bezeichnet dieses Instrument als klassischen Fall von „Garbage in, Garbage out“.
Zurückhaltend ausgedrückt sind die Alexa-Daten alles andere als Referenzwerte. Weniger diplomatisch formuliert taugt das Alexa-Ranking allenfalls zum Längenvergleich unter SEO-Freaks und ist das Alexa-Widget, auf das man hier und da stößt und das den aktuellen Alexa-Rank der Website darstellt, ein ziemlich wertloses „Aushängeschild“.
Mehr über die Creative-Commons-Lizenz erfahren
Es ist schon seit längerem bekannt das der Alexa Rank leicht manipulierbar ist. Er kann und konnte noch nie eindeutige Positionen darstellen. Seit einiger Zeit beobachte ich immer wieder das in ebay Webseiten mit einem hohen Alexa Rank verkauft werden. Der Alexa Rank soll somit die “Top” Besucherzahlen und Traffic darstellen. Leider fehltt es den meisten Webmastern an know-how um diese Betrügerei zu erkennen.
Ja, ja. Die Trauben sind ja eh sooo sauer. 😉
Auch wenn die Besucherzahlen nicht wirklich repräsentativ ermittelt werden, dürften blogger.com und wordpress.com Ihre gute Position vor allem denjenigen Blackhat-SEOs zu verdanken haben, die per automatisierter Software dort Blogs gleich in Tausenderpaketen aufbauen. Spammig ohne Ende und meist auch nicht mit besonders langer Haltbarkeitszeit, aber sicherlich trotzdem gut für den ein oder anderen Besucher. Und dass Rapidshare weit vorne ist verwundert mich nun wieder überhaupt nicht, wenn man bedenkt, welche Art von Inhalten dort bevorzugt gehostet wird.
Für mich sind die für ein Freischwimmerzeugnis erforderlichen Werte weitaus seriöser und nachvollziehbarer als diejenigen, die dem sogenannten Alexa-Ranking zugrunde liegen. Und so lange ALEXA es nicht schafft, das Manipulieren dieser Werte durch sogenannte “Booster” zu unterbinden, lohnt es sich überhaupt nicht, sich mit diesem Thema weiter zu beschäftigen. Dann könnte man diese Werte auch gleich aus dem Kaffeesatz lesen… Absolut unseriös!
Ich selbst nutze Alexa gerne zum Vergleichen und zur Recherche für aktuelle und zukünftige Projekte. Meiner Meinung nach ist die Manipulation aktuell nicht mehr so einfach wie vielleicht noch vor ein paar Jahren.
Hallo @Marco,
die massive Werbung zu manchen solcher “Booster” verspricht immer noch das Gegenteil. Solche manipulierten – teilweise sogar anonymisierten – Zugriffe lassen sich eigentlich sehr leicht erkennen. ALEXA selbst könnte dem also einen Riegel vorschieben, indem man solche Zugriffe komplett nicht mehr erfaßt und dies auch öffentlich kommuniziert. Damit könnte man auch den zahlreichen – fast ausnahmslos unseriösen – “Werte”-Ermittlern das Handwerk legen. Hinzu kommt aber, daß ALEXA nach wie vor zur Ermittlung der Ranking-Daten ausschließlich Traffic-Daten zugrunde legt, die von Nutzern erzeugt werden, welche das ALEXA-Tool in ihren Browser implementiert haben. Und nicht nur ich habe erhebliche Zweifel, ob dieser Personenkreis – besonders in Deutschland – als “repräsentativ” angesehen werden kann. Ich habe mir bereits mehrfach die Mühe gemacht, die ALEXA-Daten mit denen meiner Server-Logfiles zu vergleichen und dabei festgestellt, daß die ALEXA-Werte – bezogen auf die Gesamtzahl meiner Nutzer – vollkommen unrealistisch sind !!!
Viele sehen das Alexa-Ranking als totalen Quatsch an, andere sehen die Zahlen als Richtungsweisend. Die Meinungen gehen auseinander. Ich denke jeder sollte selber entscheiden ob man was vom Alexa-Ranking hält oder nicht ist.
Die Meinungen gehen auseinander. Ich denke jeder sollte selber entscheiden.Ich selbst nutze Alexa gerne zum Vergleichen.
Alexa ist nicht so schlecht, Danke für Tipps.
Alexa muß sein…ohne ist langweilig..
Meinst du ohne Alexa funktioniert nicht.
219,142 ist der Alexa-Rank dieser Seite. Für mich ein völlig unwichtiger Wert bei der Suchmaschinenoptimierung. Aber jeder so wie er mag.
Gute Einschätzung der Wertigkeit des Alexa-Ranks. Manipulierbare Rankings sind sinnlos