freie Alternative zu Google Analytics – Piwik als WordPress Plugin nutzen

Manche Webseitenbetreiber wollen etwas mehr über die Besucher erfahren: Welcher Browser und welches Betriebssystem wurden benutzt? Wie lange war der Besucher auf der Seite? Welche Suchmaschinen wurden mit welchen Suchbegriffen benutzt? usw. usf.
Eine Analyse bedeutet für den Betreiber eine Seite die Möglichkeit, Verbesserungen vorzunehmen, bestimmte Häufigkeiten von Suchbegriffen zu erkennen, interessante Artikel zu finden und die Verweildauer zu erhöhen. Also böte sich hier eine Webanalysesoftware an, die dem Seitenbetreiber diese Erkenntnisse erbringt.
Datenschutztechnisch stellt das, zumindest in Deutschland, einige Probleme auf, sofern eine Analyse z.B. mit einem externen Dienst wie Google Analytics ohne Anonymisierung der IP durchgeführt wird.
Würde keine IP-Adressen-Anonymisierung durchgeführt, so müsste der Benutzer einen eindeutigen Hinweis auf der Webseite finden und quasi vor der ersten Nutzung/ Betrachtung der Seite davon in Kenntnis gesetzt werden und dieser Weitergabe explizit zustimmen. Diese Weitergabe der IP Adresse ohne Einwilligung des Betroffenen an einen Dritten würde dem deutschen Telemediengesetz widersprechen und gegen dieses verstoßen, siehe hierzu auch das TMG (Telemediengesetz) § 12 Abs. 1:

(1) Der Diensteanbieter darf personenbezogene Daten zur Bereitstellung von Telemedien nur erheben und verwenden, soweit dieses Gesetz oder eine andere Rechtsvorschrift, die sich ausdrücklich auf Telemedien bezieht, es erlaubt oder der Nutzer eingewilligt hat.

Eine personenbezogene (und hierzu wird eine IP Adresse gezählt) Weitergabe dieser Daten darf nicht ohne Einwilligung der betroffenen Person (des Besuchers) erfolgen. Natürlich wirft sich die Frage auf, inwiefern eine IP Adresse aus einem DSL Pool eines DSL Anbieters personenbezogen ist. Sind es nicht eher die Daten, die ein Nutzer sowieso und in viel genauerer Form von sich preis gibt? Sind es nicht die Cookies, die JavaScripts, die Flash Plugins usw. die die Daten preis geben? Mal ganz davon abgesehen, dass eine Unmenge an Leuten sowieso schon sehr unbedacht mit ihren Daten umgehen und ihre Mails durch GoogleMail laufen lassen? Steht dort nicht im Kleingedruckten, dass Google diese eMails auch analysieren darf?
Wie dem auch sei:
Wird die IP Adresse des Besuchers zur Auswertung an den Google Analytics Dienst (und diese stehen in den USA) als Dritten weitergegeben, so kann der Betreiber einer Seite in Schwierigkeiten geraden. Es sei denn, dass der Betreiber zum Beispiel die Nutzerdaten anonymisiert, also die IP Adresse so abändert, dass hier keine eindeutige Zuordnung stattfinden kann. Google Analytics kann seit Sommer 2010 mit einer Funktion erweitert werden, der _anonymizeIp() Funktion. Diese Funktion löscht aus jeder IP Adresse die letzten 8Bit und macht somit eine eindeutige Zuordnung des Besuchers (über die IP Adresse) unmöglich.
Google hat durch Nutzung von Analytics natürlich noch einen nicht ganz unerheblichen weiteren Vorteil: Durch die sowieso schon in vielen Fällen genutzten Dienste von Google werden immer mehr und immer genauere Benutzerdaten gesammelt, gespeichert und lassen sich auswerten. Das Google-Cookie im Browser verrät sowieso schon an Google ein paar interessante Details und machen den Nutzer gegenüber Google transparent und wiedererkennbar.
Und sicherlich vermutlich werden diese aus den vielen Diensten (GoogleMail, Picasa, Google Suche, Analytics, MyGoogle Account usw.) angesammelten Daten bei Google auch zu weiteren, noch viel interessanteren Verknüpfungen verwand. Man stelle sich nur einmal die Profile vor, die Google hiermit erhalten kann. Quasi ohne viel Aufwand kann eine Datenspur eines Besuchers nachvollzogen werden. Verschiedene Seiten liefern Daten an Google Analytics, dort lässt sich eindeutig eine Verkettung verschiedener Seitenbesuche, genutzter Suchbegriffe, Verweildauer, verschickter und empfangener eMails usw. erstellen. Ein Traum. Und viele Menschen machen mit. Durch immer intensivere und mitunter leichtfärtige Nutzung von GoogleMail, der Google Suchemaschine, MyGoogle Accounts, Google Analytics usw. usf. kommen immer mehr Daten zusammen…

Ob das so gut ist?
Sicherlich ist die Auswertung interessant und für viele Seitenbetreiber unerlässlich. Je genauer die Daten erhoben werden können desto genauer lassen sich zum Beispiel Werbebanner platzieren, Seiten können entpsrechend angepasst oder personalisiert werden. Willkommen in der gläsernen Welt.

Eine kostenfreie und vermutlich ähnlich gute Alternative stellt Piwik dar. Piwik ist auch ein Trackingtool, welches für die Analyse der Besucheraktivitäten eingesetzt werden kann. Allerdings gibt es einen kleinen Vorteil: Dieses Tool nutzt keine externen Dienste wie Google zur Datenspeicherung und Auswertung sondern bietet alles „auf dem eigenen Server“ an. Damit werden keine personenbezogenen Daten (die IP Adresse des Besuchers) an Dritte (also Google) übermittelt. Der Seitenbetreiber ist damit schon einmal rechtlich besser positioniert. Zusätzlich kann Piwik mit einem Plugin (AnonymizeIP) versehen werden, welches die IP Adressen anonymisiert. Es lassen sich damit keine personenbezogenen Daten zur Auswertung heranziehen.

Anforderungen an Piwik
Piwik selbst ist relativ anspruchslos. Schon ein normaler Webspace mit PHP, einer MySQL Datenbank usw. sollte in fast allen Fällen ausreichen, um Piwik zu installieren. Diese Anforderungen sollten bei den meisten Hostern ohne große Probleme erfüllt sein.

Installation von Piwik
Piwik selber ist derzeit in der Version 1.0 in einem rund 4,5 MB großen Paket herunterladbar. Dieses muss entpackt und per FTP Client oder sonstiger Datenübertragungssoftware auf den Webspace hochkopiert werden. Danach kann ein Zugriff über den Installationspfad erfolgen, die webbasierte Installation ist in wenigen Schritten durch und benötigt nur wenige Eingaben (Daten zum Zugriff auf die Datenbank, Benutzername und Passwort (möglichst kryptisch!) f. den Piwik Login).
Eine gute Installationsanleitung findet sich unter http://piwik.org/docs/installation/.
Nach der erfolgreichen Installation kann man sich in das „Dashboard“ mit dem vergebenen Benutzernamen und Passwort einloggen. Eine Übersichtsseite begrüßt einen mit ein paar Widgets, die eine Schnellübersicht über die letzten Besucher, Suchbegriffe usw. bietet. Diese Widgets sind anpassbar und erweiterbar. Somit kann diese Dashboardübersicht nach eigenem Wunsch angepasst, erweiter und sortiert werden.
Nach der Installation werden noch keinerlei Daten erfasst werden können. Alle Besucherzähler sind auf Null. Erst durch die Integration der von Piwik vorgegebenen Codezeilen in eine Datei, die immer aufgerufen wird, wird dieses realisiert. Ein erster Schritt zum Testen wäre zum Beispiel das Einfügen dieser Zeilen in die Startseite (meist index.php). Danach wird bei jedem Aufruf der index.php Piwik mit Daten versorgt.
Problem hierbei: Die index.php wird häufig nur als „Einstiegspunkt“ genutzt und danach kaum mehr genutzt. Es würde damit zwar jeder Aufruf der Startseite, jedoch keiner der weiteren Seiten ausgewertet werden können. Wenn man seine Webseite mit ein paar weiteren Dateien aufgebaut haben, die z.B. bei jedem Seitenaufruf geladen werden, so kann dort der Code eingebaut werden.

Piwik Plugin in WordPress integrieren
Das sehr weit verbreitete WordPress (Blogsoftware) ist durch eine Vielzahl an Plugins erweiterbar. Das Plugin WP-Piwik lässt sich über die Plugin-Seite von WordPress einfach finden und installieren. Nach der Installation des Plugins befindet sich in der Footer Datei des genutzten Themes
die nötigen Zeilen Code, welche Piwik ansteuern. Diese Zeilen können natürlich auch händisch eingefügt werden. Hierzu muss der bei der Piwik Installation bereitgestellte Code-Schnipsel in dem genutzten Theme eingebaut werden, möglichst in einer Zeile, die bei jedem Seitenaufruf aufgerufen wird. Also z.B. in der Datei footer.php im Installationspfad ~/wp-content/themes/ThemeName/. Darin eingesetzt wird bei jedem Aufruf der Datei das JavaScript aufgerufen und Piwik mit Informationen versorgt.

Piwik für’s iPhone
Im App Store gibt es die Piwik App. Diese bietet einem Zugriff auf die wichtigsten Infos wie Anzahl der Besucher, Browser und Betriebssysteme, Auflösungen, Suchbegriffe und noch ein paar mehr. Es sind nicht alle Infos vorhanden und die Bedienung ist in einigen Teilen noch nicht zu hundert Prozent durchdacht, reicht aber für einen kurzen und schnellen Überblick vollkommen aus. Nebenbei lassen sich hier weitere Piwik Installationen einrichten, so dass man seine verschiedenen Domains übersichtlich in einer Liste aufgeführt hat und diese beim Start der App auswählen kann.

Was kann man grundsätzlich zum Datenschutz gegen Google Analytics, Piwik & Co. tun?
Schön für die Seitenbetreiber sind natürlich die Analysewerkzeuge, machen sie doch den Betrachter (s)einer Seite transparenter und auswertbar. Umgekehrt hat man als Besucher einer Seite immer das Problem, dass viele Daten übertragen und ausgewertet werden. Will man das? Will man nicht eher sparsam mit seinen Informationen haushalten?
Der erste Schritt wäre zum Beispiel ein Plugin in seinem Browser zu installieren, welches Tracker-Tools unterbindet. Eines dieser Tools wäre das Ghostery Plugin für Mozilla Firefox. Dieses kann einfach über die Plugin-Suche gefunden und installiert werden. Danach werden bei einem Besuch von Webseiten die gefundenen Tracker angezeigt und lassen sich unterbinden. Andere Tools sind ebenfalls auffindbar und bieten auch Schutz gegen Flash-Langzeitcookies (LSO). Einfach mal suchen und ein paar dieser Plugins installieren. Schaden kann es jedenfalls nicht…
Eine andere Variante ist die Filterung von Zugriffen zu bekannten Analyse-Domainnamen. Dieses kann auf unterschiedliche Art und Weise geschehen. Die von mir erläuterte Variante eines Werbe- und Trackingserver filternden Proxy-Servers ist vermutlich schön, aber nicht für alle nutzbar. Häufig scheitert die Nutzung eines Proxy-Servers wie Squid an fehlender Hardware (ein Rechner, der den Dienst bereitstellt) oder den dazugehörigen Kenntnissen. Damit bliebe noch die Variante des „DNS Umbiegens“. Bekannte Domains werden in der eigenen Host-Datei (oder, wer hat im eigenen DNS Server) umgebogen und zeigen nicht mehr auf den eigentlichen Host sondern z.B. auf localhost. In der hosts Datei (unter Linux unter /etc/hosts) kann nun nach und nach jeweils ein Eintrag für bekannte Domainnamen gemacht werden. Die Anfragen zu diesen Hostnamen laufen damit ins Leere. Problem hierbei: Hat man einen Rechner, mag das noch praktikabel sein. Aber bei zwei oder mehr wird das schon nervig. Ebenfalls fallen Smartphones & Co. raus, da hier keine Änderungen vorgenommen werden können. Hierfür bliebe dann nur die Variante von Proxy-Servern (sofern vorhanden/ nutzbar) oder der Installation von Plugins.

Grundsätzlich sollte man sich ein wenig mehr Gedanken über seine Daten machen. Allein schon die ganzen Zählpixel (1×1 Pixel große „Dateien“ auf Webseiten), Analysetools usw. sind schon bei einigen Webseiten in einer solch hohen Anzahl vorzufinden, dass man sich hier fragt, was sonst noch alles beleuchtet wird. Und nein, bei diesen Seiten handelt sich sich nicht um irgendwelche Dubiosen Seiten sondern um bekannte Seiten großer Verlage, Nachrichtendienste und Informationsanbieter…….


Links:
Piwik Installationsanleitung http://piwik.org/docs/installation/
Blogsoftware WordPress
WP Plugin http://www.braekling.de/wp-piwik-wpmu-piwik-wordpress/
Piwik-Plugin-Seite von WordPress http://wordpress.org/extend/plugins/wp-piwik/
Mozilla Plugin BetterPrivacy https://addons.mozilla.org/de/firefox/addon/6623/
Mozilla Plugin NoScript https://addons.mozilla.org/de/firefox/addon/722/
Mozilla Plugin Ghostery https://addons.mozilla.org/de/firefox/addon/9609/

Dieser Beitrag wurde unter Allgemeines, Dokus und Tipps, Technikspielkram abgelegt und mit , , , , , , , , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert