Piwik Web-Analytics ohne IP-Speicherung

5. März 2010

Melde gehorsamst: Das auf blog.gerozahn.de seit geraumer Zeit eingesetzte “Piwik – Open source web analytics” speichert seit heute die IP-Adressen meiner Besucher nur noch anonymisiert – und auch alle bisher gespeicherten IPs wurden nachträglich ebenfalls erfolgreich verkürzt.

Wer die qualifizierte Fachpresse (nein, nicht Computer-Bild, vielleicht eher c’t) verfolgt, der weiß wie “Iieh-bah-bah” es in heutiger Zeit ist, IP-Adressen zu sammeln. Klar – teilweise kann man als Benutzer eines zentral administrierten Hostings-Pakets oder eines Managed Servers beim Provider seines Vertrauens gar nicht anders, denn die IPs wandern dort ja in der Regel brav in die Access Logs. Aber angesichts der heuer neu hochkochenden Diskussion hat auch dort bereits hier und da ein Umdenken eingesetzt, und einige Provider anonymisieren die Zugriffe bereits – d.h. packen keine vollständigen IP-Adressen mehr in die Logs.

Zur Erinnerung: Alles hängt ab von der Frage, ob IP-Adressen personenbezogene Daten sind oder nicht, in letzterem Fall also lediglich umständlich personenbeziehbare Daten.

Die aktuelle Rechtssprechung deutet in erstere Richtung, d.h. sie seien personenbezogen – was vor allem bei festen IPs in Universitäten oder anderen Einrichtungen absolut nicht wegzudiskutieren ist. Bei täglich wechselnden dynamischen IPs beim DSL-Connect kann man darüber streiten, ob “personenbezogen” schon gegeben ist, wenn man im Ernstfall erst den Zugangsprovider zur Nennung des jeweiligen IP-Inhabers zu gegebener Zeit überreden muss. Nichtsdestoweniger: Die Gerichte entscheiden momentan vermehrt derart, dass IPs in jedem Fall personenbezogene Daten sind. Punkt, aus – damit müssen wir nun leben.

Wer als Betreiber einer Website nun Web Analytics betreibt, also Tracker-Code in die Webseite einbettet, um mehr über seine Besucher herauszubekommen (beispielsweise so etwas Lapidares wie Browserversion und Bildschirmgröße, gern aber auch Tiefergehendes wie Nationalität, Einstiegsseite, Verweildauer, angeklickte Links, Zugriffstrail und hassenichgesehn), der kommt dadurch allzu leicht in Teufels Küche. Vor allem, wenn er dazu Google Analytics einsetzt.

Denn Google Analytics speichert IPs nicht nur – nein, diese werden sogar “außer Landes” geschafft – und zwar in die USA, die vor dem EU-Recht datenschutzrechtlich als Schurkenstaat angesehen werden müssen. Googles “Don’t be evil” hin oder her – aber dieses gebetsmühlenartig vorgetragene Mantra hilft einem mit Hinweis auf das Bundesdatenschutzgesetz (BDSG) abgemahnten deutschen Website-Betreiber leider herzlich wenig.

Erste Idee: Verabschieden wir uns doch von Google Analytics und installieren wir ein Analyse-Tool direkt auf dem eigenen Server. Das Mittel der Wahl, weil nicht nur kostenlos, sondern sogar OpenSource, ist hier ausdrücklich oben genanntes Piwik. Das ist zwar nicht ganz so schlau wie Google Analytics – aber hochentwickelt genug für die meisten drängenden Fragen, was an der eigenen Website “Hot” oder “not” ist – und vor allem, wieso. Dummerweise sammelt Piwik ebenfalls IPs – und macht in der Basiskonfiguration auch keinerlei Anstalten, diese entweder zu löschen oder zumindest zu anonymisieren.

Als brauchbare IP-Anonymisierung ist akzeptabel, wenn aus der üblichen 111.222.333.444 die hinteren beiden Nummernblöche gestrichen werden. Aus dem resultierenden 111.222.0.0 lässt sich weiterhin der Zugangsprovider und die grobe geographische Herkunft des Besuchers ermitteln. Und mit der Browserkonfiguration plus gesetztem Tracking-Cookie lassen sich wiederkehrende Besucher trotzdem hinreichend gut wiedererkennen.

Genau dieser Idee hat sich Martin Gamnitzer verschrieben. Er hat ein erschreckend simples Piwik-Plugin entwickelt, das justament o.a. IP-Verkürzung realisiert. Dem Vernehmen nach wird das Plugin in erweiterter Form sogar im Lieferumfang der kommenden Piwik-Version 0.55 enthalten sein.

Wer wie ich auf dieser Website (und von Berufs wegen auch bei einem Sack voll anderer Portale) noch die aktuelle Piwik-Version 0.54 verwendet, geht wie folgt vor:

  1. Plugin herunterladen
  2. Ins Plugin-Verzeichnis ./piwik/plugins auspacken
  3. Im Piwik-Backend aktivieren
  4. Fertig

Oder nicht?

Das ist leider nur die halbe Miete. Korrekt: Alle neuen Besucher werden ab sofort nur noch mit verkürzter und damit wirksam anonymisierter IP geloggt.

Dummerweise hilft das rein gar nichts gegen die bereits in der Datenbank befindlichen Logs. Denn bis zur Aktivierung des Plugins hat Piwik ja munter IPs gesammelt – und denkt auch gar nicht daran, diese nachträglich zu anonymisieren.

Wer Zugriff auf seine Datenbank hat, z.B. per phpMyAdmin, sollte also unbedingt die gesammelten IPs nachträglich anonymisieren. Da die IPs freundlicherweise nicht in der ASCII-Schreibweise mit den Punkten, sondern vielmehr als Vier-Byte-BIGINT-Ganzzahl gespeichert sind, hilft eine einzige MySQL-Anweisung (dabei ggf. das Prefix “piwik_” an die eigene Installation anpassen):

UPDATE piwik_log_visit
SET location_ip=(location_ip >> 16 << 16)
WHERE 1

Denn “>> 16″ verschiebt die beiden höhersignifikanten Bytes nach rechts und schneidet dabei die beiden niedrigersignifikanten Bytes ab. Aus “111.222.333.444″ wird also “0.0.111.222″.

“<< 16″ zieht anschließend die beiden nun niedrigersignifikanten Bytes wieder an ihre ursprüngliche Stelle und zieht 16 blitzeblanke Null-Bits nach. Aus “0.0.111.222″ wird folglich “111.222.0.0″.

Fertig, abputzen!

Bookmark and Share

iPad als persönlicher Computer für “Silver Surfer”

4. Februar 2010

Allem Medien-Hype und der Frage “Ist das iPad der ‘Stein der Weisen’ unter den Tablet-Computern oder nicht” zum Trotz stelle ich folgende These auf: Das iPad könnte sich für Gelegenheits-Internetbenutzer und die so genannten “Silver Surfer” der Benutzergruppe 50+ zum echten PC – zum “persönlichen Computer” entwickeln.

Personen wie meine 70-jährige Mutter, die in ihrem Leben noch kein computergestütztes Gerät bedient hat, das komplexer war als ein Satellitenreceiver, werden wir sicher niemals zur Computerbenutzung bekommen. Aber stellen wir uns die technikinteressierten, aber gleichzeitig technikverängstigten Frauen und Männer der Ü50-Fraktion vor: Einige von ihnen würden vielleicht sehr gerne am Internet teilnehmen. Primär geht es dabei sicher um E-Mail-Kontakt zu Kindern, Verwandten und Bekannten. Aber darüber hinaus eben eventuell auch um Online-Shopping, Nachblättern im Seitenangebot der Stadtverwaltung, und gegebenenfalls sogar ein bisschen Facebook, Twitter & Konsorten.

Was sollen wir computeraffinen “Jungschen” (wenn ich mich als “FaVi” mal frech ebenfalls hier einsortieren darf) solchen Leuten an die Hand geben? Idee: Einen normalen Computer von der Stange.
Dafür müsste als erstes der Schreibtisch (sofern die “Zielperson” einen solchen hat) umgekrempelt werden: Da müssen Steckdosen her, und Platz für Monitor, Tastatur und Maus. Klar könnte das ein preiswerter Aldi-PC sein, aber dann fängt die ganze Geschichte mit Softwareverwaltung, Benutzerrechten, Mailclients, Add-ons, System-Updates, Virenscanner und hast-du-nicht-gesehen gerade erst an. Natürlich, alternativ könnte das auch ein Mac sein, der dem Vernehmen nach ja vor allem für Computer-Neulinge etwas intuitiver bedienbar sein soll. Aber ich als Grenzgänger zwischen den Mac- und Windows-Welten sage: Im Grunde genommen gibt sich das nichts. Mit dem Kauf ist es nicht getan: Für uns “helfende Hände” ist das ein lebenslanger “Du, mein Computer zeigt auf einmal sowas komisches an”-Frondienst.
Darüber hinaus liegt die Herausforderung darin, dem zukünftigen Benutzer zuerst einmal die Maus-Feinmotorik beizubringen, und nicht zu vergessen die Grundlagen der elektronischen Datenverarbeitung: Wenn man einen Computer unvermittelt in einem Moment abschaltet, in dem der getippte Text noch nicht gespeichert ist, ist letzterer unwiederbringlich weg – und eventuell sogar das System beschädigt. Für uns ist das das Normalste der Welt – für jemanden, der einen halben Bogen Schreibmaschinenpapier vollgetippt hat, ein mitunter schwer zu vermittelndes Bedienparadigma.

Stellen wir uns aber einen potenziellen Ü50-Internetteilnehmer vor, dem wir ein iPad auf den Wohnzimmertisch legen. Das Gerät ist äußerlich wie innerlich schick, schnurlos, ultraportabel – und erfordert keinerlei Umräumaktion. Die Akkulaufzeit ist recht brauchbar, das Ladekabel oder -dock schnell an beliebiger Stelle installiert. Die vorinstallierten Anwendungen sind hinreichend leistungsfähig und für uns “Hilfs-Administratoren” in Windeseile vorkonfiguriert – und funktionieren hinterher im wahrsten Sinne des Wortes auf Fingerzeig. “Papa, wenn Du hier drauf tippst, siehst Du sofort, ob Du eine neue E-Mail von mir bekommen hast. Und wenn Du dann hier drauf tippst, kannst Du direkt darauf antworten. Und wenn Du Tante Lieschen eine E-Mail schicken willst, dann tippst Du erst hier und tippst dann nur auf ‘L’, dann übernimmt das Gerät die vollständige Adresse aus dem Adressbuch.”

Mit diesen drei Sätzen ist der Löwenanteil der E-Mail-Kommunikation eigentlich bereits erklärt. Auch das Surfen im Internet ist “dank” nicht nachinstallierbarer Plugins und ActiveX-Komponenten zwar limitiert (Flash fehlt in der Tat ungemein) – aber ein sehr überschaubares, minimales Risiko. Wenn man Vati später also per E-Mail einen Internet-Link schickt, mit dem Hinweis, einfach mal draufzutippen – klar, dann öffnet sich Safari und präsentiert die geschickte Seite in ganzer Pracht. Safari zumachen, zurück zur E-Mail – und die ist immer noch genau da, wo man sie hinterlassen hat. Merke: Ordentlich programmierte Anwendungen bedürfen keines Multitaskings.

Lange Rede, kurzer Sinn: Für einen “Silver Surfer” hat ein iPod touch genügend Funktionen, ist aber viel zu knibbelig klein. Ein ausgewachsenes iPad dagegen, das mit exakt denselben Funktionen aufwartet, stellt ein Gerät dar, das auch für absolute Neulinge, egal welchen Alters, einen intuitiv bedienbaren, haptisch erlebbaren und in weiten Strecken vollkommen frustfreien Einstieg ins Internet ermöglicht. Und den weitergehend Interessierten installiert man dann eben noch die entspechenden Apps für Facebook, Twitter & Co., konfiguriert diese mit entsprechenden Benutzerdaten vor – und schon treibt sich manch ein Senior “wie ein Junger” im Internet und sogar im Web 2.0 herum.

Aus meiner Sicht wird das iPad daher der persönlichste Computer, den man sich aus heutiger Sicht nur vorstellen kann.

Bookmark and Share

Flash auf iPhone, iPod touch und iPad? Sicher niemals.

31. Januar 2010

Was für ein Chaos, das durch Apples zusammengeschustertes iPad Promo-Video angerichtet wurde, das ein Flash-Element anzeigte, das das iPad gar nicht anzeigen kann – Apple ruderte zurück und ersetzte den Flash-Content durch den ungeliebten blauen Lego-Stein.

Und so sehr ich ja schon sagte, dass die fehlende Flash-Unterstützung für mich eines der größten Ärgernisse an den „i-Berühr-mein-Display”-Geräten ist: Es wird in meinen Augen nie, niemals passieren.

Schweigen wir darüber, dass Flash-Applikationen (allen voran Flash-Spiele) rein GUI-seitig Probleme bekommen könnten – vor allem dann, wenn Objekte im Rahmen der Benutzerführung nicht nur angeklickt, sondern verschoben oder auch nur berührt werden sollen. Eine Mauszeiger-basierte Navigation ist schwierig auf das Benutzerinterface des iPhone OS zu transportieren. – Wer erinnert sich nicht mit Grausen an „The Secret of Monkey Island: Special Edition“ für das iPhone, bei dem tatsächlich ein Mauszeiger eingeblendet wurde … der aber nicht etwa auf die Fingerpostion reagierte, sondern mit Fingerbewegungen an beliebiger Stelle des Displays herumgeschoben wurde. So sollte man es nicht machen.

Insofern steht zu vermuten, dass die Portierung eines Flash-Players für iPhone OS Umdenken und/oder Kompromisse hinsichtlich dr Bedienungs-Paradigmen erfordert. Andererseits möchte ich ebenfalls schwer annehmen, dass Adobe stehenden Fußes ein komplettes Team abkommandieren würde, um einen Flash Player für iPhone OS zu realisieren. Adobe würde dies sicher auch in kürzester Zeit mindestens zum benutzbaren Beta-Stadium peitschen. Wenn – ja, wenn Apple sie nur ließe.

Fakt: Es gibt weder Java noch Flash für das iPhone – keine Umgebung, in der sich ohne Kontrolle von Apple quasi beliebiger Code auf dem Handheld ausführen ließe. Wir erinnern uns auch noch daran, dass der C64-Emulator für iPhone OS wieder aus dem App Store entfernt wurde, da die Benutzer dort beliebigen BASIC-Code eingeben und ausführen konnten. Unter dieser Voraussetzung ist es höchst erstaunlich, dass der Safari für iPhone OS überhaupt JavaScript unterstützt.

Würde Apple Flash freigeben, verlöre es App Store Kunden – und Entwickler. So lange jedes App, egal ob Spiel, Anwendung oder Fun-Programm, Apples Segen braucht, um in den App Store zu kommen, wird es weder Flash noch Java für das iPhone, den iPod touch oder das iPad geben. Das ist ausdrücklich nicht einer technischen Begrenzung der Handhelds geschuldet, sondern eine felsenfeste produktpolitische Entscheidung. Punkt, aus.

Leute, verabschiedet Euch von dem Gedanken, das iPad könnte in ferner Zukunft irgendwann Flash unterstützen. Ain’t gonna happen.

Bookmark and Share