Permalink

1

Der Hawking-Index und die Wahrheit über das E-Book-Leseverhalten

Big DataNachdem der Mathematiker Jordan Ellenberg die in den USA und UK von Amazon öffentlich verfügbaren Daten über die am häufigsten markierten Textstellen in E-Books analysiert hatte, erstellte er eine Formel, anhand derer (angeblich) ermittelt werden kann, wie viel von einem Buch (resp. natürlich E-Book) eigentlich gelesen wurden. Der gläserne Leser schien Realität zu werden.
Daraus generierte er ein im Wall Street Journal veröffentlichtes Ranking. Die Bezeichnung „Hawking-Index“ für dieses Ranking entbehrt dabei wie manch anderes nicht ganz der Ironie: „Verbreiteten Vorurteilen nach soll es sich bei Hawkings „Eine kurze Geschichte der Zeit“ schließlich um eines der meistverkauften, aber schnellst-wieder-beiseite-gelegten Sachbüchern handeln.“, so Markus Pössel auf scilogs.
Wird hier als der Traum jedes Marketinganalysten und Big Data-Fetischisten wahr, verändert sich gar die „Zukunft des Kunstbetriebs“, wie Johannes Boie in der Süddeutschen menetekelt? Die publizistische Aufregung ist also erstmal groß – bleibt die Frage, welche Auswirkungen solche Analysen denn für den Literaturbetrieb tatsächlich hätten.

Beim Lesen auf die „Finger“ schauen und dessen Auswirkungen

Zunächst muss man dazusagen, dass eine echte Analyse des Leseverhaltens im Moment auf dieser Datenbasis gar nicht möglich ist. Und die Auswirkungen für den einzelnen Leser, falls es einmal ernstzunehmende Auswertungsszenarien geben sollte, werden vermutlich zunächst eher marginal sein, da die Rezeption von Inhalten zunächst und zuerst ein komplett individualistischer Akt ist.
Die Auswirkungen für den Käufer werden ebenfalls überschaubar sein: entweder ist er gleichzeitig der Leser, dann tritt obiger Absatz in Kraft. Oder er verschenkt das E-Book, dann wird er sich vermutlich auch eher an menschlichem Empfehlungsmarketing (sprich: Rezensionen etc) orientieren und eher nachrangig nach rein mathematischen Algorithmen, die Lese-Verhalten darstellen.
Die Auswirkungen für einen Verlag/Content-Produzenten wiederum werden stark von der Struktur des inhaltlichen Programms abhängen. Die Belletristik wird sich auf die beiden oberen Absätze zurückziehen können. Faktenorientierte Werke aus dem Non-Fiction-Bereich könnten mit diesen Daten endlich eine Marktforschungslücke schließen und Trends ableiten (statt nur auf das berühmte verlegerische „Bauchgefühl“ zu vertrauen). Ein Szenario, das Webseiten-Betreiber ja schon seit Jahrzehnten kennen, wenn sie einen Blick in ihre Zugriffsstatistiken werfen – und am Ende des Tages auch ihre Schlüsse daraus ziehen.*

Lese-Daten und der Untergang der westlichen Zivilisation

Ohne eine gewisse bedeutungsschwangere Weltuntergangsmetaphorik scheint man heutzutage nicht mehr auszukommen, wenn es um das Thema „Digitalisierung“ und „Kreative Schöpfung“ geht – jedenfalls nicht bei der FAZ und auch nicht bei der Süddeutschen. Für letztere schreibt der Journalist Johannes Boie mit verschwörerischem Unterton: „Nicht zuletzt in der Kultur wird dies womöglich noch viele erschüttern, denn die exakte Kenntnis darüber, wann Menschen aufhören, sich für ein Produkt zu interessieren, wird dazu führen, dass sich Produkte verändern. Der Markt dringt hocheffizient vor in die Verästelungen von Texten, in einzelne Takte von Liedern, in einzelne Szenen eines Videos.“
Dies sind zum einen Massenmarkt-Theorien und zum anderen ist dieser Umstand doch eigentlich für Autoren ideal, die ihren Beruf klar als Broterwerb sehen. Wer sich als „Kulturschaffender“ definiert hat sich aber zumeist in den letzten Jahrhunderten kaum an diesen marktfixierten Faktoren orientiert.

Big Data Small Data

Lese-Daten und Käuferprofile

Im Kontext der Anreicherung von Kundendaten, um bessere Käufer-Profile zu erhalten, mag die Sache dann schon anders aussehen. Ähnlich den Medienunternehmen, die faktenorientierte Inhalte produzieren, steht hier die Optimierung im Vordergrund. Und neben Käuferhistorie und anderen Daten wird das Lese-Verhalten des Einzelnen im Gesamtzusammenhang sicher eine Rolle spielen. Um ihm dann bestehende Produkte anzubieten. Der Rückfluss auf künstlerische Werke wird aber, wie oben erwähnt, mit Sicherheit marginal bleiben.

Der Hawking-Index und journalistische Exaktheit

Diese kleine Fußnote sei erlaubt: von journalistischer Exaktheit ist auch manch Schreiberling großer deutscher Tageszeitungen nicht immer überzeugt. Dies gilt sowohl für den Artikel in der Süddeutschen zum Thema als auch für den Artikel „Amazons Lesertracking: Das Ende einer Illusion“ in der FAZ.

Zum einen sind die in beiden Tageszeitungen gezogenen Schlüsse leicht durchschaubar auf statistisch mehr als wackligen Füßen. Darauf weist Jordan Ellenberg selbst deutlich hin: „This is not remotely scientific and is for entertainment purposes only!“. Auch der Guardian geht fast schon humoristisch darauf ein: „Oh just because it’s statistically flawed. Print readers aren’t counted, nor are Kindle-readers who don’t use the highlighting feature. And maybe writers put more appealing sentences at the beginning.“

Das ficht die beiden Autoren aber nicht weiter an, was Markus Pössel auf scilogs in Rage bringt. Zu Recht, muss man sagen. Dass Johannes Boie in der Süddeutschen dann noch von „Piketty-Index“ statt dem originalen Hawking-Index spricht wundert einen dann auch schon nicht mehr.

Und jetzt?

Zumindest im Moment lässt sich die im Titel des Beitrags suggerierte „Wahrheit“ im Moment gar nicht herstellen, dazu ist die statistische Grundlage viel zu dünn, wir reden eher über „small data“ statt „big data“. Das sieht seitens der großen Anbieter wie Amazon oder Apple (die ja über deutlich mehr und detailliertere Daten verfügen) sicher anders aus, es bleibt aber abzuwarten, inwiefern diese Daten dann direkten Einfluss auf den Inhalt haben. Große Plattformen werden primär eher Interesse daran haben, diese Daten zur Absatzförderung einzusetzen als Kulturräume nachhaltig zu beeinflussen. Oder, wie Douglas Adams einst so weise schrieb: „Don’t panic!“.

* Der Webseitenbetreiber dieses kleinen Blogs tut das schon immer und auch wenn der Autor dieser Zeilen keinen Nanopfifferling auf die künstlerische Qualität der Artikel in diesem Blog gibt: ihm ist es auch schlicht egal, was diese Statistiken aussagen, da Zugriffszahlen hier keine Relevanz haben sondern eher der qualitative Faktor. Auf gut deutsch: lieber die richtigen Leser als so viele wie möglich zu erreichen. Warum sollte es einem Schriftsteller, der für seine Inhalte vor sich hinlodert, anders gehen?

Teaserbild: biononicteaching

Großes Bild: jalbertbowdenii

Google

1 Kommentar

  1. Weise, der olle Douglas. Panik könnte man nur dann bekommen, wenn man sich ausmalt, dass Programmverantwortliche in Verlagen, die jetzt schon nur irgendwelchen Supertrends hinterherhasten, auch noch auf diese Illusionsblubberblase abfahren könnten. Die Statistiken sind schon von daher nicht ernst zu nehmen, weil man ja die Wahl hat, die Mitleserei der Anbieter auszuschalten – was viele Leser tun. Und was ist mit all den Markierungen von schrägen Rechercheuren, die sich ein Zitat nur anstreichen, weil sie es im Artikel über Tante Ernas Kohlkocherei benutzen wollen?

    Wer Bücher primär unter dem Gesichtspunkt von Massenmärkten à la RTL oder BILD betrachten möchte, dem gehört es eigentlich nicht anders, als dass hinten eines Tages nur glatte, gleichgeschaltete Langweilerei herauskommt.

    Bücher und Texte überhaupt sind doch dazu da, in all den unverdaulichen austauschbaren Brei individuelle Stimmen zu bringen, mutige und neue Stimmen, Abwechslung, Provokation, Forderndes. Gerade deshalb hatten Blogs ja solch einen Erfolg!

    Nach der Bestsellerformel suchen die Dummen seit Jahrzehnten vergebens. Die Schlauen wissen, dass man Bestseller nicht „machen“ kann und Trends und Hypes oft erst aus Texten entstehen, die gegen alle Konventionen etwas völlig Eigenes erfinden. Wie sonst hätten sich z.B. Teenievampire durchsetzen können? 😉

Schreibe einen Kommentar

Pflichtfelder sind mit * markiert.