„Twilight-Detektor“ sagt Erfolg von Vampir-Romanen voraus

Wer einen Vampir-Bestseller landen will, muss schreiben wie Stephenie Meyer. Soviel ist klar. Doch wie macht man das, bzw. lässt sich die stilistische Nähe zum Original eigentlich zuverlässig messen? Drei britische Wissenschaftler wollten es wissen – sie entwickelten eine Methode, um „Semantik, Geschwindigkeit und Rhythmus einer Erzählung via Data Mining zu visualisieren“. (Joseph Reddington, Fionn Murtagh, Douglas Cowie: Computational Properties of Fiction Writing and Collaborative Work) Ein wichtiger Indikator ist dabei die Häufigkeit und Verteilung von Strukturwörtern, die in fast jedem Satz vorkommen.

Ausprobiert haben Joseph Reddington und seine Kollegen das Analyse-Konzept mit einem Sample aus mehr oder weniger populären Vampir-Romanen, inklusive Stephenie Meyers Twilight-Serie, den Vampire-Chronicles von Anne Rice, Charlaine Harris‘ Romanvorlage für die TV-Serie „True Blood“ und nicht zuletzt auch Carpe Jugulum, einem Scheibenwelt-Roman von Terry Pratchett, in dem ebenfalls untote Blutsauger auftauchen.

Reddington zufolge hat die überaus erfolgreiche Twilight-Serie einen messbar konstanten Erzählrhythmus – von dem sich sowohl die Texte von Pratchett wie auch Rice deutlich unterscheiden. Die Romane von Charlaine Harris dagegen schienen einen „erstaunlich ähnlichen Stil“ zu besitzen: „Somit ist es kein Wunder, dass gerade sie auch als Film- und Fernsehfassung populär geworden sind“. Allerdings betont der Forscher auch: stilistische Ähnlichkeiten würden nichts über den Plot aussagen, der sich durchaus unterscheiden kann.

Interessant wäre es natürlich, den „Twilight-Detektor“ mal auf Fan-Fiction anzuwenden – wie nah kommen die Amateure dem Original tatsächlich? Über den literarischen Erfolg entscheiden am Ende natürlich immer die Leser, doch ein spezielles Analyse-Tool dürfte sicherlich hilfreich dabei sein, ihren Erwartungen besser zu entsprechen. Auch das kollaborative Schreiben von Serien dürfte von der Stil-Analyse profitieren – bisher half Big Data hier vor allem durch Rückschlüsse aus dem messbaren E-Leseverhalten des Massenpublikums.

Abb.: Flickr/virginsuicide photography (cc)