W słynnych dziełach literackich widać multifraktale i kaskady świadomości

21 stycznia 2016

EurekAlert!: [http://www.eurekalert.org/pub_releases/2016-01/thni-twg012116.php]

Multifraktalność dzieł literackich. Liczby odpowiadają numerom dzieł literackich w badanej puli (szczegółowy wykaz jest dostępny w publikacji naukowej). Kolorem czerwonym oznaczono dzieła tradycyjnie przypisywane do gatunku strumienia świadomości. Na osi pionowej odłożono tzw. szerokość spektrum multifraktalnego – im jest ona bliższa jedności, tym tekst ma budowę bardziej multifraktalną. Oś pozioma to tzw. stopień trwałości trendów H, w tym przypadku w długości zdań. Jego większa wartość oznacza, że jest większe prawdopodobieństwo wystąpienia długiego zdania bezpośrednio po długim, a krótkiego po krótkim. H=0.5 oznacza brak tego typu tendencji. (Źródło: IFJ PAN)

James Joyce, Julio Cortázar, Marcel Proust, Henryk Sienkiewicz czy Umberto Eco. Zaskakujące, ale niezależnie od języka, dzieła literackie najsłynniejszych autorów pod pewnymi względami okazują się mieć budowę fraktalną. Analizy statystyczne przeprowadzone w Instytucie Fizyki Jądrowej PAN w Krakowie ujawniły jednak fakt jeszcze bardziej intrygujący. Kompozycja utworów jednego z gatunków literackich cechuje się wyjątkową dynamiką, o strukturze kaskadowej (lawinowej). Ten typ narracji okazuje się mieć charakter multifraktalny, czyli jest fraktalem fraktali.

Dla niejednego książkowego mola zaawansowane równania i wykresy to ostatnie rzeczy, z którymi chciałby mieć bliższy kontakt. Przed matematyką trudno jednak uciec. Fizycy z Instytutu Fizyki Jądrowej Polskiej Akademii Nauk (IFJ PAN) w Krakowie przeprowadzili szczegółową analizę statystyczną ponad stu słynnych dzieł światowej literatury, napisanych w kilku językach i kojarzonych z różnymi gatunkami literackimi. Książki, badane pod kątem korelacji ujawniających się w zmianach długości zdań, okazały się być rządzone dynamiką o charakterze kaskadowym. Fakt ten oznacza, że budowa tych książek jest w istocie fraktalna. W przypadku kilkunastu dzieł ich matematyczna złożoność okazała się wyjątkowa, porównywalna ze strukturą tak skomplikowanych obiektów matematycznych jak multifraktale. Co ciekawe, w analizowanej puli wszystkie utwory multifraktalne okazały się należeć do jednego gatunku literackiego.

Fraktale to samopodobne obiekty matematyczne: gdy zaczynamy powiększać ich jeden czy drugi fragment, prędzej czy później zobaczymy strukturę przypominającą obiekt wyjściowy. Typowe fraktale, zwłaszcza te szerzej znane, jak trójkąt Sierpińskiego czy zbiór Mandelbrota, są monofraktalami. Stwierdzenie to oznacza, że tempo powiększania w każdym miejscu fraktala jest takie samo, liniowe: jeśli gdzieś przeskalowaliśmy go x razy i zobaczyliśmy strukturę podobną do pierwotnej, to samo powiększenie w innym miejscu także ujawni strukturę podobną.

Multifraktale są bardziej zaawansowanymi konstrukcjami matematycznymi: to fraktale fraktali. Powstają z fraktali „splecionych” ze sobą w odpowiedni sposób i w odpowiednich proporcjach. Multifraktal nie jest zwykłą sumą fraktali i nie można go rozłożyć z powrotem na fraktale składowe, ponieważ już sam sposób splotu ma charakter fraktalny. Powoduje to, że aby zobaczyć strukturę podobną do pierwotnej, różne fragmenty multifraktala trzeba powiększać z różną szybkością. Multifraktal jest więc obiektem o charakterze nieliniowym.

„Analizy w wielu skalach, prowadzone z użyciem fraktali, pozwalają w zwarty sposób ująć informacje o korelacjach między danymi na rozmaitych poziomach złożoności badanego układu i wskazują na hierarchiczną organizację zjawisk i struktur występujących w naturze. Można więc oczekiwać, że język naturalny, który jest wielkim ewolucyjnym osiągnięciem świata przyrody, też będzie wykazywał takie korelacje. Ich istnienie w dziełach literackich nie było jednak jak dotąd przekonująco udokumentowane. Tymczasem okazało się, że gdy spojrzeć na te dzieła z właściwej perspektywy, takie korelacje są nie tylko częste, ale w niektórych utworach wykazują szczególnie wyrafinowaną matematyczną złożoność", mówi prof. dr hab. Stanisław Drożdż (IFJ PAN, Politechnika Krakowska).

Badaniom poddano 113 utworów literackich napisanych w językach angielskim, francuskim, niemieckim, włoskim, polskim, rosyjskim i hiszpańskim. Wśród autorów znalazły się tak znane postaci jak Honoré de Balzac, Arthur Conan Doyle, Julio Cortázar, Charles Dickens, Fiodor Dostojewski, Alexandre Dumas, Umberto Eco, George Elliot, Victor Hugo, James Joyce, Thomas Mann, Marcel Proust, Władysław Reymont, William Shakespeare, Henryk Sienkiewicz, John R. R. Tolkien, Lew Tołstoj czy Virginia Woolf. Wybrane dzieła liczyły nie mniej niż 5000 zdań, co zapewniało statystyczną wiarygodność analiz.

Aby przekształcić tekst w poddające się analizie statystycznej ciągi liczbowe, w każdej książce zliczano długości zdań, wyrażone liczbą wyrazów (alternatywna metoda, zliczania znaków w zdaniu, okazała się nie mieć większego wpływu na wnioski płynące z analizy). W danych szukano następnie zależności – najpierw tych najprostszych, czyli liniowych. Chodziło o odpowiedź na pytanie: jeśli zdań o pewnej długości jest x razy więcej niż zdań o innej długości, to czy te same proporcje zostaną zachowane, gdy spojrzymy na zdania odpowiednio dłuższe lub krótsze?

„Wszystkie badane przez nas utwory wykazywały samopodobieństwo pod względem organizacji długości zdań. Jedne bardziej wyraziste – tu wyróżniali się zwłaszcza 'The Ambassadors' Henry'ego Jamesa – inne zdecydowanie mniej, z ekstremalnym przypadkiem francuskiego XVII-wiecznego romansu 'Artamene ou le Grand Cyrus'. Korelacje były jednak ewidentne, a zatem teksty te miały budowę fraktalną”, komentuje dr hab. Paweł Oświęcimka (IFJ PAN) i zaznacza jednocześnie, że fraktalność tekstu w praktyce nigdy nie będzie tak perfekcyjna jak w świecie matematyki. Fraktale matematyczne można bowiem powiększać w nieskończoność. Tymczasem liczba zdań w każdej książce jest skończona i na pewnym etapie skalowania zawsze pojawi się przeszkoda w postaci końca zbioru danych.

Sprawy przybrały szczególnie interesujący obrót, gdy fizycy z IFJ PAN zaczęli tropić zależności nieliniowe. W większości klasycznych tekstów ujawniały się one słabo lub w umiarkowanym stopniu. W trakcie analiz wyłonił się jednak zbiór kilkunastu dzieł o bardzo wyraźnej strukturze multifraktalnej. Niemal wszystkie książki tej grupy okazały się być przedstawicielami jednego gatunku literackiego, szerzej znanego jako strumień świadomości. Jedynym wyjątkiem była Biblia, a konkretnie Stary Testament – książka do tej pory nigdy nie kojarzona z tym gatunkiem literackim.

„Absolutnym rekordzistą pod względem multifraktalności okazało się 'Finnegans Wake' Jamesa Joyce'a. Wyniki naszych analiz w przypadku tego tekstu praktycznie w niczym nie odbiegają od otrzymywanych dla idealnych, czysto matematycznych multifraktali”, mówi prof. Drożdż.

Wśród najbardziej multifraktalnych dzieł znalazły się także: „A Heartbreaking Work of Staggering Genius” Dave'a Eggersa, „Rayuela” Julio Cortázara, „Ulysses” Jamesa Joyce'a, „U.S.A. trilogy” Johna Dos Passosa, „The Waves” Virginii Woolf i „2666” Roberto Bolano. Jednocześnie sporo dzieł zwykle zaliczanych do strumienia świadomości okazało się mieć niewielkie korelacje multifraktalne. Były one trudno zauważalne zwłaszcza w takich książkach jak „Atlas Shrugged” Ayn Randy czy „A la recherche du temps perdu” Marcela Prousta.

„Nie jest do końca jasne, czy utwory należące do strumienia świadomości rzeczywiście ujawniają głębsze cechy naszej świadomości, czy raczej wyobrażenia literatów na jej temat. Trudno się więc dziwić, że przypisanie dzieła do tego czy innego gatunku bywa subiektywne. Widzimy tu zresztą możliwość ciekawego zastosowania naszej metodologii: w przyszłości może ona pomagać w bardziej obiektywnym przyporządkowaniu książek do tego czy innego gatunku literackiego”, zauważa prof. Drożdż.

Analizy multifraktalne tekstów literackich, przeprowadzone w IFJ PAN, zostały opublikowane w Information Sciences, prestiżowym czasopiśmie nauk informatycznych. Publikacja przeszła rygorystyczną weryfikację: z uwagi na interdyscyplinarny charakter tematyki redaktorzy powołali od razu aż sześciu recenzentów.

[PDF]

Kontakt:

prof. dr hab. Stanisław Drożdż
Instytut Fizyki Jądrowej Polskiej Akademii Nauk
tel. +48 12 6628220
email: stanislaw.drozdz@ifj.edu.pl

Prace naukowe:

„Quantifying origin and character of long-range correlations in narrative texts”
S. Drożdż, P. Oświęcimka, A. Kulig, J. Kwapień, K. Bazarnik, I. Grabska-Gradzińska, J. Rybicki, M. Stanuszek; Information Sciences, vol. 331, 32–44, 20 February 2016; DOI: 10.1016/j.ins.2015.10.023

Materiały graficzne:

Multifraktalność dzieł literackich. Liczby odpowiadają numerom dzieł literackich w badanej puli (szczegółowy wykaz jest dostępny w publikacji naukowej). Kolorem czerwonym oznaczono dzieła tradycyjnie przypisywane do gatunku strumienia świadomości. Na osi pionowej odłożono tzw. szerokość spektrum multifraktalnego – im jest ona bliższa jedności, tym tekst ma budowę bardziej multifraktalną. Oś pozioma to tzw. stopień trwałości trendów H, w tym przypadku w długości zdań. Jego większa wartość oznacza, że jest większe prawdopodobieństwo wystąpienia długiego zdania bezpośrednio po długim, a krótkiego po krótkim. H=0.5 oznacza brak tego typu tendencji. (Źródło: IFJ PAN)

„Finneganów tren” poddany analizie multifraktalnej. Tak idealny kształt wykresu jest charakterystyczny dla czysto matematycznych multifraktali. Na osiach poziomych stopień osobliwości, na pionowych – spektrum osobliwości. (Źródło: IFJ PAN)

Sekwencje długości zdań wyrażonych liczbą wyrazów w czterech dziełach literackich, reprezentatywnych dla różnego stopnia ich kaskadowego charakteru. (Źródło: IFJ PAN)