Kiedy język podlaski „rozszedł się” z ukraińskim

Jak powstaje nowy język? Lingwiści nie mają jednoznacznej odpowiedzi co do mechanizmu powstawania odrębnego języka, tym niemniej wszyscy się zgadzają, że nowy język kształtuje się ze „starszego” materiału językowego. W dzisiejszym artykule naszkicuję problem datowania „początku” języków, którym zajmuje się dziedzina lingwistyki zwana glottochronologią. I spróbuję na podstawie wyników glottochronologii wyznaczyć datę „początku” naszego języka podlaskiego.

Dywergencja językowa

W każdym języku nie posiadającym formy skodyfikowanej (która jest podtrzymywana celową działalnością normalizacyjną przez władzę, piśmiennictwo, system oświatowy, itp.) cały czas zachodzą zmiany we wszystkich składnikach jego struktury pod wpływem czynników wewnętrznych albo zewnętrzych (kontaktów językowych). Jeśli użytkownicy jednego języka znajdują się w warunkach wzajemnej izolacji (wywołanej np. migracjami, środowiskiem geograficznym albo pojawieniem się granic politycznych), wówczas zmiany wewnątrz tego języka mogą przebiegać niejednakowo. W procesie zmian różnice pojawiające się w mniej lub bardziej izolowanych częściach jednego obszaru językowego mogą prowadzić do wyodrębnienia się na tym obszarze dialektów i powstania na ich bazie samodzielnych języków, spokrewnionych ze sobą. Takim ogólnym schematem (dywergencją językową) tłumaczy się na przykład „rozejście się” rodziny języków indoeuropejskich z jednego protojęzyka — praindoeuropejskiego.

Glottochronologia Morrisa Swadesha

Pionierem glottochronologii był amerykański lingwista Morris Swadesh (1909-1967), który zaproponował matematyczny model wymiany słownictwa w języku przy pomocy podejścia stosowanego w opisie rozpadu radioaktywnego. Podstawowe zasady, na których Swadesh oparł swoją glottochronologię, mogą być sformułowane w postaci pięciu postulatów:

1. W słowniku dowolnego języka można wyróżnić „słownictwo podstawowe”, które zmienia się wolniej niż pozostałe.

2. Możliwe jest stworzenie listy znaczeń, które w każdym języku świata będą reprezentowane przez wyrazy ze słownictwa podstawowego (tzw. lista podstawowa albo lista Swadesha).

3. Proporcja słów z listy podstawowej, które są zachowywane w danym języku (tzn. nie są zamienione przez inne słowa) w czasie t, jest stała. Inaczej mówiąc, proporcja ta nie zależy ani od wyboru czasu t, ani od wyboru słów lub języka.

4. Prawdopodobieństwo zachowania albo wymiany słów z listy podstawowej języka w określonym przedziale czasowym jest jednakowe.

5. Prawdopodobieństwo zachowania słowa z listy podstawowej protojęzyka na liście podstawowej jednego z języków pokrewnych jest niezależne od prawdopodobieństwa zachowania tego słowa na liście podstawowej innego języka pokrewnego.

Mając na uwadze te postulaty, przejdźmy do matematyki. Matematyczny sens procesu wymiany słów z listy podstawowej można sformułować w postaci następującego stwierdzenia: ilość wymienionych słów ΔN w przedziale czasu Δt jest proporcjonalna do długości Δt tego przedziału i całkowitej ilości niewymienionych na dany moment czasu t słów N(t):

- ΔN = c * N(t) * Δt

gdzie c jest współczynnikiem proporcjonalności.

Równanie to możemy zapisać w postaci równania różniczkowego:

1/c * dN/dt + N(t) = 0

Jest to równanie analogiczne do tego, które uzyskujemy w opisie procesu rozpadu izotopów promieniotwórczych. Jego rozwiązaniem jest funkcja wykładnicza o podstawie e:

N(t) = N(0) * exp(-ct) (1)

Znając liczbę N(t) słów z listy podstawowej, które pozostały w danym języku, można obliczyć czas, w którym ilość niewymienionych słów na liście podstawowej zmniejszyła się od N(0) do N(t):

t = - 1/c * ln(N(t)/N(0))

Ponieważ N(0) = 1 (co oznacza, że w chwili początkowej żadne ze słów nie zostało wymienione), dla praktycznych obliczeń mamy wzór:

t = - ln(N(t))/c (2)

Stały współczynnik c można wyznaczyć empirycznie na podstawie listy podstawowej języków z udokumentowaną historią rozciągającą się na tysiąclecie albo i dłużej. Swadesh dla listy podstawowej składającej się ze 100 słów otrzymał wartość c = 0,14.

Podejście Swadesha pozwala także na wyznaczenie czasu „rozejścia się” dwóch języków pokrewnych, które wywodzą się ze wspólnego protojęzyka. Odpowiedni wzór na czas dywergencji t_d takich języków ma wygląd:

t_d = - ln N(t)/2c (3)

Przykładowo, jeśli c = 0,14, a ilość słów niezmienionych na liście podstawowej obu języków jest równa 0,8 (tzn. 80%), wówczas czas „rozejścia się” języków wyliczony z tego wzoru jest równy około 0,8 (tzn. około 800 lat).

Teoria glottochronologii Swadesha jest bardzo elegancka, ale dla większości języków, których rozwój historyczny został udokumentowany, daje wyniki niestety znacznie „młodsze” niż te sugerowane przez źródła historyczne.

Swadesh poprawiony przez Starostina

Zmodyfikować teorię glottochronologii Swadesha w celu uzyskania lepszej zgodności z rzeczywistością udało się rosyjskiemu językoznawcy Siergiejowi Starostinowi, który zakwestionował trzeci i czwarty postulaty Swadesha i wprowadził do podstawowego wzoru glottochronologii (1) dwie zmiany.

Według Starostina, słowa (w przeciwieństwie do jąder izotopów promieniotwórczych) mogą się starzeć, tzn. im dłuższy przedział czasu rozpatrujemy, tym większe mamy prawdopodobieństwo zniknięcia słowa z listy podstawowej. A zatem „współczynnik rozpadu języka” c zależy od czasu rosnąco. Starostin zaproponował zależność liniową: c(t) = a * t. W ten sposób zmodyfikował trzeci postulat Swadesha.

Starostin także argumentował, że prawdopodobieństwo zniknięcia słów z listy podstawowej zmniejsza się wraz ze spadkiem ilości niezamienionych słów na liście podstawowej, tzn. nie jest spełniony czwarty postulat Swadesha. Zaproponował, żeby ten spadek wyrazić także zależnością liniową: c(t) = b * N(t). Wprowadzając te dwie modyfikacje do formuły (1), Starostin otrzymał podstawowe równanie glottochronologii w następującej postaci:

N(t) = N(0) * exp(- s * N(t) * t²) (4)

gdzie s jest stałym współczynnikiem, odpowiadającym współczynnikowi c w oryginalnym równaniu Swadesha.

Odpowiednikiem wzoru (2) w ujęciu Starostina jest następujące wyrażenie:

t = (- lnN(t)/s * N(t))^1/2 (5)

Zaś czas dywergencji dwóch języków pokrewnych t_d (odpowiednik wzoru (3) w ujęciu Swadesha) obliczymy ze wzoru:

t_d = (- ln(N(t)/2 * s* (N(t)^1/2)^1/2 (6)

Wyznaczony empirycznie „współczynnik rozpadu języka” s w ujęciu Starostina jest równy 0,05.

Problem listy słownictwa podstawowego

Pojęcie słownictwa podstawowego jest kluczowym pojęciem glottochronologii. Siergiej Starostin charakteryzuje tą część słownictwa w następujący sposób: Słownictwo podstawowe określane jest jako przeciwieństwo słownictwa „kulturowego”, często zapożyczanego przez język z innych języków. Do słownictwa podstawowego zaliczane są zazwyczaj słowa nie zależące od konkretnej kultury i epoki historycznej i występujące w dowolnym języku: podstawowe pojęcia pokrewieństwa, nazwy najbardziej podstawowych i powszechnych zjawisk przyrody i obiektów przyrodniczych, nazwy części ciała, liczebniki (przynajmniej te pierwsze), proste działania i cechy.

Morris Swadesh zaproponował kilka zestawów słownictwa podstawowego do wykorzystania w obliczeniach glottochronologicznych. Najbardziej „klasyczną” listą Swadesha jest lista 100-wyrazowa, opublikowana już po jego śmierci (https://en.wikipedia.org/wiki/Swadesh_list). Swadesh wykorzystywał w swoich pracach także listy podstawowe o innych objętościach: 200 słów i 207 słów. Istnieje również „krótka wersja” listy Swadesha zawierająca 35 słów.

Wybór słownictwa do listy podstawowej może w sposób radykalny rzutować na wyniki obliczeń glottochronologicznych, dlatego też dyskusje wśród lingwistów o tym, które słowa są bardziej „podstawowe” od innych, nie ucichły do dnia dzisiejszego. Ogólnie o liście/listach Swadesha można powiedzieć, że ich autor postarał się zminimalizować występowanie słownictwa zapożyczonego. I chociaż w większości języków zapożyczenia stanowią nie mniej niż połowę zasobów leksykalnych, Swadesh zredukował je na swojej liście podstawowej języka angielskiego do kilku procent.

Do dalszych rozważań i obliczeń wykorzystam ułożoną przez siebie 100-wyrazową podlaską listę słownictwa podstawowego będącą odpowiednikiem listy Swadesha dla języka angielskiego. Odpowiadające angielskiej liście Swadesha zestawy słownictwa podstawowego dla innych języków słowiańskich można znaleźć pod adresem: https://en.wiktionary.org/wiki/Appendix:Slavic_Swadesh_lists.

Lista Swadesha dla języka podlaskiego

100-wyrazowa lista słownictwa podstawowego dla języka podlaskiego wygląda następująco: ja, ty, vôn, my, vy, vony, siêty/siej, toj, tut, tam, chto, što, de, koli, jak, niê/ne, usio/usiê, mnôho, kilka, mało, inšy, odin, dva, try, štyry, pjať, veliki, dovhi, šyroki, gruby, tiažki, mały, korotki, uzki, tonki, kobiêta/baba, mužčyna, čołoviêk, ditia, žônka, muž, mati, baťko, zviêr, ryba, ptaška, sobaka, voš, už, robak/červjak, derevo, liês, pałka, płôd, nasiênie, listok, koreń, kora, kviêtka, trava, šnurok/verovka, skôra, mjaso, krov, kôsť/kôstka, tłušč/sało, jicie, rôh, chvôst, piro, vołosy, hołova, ucho, oko, nôs, rot, zub, jazyk, pazur, stopa, noha, koliêno, ruka, kryło, žyvôt, kiški/čerevo, šyja, plečy/chrebet, hrudi, sercie, pečônka, piti, jiêsti, hryzti/kusati, smoktati/ssati, plovati, blovati, duti/viêjati, dychati, smijatisie.

Wspólna część słownictwa podstawowego języków podlaskiego, ukraińskiego i białoruskiego jest gdzieś na poziomie 95%. Ale wyznaczenie tych kilku słów, które uległy wymianie w procesie rozwoju i dywergencji języków, nie jest rzeczą łatwą. Trzeba bowiem wziąć pod uwagę tylko takie słowa, które mają rzeczywiście różne rdzenie. A jak potraktować odpowiedniki słowa this w tych językach: siêty/гэты/цей? Jako słowa o różnych rdzeniach czy też nie? Szczerze mówiąc, nie wiem. Zrobię więc tak: raz przyjmę, że to różne słowa, a raz, że takie same.

Odrębną trudność stanowią synonimy. Które słowo odpowiadające angielskiemu many wziąć do listy podstawowej języka białoruskiego: шмат czy многа? A może oba? Albo co zrobić z odpowiednikiem angielskiego worm w języku podlaskim — robak czy červjak? Na ogół włączam pary synonimów do podlaskiej listy Swadesha.

Zdając sobie sprawę z potencjalnych kontrowersji wokół tego zagadnienia, tym niemniej ustalam wspólne części słownictwa podstawowego N ze 100-wyrazowej liczby Swadesha dla języka podlaskiego oraz:

a) języka ukraińskiego — 0,96 (96%)/0,97 (97%);

b) języka białoruskiego — 0,95 (95%)/0,96 (96%);

c) języka polskiego — 0,91 (91%).

„Datowanie” języka podlaskiego

Nareszcie mogę zrobić kilka obliczeń.

Wyznaczę t_d — czas dywergencji („rozejścia się”) języków podlaskiego i ukraińskiego — według metodyki Swadesha (wzór (3)) i Starostina (wzór (6)). Przypominam, że w ujęciu Swadesha „współczynnik rozpadu języka” c = 0,14, a w ujęciu Starostina s = 0,05.

Według Swadesha:

(N = 0,96)
t_d = 0,15 (150 lat)
(N = 0,97)
t_d = 0,1 (100 lat)

Według Starostina:

(N = 0,96)
t_d = 0,65 (650 lat)
(N = 0,97)
t_d = 0,56 (560 lat)

Wyniki otrzymane według metody Swadesha są oczywiście nic nie warte. W drugiej połowie wieku XIX nie nastąpiło nic takiego, co w istotny sposób mogłoby wpłynąć na zmianę słownictwa języka podlaskiego.

Natomiast wyniki osiągnięte metodą Starostina są jak najbardziej do przyjęcia. Jakie wydarzenie między latami 1350 i 1450 mogło zapoczątkować „rozejście się” języków podlaskiego i ukraińskiego? Oczywiście kolonizacja Północnego Podlasia osadnikami z Wołynia. To właśnie na przełomie wieków XIV i XV zaczęto zakładać wsie na pojaćwieskich pustkach na Podlasiu i zaludniać je osadnikami z Wołynia. Wtedy też, jak podpowiada zdrowy rozsądek, peryferyjny dialekt osadników z Wołynia, na bazie którego powstała dzisiejsza unormowana (literacka) wersja języka podlaskiego, zaczął się oddalać od dialektu/dialektów środkowej Ukrainy, który/które posłużyły do uformowania się współczesnego języka ukraińskiego.

Uwaga końcowa

Niniejszy tekst nie jest konstrukcją „naukowego dowodu”, że język podlaski dzisiaj to nie dialekt języka ukraińskiego, a samodzielny język. Uznanie, że jakiś język jest odrębnym językiem, a nie dialektem, jest w rzeczywistości zagadnieniem pozanaukowym. Przypominając glottochronologię i metody Swadesha/Starostina chciałem kolejny raz uzmysłowić zainteresowanym losem języka podlaskiego, że ten język może stać się przedmiotem naukowych dociekań, a nie tylko powodem do nostalgii za minionym czasem i bezpowrotnie straconymi możliwościami.