Dicționarul limbii române, din dragoste pentru cunoaștere și limba română

Trăim atât de multe emoții și petrecem atât de mult timp împreună încât aproape că nu ne dăm seama că, de fapt, suntem în iubire cu limba română. Acesta a fost unul dintre gândurile care au venit natural după dialogul cu Dr. Gabriela Haja, responsabil pentru Departamentul de lexicologie-lexicografie din cadrul Institutului de Filologie Română „A. Philippide“ al Academiei Române.

Cătălin Mosoia: Sunteți un cercetător norocos!

Gabriela Haja: Mă consider un cercetător norocos pentru că am participat la redactarea și la încheierea primei ediții a Dicționarului limbii române, dicționarul Academiei Române, început, în această formă, în 1905. E un mare noroc! E o șansă!

Cătălin Mosoia: Alți cercetători nu se întâlnesc cu o asemenea șansă?

Gabriela Haja: Nu mulți, pentru că lucrările de acest fel sunt speciale și unice în felul lor. În România nu există un alt dicționar de asemenea dimensiuni și de o asemenea importanță. Apoi, pentru că o astfel de lucrare se realizează de-a lungul unor decenii, în echipe mari și cu eforturi pe măsură. Visul oricărui cercetător este să-și vadă opera împlinită, dar la o astfel de operă participă generații. Aceeași istorie o au și dicționarele Academiilor din Franța sau din Spania. În plus, o asemenea lucrare, odată încheiată, trebuie reluată și actualizată periodic, fiindcă lexicul este în continuă schimbare. De pildă, Dicționarul Academiei Franceze a ajuns la a noua ediție, începută în 1986, încă nepublicată integral.

Cătălin Mosoia: Aveți sentimentul că i-ați mulțumit și pe cei care au lucrat la Dicționarul limbii române înaintea dumneavoastră?

Gabriela Haja: Cred că da! Știu că m-am străduit să ajung la cele mai bune definiții, la cele mai bune articole. Dar satisfacția nu-i a mea personală, eu sunt doar o parte dintr-un mare ansamblu. Redactările mele au fost revizuite de specialiști cu experiență, care m-au și format de altfel. Apoi, întregul material a fost verificat de membrii Comisiei de etimologii, înainte de a fi predat la tipar. Mulțumirea este că s-a încheiat o astfel de operă. Foarte important eveniment pentru o cultură să aibă un tezaur încheiat! Când compara Dicționarul cu o catedrală, acad. Marius Sala se gândea, cred, la catedralele gotice...

Despre Dicționarul nostru tezaur trebuie repetate o serie de lucruri importante. În primul rând, el este legat strict de istoria Academiei Române. Am sărbătorit, în 2016, 150 de ani de la înființarea Academiei Române; tot atâția ani au trecut de la primele cercetări lexicografice de o asemenea anvergură. În actul de întemeiere al Societății literare române, devenită în 1879 Academia Română, un obiectiv important era redactarea unui dicționar reprezentativ al limbii române; al doilea era realizarea gramaticii limbii române, care implica și unificarea ortografiei; în fine, alcătuirea unui tratat de referință despre istoria românilor. Toate – proiecte care aveau să aducă argumente științifice pentru unirea românilor și pentru întemeierea noului stat, România.

Cătălin Mosoia: Ce puteți spune despre valoarea Dicționarului tezaur al limbii române?

Gabriela Haja: Dicționarul limbii române (DLR), supranumit și Dicționarul tezaur al limbii române sau Dicționarul Academiei, este o certificare științifică a identității naționale. Același rol îl are Dicționarul Academiei Franceze, același rol îl are Dicționarul Academiei Regale din Spania, același rol îl are orice dicționar tezaur al unei limbi realizat sub egida unei instituții de tip academic.

Dicționarul limbii române este comparabil ca importanță cu Deutsches Wörterbuch - început de frații Jakob și Wilhelm Grimm și a cărui elaborare a durat peste 100 de ani, cu Dictionnaire de l’Académie Française ori Oxford English Dictionary (OED).

Academia Română a fost înființată printr-un statut care preciza, încă la 1866, când abia se obținuse unirea principatelor, că din Academie vor face parte personalități de excepție din toate ținuturile locuite de români, Transilvania, Maramureș, Bucovina, Basarabia, Banat, Macedonia. Înființarea Academiei a fost un gest de politică culturală, dar și unul de politică lingvistică. În secolul al XIX-lea elitele politice, care erau și oameni de cultură, știau că astfel pot modela istoria sau destinul unei națiuni. Au știut să își aleagă bine modelele.

Cătălin Mosoia: Dicționarul limbii române, în cifre…

Gabriela Haja: Lucrarea are 37 de volume, în prima sa ediție, și aproape 18.000 de pagini, 175.000 de cuvinte și peste 1.000.000 de citate din texte românești, de la Scrisoarea lui Neacșu din Câmpulung (1521) (și chiar anterioare acesteia, din textele slavo-române), până în prezent.

Cătălin Mosoia: Care este structura dicționarului?

Gabriela Haja: Încerc o analogie. Dicționarul limbii române (DLR) este de mai bine de zece ori mai mare decât Dicționarul explicativ al limbii române (DEX) și, firește, cuprinde mult mai multe cuvinte, fiindcă include toate arhaismele și regionalismele, cuvinte populare, precum și toate cuvintele limbii literare. În plus, fiecare sens și subsens al unui cuvânt este argumentat și ilustrat de citate extrase din texte românești scrise și vorbite (înregistrate în atlase lingvistice, în glosare, în culegeri de folclor ori în răspunsurile la chestionare lingvistice, precum cel al lui Hasdeu), de la primele atestări până în prezent sau, mai precis, până la data tipăririi fiecărui volum. Pe lângă partea semantică, fiecare articol de dicționar aduce informații privind uzul cuvântului, originea lui, valorile și formele morfologice, variantele sale, acolo unde este cazul, sinonimele, dar și relația semantică pe care o are, ierarhic, cu alte cuvinte.

Cătălin Mosoia: Analizați inclusiv sensurile care apar la unii scriitori?

Gabriela Haja: Desigur. Pentru că, în bună parte, Bibliografia DLR cuprinde opere literare, pe lângă vechi manuale școlare, tratate de istorie, tratate juridice, publicistică literară și cotidiană, traducerile făcute până în prima parte a secolului al XIX-lea și multe altele. Am ajuns, în prezent, la circa 3000 de titluri. Luăm în considerare toate sensurile speciale, figurative sau sensurile nou introduse ori chiar creațiile lexicale ale unor autori influenți. Un exemplu este G. Călinescu (1899-1965), rafinat modelator de limbaj. Dicționarul limbii române oglindește istoria culturii române văzută din perspectiva cuvintelor - și reflectă limba vorbită în toate regiunile românești. Seria veche a dicționarului, coordonată de Sextil Pușcariu (1877-1948), făcea trimiteri la cuvinte și forme din celelalte graiuri românești (aromâna sau macedoromâna, meglenoromâna, istroromâna).

Dicționarul are mari dimensiuni și nu a putut fi realizat doar de o echipă. Până să ajungem la forma actuală, au fost mai multe încercări. Prima a fost al lui Bogdan Petriceicu Hasdeu (1838-1907), care a scris Etymologicum magnum Romaniae (1886-1893). Însă a ajuns doar până la cuvântul bărbat. Proiectul conceput de el nu putea fi realizat de un om. Hasdeu a vrut să fie exhaustiv, să lucreze toate cuvintele înregistrate în scris. Limbajul popular l-a interesat mult și dicționarul e foarte bogat din acest punct de vedere; a fost primul care a lucrat cu chestionare trimise pe teren. Partea etimologică este bine dezvoltată. De fapt, Hasdeu a lucrat monografic fiecare cuvânt, cu trimiteri la evoluția și influențele mentalităților, cu numeroase citate din texte vechi și folclorice. Pentru noi, cercetătorii limbii române, lucrarea lui rămâne una de referință, cu rezervele critice obligatorii în această întreprindere...

Cătălin Mosoia: Cui a trimis chestionarele?

Gabriela Haja: Preoților, notarilor, învățătorilor și de la ei a primit răspunsuri scrise. Toate acestea se află depozitate la Biblioteca Academiei Române din București. O colegă de la Institutul nostru se ocupă tocmai de salvarea și editarea acestor răspunsuri; sunt 9000 de pagini.

Cătălin Mosoia: Bogdan Petriceicu Hasdeu a fost primul care a lansat chestionarele pentru dicționar.

Gabriela Haja: La noi, da. Înainte de el, au lucrat la primul dicționar academic doi filologi, August Treboniu Laurian (1810-1881) și Ion C. Massim (1825-1877); ei aveau formație latinistă și susțineau linia Școlii Ardelene, exclusiva latinitate a limbii române, scrierea etimologizantă și, din această pricină, dicționarul lor,  Dicționarul limbei române (1871-1876), a fost respins de către comisia care a supraveghea lucrarea. Primul dicționar finalizat al Academiei, publicat de Laurian și Massim, a fost criticat aspru de cei care susțineau scrierea fonetică și o dreaptă măsură în împrumuturile din latină sau din franceză. Cu toate acestea, este un dicționar important pentru istoria culturii noastre și foarte interesant pentru lexicografi.

După încercarea lui Hasdeu, dicționarul a fost încredințat unui savant recunoscut nu doar în țară, Alexandru Philippide (1859-1933). Academia Română i-a solicitat lucrarea în cinci ani, iar el, ca unul care nu lucrase la un dicționar, a acceptat.

Trebuie să fac o paranteză. Aceasta este eroarea oricărui venit din afara domeniului. Și este, întrucâtva, de înțeles. Am avut nevoie de aproape zece ani ca să deprind tehnica de lucru la tezaur, să redactez și să revizuiesc singură; până atunci, am lucrat în echipă cu un senior; la dicționarele de felul celui explicativ sau al celor etimologice ori generale, se învață mai repede tehnica lexicografică, dar să lucrezi la tezaur e cu totul altceva.

Philippide a făcut câteva lucruri foarte importante: a gândit structura dicționarului, metodologia de lucru și a căutat modele europene care puteau să-i mulțumească spiritul critic, el fiind recunoscut drept unul dintre cei mai aspri critici în domeniul lingvisticii și al filologiei.

Cătălin Mosoia: Care a fost structura dicționarului gândită de Alexandru Philippide?

Gabriela Haja: Cuvântul titlu, încadrarea morfologică, urmează definiția și apoi citatele, firește, cu menționarea sursei, indicații privind flexiunea, variantele lexicale, în fine etimologia. Un cuvânt poate avea un sens, în cazurile cele mai simple, sau, de cele mai multe ori, este polisemantic. Forma unui cuvânt și înțelesurile sale sunt determinate strict de originea cuvântului.

Cătălin Mosoia: O structură de arbore, dar la un moment dat trebuie să te oprești. Unde sau când?

Gabriela Haja: Ca lexicograf, construiești arborele și te oprești când ajungi la frunze. Frunzele sunt sensuri speciale; te oprești la sensurile speciale care au tendința de a intra în uzul general. Nu lucrezi, decât în rare cazuri, sensurile cu totul particulare; pentru că dicționarul limbii s-ar transforma în dicționarul limbajelor literare. Prin urmare, te oprești în momentul în care sensurile intră în domeniul limbajelor individuale. Dicționarul nu este al limbajelor, ci este al limbii române.

Cătălin Mosoia: Cum simți lucrul acesta?

Gabriela Haja: Toată lumea vorbește despre simțul limbii, pe care îl ai sau nu... Criteriile științifice la îndemâna noastră sunt cele statistice. Observi în ce măsură o formă a unui cuvânt, un sens al unui cuvânt, apare în mai mult de un stil ori la mai mulți autori. O personalitate ca aceea a lui Călinescu putea influența îndeajuns limba literară încât să considerăm cuvinte create de el, dar alți autori, mai puțin. Ar trebui oare să introducem în dicționar cuvinte din limba spargă (inventată de poeta Nina Cassian) sau din limba leopardă a lui Virgil Teodorescu (1909-1987)? Nu. Cazul lui Mihai Eminescu (1850-1889) este cu totul altul, pentru că el a creat limba literară modernă și urmărim cu atenție maximă sensurile pe care le-a dat cuvintelor. Acum, că avem o ediție electronică cvasicompletă a operelor sale, vom putea fi siguri că niciun cuvânt scris de el nu va lipsi din a doua ediție a dicționarului.

Alexandru Philippide a fost într-un fel nedreptățit de istoria dicționarului. Spun asta pentru că el a promis că în cinci ani termină dicționarul. Nu l-a terminat. În cinci ani (1899-1904) a terminat o treime. Ceea ce este enorm! Și mai ceruse îngăduință încă zece. Dar nu a fost înțeles. Nu poți înțelege, dacă nu lucrezi efectiv. Cu toate că Philippide a trimis rapoarte foarte riguros argumentate și bucăți din manuscris spre revizie, când tensiunea dintre el și Academie crescuse foarte mult, a refuzat să termine dicționarul și a reziliat contractul, unilateral. Philippide a avut și el ambiția unui dicționar exhaustiv, care să cuprindă toate cuvintele, indiferent de forma lor, indiferent dacă sunt regionalisme, arhaisme sau neologisme. Manuscrisul dicționarului a fost considerat multă vreme pierdut. A fost descoperit, în 1982, de colega noastră Carmen-Gabriela Pamfil și se găsește la Biblioteca Academiei din Iași, în fondul A. Philippide. Noi am digitizat acest manuscris, în formă scanată, și e la dispoziția specialiștilor, din 2015, în biblioteca electronică a DLR, realizată la Institutul nostru.

Spuneam că Alexandru Philippide a stabilit principiile și metodologia de lucru. Altminteri spus, a stabilit etapele de lucru și activitățile: să pornească mai întâi de la documentare, să fișeze un număr de lucrări – texte românești, de la cele mai vechi până la cele contemporane lui și, pe baza acelor citate, să recupereze semantica unui cuvânt. El pornea de la principiul statistic în stabilirea listei de cuvinte lucrate și a dimensiunii unui articol de dicționar. Philippide a avut o intuiție teribilă și de foarte mare actualitate: în momentul în care tu, cercetătorul, ai reușit să extragi toate contextele în care apare un cuvânt, este foarte posibil să rămâi blocat în prea marea masă de informații. Or, lucrul este extrem de actual astăzi, când lucrăm la schimbarea metodelor și a mijloacelor de lucru la DLR.

Volumele dicționarului publicate până la utilizarea calculatorului au fost scrise așa cum se alcătuiau dicționarele în secole de mult revolute, doar că noi nu foloseam pana, ci creionul și stiloul – metodele erau aceleași. Fișele erau extrase manual și apoi repartizate unui lexicograf spre verificare și utilizare. Manuscrisele se făceau pe jumătăți de coli A4, iar numărarea semnelor pentru verificarea îndeplinirii normei lunare se făcea manual și prin aproximare. S-a întâmplat să influențez direct informatizarea cercetării lexicografice la Iași. Când am fost angajată, în 1994, în departament exista doar o mașină de scris Optima, cu car mare, pe care am folosit-o să culeg cuvântul viață, în două exemplare - aceasta a fost prima mea sarcină. Dar eu deja lucrasem cu niște calculatoare. Nu îmi mai amintesc ce model erau. Doar că ecranul era negru și literele verde fosforescent, ca ochiul de pisică al radioului de acasă...

Cătălin Mosoia: Cât timp ați lucrat la cuvântul viață?

Gabriela Haja: Nu foarte mult; eram abia angajată și am cules cele o sută și ceva de pagini de dicționar, ca o dactilografă și o ucenică. Colegii mei cred că au lucrat la viață mai mult de un an. Sunt verbe la care s-a lucrat doi sau chiar trei ani -de exemplu, vrea/voi, veni, lega, lăsa. Asta pentru că sunt foarte complexe semantic. Verbele înseamnă mișcare, interacțiune, proces. Substantivele nu sunt neapărat mai simplu de lucrat și sunt mult mai numeroase, fiindcă tot ceea ce există și ne este cunoscut are un nume, nu-i așa? Dar semantismul lor e mai ușor de cuprins, fiindcă reperele sunt stabile.

Cătălin Mosoia: Recapitulând, structura dicționarului a fost gândită de Alexandru Philippide.

Gabriela Haja: Într-adevăr. După ce Philippide a renunțat la dicționar, la sfârșitul anului 1904, lucrarea a fost dată în sarcina lui Sextil Pușcariu, care în 1907 a tipărit prima fasciculă din litera A. Cu ajutorul colegilor lui de la Cluj, unde a înființat, în 1919, Muzeul Limbii Române, Pușcariu a reușit să ajungă până la cuvântul lojniță. Cu alte cuvinte, a preluat cele aproximativ 500.000 de fișe culese de echipa lui Philippide, așezate pe sensuri, cu definiții scrise, deci a avut materialul brut bine organizat. Firește, el a îmbogățit mult Bibliografia dicționarului și a realizat o operă admirabilă.

Cătălin Mosoia: Înțeleg că la elaborarea tuturor acestor produse s-a ținut cont de lucrul anterior.

Gabriela Haja: Sextil Pușcariu este cel care a preluat de la Alexandru Philippide fișierul și structura. Între Philippide și Pușcariu e o certă continuitate. Pușcariu a putut publica destul de repede primul volum A-B, pe urmă C, pornind de la un material lexical deja structurat. Și a lucrat cu o echipă de specialiști, e drept nu foarte mare, dar necesară, fiindcă un astfel de opus e dificil de îndeplinit solitar. Există o excepție totuși: francezul Émile Littré. Dar aceasta e o altă poveste.

De asemenea, este cu totul remarcabil faptul că, în anii ’50, când cenzura comunistă epura tot ceea ce amintea de Regalitate, conducerea Academiei a decis continuarea lucrării lui Sextil Pușcariu și recuperarea întregii tradiții lexicografice anterioare, precum și păstrarea în mare parte a izvoarelor textuale folosite în exemple – inclusiv textele religioase și literatura marilor autori. Se poate face, de altfel, un studiu asupra evoluției citatelor din volumele publicate după 1965. Încât da, s-a menținut continuitatea în elaborarea Dicționarului limbii române. S-a construit o tradiție pe care se cuvine să o respectăm.

Cătălin Mosoia: De unde proveneau banii?

Gabriela Haja: Dicționarul a fost susținut financiar de Casa Regală, începând cu Etymologicum magnum Romaniae. Erau stipendii pentru cheltuieli, tipar, cumpărarea de cărți, retribuții pentru colaboratori. Tiparul se făcea la ziarul Universul, în general. Cât să însemne acum șase mii de lei, cât a solicitat Philippide pentru achiziția de cărți și cheltuielile de întreținere?...

Cătălin Mosoia: Ce s-a întâmplat apoi?

Gabriela Haja: A venit războiul. În 1948 Pușcariu a murit și curând s-a întrerupt lucrul. Între timp s-a schimbat politica, s-a schimbat ortografia și lucrarea a rămas în așteptare timp de zece ani. Abia în anul 1958, după ce Academia Română a fost restructurată și devenise Academia R.P.R., au fost numiți lingviști care să se ocupe de dicționar. Acad. Iorgu Iordan (1888-1986) a fost cel care a preluat coordonarea lucrării, în 1949 și i-a chemat alături, din 1958, pe acad. Ion Coteanu (1920-1997), lingvist de excepție, și, din 1965, pe acad. Alexandru Graur (1900-1988), care era un etimologist extrem de talentat. Ei au fost redactorii responsabili.

Iorgu Iordan, fost student al lui Philippide, i-a continuat, direct sau nu, principiile pe care, însă, le-a simplificat și a renunțat la echivalarea în franceză a definițiilor; de asemenea, a mărit considerabil lista lucrărilor de fișat, a stabilit niște reguli precise și a gândit lucrurile ca pentru echipe mari de lucru. În orice caz, Dicționarul limbii române, în seria nouă, inițiat de acad. Iorgu Iordan, este mai sistematic și mai consecvent, mai unitar din punctul de vedere al normelor de redactare; noii redactori responsabili au reușit să evite scăderile seriei vechi. Totuși, seria lui Pușcariu avea capitolul privitor la etimologie mult mai dezvoltat și mai explicit. În seria nouă, datele etimologice sunt abreviate la maximum și asta i se impută.
După ce s-au creat echipele de lexicografi la București, Cluj și Iași s-au distribuit literele, la Iași au fost lucrate literele E, L, Ș și V, W, X, Y.

Cătălin Mosoia: Când a fost tipărit primul volum?

Gabriela Haja: Primul volum din seria nouă a apărut în 1965. Echipa de la București a fost întotdeauna mai mare și mai harnică. S-a lucra - din 2000, responsabilitatea lucrării a fost asumată de acad. Marius Sala (n. 1932) și acad. Gheorghe Mihăilă (1930-2011).

Cătălin Mosoia: Ce s-a întâmplat în 2010?

Gabriela Haja: Ne-am pus problema că dicționarul are 100 de ani vechime și primele volume, primele litere au fost lucrate după alte norme și că e nevoie să unificăm dicționarul, să facem nu neapărat o a doua ediție, deși asta se conturează, ediția a doua.

Cătălin Mosoia: Lucrați la o nouă ediție?

Gabriela Haja: Actualizăm și completăm volumele seriei vechi după normele de redactare ale seriei noi. După 2011, colegii de la București au încheiat un contract cu o firmă privată, care are ca obiect de lucru, între altele, crearea de interfețe de scriere pentru dicționare.

Dacă până în anul 2000 am lucrat cu mijloace tradiționale, redactări manuscrise, culese în edituri, apoi, la calculator, e obligatoriu să schimbăm maniera de lucru. În lume, nu se mai fac dicționare ca în Secolul Luminilor. Avem baze de date, o platformă de lucru și un produs. Avem un lanț tehnologic în lucrul cu mijloace informatice. Informatizarea înseamnă nu doar faptul că publici on line un dicționar, ci și că lucrezi altfel și cu alte resurse. S-a schimbat fundamental viziunea. Acesta este un start foarte important în lexicografia academică românească.

Cătălin Mosoia: Un nou început…

Gabriela Haja: În primul rând, vor fi mult mai precise rezultatele analizelor statistice. Când facem fișarea manual, ea este una selectivă și ne poate scăpa un sens sau, mai grav, un cuvânt. De aceea trebuie să realizăm niște corpusuri ale limbii române pe care le putem pune la punct folosind și tezaurul digitizat până acum.

Cătălin Mosoia: Ce este un corpus?

Gabriela Haja: Un corpus înseamnă o colecție imensă de text scris. Sau vorbit. Milioane de ocurențe ale unui cuvânt. Big data! Despre asta vorbim. Dacă se poate, tot ce s-a scris în limba română. Pe de altă parte, nu-i destul să ai colecția de text. Trebuie ca aceste texte să fie analizate morfologic, sintactic și, pe cât posibil, semantic.
Când tu, lexicograful, ai un asemenea corpus, de fiecare dată când cauți un cuvânt, reușești să l identifici cu toate contextele și formele morfo-sintactice și, eventual, cu sugestii semantice. În aceste condiții, se schimbă maniera de lucru la un dicționar: altfel te concentrezi asupra definițiilor, altfel poți modela dicționarul, intrăm în altă eră. Este ca trecerea de la flașnetă la CD player.

Cătălin Mosoia: Cum vă imaginați că saltul acesta va influența cititorul de zi cu zi?

Gabriela Haja: În primul rând, va avea acces la dicționar. Pentru că, în prezent, acest dicționar, atât de minunat, este cvasiinaccesibil, aș spune. Tirajele au fost limitate. În bibliotecile academice sau universitare, nu merge oricine. A fost tipărit într-un tiraj nu foarte mare, cu sprijinul Băncii Naționale, ediția facsimilată sau anastatică a DLR, reorânduită în 19 volume; e frumos editat, arată bine pe raft, e foarte bine să-l dăruiești sau să-l primești în dar ... însă nu este la îndemâna publicului larg, de fapt. Când ne am gândit să digitizăm dicționarul (încă de prin 2001), exact asta ne-am dorit: să devină cu adevărat public, să fie vizibil on-line. Cititorii de zi cu zi vor deveni mai informați și, poate, mai înțelepți ori, măcar, mai curioși.

Cătălin Mosoia: Credeți că o să treacă 100 de ani până se va reuși acest lucru?

Gabriela Haja: Nu. În urmă cu zece ani, la Iași, profesorul Dan Cristea, de la Facultatea de Informatică, Universitatea „Alexandru Ioan Cuza“ din Iași, a inițiat un proiect de transpunere în format electronic a Dicționarului tezaur. În 2007 s-a alcătuit un consorțiu între Universitatea „Alexandru Ioan Cuza“ din Iași și Academia Română, prin mai multe institute, Institutul de Lingvistică din București, Institutul de Filologie din Iași, Institutul de Lingvistică și Istorie Literară din Cluj. Cu alte cuvinte, toate institutele unde a fost elaborat Dicționarul limbii române au fost prinse în acest proiect național și lor li s-au alăturat Institutul de Cercetări pentru Inteligență Artificială de la București, Institutul de Informatică Teoretică din Iași și Facultatea de Informatică și cea de Litere din Iași. A fost un moment de grație prilejuit de reunirea grupurilor de lingviști și informaticieni. După trei ani, am ajuns, prin instrumentele construite de informaticieni și cu efortul de corectură al lingviștilor, la prima variantă electronică a DLR: eDTLR.

Cătălin Mosoia: Cum vă înțelegeați unii cu alții?

Gabriela Haja: A fost greu să găsim căi de comunicare între două domenii aparent incongruente. După ce mi-am susținut doctoratul s-a întâmplat să asist la o școală de vară condusă de profesorul Dan Cristea (n. 1951), membru corespondent al Academiei Române, EuroLan, unde se discută tendințele noi în cercetările din lingvistica computațională. Am fost fascinată pentru că nu știam de existența acestui domeniu, dar, de cum l-am descoperit, m-am înscris imediat la masterul de lingvistică computațională, tocmai ca să aflu cum mai poate fi gândită lingvistica, cum se analizează automat limbajul natural, ce înseamnă procesarea limbajului și cum m-ar putea ajuta pe mine, lexicograful, să trec, de la fișa scrisă manual și verificată de cinci ori, la alt nivel. Atunci s-au născut și ideile de proiecte. Digitizarea dicționarului este un proiect care a făcut primii pași în perioada 2003-2005, la Institutul de Filologie Română. Noi am încercat, colaborând cu Facultatea de Informatică din Iași, să găsim maniera de digitizare a dicționarului tipărit. În principiu, dai dicționarul la cules literă cu literă, îl procesezi, prin diverse tehnici și programe de analiză, și apoi obții produsul. Ne-am propus să încercăm altă manieră, să scanăm, să corectăm, să procesăm. Și am găsit soluția. Am publicat în 2005 o carte pe această temă - importantă, pentru că propune un model viabil. După aceea am găsit noi căi de comunicare, în 2008 aveam un consorțiu bine întemeiat și în 2010 am pus la punct principiile informatice. S-a construit o „mașină“ care să recunoască structura unui articol DLR și să o adnoteze corect. Prin urmare, un program care să recunoască structura dicționarului, un program care știe că această succesiune de litere reprezintă cuvântul titlu și o etichetează ca atare, un program care știe că ceea ce urmează este definiție iar nu citat și înregistrează informația automat într-o bază de date structurată, un program care știe că sensurile A., I., 1. se află în relație de subordonare și care poate să mă ducă de la un nivel la altul fără eroare. Și încă multe... Eventual, mă ajută să scriu un alt dicționar.

Cătălin Mosoia: Înțeleg că sunteți fascinată de ceea ce înseamnă informatizare.

Gabriela Haja: Cine nu ar fi? Peste tot în lume, la dicționare lucrează lexicografi cu dublă specializare, lingvistică și filologică, dar și informatică. Au început să crească noile generații și la noi.

Cătălin Mosoia: Cum ați cuprinde în câteva cuvinte problema digitizării dicționarului?

Gabriela Haja: Primele studii le-am realizat în 2003-2005, iar în 2007-2010 am ajuns la o primă formă: eDTLR. Rămâne să corectăm erorile de literă care au mai rămas și să rezolvăm problemele pe care seria veche, mai inconsecventă, le pune programului de parsare. Decizia coordonatorilor DLR de a scrie dicționarul direct în format bază de date reprezintă și cea mai bună soluție pentru viitor.

Cătălin Mosoia: Când o să-l publicați?

Gabriela Haja: Sunt mai multe lucruri de finalizat. Noi, lexicografii, avem dorința de a mai face o corectură a textului. Este nevoie de cel puțin o lectură și de corecturi. Sigur că am putea să publicăm eDTLR și așa, dar într-un dicționar ca acesta nu încape eroare de literă. Nu e permis. Nu putem. Dicționarul Academiei este reper pentru cercetările lingvistice serioase. În tezele de doctorat din domeniul lingvistic nu se lucrează fără acest dicționar sau nu ar trebui să se lucreze. Or, dacă introducem un zgomot, cum spun informaticienii, adică o eroare, ea este preluată progresiv, iar efectul poate fi dezastruos. Putem face următorul compromis: să publicăm paginile scanate, iar, în spate, să se afle formatul electronic, care permite consultări complexe.

De altfel, din 2010, la Institutul nostru se lucrează la cel mai amplu corpus de dicționare românești în format electronic, pe scurt CLRE. Proiectul acesta e un efect al marelui eDTLR. CLRE cuprinde, în prezent, 160 de dicționare, de la cel mai vechi (Anonimus Caransebensiensis, cca 1650) până la ultimul DEX. Suntem în faza de revizie a celor aproape 1 000 000 de cuvinte-titlu, cât are acum corpusul. Aceste cuvinte sunt puse în legătură cu intrările/articolele din Dicționarul limbii române. Sperăm să avem mijloacele tehnice necesare publicării on line a rezultatelor obținute până în prezent. Vrem să lansăm acest corpus în 2018, pentru că e un an special.

Și mai ales pentru că lucrările pe care noi le realizăm nu sunt numai ale noastre. Ele aparțin, de fapt, limbii române, pe care o slujim, care trebuie cunoscută și pusă în valoare.

Cătălin Mosoia: De unde vă alimentați această pasiune pentru cuvinte?

Gabriela Haja: Iubesc enorm limba română. Apoi, am avut norocul să întâlnesc oameni extraordinari în acest domeniu, cercetători cu totul aparte, cu o excelentă pregătire profesională, cu lucrări semnificative pentru domenii ca filologia, istoria limbii literare, gramatica, semantica, lexicologia. Dar, mai cu seamă, mânați de o pasiune molipsitoare. Pentru că lucrul la dicționar este pasionant: să urmărești istoria folosirii fiecărui cuvânt, evoluția lui semantică, sensurile neobișnuite, farmecul textelor care te poate ispiti să întârzii asupra lor, în pofida verificării citatului... Se cere să ai deopotrivă răbdarea, precizia, finețea restauratorului și viziunea de ansamblu a arhitectului creator de mari structuri. Poate fi înrobitor și poate fi foarte frustrant. Tu ești o rotiță măruntă într-un mecanism copleșitor și nici nu te chemi autor, ci, simplu, redactor. Am colegi care au ostenit 50 de ani numai la Dicționarul limbii române sau la alte mari dicționare ale Academiei, cum este Dicționarul general al literaturii române; și nu au publicat nicio carte, nu sunt doctori în filologie, dar contribuția lor este enormă. O știm noi, cei care am lucrat sau lucrăm cu alături de ei.

Cătălin Mosoia: Iubiți limba română.

Gabriela Haja: ... Cuvintele au fost comparate cu banii. Fiindcă ele circulă asemenea monedelor. Adunate laolaltă, formează tezaure. Dar acum, când totul – inclusiv cercetarea – se măsoară numai în numere, în eficiență economică, după indicatori care nu reprezintă prea mult pentru cercetătorul umanist, filolog al limbii române, mă gândesc că suma cuvintelor unei limbi nu face neapărat o operă. Că lipsită de conținut, de sens, de valoare intrinsecă, o lucrare este ratată, inutilă, o risipă. Când am publicat prima carte, bunișoară, i-am arătat-o cu mândrie mamei. Care, înțeleaptă, a spus doar: Și tu? Am meditat la întrebare și mi-am propus să public doar ce cred că este cu adevărat important, cu încredere că ceea ce e valoros dăinuiește.

Chiar spațiul virtual devine sufocant din pricina milioanelor de cuvinte și semne, care tot circulă, banale, între noi, cu viteze tot mai mari. Încât s-au dezvoltat noi instrumente, capabile să selecteze informația relevantă, să răspundă inteligent la căutările noastre, să extragă elemente utile din cele mai aparent nesemnificative mesaje. Pentru toate acestea e nevoie de resurse pentru prelucrarea limbajului natural. Pe lângă corpusuri monolingve ori multilingve, paralele, e nevoie de lexicoane și mai ales de dicționare complexe precum este Dicționarul limbii române. Încât, da, e plin de sens lucrul la acest Dicționar. Este o formă de iubire.

Foto:

copyright © Academia Română 2006

copyright © Academia Română 2006