Имена в световната лингвистика: Юрий Дереникович Апресян

Юрий Дереникович Апресян

Aкадемик в Руската академия на науките, главен научен сътрудник в Лабораторията по компютърна лингвистика в Института по проблеми на предаването на информация „А. А. Харкевич“ на Руската академия на науките (ИППИ РАН).

 

– Юрий Дереникович, бихме искали да започнем с най-общите въпроси за лингвистиката като наука. Езикът е невероятно сложен обект, много труден за изследване. Езикът живее свой живот, подобен на живота в природата, а в същото време се реализира чрез човешката реч. И във връзка с това е първият въпрос: хуманитарна или естествена наука е лингвистиката?

– Лингвистиката е твърде нееднородна, за да може да се даде еднозначен отговор на този въпрос. Ако смятаме за еталон на естествена наука такава наука, чиито твърдения могат да бъдат проверени с помощта на експерименти, то лингвистиката по-скоро е хуманитарна наука. "По-скоро", защото различните лингвистични дисциплини заемат различно място на тази скала. Фонологията или морфологията, които се занимават с краен брой единици, са по-близо до точните науки. Като пример може да бъде приведен "Граматичният речник на руския език" на А. А. Зализняк, който позволява по достатъчно прости правила да се построят всички граматични форми на около 110 хиляди руски думи.

Безкрайността започва в синтаксиса и придобива още по-големи мащаби в семантиката. Дори относно броя и характера на значенията на някаква граматична форма има разногласия. Така например в академичната „Граматика на руския език“ от 1960 година на творителен падеж при глаголите се приписват седем различни значения: инструмент (резать ножом режа с нож), извършител на действието (изобретенный китайцами изобретен от китайци), съдържание (интересоваться живописью интересувам се от живопис), време (уехать ранней весной заминавам през пролетта), път (идти лесом вървя през гората), начин (петь басом пея басово), и признак на лице или предмет (назначить кого-либо ректором назначавам някого за ректор).

В академичната „Граматика на съвременния руски литературен език“ от 1970 година не се споменава инструменталното значение и значението за съдържание, но затова пък има няколко други, липсващи в Граматика-60: обектно (распоряжаться людьми разпореждам се с хора), определително (родиться счастливчиком да се родя с късмет), квантитативно (болтать часами бърборя с часове). В класическата книга на А. М. Пешковски ("Руският синтаксис в научна светлина") няма творителен квантитативен, но затова пък има творителен усилителен (криком кричит виком вика) и творителен ограничителен (окрепнуть духом укрепвам духом).

Разногласията нарастват, когато преминаваме в областта на лексикалната семантика. За да се убедим в това, достатъчно е да видим как различните тълковни речници на един и същ език описват броя, характера и подреждането на значенията на многозначните думи.

До тук ставаше дума за синхронната лингвистика. Диахронната лингвистика, която работи с историята на езика и поради необходимост, макар в някои случаи и с много голям брой паметници, е по-близо до естествените науки. Такова в частност е сравнително-историческото езикознание, може би единствената лингвистична дисциплина, която в редица случаи установява законите на своя обект. Като пример могат да служат фонетичните закони, по които в хода на историята в определено време и на определено лингвистично пространство

Такова в частност е сравнително-историческото езикознание – може би единствената лингвистична дисциплина, която в редица случаи установява законите на развитието на своя обект. За пример могат да служат фонетичните закони, според които в хода на историята в определено време и на определено лингвистично пространство се променят звуковете в езика. Ще назова един от тях – преминаване на съгласните в германските езици, в резултат на което индоевропейските глухи [p], [t] и [k], запазили се добре например в латинския, преминават съответно в спиранти [f], [θ] и [h]; сравнете латинското pēs (крак, стъпало)’ и английското foot; латинското trēs (три) и английското three; латинското cănis (куче) и английското hound.

В областта на диахронната лингвистика има дори прецеденти за това, което би могло да бъде назовано научно предсказание. Едно от най-известните е дешифрирането от Жан Франсоа Шамполион през 1824 год. на египетско йероглифно писмо. Правилността на предложения от него модел е категорично потвърдена през 1866 год., когато неговият последовател Карл Рихард Лепиус е намерил в Египет камък с текстове на три езика (така наречения Канопски декрет) и, превеждайки египетския текст на гръцки език по метода на Шамполион, е получил превод, съвпадащ с гръцкия текст на декрета.

Има и други факти от подобен род, например направеното ненадейно от Фердинад де Сосюр откритие на ларингалните звукове (то е описана кратко в книгата ми "Идеи и методи на съвременната структурна лингвистика", затова няма да го излагам тук отново).

 

Имат ли лингвистичните разработки съответствия (корелации) в действителността?

– Ако се имат предвид диахронните изследвания, то на този въпрос отговорих по-горе. Ако ли пък синхронните, то ще отговарям на него, изхождайки от предположението, че под „действителност“ в дадения случай се разбира езикът. Тук трябва да се направи още едно допускане и да се смята, че всеки конкретен език, т. е. способността да се произвеждат текстове, изразяващи нужния смисъл и да бъдат разбирани такива текстове, може да бъде зададен във формата на относително пълна граматика и относително пълен речник на този език. Тогава косвено свидетелство за това, че "лингвистичните разработки се съотнасят с действителността", е например възможността да научиш нов за себе си език по тези два документа и свободно да започнеш да говориш на него. Наричам това свидетелство "косвено", защото съм дълбоко убеден в това, че ние никога няма да научим достатъчно детайлно как работи мозъкът/съзнанието на човека въобще и при усвояване на език в частност. Тази тема в друга връзка се обсъжда и по-долу.

 

– Уточняващ въпрос. Какво означава, че една лингвистична теория е по-добра от друга? Достатъчно ли по-доброто описание да е по-просто, удобно, лаконично и правилно да предсказва поведението на обекта? Или все пак най-простото описание противоречи на интуицията и на лингвиста му се струва, че то „не прилича“ на описваното езиково явление, то такова описание няма да задоволи лингвиста?

– Според мен в съвременния лингвистичен дискурс твърдението, че една лингвистична концепция е по-добра от друга, не означава нищо, макар че има достатъчно такива спекулации. Нека направим явно фантастичното допускане, че вече са съгласувани критериите, по които може да се оценява качеството на лингвистичните теории, нека например критерият да бъде обемът на лингвистичните описания (в печатни коли), съставени въз основа на теориите Тi и Тj, спрямо един и същ обем описвани езикови факти във вид на някакво множество писмени текстове (също в печатни коли). Теорията Тi е по-добра от теорията Тj, ако тази дроб за нея е по-малка.

Доколкото ми е известно, нито такава, нито някаква друга работа не е провеждана за нито един език. Реално, така ми се струва, някоя лингвистична теория е предпочитана не въз основа на строги критерии за оценка и по-нататъшно отхвърляне на алтернативни теории, а по други, чисто човешки основания: тя е по-близо териториално на лингвиста, той я познава по-добре, защото познава нейния автор и може да обсъжда с него неясни места и т.н.

 

– В лингвистиката има ли проверяеми твърдения? Нали има верифицирани/неверифицирани? Последното не пречи ли на лингвистиката да бъде наука?

– Има, разбира се. Такива са например фонетичните закони, за които стана дума по-горе. Наистина там стана дума за диахронията и за фонетичните явления. Но болшинството „синхронни“ граматични правила също е проверяемо, макар и с уговорки. Всеки ученик знае, че в руския език се различават качествени и относителни прилагателни. Например бедный е качествено прилагателно, а каменный – относително. На качествените прилагателни в граматиките на руския език се приписват до шест свойства, от които ще спомена четири: а) те имат пълни и кратки форми (бедный — беден, бедна); променят се по степен (бедный, беднее, беднейший); в) от тях се образуват наречия (жил бедно); г) от тях се образуват съществителни със значение на свойство или състояние (бедность). Относителните прилагателни нямат нито едно от изброените свойства.

С помощта на тези признаци можем с голяма доза увереност да установим дали дадено прилагателно е относително или качествено.

Но в стихотворението на Валерий Брюсов „Лестница (Стълби)“ има такива редове: „Всё каменней ступени, / Всё круче, круче всход“. Той използва относителното прилагателно като качествено, като метафорично, и това му дава възможност за по-голяма изразителност.

Малко отстъпление. Всяка метафора – например пряжа тумана преждата на мъглата, лысины булыжника плешивината на камъка, волна судьбы вълна на съдбата – е семантична грешка, или с други думи, нарушение на правилата на семантичното съгласуване. Въпреки това речта на най-добрите носители на езика е изпъстрена с такива грешки, защото те позволяват да изразяват мисълта си кратко и образно.

Никой не е казал това по-добре от Борис Пастернак: „Метафоризмът е естествено следствие от кратковременността на човека и на замислената далеч занапред огромност на неговите задачи. При това несъответствие той е принуден да гледа на нещата зорко като орел и да се изразява с мигновени и веднага разбираеми озарения. Именно това е поезията. Метафоризмът е стенографията на голямата личност, бързопис на нейния дух“. Обърнете внимание на ефектните и дълбоки метафори на самия Пастернак.

Да се върнем към качествените и относителните прилагателни: в началото на 1960-те години в Института за руски език на Академията на науките на СССР е проведено изследване на свойствата на качественост – относителност на голям масив прилагателни и е установено, че между тях няма ясна граница. Има плавна скала на прехода от прототипични качествени прилагателни (те притежават всичките шест свойства на качественост) към прототипични относителни прилагателни (не нямат нито едно от тези свойства) през много промеждутъчни степени. Има по пет/четири/три и т. н. свойства на качественост, при това не задължително едни и същи при различните прилагателни.

В действителност картина е още по-сложна. Изцяло качествено прилагателно може да не притежава нито едно от неговите прототипични свойства, ако то се развива в структурата на многозначността на изходно относително прилагателно. Да вземем прилагателните железный и стальной: железен и стоманен. В главните си значения (железная стружка, стальная дверь) (желязна стружка, стоманена врата), това, разбира се, са относителни прилагателни. Но в значенията „крепкий“ (здрав) (железные мускулы, стальные мышцы - железни мускули, стоманени мишци) и „твердый“ (твърд) (желязная дисциплина, стальная воля желязна дисциплина стоманена воля) семантично те стават качествени прилагателни. Те обаче не придобиват никакви формални свойства на качествените прилагателни (вж.по-горе). В частност те нямат кратки форми (едва ли ще чуете Его мышцы железны/стальны), степени за сравнение (не казват А у них дисциплина еще железнее или Его воля еще стальнее) и т.н., при това, че техните синоними крепкий и твердый притежават всички свойства на качествените прилагателни.

Макар че както показват разгледаните факти, между полярните явления в езика има широка област промеждутъчни явления, която прави прехода от единия полюс към другия почти непрекъснат, това съвсем не отменя ползата от разграничаване на полюсите. Именно в тези прототипични точки проверяването на синхронните лингвистични твърдения достига своя максимум.

За съвременното състояние на лингвистиката, машинния превод и системата „Етап“.

 

– Какво най-интересно сега се случва в теоретичната лингвистика?

– Всичко зависи от това какво се разбира под теоретична лингвистика. Ако например фундаменталните изследвания на вида в руския език или на лексикалната многозначност отнесем към сферата на теоретичната лингвистика, то да се посочат поне десетина интересни работи, посветени само на тези две теми (в действителност такива теми са много повече), в един кратък отговор е невъзможно. Ако към теоретичната лингвистика бъдат отнесени и формалните системи от типа на граматиката на Монтегю, макар да си да си призная, не следя тази област, а малкото, което по случайност зная, ми се струва неприложимо в реалната работа с материал от естествените езици.

Във връзка с обсъждания въпрос следва да се спомене още едно обстоятелство, което доведе до усъвършенстване на методологията на търсене на научната истина и по този начин ускори темповете на развитие на теоретичната лингвистика през последните десетилетия на миналия век започна да се променя емпиричната база на лингвистиката. Появиха се големи електронни корпуси с текстове, снабдени с програми за търсене на нужната за лингвиста информация, в частност Националния корпус на руския език. Те с цял порядък съкратиха времето за събиране на емпиричен материал, от една страна, и станаха удобно място за проверка на фактическата обосновка на теоретичните хипотези, от друга.

 

– Още един въпрос – за връзката на теоретичната лингвистика и автоматичния превод, въобще за задачите на автоматичната обработка на текста. На началния етап изглеждаше, че машинният превод ще възникне/ще се роди непосредствено от семантичните представяния. Но сега виждаме, че автоматичната обработка на текстовете се базира преди всичко на статистическа обработка на големи масиви текстове. Практическите приложения на теоретичната семантика се оказаха по-ограничени, отколкото изглеждаше отначало, така ли? Или те имат перспектива?

– Цитирам началото на Вашия въпрос: „На началния етап изглеждаше, че машинният превод ще се роди непосредствено от семантичните представяния“.

Честно казано, не зная на кого му се е струвало така. Семантичното представяне не може да бъде изходна точка за машинния превод по две причини. Първо, не е ясно откъде то ще се появи. Второ, и до сега не съществува формален семантичен език, на който може напълно да бъде отразен смисълът на произволно изречение от естествения език.

Въпреки това и поради липсата на семантично представяне задачата на машинния превод се свежда до това, че на всяко изречение от езика източник да се намери съответствие на такова граматически правилно изречение от друг език, в което с достатъчна пълнота се запазва смисълът на изходното изречение. Когато започвахме работата си в тази област, ние изхождахме от това, че посочената задача може да бъде решена само въз основа на сериозна лингвистична теория.

Като такава теория избрахме модела „Смисъл – Текст“ на И. А. Мелчук. Главният ни резултат в областта на машинния превод е системата „Етап – 2“ и по-конкретно подсистемата за превод на научно-технически текстове от английски на руски език и от руски на английски.

Основните им лингвистични компоненти са пълните формални граматики (морфология и синтаксис) на английския и руския език, формални речници на двата езика с обем повече от 100 хиляди думи всеки и модули за преход от изречението на входния език към изречението на изходния. В процеса на разработване на системата „Етап“ ние изработихме нов тип лингвистично описание – така нареченото интегрално описание на езика.

В двете подсистеми преходът от изходния текст към неговия превод става не на ниво семантично представяне, а на ниво синтактична структура (дърво на зависимостите) на превежданото изречение. Полученото в резултат на синтактичния анализ дърво на зависимостите на входното изречение през редица промеждутъчни стъпки (снемане на особеностите на входния език, собствено превод, пораждане на особеностите на изходния език) се преобразува в дърво на зависимостите на изходното изречение; последното с помощта на редица операции, „обратни“ на операциите на синтактичния анализ, се превръща в реално изречение на изходния език.

Пример за машинен превод от английски език на руски: In the early sixties, chromatography became an analytical tool (now the most highly used instrumental technique in the chemical laboratory) g В начале шестидесятых годов хроматография стала аналитическим инструментом (в настоящее время наиболее широко использованный инструментальный метод в химической лаборатории).

Пример за машинен превод от руски език на английски: Несколько лет назад стали коммерчески доступны первые микропроцессорные схемы, что привело к созданию многочисленных вариантов машины ответа g Several years ago became commercially accessible the frst microprocessor chips, which has led to creation of numerous versions of a machine of answer.

Нарочно приведох примери за преводи, които съдържат явни грешки, защо – ще стане ясно малко по-долу.

Когато се появиха статистически системи за машинен превод (споменати и във вашия въпрос), се оказа, че те функционират не по-лошо, отколкото нашата „умна“ система, а понякога дават и по-правилни от всяка гледна точка преводи.

Във всеки случай извън конкуренция остава превода на текстове от професионални преводачи.

Тук бих искал да се върна към изказаното по-горе твърдение: ние никога няма да разберем достатъчно детайлно как работи мозъкът/съзнанието на човека. Ако това знание ни беше достъпно, бихме могли да конструираме машинен преводач, който да може да се конкурира с човека.

Казаното в никакъв случай не означава, че усилията ни са били напразни. Първо, получените резултати са ценни сами по себе си, в частност, защото могат да показват грешки в самия модел на езика, заложен в основата на системата за машинен превод.

Второ, което е доста по-важно, в процеса на разработването на системата „Етап“ изработихме нов тип лингвистично описание, което, струва ми се, представлява общотеоретичен интерес – така нареченото интегрално описание на езика.

 

– Какво представлява то?

– Пълното лингвистично описание на всеки конкретен език се състои от два основни компонента – граматика и речник. В идеалния случай тези два компонента трябва да са напълно съгласувани един с друг по типовете поместена в тях информация и по формалните езици на нейното записване – в противен случай те няма да могат да си взаимодействат помежду си. Традиционните лингвистични описания не отговарят на това изискване.

Например в граматиките (в това число и във вече споменатата академична Граматика на руския език от 1960 год.) при описване на сравнителната степен на прилагателните не се отбелязва, че тя има различни значения за различните семантични класове прилагателни.

В частност сравнителната степен от прилагателни, обозначаващи размер, „преминава“ през цялата скала на размера: предметът Х може да бъде по-голям или по-малък от предмета Y и в този случай, когато Y е много голям, и в случай, когато той е много малък. Между другото сравнителната степен от прилагателните, обозначаващи цвят, не минава през цялата цветова гама, т. е. позволява да се сравняват не кои да е цветове, а само оттенъците на един и същи цвят: предметът Х може да бъде по-червен от предмета Y само в случай, че и двата предмета са червени.

Нещо повече, дори в пределите на един и същ семантичен клас прилагателни сравнителната степен може да има различни значения. Така стоят нещата при антонимичните оценъчни прилагателни от типа – умный-глупый. Човекът Х може да бъде по-умен от човека Y и в този случай, когато Y също е умен, и в този случай, когато той е глупав. Ако казваме, че Х е по-глупав от Y, то обикновено се има предвид, че Y също е глупав.

На свой ред в речника се дават твърде общи граматични бележки, които не отчитат граматичните особености на думата в различните случаи на употребата ѝ дори в рамките на едно и също значение. На същото прилагателно красный в значението цвят на кръвта речниците приписват кратките форми красен, красна и красно, но не съобщават точно в кои случаи те са възможни, а в кои – не. Например във фрагмента на речниковата статия на Големия академичен речник на руския език (8-и том), посветен на главното значение на това прилагателно, фигурират като примери словосочетания красная икра, красная медь, красное золото, красное вино, красный гриб и т.н. Нито в едно от тези словосъчетания сравнителната степен е възможна, защото в тях красный всъщност е относително прилагателно. Обаче в речника това не се отбелязва по никакъв начин.

Аз смятам интегралното описание на езика за свръхзадача на синхронната лингвистика. В своята лингвистична работа, и в частност в рамките на системата „ЭТАП“, се стремим в максимална степен да спазваме принципите на интегралното описание, макар, естествено, също да не сме застраховани от грешки.

  • Страница: 146-153

ПОЛИТИКА ПО СИГУРНОСТТА

Моля, прочетете внимателно тази Политика за поверителност и защита на личните данни, преди да използвате този уеб сайт.

Повече информация

УСЛОВИЯ ЗА ПОЛЗВАНЕ

Моля, прочетете внимателно тези Условия за ползване на сайта, преди да използвате този уеб сайт.
С достъпа си до този сайт, Вие се съгласявате със следващите по-долу условия.

Повече информация

КОНТАКТИ

Списание „Съвременна лингвистика“
Факултет по славянски филологии
СУ „Св. Климент Охридски“
бул. Цар Освободител №15, каб. 139А
София 1504
тел. 02 930 8393
editors@modern-linguistics.eu
www.modern-linguistics.eu