Оглавление
Введение
Глава 1. История примененияматематических методов в лингвистике
1.1. Становление структурнойлингвистики на рубеже XIX – ХХ веков
1.2. Применение математических методов в лингвистикево второй половине ХХ века
Глава 2. Отдельные примеры использованияматематики в лингвистике
2.1. Машинный перевод
2.2.Статистические методы в изученииязыка
2.3. Изучение языка методамиформальной логики
2.4. Перспективы примененияматематических методов в лингвистике
Заключение
Литература
Приложение 1. Ronald Schleifer.Ferdinand de Saussure
Приложение 2. Фердинанд де Соссюр(перевод)
Введение
В ХХ веке наметилась продолжающаяся и поныне тенденция к взаимодействию ивзаимопроникновению различных областей знаний. Постепенно стираются грани междуотдельными науками; появляется всё больше отраслей умственной деятельности,находящихся «на стыке» гуманитарного, технического и естественнонаучногознания.
Другая очевидная особенность современности – стремление к изучениюструктур и составляющих их элементов. Поэтому всё большее место как в научнойтеории, так и на практике уделяется математике. Соприкасаясь, с одной стороны,с логикой и философией, с другой стороны, со статистикой (а, следовательно, и собщественными науками), математика всё глубже проникает в те сферы, которые напротяжении долгого времени было принято считать чисто «гуманитарными», расширяяих эвристический потенциал (ответ на вопрос «сколько» часто помоагет ответить ина вопросы «что» и «как). Исключением не стало и языкознание.
Цель моей курсовой работы – кратко осветить связь математики с такойотраслью языкознания, как лингвистика. Начиная с 50-х годов прошлого века,математика применяется в лингвистике при создании теоретического аппарата дляописания строения языков (как естественных, так и искусственных). Однакоследует сказать, что она не сразу нашла себе подобное практическое применение.Первоначально математические методы в лингвистике стали использоваться длятого, чтобы уточнить основные понятия языкознания, однако с развитиемкомпьютерной техники подобная теоретическая посылка стала находить применениена практике. Разрешение таких задач, как машинный перевод, машинный поискинформации, автоматическая обработка текста требовало принципиально новогоподхода к языку. Перед лингвистами назрел вопрос: как научиться представлятьязыковые закономерности в том виде, в котором их можно подавать непосредственнона технику. Популярным в наше время термином «математическая лингвистика»называют любые лингвистические исследования, в которых применяются точныеметоды (а понятие точных методов в науке всегда тесно связано с математикой).Некоторые учёные прошлых лет, считают, что само выражение нельзя возводить вранг термина, так как оно обозначает не какую-то особую «лингвистику», а лишьновое направление, ориентированное на усовершенствование, повышение точности инадёжности методов исследования языка. В лингвистике используются какколичественные (алгебраические), так и неколичественные методы, что сближает еёс математической логикой, а, следовательно, и с философией, и даже спсихологией. Ещё Шлегель отмечал взаимодействие языка и сознания, а видныйлингвист начала ХХ века Фердинанд де Соссюр (о его влиянии на становлениематематических методов в лингвистике расскажу позже) связывал структуру языка сего принадлежностью к народу. Современный исследователь Л. Перловский [43] идётдальше, отождествляя количественные характеристики языка (например, числородов, падежей) с особенностями национального менталитета (об этом в разделе2.2, «Статистические методы в лингвистике»).
Взаимодействие математики и языкознания – тема многогранная, и в своейработе я остановлюсь не на всех, а, в первую очередь, на её прикладныхаспектах.
Глава I. История примененияматематических методов в лингвистике
1.1 Становление структурнойлингвистики на рубеже XIX – ХХ веков
Математическое описаниеязыка основано на представлении о языке как о механизме, восходящем кизвестному швейцарскому лингвисту начала ХХ века Фердинанду де Соссюру.
Начальное звено его концепции – теория языка как системы, cостоящей изтрёх частей (собственно язык – langue, речь – parole, и речевуюдеятельность – langage), в которой каждое слово (член системы)рассматривается не само по себе, а в связи с другими членами. Как впоследствииотметил другой видный лингвист, датчанин Луи Ельмслев, Соссюр «первый требовалструктурного подхода к языку, то есть научного описания языка путём регистрациисоотношений между единицами» [22, c. 54].
Понимая язык как иерархическую структуру, Соссюр первым поставил проблемуценности, значимости языковых единиц. Отдельные явления и события (скажем,история происхождения отдельных индоевропейских слов) должны изучаться не самипо себе, а в системе, в которой они соотнесены с подобными же составляющими.
Структурной единицей языка Соссюр считал слово, «знак», в котором соединялись звучание и смысл. Ни одиниз этих элементов не существует друг без друга: поэтому носителю языка понятныразличные оттенки значения многозначного слова как отдельного элемента вструктурном целом, в языке.
Таким образом, в теории Ф. де Соссюра можно увидеть взаимодействиелингвистики, с одной стороны, с социологией и социальной психологией (следуетотметить, что в это же время развиваются феноменология Гуссерля, психоанализФрейда, теория относительности Эйнштейна, происходят эксперименты над формой исодержанием в литературе, музыке и изобразительном искусстве), с другой стороны– с математикой (понятие системности соответствует алгебраической концепцииязыка). Подобная концепция изменила понятие языковой интерпретации как таковой:Явления стали трактоваться не относительно причин их возникновения, аотносительно настоящего и будущего. Толкование перестало быть независимым отнамерений человека (несмотря на то, что намерения могут быть безличными,«бессознательными» во фрейдистском понимании этого слова).
Функционирование же языкового механизма проявляется через речевуюдеятельность носителей языка. Результатом речи являются так называемые«правильные тексты» – последовательности речевых единиц, подчиняющиесяопределённым закономерностям, многие из которых допускают математическоеописание. Изучением способов математического описания правильных текстов (впервую очередь, предложений) занимается теория способов описания синтаксическойструктуры. В подобной структуре языковыеаналогии определены не с помощью изначально присущих им качеств, а с помощьюсистемных («структурных») отношений.
На Западе соссюровские идеи развивают младшие современники великогошвейцарского лингвиста: в Дании – уже упомянутый мною Л. Ельмслев, давшийначало алгебраической теории языка в своём труде «Основы лингвистическойтеории», в США – Э. Сепир, Л. Блумфилд, Ц. Харрис, в Чехии – русскийучёный-эмигрант Н. Трубецкой.
Статистическими же закономерностями в изучении языка стал заниматься некто иной, как основоположник генетики Георг Мендель. Только в 1968 годуфилологи обнаружили, что, оказывается, в последние годы жизни он был увлеченизучением лингвистических явлений с помощью методов математики. Этот методМендель привнёс в лингвистику из биологии; в девяностые годы девятнадцатоговека лишь самые смелые лингвисты и биологи заявляли о целесообразностиподобного анализа. В архиве монастыря св. Томаша в г. Брно, аббатом которогобыл Мендель, были найдены листки со столбцами фамилий, оканчивающимися на«mann», «bauer», «mayer», и с какими-то дробями и вычислениями. Стремясьобнаружить формальные законы происхождения фамильных имен, Мендель производитсложные подсчеты, в которых учитывает количество гласных и согласных в немецкомязыке, общее число рассматриваемых им слов, количество фамилий и т.д.
В нашейстране структурная лингвистика начала развиваться примерно в то же время, что ина Западе – на рубеже XIX-XX веков. Одновременно с Ф. де Соссюром понятие языкакак системы разрабатывали в своих трудах профессора Казанского университетаФ.Ф. Фортунатов и И.А. Бодуэн де Куртенэ. Последний на протяжении долгоговремени переписывался с де Соссюром, соответственно, женевская и казанскаяшколы языкознания сотрудничали друг с другом. Если Соссюра можно назватьидеологом «точных» методов в лингвистике, то Бодуэн де Куртенэ заложилпрактические основы их применения. Он первым отделил лингвистику (как точнуюнауку, использующую статистические методы и функциональную зависимость) отфилологии (общности гуманитарных дисциплин, изучающих духовную культуру черезязык и речь). Сам учёный считал, что «языкознание может принести пользу вближайшем будущем, лишь освободившись от обязательного союза с филологией иисторией литературы» [13, c.102]. «Испытательным полигоном» для внедренияматематических методов в лингвистику стала фонология – звуки как «атомы»языковой системы, обладающие ограниченным количеством легко измеримых свойств,были самым удобным материалом для формальных, строгих методов описания.Фонология отрицает наличие смысла у звука, так что в исследованиях устранялся«человеческий» фактор. В этом смысле фонемы подобны физическим илибиологическим объектам.
Фонемы, как самые мелкие языковые элементы,приемлемые для восприятия, представляют собой отдельную сферу, отдельную «феноменологическуюреальность». Например, в английском языке звук «т» может произноситьсяпо-разному, но во всех случаях человек, владеющий английским, будетвоспринимать его как «т». Главное, что фонема будет выполнять свою главную –смыслоразличительную – функцию. Более того – различия между языками таковы, чторазновидности одного звука в одном языке могут соответствовать разным фонемам вдругом; например «л» и «р» в английском различны, в то время как в другихязыках это разновидности одной фонемы (подобно английскому «т», произнесённомус придыханием или без). Обширный словарный запас любого естественного языкапредставляет собой набор сочетаний гораздо меньшего количества фонем. Ванглийском, например, для произнесения и написания около миллиона словиспользуется всего 40 фонем.
Звуки языка представляют собой системноорганизованный набор черт. В 1920е –1930е, вслед за Соссюром, Якобсон иН.С.Трубецкой выделили «отличительные черты» фонем. Эти черты основаны настроении органов речи – языка, зубов, голосовых связок. Скажем, в английскомразница между «т» и «д» заключается в наличии или отсутствии «голоса»(напряжении голосовых связок) и в уровне голоса, отличающем одну фонему отдругой. Таким образом, фонологию можно считать примером общего языковогоправила, описанного Соссюром: «В языке есть только различия» [24, c. 145].Более важно даже не это: различие обычно подразумевает точные условия, междукоторыми оно и находится; но в языке существуют только различия без точныхусловий. Рассматриваем ли мы «обозначение» или «обозначаемое» – в языке несуществует ни понятий, ни звуков, которые существовали бы до того, какразвилась языковая система.
Таким образом, в соссюровском языкознании изучаемыйфеномен понимается как свод сопоставлений и противопоставлений языка. Язык –это и выражение значения слов, и средство общения, причём эти две функцииникогда не совпадают. Мы можем заметить чередование формы и содержания:языковые контрасты определяют его структурные единицы, и эти единицывзаимодействуют, чтобы создать определённое значимое содержание. Так какэлементы языка случайны, ни контраст, ни сочетание не могут быть основой.Значит, в языке отличительные признаки формируют фонетический контраст надругом уровне понимания, фонемы соединяются в морфемы, морфемы – в слова, слова– в предложения и т.д. В любом случае, целая фонема, слово, предложение и т.д.представляет собой нечто большее, чем просто сумма составляющих.
Соссюр предложил идею новой науки двадцатого века,отдельно от лингвистики изучающей роль знаков в обществе. Соссюр назвал этунауку семиологией (от греческого «semeîon» — знак). «Наука» семиотики,развивавшаяся в Восточной Европе в 1920е –1930е и в Париже в 1950е – 1960е,расширила изучение языка и лингвистических структур до литературных находок,составленных (или сформулированных) с помощью этих структур. Кроме того, назакате своей карьеры, параллельно совему курсу общей лингвистики, Соссюрзанялся «семиотическим» анализом поздней римской поэзии, пытаясь открытьумышленно составленные анаграммы имён собственных. Этот метод был во многомпротивоположен рационализму в его лингвистическом анализе: он был попыткой,изучить в системе проблему «вероятности» в языке. Такое исследование помогаетсосредоточиться на «вещественной стороне» вероятности; «ключевое слово»,анаграмму которого ищет Соссюр, как утверждает Жан Старобинский, «инструментдля поэта, а не источник жизни стихотворения». Стихотворение служит для того,чтобы поменять местами звуки ключевого слова. По словам Старобинского, в этоманализе «Соссюр не углубляется в поиски скрытых смыслов». Напротив, в егоработах заметно желание избежать вопросов, связанных с сознанием: «так какпоэзия выражается не только в словах, но и в том, что порождают эти слова, онавыходит из-под контроля сознания и зависит только от законов языка» (cм.Приложение 1).
Попытка Соссюра изучить имена собственные в позднейримской поэзии подчёркивает одну из составляющих его лингвистического анализа –произвольную природу знаков, а также формальную сущность соссюровскойлингвистики, что исключает возможность анализа смысла. Тодоров делает вывод,что в наши дни труды Соссюра выглядят на редкость последовательными в нежеланииизучать символы явления, имеющие чётко определённое значение [Приложение 1]. Исследуя анаграммы, Соссюробращает внимание только на повторение, но не на предшествующие варианты….Изучая «Песнь о Нибелунгах», он определяет символы только для того, чтобыприсвоить их ошибочным чтениям: если они неумышленны, символов не существует. Вконце концов, в своих трудах по общей лингвистике он делает предположение осуществовании семиологии, описывающей не только лингвистические знаки; но этопредположение ограничивается тем, что семиoлогия может описывать толькослучайные, произвольные знаки.
Раз это действительно так, то только потому, что немог представить «намерение» без предмета; он не мог до конца преодолетьпропасть между формой и содержанием – в его трудах это превращалось в вопрос.Вместо этого он обращался к «языковой законности». Находясь между, с однойстороны, концепциями девятнадцатого века, основанными на истории и субъективныхдогадках, и методах случайной интерпретации, основанных на этих концепциях, и,с другой стороны, структуралистскими концепциями, стирающими противостояниемежду формой и содержанием (субъектом и объектом), значением и происхождением вструктурализме, психоанализе и даже квантовой механике – труды Фердинанда деСоссюра по лингвистике и семиотике обозначают поворотный момент в изучениизначений в языке и культуре.
Русскиеучёные были представлены и на Первом международном конгрессе лингвистов в Гаагев 1928 году. С. Карцевский, Р. Якобсон и Н. Трубецкой выступили с докладом, вкотором рассматривалась иерархическая структура языка – в духе самыхсовременных для начала прошлого века представлений. Якобсон в своих трудахразвивал идеи Соссюра о том, что базовые элементы языка должны изучаться, впервую очередь, в связи со своими функциями, а не с причинами их возникновения.
К сожалению,после прихода в 1924 году к власти Сталина отечественное языкознание, как и многиедругие науки, отбрасывает назад. Многие талантливые учёные вынуждены былиэмигрировать, были высланы из страны или погибли в лагерях. Только с середины1950-х годов стал возможен некоторый плюрализм теорий – об этом в разделе 1.2.
1.2Применение математических методов в лингвистике во второй половине ХХ века
К середине ХХвека сформировалось четыре мировых лингвистических школы, каждая из которыхоказалась родоначальником определённого «точного» метода. Ленинградскаяфонологическая школа (её родоначальником был ученик Бодуэна де Куртенэ Л.В.Щерба) использовала в качестве основного критерия обобщения звука в виде фонемыпсихолингвистический эксперимент, основанный на анализе речи носителей языка.
Учёные Пражскоголингвистического кружка, в частности – его основатель Н.С. Трубецкой,эмигрировавший из России, разработали теорию оппозиций – семантическаяструктура языка была описана ими как набор оппозитивно постороенныхсемантических единиц – сем. Эта теория применялась в изучении не только языка,но и художественной культуры.
Идеологами американского дескриптивизма были языковеды Л. Блумфилди Э. Сепир. Язык представлялся дескриптивистам в виде совокупности речевыхвысказываний, которые и были главным объектом их исследования. В центре ихвнимания оказались правила научного описания (отсюда название) текстов:изучение организации, аранжировка и классификация их элементов. Формализацияаналитических процедур в области фонологии и морфологии (разработка принциповисследования языка на разных уровнях, дистрибутивного анализа, методанепосредственно составляющих и т.д.) привела к постановке общих вопросовлингвистического моделирования. Невнимание к плану содержания языка, а такжепарадигматической стороне языка не позволило дескриптивистам достаточно полно интерпретироватьязык как систему.
В 1960-х годах развивается теория формальных грамматик, возникшая,главным образом, благодаря работам американского философа и лингвиста Н.Хомского. Он по праву считается одним из наиболее известных современных учёныхи общественных деятелей, ему посвящено множество статей, монографий и дажеполнометражный документальный фильм. По имени принципиально нового способаописания синтаксической структуры, изобретённого Хомским – генеративной(порождающей) грамматики – соответствующее течение в лингвистике получилоназвание генеративизма.
Хомский, потомок выходцев из России, с 1945 года изучал в Пенсильванскомуниверситете лингвистику, математику и философию, находясь под сильным влияниемсвоего учителя Зелига Хэрриса – как и Хэррис, Хомский считал и считает своиполитические взгляды близкими к анархизму (до сих пор он известен как критиксуществующего политического строя США и как один из духовных лидеровантиглобализма).
Первая крупная научная работа Хомского, магистерская диссертация«Морфология современного иврита» (1951), так и осталасьнеопубликованной. Докторскую степень Хомский получил в Пенсильванскомуниверситете в 1955, однако большая часть исследований, положенных в основудиссертации (полностью опубликованной только в 1975 под названием «Логическаяструктура лингвистической теории») и его первой монографии «Синтаксическиеструктуры» (Syntactic Structures, 1957, рус. пер. 1962), была выполнена вГарвардском университете в 1951–1955. В том же 1955 ученый перешел в Массачусетскийтехнологический институт, профессором которого он стал в 1962.
В своём развитии теория Хомского прошла несколько этапов.
В первой монографии «Синтактические структуры» учёный представил язык какмеханизмепорождения бесконечного множества предложений с помощью конечногонабора грамматических средств. Для описания языковых свойств он предложилпонятия глубинной (скрытой от непосредственного восприятия и порождаемойсистемой рекурсивных, т.е. могущих применяться многократно, правил) иповерхностной (непосредственно воспринимаемой) грамматических структур, а такжетрансформаций, описывающих переход от глубинных структур к поверхностным. Однойглубинной структуре могут соответствовать несколько поверхностных (например,пассивная конструкция Указ подписывается президентом выводится из той жеглубинной структуры, что и активная конструкция Президент подписывает указ)и наоборот (так, неоднозначность Мать любит дочь описывается какрезультат совпадения поверхностных структур, восходящих к двум различным глубинным,в одной из которых мать – та, кто любит дочь, а в другой – та, кого любитдочь).
Стандартной теорией Хомского считается модель «Аспектов», изложенная вкниге Хомского «Аспекты теории синтаксиса». В этой модели в формальную теориювпервые вводились правила семантической интерпретации, приписывающих значениеглубинным структурам. В «Аспектах» языковая компетенция противопоставленаупотреблению языка (performance), принята так называемая гипотеза Катца –Постала о сохранении смысла при трансформации, в связи с чем исключено понятиефакультативной трансформации, а также введен аппарат синтаксических признаков,описывающих лексическую сочетаемость.
В 1970-е Хомский работает над теорией управления и связывания (GB-теория– от слов government и binding) – более общей, нежели предыдущая.В ней учёный отказался от специфических правил, описывающих синтаксическиеструктуры конкретных языков. Все трансформации были заменены однойуниверсальной трансформацией перемещения. В рамках GB-теории существуют ичастные модули, каждый из которых отвечает за свою часть грамматики.
Уже недавно, в 1995 году, Хомский выдвинул минималистскую программу, гдечеловеческий язык описывается подобно машинному. Это лишь программа – не модельи не теория. В ней Хомский выделяет две главных подсистемы языкового аппаратачеловека: лексикон и вычислительную систему, а также два интерфейса –фонетический и логический.
Формальные грамматики Хомского стали классическими для описания не толькоестественных, но и искусственных языков – в частности, языков программирования.Развитие структурной лингвистики во второй половине ХХ века можно по правусчитать «хомскианской революцией».
Московскаяфонологическая школа,представителями которой были А.А. Реформатский, В.Н. Сидоров, П.С. Кузнецов,А.М. Сухотин, Р.И. Аванесов, использовала подобную же теорию для изученияфонетики. Постепенно «точные» методы начинают применяться касаемо не толькофонетики, но и синтаксиса. Структурностью языка начинают заниматься илингвисты, и математики – как у нас, так и за рубежом. В 1950-60е в СССРначинается новый этап во взаимодействии математики и лингвистики, связанный сразработкой систем машинного перевода.
Толчком к началу этих работ в нашей стране послужили первые разработки вобласти машинного перевода в США (хотя первое механизированное переводноеустройство П.П. Смирнова-Троянского было изобретено в CCCР ещё в 1933 году,оно, будучи примитивным, не получило распространения). В 1947 году А.Бутт и Д.Бриттен придумали код для пословного перевода с помощью ЭВМ, годом позжеР.Риченс предложил правило разбиения слов на основу и окончание при машинномпереводе. В те годы довольно сильно отличались от современных. Это были оченьбольшие и дорогие машины, которые занимали целые комнаты и требовали для своегообслуживания большой штат инженеров, операторов и программистов. В основном этикомпьютеры использовались для осуществления математических расчетов для нуждвоенных учреждений – новое в математике, физике и технике служило, в первуюочередь, военному делу. На ранних этапах разработка МП активно поддерживаласьвоенными, при этом (в условиях «холодной войны») в США развивалосьрусско-английское направление, а в СССР — англо-русское.
В январе 1954года в Массачусетском техническом университете состоялся «Джорджтаунский эксперимент»–первая публичная демонстрация перевода с русского языка на английский на машинеИБМ-701. Реферат сообщения об удачном прохождении эксперимента, сделанный Д.Ю.Пановым, появился в РЖ «Математика», 1954, №10: «Перевод с одного языка надругой при помощи машины: отчёт о первом успешном испытании».
К работам помашинному переводу Д. Ю. Панов (в то время директор Института научнойинформации – ИНИ, позднее ВИНИТИ) привлёк И. К. Бельскую, которая позднеевозглавит группу машинного перевода в Институте точной математики ивычислительной техники АН СССР. К концу 1955 года относится первый опытперевода с английского языка на русский при помощи машины БЭСМ. Программы дляБЭСМ составляли Н.П. Трифонов и Л.Н. Королёв, кандидатская диссертация которогобыла посвящена методам построения словарей для машинного перевода.
Параллельноработы по машинному переводу велись в Отделении прикладной математикиМатематического института АН СССР (сейчас Институт прикладной математики имениМ.В. Келдыша РАН). По инициативе математика А.А. Ляпунова. К работам попереводу текстов на машине «Стрела» с французского языка на русский он привлёкаспирантку МИАН О.С. Кулагину и своих учениц Т.Д. Вентцель и Н.Н. Рикко.Представления Ляпунова и Кулагиной о возможности использования техники дляперевода с одного языка на другой были опубликованы в журнале «Природа», 1955,№8. С конца 1955 года к ним присоединилась Т.Н. Молошная, затем приступившая ксамостоятельной работе над алгоритмом англо-русского перевода.
Р.Фрумкина[37, c.12], занимавшаяся в то время алогритмом перевода с испанского, вспоминает,что на этом этапе работ сложно было делать какие-то последовательные шаги.Гораздо чаще приходилось следовать эвристическому опыту – своему или коллег.
Однако первое поколение систем машинного перевода было весьманесовершенным. Все они базировались на алгоритмах последовательного перевода«слово за словом», «фраза за фразой» – смысловые связи между словами ипредложениями никак не учитывались. Для примера можно привести предложения: «Johnwas looking for his toy box. Finally he found it. The box was in the pen. John was very happy. (Джон искал свою игрушечнуюкоробку. Наконец он ее нашел. Коробка была в манеже. Джон был оченьсчастлив.)». «Pen» в данном контексте – не «ручка» (инструмент для письма), а«детский манеж» (play-pen). Знание синонимов, антониов и переносныхзначений сложно вводить в компьютер. Перспективным направлением становиласьразработка машинных систем, ориентированных на использованиечеловеком-переводчиком.
Со временем на смену системам прямого перевода пришли Т-системы (отанглийского слова «transfer» – преобразование), в которых перевод осуществлялсяна уровне синтаксических структур. В алгоритмах Т-систем использовалсямеханизм, позволяющий построить синтаксическую структуру по правилам грамматикиязыка входного предложения (подобно тому, как учат иностранному языку в среднейшколе), а затем синтезировать выходное предложение, преобразуя синтаксическуюструктуру и подставляя из словаря нужные слова.
Ляпуновговорил о переводе путём извлечения смысла переводимого текста и егопредставления на другом языке. Подход к построению систем машинного перевода,основанный на получении смыслового представления входного предложения путём егосемантического анализа и синтеза входного предложения по полученному смысловомупредставлению, до сих пор считается наиболее совершенным. Такие системыназывают И-системами (от слова «интерлингва»). Однако задача по их созданию, поставленнаяещё в конце 50-х – начале 60-х, не решена полностью до сих пор, несмотря наусилия Международной федерации IFIP – мирового сообщества учёных в областиобработки информации.
Учёныезадумались над тем, как нужно формализовать и строить алгоритмы для работы стекстами, какие словари надо вводить в машину, какие лингвистическиезакономерности следует использовать при машинном переводе. Такимипредставлениями традиционная лингвистика не располагала – не только в частисемантики, но и в части синтаксиса. Ни для одного языка в то время несуществовало перечней синтаксических конструкций, не были изучены условия ихсочетаемости и взаимозмаеняемости, не были разработаны правила построениякрупных единиц синтаксической структуры из более мелких составляющих элементов.
Потребность всоздании теоретических основ машинного перевода и привела к формированию иразвитию математической лингвистики. Ведущую роль в этом деле в СССР сыгралиматематики А.А. Ляпунов, О.С. Кулагина, В.А. Успенский, лингвисты В.Ю.Розенцвейг, П.С. Кузнецов, Р.М. Фрумкина, А.А. Реформатский, И.А. Мельчук, В.В.Иванов. Диссертация Кулагиной была посвящена исследованию формальной теорииграмматик (одновременно с Н.Хомским в США), Кузнецов выдвинул задачуаксиоматизации лингвистики, восходящую к работам Ф.Ф. Фортунатова.
6 мая 1960года было принято Постановление Президиума АН СССР «О развитии структурных иматематических методов исследования языка», в Институте языкознания и Институтерусского языка были созданы соответствующие подразделения. С 1960 года введущих гуманитарных вузах страны – филологическом факультете МГУ,Ленинрадском, Новосибирском университетах, МГПИИЯ – началась подготовка кадровв области автоматической обработки текста.
Однако работыпо машинному переводу этого периода, называемого «классическим», представляютсобой скорее теоретический, нежели практический интерес. Экономическиэффективные системы машинного перевода стали создаваться только в восьмидесятыегоды прошлого века. Об этом я расскажу позже, в разделе 2.1, «Машинныйперевод».
К 1960-м – 70-м годам относятся глубокие теоретические разработки,использующие методы теории множеств и математической логики, такие, как теорияполя и теория нечётких множеств.
Авторомтеории поля в лингвистике был советский поэт, переводчик и лингвист В.Г.Адмони. Свою теорию он изначально разрабатывал на основе немецкого языка. УАдмони понятие «поле» обозначает произвольное непустое множество языковыхэлементов (например, «лексическое поле», «семантическое поле»).
Структураполя неоднородна: оно состоит из ядра, элементы которого обладают полнымнабором признаков, определяющих множество, и периферии, элементы которой могутобладать как признаками данного множества (не всеми), так и соседних. Приведупример, иллюстрирующий данное высказывание: скажем, в английском языке полесложных слов («day-dream» – «мечтать» трудноотделимо от поля словосочетаний(«tear gas» – «слезоточивый газ»).
С теориейполя тесно связана уже упомянутая выше теория нечётких множеств. В СССР еёобоснованием занимались лингвисты В.Г. Адмони, И.П. Иванова, Г.Г. Поченцов,однако её родоначальником был американский математик Л.Заде, в 1965 годувыпустивший статью «Fuzzy Logic». Давая математическое обоснование теориинечётких множеств, Заде рассматривал их на лингвистическом материале.
В этой теории речь идёт уже не столько о принадлежности элементов кданному множеству (АÎа), сколько о степени этой принадлежности (mАÎа), так как периферийные элементы могут в той или иной мерепринадлежать нескольким полям. Заде (Лофти-заде) был выходцем из Азербайджана,до 12 лет имел практику общения на четырех языках — азербайджанском, русском,английском и персидском — и пользовался тремя различными алфавитами:кириллицей, латинским, арабским. Когда ученого спрашивают, что общего междутеорией нечетких множеств и лингвистикой, он не отрицает этой связи, ноуточняет: «Я не уверен, что изучение этих языков оказало большое влияние на моемышление. Если это и имело место, то разве что подсознательно». В юности Задеучился в Тегеране в пресвитерианской школе, а после Второй мировой войныэмигрировал в США. «Вопрос не в том, являюсь ли я американцем, русским,азербайджанцем или кем-то еще, — сказал он в одной из бесед, — я сформированвсеми этими культурами и народами и чувствую себя достаточно комфортабельносреди каждого из них» [34, c.13]. В этих словах есть нечто родственное тому,что характеризует теорию нечетких множеств – отход от однозначных определений ирезких категорий.
В нашейстране в 70е переводятся и изучаются труды западных лингвистов ХХ века. И.А.Мельчук перевёл на русский язык сочинения Н. Хомского. Н.А. Слюсарева в своейкниге «Теория Ф. де Соссюра в свете современной лингвистики» связывает постулатысоссюровского учения с актуальными проблемами лингвистики 70-х. Намечаетсятенденция к дальнейшей математизации лингвистики. В ведущих отечественныхвузахидёт подготовка кадров по специальности «Математическая (теоретическая,прикладная) лингвистика». В это же время на Западе происходит резкий скачок вразвитии вычислительной техники, для чего требуются всё более новыелингвистические основы.
В 1980-е годыпрофессор Института востоковедения АН Ю.К. Лекомцев, занимаясь анализом языкалингвистики через анализ схем, таблиц и других видов записи, используемых влингвистических описаниях, рассматривает математические системы, пригодные дляэтих целей (в основном – системы матричной алгебры).
Такимобразом, на протяжении всего ХХ века шло сближение точных и гуманитарных наук.Взаимодействие математики с лингвистикой всё чаще находило практическоеприменение. Об этом – в следующей главе.
Глава 2.Отдельные примеры использования математики в лингвистике
2.1 Машинный перевод
Идея перевода с одного языка на другой при помощи универсальногомеханизма возникла несколькими веками раньше, чем начались первые разработки вэтой области – ещё в 1649 году Рене Декарт предложил идею языка, в которомэквивалентные идеи разных языков выражались бы одним символом. Первые попыткиосуществить эту идею в 1930-40е, начало теоретических разработок в серединевека, усовершенствование систем перевода при помощи техники в 1970-80е, бурноеразвитие переводческой техники в последнее десятилетие – таковы этапы развитиямашинного перевода как отрасли. Именно из работ по машинному переводу выросла компьютернаялингвистика как наука.
С развитием вычислительной техники в конце 70х – начале 80х исследователизадались более реалистичными и экономически выгодными целями – машинастановилась не конкурентом ( как предполагалось раньше), а помощником человека-переводчика.Машинный перевод перестаёт служить исключительно военным задачам (все советскиеи американские изобретения и исследования, ориентированные, в первую очередь, нарусский и английский языки, в той или иной мере способствовали «холодной войне»).В 1978 году слова естественного языка были переданы в объединённой сети Arpa,шестью годами позже в США появились первые программы перевода длямикрокомпьютеров.
В 70е Комиссия Европейских Общин покупает англо-французскую версиюкомпьютерного переводчика Systran, заказывая также франко-аглийскую иитало-английскую версии, и систему перевода с русского на английский,использовавшуюся американскими Вооружёнными Силами. Так были заложены основыпроекта EUROTRA.
О возрождении машинного перевода в 70-80-е гг. свидетельствуют следующиефакты: Комиссия Европейских общин (CEC) покупает англо-французскую версиюSystran, а также систему перевода с русского на английский (последняяразвивалась после доклада ALPAC и продолжала использоваться ВВС США и НАСА);кроме того, CEC заказывает разработку франко-английской и итало-английскойверсий. Одновременно происходит быстрое расширение деятельности по созданиюсистем машинного перевода в Японии; в США Панамериканская организацияздравоохранения (PAHO) заказывает разработку испано-английского направления(система SPANAM); ВВС США финансируют разработку системы машинного перевода вЛингвистическом исследовательском центре при Техасском университете в Остине;группа TAUM в Канаде достигает заметных успехов в разработке своей системыMETEO (для перевода метеорологических сводок). Целый ряд проектов, начатых в70-80-е гг. впоследствии развились в полноценные коммерческие системы.
За период 1978-93 в США на исследования в области машинного переводаистрачено 20 миллионов долларов, в Европе — 70 миллионов, в Японии — 200миллионов.
Одной из новых разработок стала технология TM (translation memory),работающая по принципу накопления: в процессе перевода сохраняется исходныйсегмент (предложение) и его перевод, в результате чего образуетсялингвистическая база данных; если идентичный или подобный исходному сегментобнаруживается во вновь переводимом тексте, он отображается вместе с переводоми указанием совпадения в процентах. Затем переводчик принимает решение(редактировать, отклонить или принять перевод), результат которого сохраняетсясистемой, поэтому не нужно дважды переводить одно и то же предложение. Внастоящее время разработчиком известной коммерческой системы, основанной натехнологии TM, является система TRADOS (основана в 1984 г.).
В настоящее несколько десятков компаний занимаются разработкойкоммерческих систем машинного перевода, в их числе: Systran, IBM, L&H(Lernout & Hauspie), Transparent Language, Cross Language, TridentSoftware, Atril, Trados, Caterpillar Co., LingoWare; Ata Software; Lingvisticab.v. и др. Появилась возможность воспользоваться услугами автоматическихпереводчиков непосредственно в Сети: alphaWorks; PROMT's Online Translator;LogoMedia.net; AltaVista's Babel Fish Translation Service; InfiniT.com; Translatingthe Internet.
Коммерчески эффективные переводческие системы появились во второйполовине 80х и в нашей стране. Расширилось само понятие машинного перевода (кнему стали относить «создание целого ряда автоматических и автоматизированныхсистем и устройств, выполняющих автоматически или полуавтоматически весь циклперевода либо отдельные задачи в диалоге с человеком» [29, c.13]), увеличилисьгосударственные ассигнования на развитие этой отрасли.
Основными языками отечественных переводческих систем стали русский,английский, немецкий, французский и японский. Во Всесоюзном центре переводов(ВЦП) была разработана система перевода с английского и немецкого языков нарусский на машине ЭВМ ЕС-1035 –АНРАП. Она состояла из трёх словарей – входныханглийского и немецкого и выходного русского – под единым программнымобеспечением. Существовало несколько сменных специализированных словарей – повычислительной технике, программированию, радиоэлектронике, машиностроению,сельскому хозяйству, металлургии. Система могла работать в двух режимах –автоматическом и интерактивном, когда на экране отображался пофразно исходныйтекст и перевод, который человек мог отредактировать. Скорость перевода текстана АНРАП (от начала набора до окончания печати) составляла примерно 100 страницв час.
В 1989 году было создано семейство коммерческих переводчиков типа СПРИНТ,работавших с русским, английским, немецким и японским языками. Их главнымпреимуществом стала их совместимость с IBM PC – таким образом отечественныесистемы машинного перевода достигали международного уровня качества. В это жевремя разрабатывается система машинного перевода с французского языка нарусский ФРАП, включающая в себя 4 этапа анализа текста: графематический,морфологический, синтаксический и семантический. В ЛГПИ им. Герцена шла работанад четырёхязычной (английский, французский. Испанский, русский) системойСИЛОД-МП (в промышленном режиме эксплуатировались англо-русский ифранко-русский словари.
Для специализированного перевода текстов по электротехнике существоваласистема ЭТАП-2. Анализ входного текста в ней осуществлялся на двух уровнях –морфологическом и синтаксическом. Словарь ЭТАП-2 содержал около 4 тысяч статей;этап преобразования текста – около 1000 правил (96 общих, 342 частных,остальные – словарные). Всё это обеспечивало удовлетворительное качествоперевода (скажем, заголовок патента «Optical phase grid arrangement andcoupling device having such an arrangement» переводился как «Устройствооптической фазовой сетки и соединяющее устройство с таким устройством» [29,c.20] – несмотря на тавтологию, смысл сохранён).
В Минском педагогическом институте иностранных языков на базеангло-русского словаря словоформ и оборотов была изобретена система машинногоперевода заголовков), в Институте востоковедения АН – система перевода сяпонского на русский. Созданная в Московском НИИ систем автоматизации перваяавтоматическая словарно-терминологическая служба (СЛОТЕРМ) по вычислительнойтехнике и программированию содержала примерно 20000 терминов в толковом словареи специальных словарях для лингвистических исследований.
Системы машинного перевода постепенно стали использоваться не только попрямому назначению, но и как важный компонент автоматических обучающих систем(для обучения переводу, контроля орфографических и грамматических знаний).
90-е годы принесли с собой бурное развитие рынка ПК (от настольных докарманных) и информационных технологий, широкое использование сети Интернет(которая становится все более интернациональной и многоязыкой). Все это сделаловостребованным дальнейшее развитие автоматизированных переводческих систем. Сначала 1990-х гг. на рынок систем ПК выходят и отечественные разработчики.
В июле 1990 года на выставке PC Forum в Москве была представлена первая вРоссии коммерческая система машинного перевода под названием PROMT(PROgrammer's Machine Translation). В 1991 г. было создано ЗАО «ПРОектМТ», и уже в 1992 г. компания «ПРОМТ» выиграла конкурс NASA напоставку систем МП (ПРОМТ была единственной неамериканской фирмой на этомконкурсе). В 1992 г. «ПРОМТ» выпускает целое семейство систем подновым названием STYLUS для перевода с английского, немецкого, французского,итальянского и испанского языков на русский и с русского на английский, а в1993 г. на базе STYLUS создается первая в мире система машинного перевода дляWindows. В 1994 г. вышла версия STYLUS 2.0 для Windows 3.Х/95/NT, а в 1995-1996гг. представлено третье поколение систем машинного перевода, полностью32-разрядных STYLUS 3.0 для Windows 95/NT, одновременно с этим успешно завершенаразработка совершенно новых, первых в мире русско-немецкой и русско-французскойсистем машинного перевода.
В 1997 г. подписано соглашение с французской фирмой Softissimo о созданиисистем перевода с французского языка на немецкий и английский и обратно, а вдекабре этого года была выпущена первая в мире система немецко-французскогоперевода. В этом же году компания «ПРОМТ» компания выпустила систему,реализованную по технологии Гигант, поддерживающей несколько языковыхнаправлений в одной оболочке, а также специальный переводчик для работы вИнтернете WebTranSite.
В 1998 г. выпускается целое созвездие программ под новым названием PROMT98. Через год компания ПРОМТ выпустила два новых продукта: уникальный пакетпрограмм для работы в Интернете — PROMT Internet, и переводчик длякорпоративных почтовых систем — PROMT Mail Translator. В ноябре 1999 года PROMTбыла признана лучшей системой машинного перевода среди тестируемых французскимжурналом PC Expert, обойдя конкурентов по сумме показателей на 30 процентов.Для корпоративных клиентов разработаны также специальные серверные решения — корпоративный сервер переводов PROMT Translation Server (PTS) иИнтернет-решение PROMT Internet Translation Server (PITS). В 2000 г.«ПРОМТ» обновила всю линию своих программных продуктов, выпустив МПсистемы нового поколения: PROMT Translation Office 2000, PROMT Internet 2000 иMagic Gooddy 2000.
Перевод в режиме он-лайн при поддержке системы «ПРОМТ»используется на ряде отечественных и зарубежных сайтов: PROMT's Online Translator,InfiniT.com, Translate.Ru, Lycos и др., а также в учреждениях различногопрофиля для перевода деловой документации, статей и писем (существуют системыперевода, встраиваемые непосредственно в Outlook Express и другие почтовыеклиенты).
В наше время появляются новые технологии машинного перевода, основанныена использовании систем искусственного интеллекта, статистических методах. Опоследних – в следующем разделе.
2.2 Статистические методы в изученииязыка
Немалоевнимание в современной лингвистике отводится изучению языковых явлений методамиколичественной математики. Количественные данные часто помогают более глубокоосмыслить изучаемые явления, их место и роль в системе смежных явлений. Ответна вопрос «сколько» помогает ответить и на вопросы «что», «как», «почему» –таков эвристический потенциал количественной характеристики.
Немалую роль статистические методы играют в разработке систем машинногоперевода (см. раздел 2.1). При статистическом подходе проблема переводарассматривается в терминах канала с помехами. Представим себе, что нам нужноперевести предложение с английского на русский. Принцип канала с помехамипредлагает нам следующее объяснение отношений между английской и русскойфразой: английское предложение представляет собой не что иное, как русскоепредложение, искаженное неким шумом. Для того чтобы восстановить исходноерусское предложение, нам нужно знать, что именно люди обычно говорят по-русскии как русские фразы искажаются до состояния английского. Перевод осуществляетсяпутем поиска такого русского предложения, которое максимизирует произведениябезусловной вероятности русского предложения и вероятности английскогопредложения (оригинала) при условии данного русского предложения. Согласнотеореме Байеса, это русское предложение является наиболее вероятным переводоманглийского:
/>
где e – предложение перевода, а f – предложение оригинала
Таким образом, нам требуется модель источника и модель канала, или модельязыка и модель перевода. Модель языка должна присваивать оценку вероятностилюбому предложению конечного языка (в нашем случае, русского), а модельперевода –предложению оригинала. (cм. табл.1)
Табл.1.
amount
bonus
compensation
payment
rate
выплата 15% 8% 6% 71% 0%
оплата 0% 0% 0% 97% 3%
В общем случае система машинного перевода работает в двух режимах:
1. Обучение системы: берется тренировочный корпус параллельных текстов, ис помощью линейного программирования ищутся такие значения таблиц переводныхсоответствий, которые максимизируют вероятность (например) русской частикорпуса при имеющейся английской согласно выбранной модели перевода. На русскойчасти того же корпуса строится модель русского языка.
2. Эксплуатация: на основе полученных данных для незнакомого английскогопредложения ищется русское, максимизирующее произведение вероятностей,присваиваемых моделью языка и моделью перевода. Программа, используемая длятакого поиска, называется дешифратором.
Самой простойстатистической моделью перевода является модель дословного перевода. В этоймодели предполагается, что для перевода предложения с одного языка на другойдостаточно перевести все слова (создать «мешок слов»), а расстановку их вправильном порядке обеспечит модель Для приведения P(a, f | e) к P(a | e, f),т.е. вероятности данного выравнивания при данной паре предложений, каждаявероятность P(a, f | e) нормализуется по сумме вероятностей всех выравниванийданной пары предложений:
Реализация алгоритма Витерби, используемая для обучения Модели №1,состоит в следующем:
1.Вся таблица вероятностей переводных соответствий заполняетсяодинаковыми значениями.
2. Для всех возможных вариантов попарных связей слов вычисляетсявероятность P(a, f | e):
3. Значения P(a, f | e) нормализуются для получения значений P(a | e, f).
4. Подсчитывается частота каждой переводной пары, взвешенная повероятности каждого варианта выравнивания.
5. Полученные взвешенные частоты нормализуются и формируют новую таблицувероятностей переводных соответствий
6. Алгоритм повторяется с шага 2.
Рассмотрим в качестве примера тренировку подобной модели на корпусе издвух пар предложений (рис.2):
— Белый Дом/White House
- Дом/House
/>
Рис.1
Послебольшого числа итераций мы получим таблицу (табл.2.), из которой видно, чтоперевод осуществляется с высокой точностью.
Табл.2
White
House
белый 0,9999 0, 0001
дом 0, 0001 0,9999
Также статистические методы широко используются в изучении лексики,морфологии, синтаксиса, стилистики. Учёные Пермского государственногоуниверситета провели исследование, в основе которого лежало утверждение о том,что стереотипные словосочестания являются важным «строительным материалом»текста [13, c.24]. Эти словосочетания состоят из «ядерных» повторяющихся слов изависимых слов-конкретизавторов и имеют ярко выраженную стилистическую окраску.
В научном стиле «ядерными» словами можно назвать: исследование,изучение, задача, проблема, вопрос, явление, факт, наблюдение, анализ и др.В публицистике «ядерными» будут уже другие слова, обладающие повышеннойценностью именно для текста газеты: время, лицо, власть, дело, действие,закон, жизнь, история, место и т.д. (всего 29)
Особый интерес для лингвистов представляет также профессиональнаядиффереренциация общенародного языка, своеобразие использования лексики играмматики в зависимости от рода занятий. Известно, что шофёры впрофессиональной речи употребляю форму шофер, медики говорят коклюшвместо коклюш – подобных примеров можно привести. Задачастатистики – проследить за вариативностью произношения и изменением языковойнормы.
Профессиональные различия ведут за собой различия не толькограмматические, но и лексические. В Якутском государственном университете им.М.К. Аммосова было проанализировано по 50 анкет с наиболее часто встречающимисяреакциями на некоторые слова среди медиков и строителей (табл.3) [13, c.78].
Табл.3Стимул Медики Строители
человек
пациент (10), личность (5)
мужчина (5)
добро
помощь (8), помогать (7)
зло (16)
жизнь
смерть (10)
прекрасная (5)
смерть
труп (8)
жизнь (6)
огонь
жар (8), ожог (6)
пожар (7)
палец
рука (14), панариций (5)
большой (7), указательный (6)
глаза
зрение (6), зрачок, окулист (по 5)
карие (10), большие (6)
голова
ум (14), мозги (5)
большая (9), умная (8), ум (6)
терять
сознание, жизнь (по 4)
деньги (5), находить (4)
Можнозаметить, что медики чаще, чем строители, дают ассоциации, связанные с ихпрофессиональной деятельностью, так как приведённые в анкете слова-стимулыимеют к их профессии больше отношения, чем к профессии строителя.
Статистическиезакономерности в языке используются для создания частотных словарей – словарей,в которых приводятся числовые характеристики употребительности слов (словоформ,словосочетаний) какого-либо языка – языка писателя, какого-либо произведения ит. п. Обычно в качестве характеристики употребительности используется частотавстречаемости слова в тексте определенного объема
Модельвосприятия речи невозможна без словаря как своего существеннейшего компонента.При восприятии речи основной оперативной единицей выступает слово. Из этогоследует, в частности, что каждое слово воспринимаемого текста должно бытьотождествлено с соответствующей единицей внутреннего словаря слушающего (иличитающего). Естественно считать, что уже с самого начала поиск ограниченнекоторыми подобластями словаря. Согласно большинству современных теорийвосприятия речи, собственно фонетический анализ звучащего текста в типичномслучае дает лишь некоторую частичную информацию о возможном фонологическомоблике слова, и такого рода информации отвечает не одно, а определенноеМНОЖЕСТВО слов словаря; следовательно, возникает две задачи:
(а) выделитьсоответствующее множество по тем или иным параметрам;
(б) впределах очерченного множества (если оно выделено адекватно) произвести «отсев»всех слов, кроме того единственного, которое и соответствует наилучшим образомданному слову распознаваемого текста. Одна из стратегий «отсева» – исключениенизкочастотных слов. Отсюда следует, что словарь для восприятия речи – эточастотный словарь. Именно создание компьютерной версии частотного словарярусского языка и является первоначальной задачей представляемого проекта.
На материалерусского языка существует 5 частотных словарей (не считая отраслевых). Отметимлишь некоторые общие недостатки имеющихся словарей.
Все известныечастотные словари русского языка построены на обработке массивов письменных(печатных) текстов. Отчасти по этой причине, когда тождество слова во многомопирается на совпадение формальное, графическое, недостаточно учитываетсясемантика. В результате оказываются смещенными, искаженными и частотныехарактеристики; например, если слова из сочетания «друг друга» составительчастотного словаря включает в общую статистику употребления слова «друг», тоедва ли это оправданно: учитывая семантику, мы должны признать, что это ужедругие слова, а точнее, что самостоятельной словарной единицей выступает лишьсамо по себе сочетание в целом.
Также во всехсуществующих словарях слова помещены лишь в своих основных формах:существительные в форме единственного числа, именительного падежа, глаголы вформе инфинитива и т.д. Некоторые из словарей дают информацию о частотностисловоформ, но обычно делают это недостаточно последовательно, не исчерпывающимобразом. Частотности разных словоформ одного и того же слова заведомо несовпадают. Разработчик же модели восприятия речи должен учитывать, что вреальном перцептивном процессе распознаванию подлежит именно конкретнаясловоформа, «погруженная» в текст: на базе анализа начального участка экспонентасловоформы формируется множество слов с идентичным началом, причем начальныйучасток словоформы не обязательно тождествен начальному участку словарнойформы. Именно словоформе принадлежит конкретная ритмическая структура – такжечрезвычайно важный параметр для перцептивного отбора слов. Наконец, в итоговомпредставлении распознанного высказывания опять-таки слова представленысоответствующими словоформами.
Существуетмножество работ, в которых демонстрируется важность частотности в процессевосприятии речи. Но нам не известны работы, где использовалась бы частотностьсловоформ – напротив, все авторы практически игнорируют частотность отдельныхсловоформ, обращаясь исключительно к лексемам. Если полученные ими результатыне считать артефактами, приходится допустить, что носителю языка каким-тообразом доступна информация о соотношении частотностей словоформ и словарнойформы, т.е., фактически, лексемы. Причем такого рода переход от словоформы клексеме, конечно, невозможно объяснить естественным знанием соответствующейпарадигмы, поскольку информация о частотности должна использоваться доокончательной идентификации слова, иначе она просто теряет смысл.
По первичнымстатистическим характеристикам можно определить с заданной относительнойпогрешностью ту часть словника, в которую входят слова с высокой частотойпоявления независимо от типа текста. Возможно также, введя ступенчатоеупорядочение в словарь, получить серию словников, охватывающих первые 100,1000, 5000 и т. д. частых слов. Статистические характеристики словаря вызываютинтерес в связи со смысловым анализом лексики. Изучениепредметно-идеологическнх групп и семантических полей показывает, чтолексические объединения поддерживаются семантическими связями, которыеконцентрируются вокруг лексем с наиболее общим значением. Описание значений впределах лексико-семантического поля может проводиться посредствомидентификации слов с наиболее абстрактными по смыслу лексемами. По-видимому,«пустые» (с точки зрения номинативных потенций) единицы словаря составляютстатистически однородный пласт.
Не меньшуюценность имеют и словники по отдельным жанрам. Изучение меры их сходства ихарактера статистических распределений даст интересные сведения о качественномрасслоении лексики в зависимости от сферы речеупотребления.
Составлениебольших частотных словарей требует обращения к вычислительной технике. Введениечастичной механизации и автоматизации в процесс работы над словаремпредставляет интерес как эксперимент машинной обработки словников к разнымтекстам. Такой словарь требует более строгой системы обработки и накоплениясловарного материала. В миниатюре это информационно-поисковая система, котораяспособна выдавать сведения о различных сторонах текста и словаря. Некоторыеосновные запросы к этой системе планируются с самого начала: общее количествоинвентаризованных слов, статистические характеристики отдельного слова и целыхсловников, упорядочение частых и редких зон словника и т. п. Машинная картотекапозволяет автоматически строить обратные словари по отдельным жанрам иисточникам. Множество других полезных статистических сведений о языке будетизвлечено из накопленного массива информации. Компьютерный частотный словарь создаетэкспериментальную базу для перехода к более обширной автоматизации словарныхработ.
Статистическиеданные частотных словарей могут быть широко использованы и при решении другихлингвистических задач – например, при анализе и определении активных средствсловообразования современного русского языка, решении вопросовусовершенствования графики и орфографии, которые связаны с учетомстатистических сведений о словарном составе (при этом важно учитыватьвероятностные характеристики комбинаций графем, реализованные в словах типыбуквосочетаний), практической транскрипции и транслитерации. Статистическиепараметры словаря будут полезны и при решении вопросов автоматизации печатногодела, распознавания и автоматического чтения буквенного текста.
Современныетолковые словари и грамматики русского языка в основном построены на базелитературно-художественных текстов. Существуют частотные словари языка А.С.Пушкина, А.С. Грибоедова, Ф.М. Достоевского, В.В. Высоцкого и многих другихавторов. На кафедре истории и теории литературы Смоленского гос.педагогического университета ряд лет ведётся работа по составлению частотныхсловарей стихотворных и прозаических текстов. Для настоящего исследованияотобраны частотные словари всей лирики Пушкина и ещё двух поэтов золотого века– «Горя от ума» Грибоедова и всей поэзии Лермонтова; Пастернака и ещё пятипоэтов серебряного века — Бальмонта 1894-1903 гг., «Стихов о Прекрасной Даме»Блока, «Камня» Мандельштама, «Огненного столпа» Гумилёва, «Anno Domini MCMXXI»Ахматовой и «Сестры моей жизни» Пастернака и ещё четырёх поэтов века железного– «Стихотворений Юрия Живаго», “Когда разгуляется”, всего корпуса лирики М.Петровых, «Дорога далека», «Ветрового стекла», «Прощания со снегом» и «Подковы»Межирова, «Антимиров» Вознесенского и «Снежницы» Рыленкова.
Следуетотметить, что эти словари по природе своей различны: одни представляют лексикуодного драматического произведения, другие – книги лирики, или нескольких книг,или всего корпуса стихов поэта. Результаты анализа, представленные в настоящейработе, следует воспринимать с осторожностью, их нельзя абсолютизировать. Однакос помощью специальных мер разницу онтологической природы текстов можно доизвестной степени уменьшить.
В последниегоды все более отчетливо осознается противопоставление разговорной и книжнойречи. Особенно остро обсуждается этот вопрос среди методистов, которые требуютповорота обучения в сторону разговорного языка. Однако специфика разговорнойречи до сих пор остается необъясненной.
Обработкасловарей выполнялась путем создания пользовательского приложения в средеофисной программы EXCEL97. Приложение включает четыре рабочих листа книги EXCEL– «Титульный лист», лист «Словари» с исходными данными, «Близости» и«Расстояния» с результатами, а также набор макросов.
Исходнаяинформация вводится на лист «Словари». В ячейки EXCEL, записываются словариисследуемых текстов, последний столбец S формируется из полученных результатови равен количеству слов, встречающихся в других словарях. Таблицы «Близости» и«Расстояния» содержат рассчитанные меры близости M, корреляции R и расстоянияD.
Макросыприложения представляют собой событийные программные процедуры на языке VisualBasic for Application (VBA). Основу процедур составляют библиотечные объектыVBA и методы их обработки. Так, для операций с рабочими листами приложенияиспользуется ключевой объект Worksheet (рабочий лист) и соответствующий емуметод активизации листа Activate (активизировать). Задание диапазонаанализируемых исходных данных на листе «Словари» выполняется методом Select(выбрать) объекта Range (диапазон), а передача слов в качестве значений переменнымвыполняется как свойство Value (значение) этого же объекта Range.
Несмотря нато, что ранговый корреляционный анализ заставляет с осторожностью говорить озависимости тематики между разными текстами, большая часть самых частотных словкаждого текста имеет соответствия в одном или нескольких других текстах. Вколонке S показано количество таких слов среди 15 наиболее частотных у каждогоавтора. Полужирным шрифтом выделены слова, встречающиеся в нашей таблице толькоу одного поэта. Нет выделенных слов вовсе у Блока, Ахматовой и Петровых, у нихS = 15. У этих трёх поэтов все 15 самых частотных слов одни и те же,различаются они только местом в списке. Но даже у Пушкина, лексика которогонаиболее оригинальна, S = 8, а выделенных слов 7.
Результатыпоказывают, что существует определённый слой лексики, концентрирующий основныетемы поэзии. Как правило, эти слова коротки: из общего числа (225)словоупотреблений односложных 88, двусложных 127, трёхсложных 10. Зачастую этислова представляют основные мифологемы и могут распадаться на пары: ночь — день, земля — небо (солнце), Бог — человек (люди), жизнь — смерть, тело — душа,Рим — мир (у Мандельштама); могут объединяться в мифологемы более высокогоуровня: небо, звезда, солнце, земля; в человеке как правило выделяются тело,сердце, кровь, рука, нога, щека, глаза. Из человеческих состоянийпредпочтение отдаётся сну и любви. К миру человека принадлежат дом и города –Москва, Рим, Париж. Творчество представлено лексемами слово и песня.
У Грибоедоваи Лермонтова среди наиболее частотных слов почти нет слов, обозначающихприроду. У них втрое больше слов, обозначающих человека, части его тела,элементы его духовного мира. У Пушкина и поэтов ХХ в. обозначений человека иприроды приблизительно поровну. В этом важном аспекте тематики, можем сказать,ХХ в. пошёл за Пушкиным.
Минимальнаятема дело среди самых частотных слов встречается только у Грибоедова иПушкина. У Лермонтова и поэтов ХХ в. она уступает место минимальной теме слово.Слово не исключает дела (библейская трактовка темы: в Новом Завете всё учениеИисуса Христа рассматривается как слово Божье или слово Иисуса, а апостолыиногда называют себя служителями Слова). Сакральный смысл лексемы словоубедительно проявляется, например, в стихе Пастернака «И образ мира, в Словеявленный». Сакральный смысл лексемы слово в со- и противопоставлении счеловеческими делами убедительно проявляется в одноимённом стихотворенииГумилёва.
Лексемы,которые встречаются только в одном тексте, характеризуют своеобразие даннойкниги или совокупности книг. Например, слово «ум» — самое частотное в комедииГрибоедова «Горе от ума» – но оно не встречается среди частотных слов другихтекстов. Тема ума безусловно является наиболее значимой в комедии. Эта лексемасопровождает образ Чацкого, причём имя Чацкого является наиболее частотным вкомедии. Таким образом, в произведении органически сочетаются самое частотноеимя нарицательное с самым частотным именем собственным.
Самый высокийкоэффициент корреляции связывает тематику трагических книг Гумилёва «Огненныйстолп» и Ахматовой «Anno Domini MCMXXI». Среди 15 наиболее частотных имёнсуществительных здесь 10 общих, в том числе кровь, сердце, душа, любовь, слово,небо. Напомним, что в книгу Ахматовой вошла миниатюра «Не бывать тебе вживых...», написанная между арестом Гумилёва и его расстрелом.
Темы свечи итолпы в исследованном материале встречаются только в «Стихотворениях ЮрияЖиваго». Тема свечи в стихах из романа имеет множество контекстуальныхзначений: она связана с образом Иисуса Христа, с темами веры, бессмертия,творчества, любовного свидания. Свеча – важнейший источник света в центральныхсценах романа. Тема толпы развивается в связи с основной идеей романа, вкотором частная жизнь человека с её незыблемыми ценностями противопоставлена безнравственностинового государства, построенного на началах угождения толпе.
Работапредполагает и третий этап, тоже отраженный в программе, — это вычислениеразности порядковых номеров слов, общих для двух словарей и среднего показателярасстояния между одинаковыми словами двух словарей. Этот этап позволяет отобщих тенденций взаимодействия словарей, выявленных с помощью статистики,перейти на уровень, приближающийся к тексту. Например, статистически значимокоррелируют книги Гумилева и Ахматовой. Мы смотрим, какие слова оказалисьобщими для их словарей, и выбираем прежде всего те, разница между порядковыминомерами которых минимальна или равна нулю. Именно эти слова имеют один и тотже ранговый номер и, следовательно, именно эти минимальные темы в сознании двухпоэтов одинаково важны. Далее следует переходить на уровень текстов иконтекстов.
Количественныеметоды также помогают изучить особенности народов – носителей языка. Скажем, врусском языке 6 падежей, в английском падежей нет, а в отдельных языках народовДагестана количество падежей доходит до 40. Л.Перловский в своей статье«Сознание, язык и культура» соотносит эти характеристики со склонностью народовк индивидуализму или коллективизму [36, c.28], с восприятием вещей и явленийотдельно или в связи с другими. Ведь именно в англоязычном мире (падежей нет –вещь воспринимается «сама по себе») появились такие понятия, как свободаличности, либерализм и демократия (замечу, что я употребляю эти понятия тольков связи с языком, без какой-либо оценочной характеристики). Несмотря на то, чтоподобные догадки пока остаются лишь на уровне смелых научных гипотез, онипомогают посмотреть по-новому на уже знакомые явления.
Как мы видим,количественные характеристики могут применяться в совершенно различных областяхязыкознания, что всё больше стирает границы между «точными» и «гуманитарными»методами. Лингвистика всё чаще прибегает к помощи не только математики, но ивычислительной техники для решения своих задач.
2.3 Изучение языка методамиформальной логики
С неколичественнымиметодами математики, в частности, с логикой, современная теоретическаялингвистика взаимодействует не менее плодотворно, чем с количественными.Быстрое развитие компьютерных технологий и возрастание их роли в современноммире потребовало пересмотра подхода к взаимодействию языка и логики в целом.
Методы логикишироко используются в разработке формализованных языков, в частности, языковпрограммирования, элементами которых являются некоторые символы (сродниматематическим), выбираемые (или конструируемые из выбранных ранее символов) иинтерпретируемые определённым образом, связанным ни с каким «традиционным»употреблением, пониманием и функциями таких же символов в других контекстах.Программист постоянно имеет дело с логикой в своей работе. Смыслпрограммирования состоит как раз в том, чтобы научить компьютер рассуждать (вшироком смысле слова). При этом методы «рассуждения» оказываютсясамыми разными. Каждый программист тратит определенное время на поиск ошибок всвоих и чужих программах. То есть, на поиск ошибок в рассуждениях, в логике. Иэто тоже накладывает свой отпечаток. Гораздо легче обнаруживаешь логическиеошибки и в обычной речи. Относительная простота языков, изучаемых логиками,позволяет им выяснять структуры этих языков более четко, чем это достижимо длялингвистов, анализирующих исключительно сложные естественные языки. Ввиду того,что языки, изучаемые логиками, используют отношения, скопированные сестественных языков, логики способны внести существенный вклад в общую теориюязыка. Ситуация здесь подобна той, которая имеет место в физике: физик такжеформулирует теоремы для идеально упрощенных случаев, которые не происходят вприроде вообще — он формулирует законы для идеальных газов, идеальныхжидкостей, говорит о движении при отсутствии трения и т.д. Для этихидеализированных случаев можно установить простые законы, которые значительноспособствовали бы пониманию того, что происходит в действительности и что,вероятно, осталось бы неизвестным физике, если бы она пробовала рассматриватьдействительность непосредственно, во всей сложности.
В изучении естественных языков логические методы используются для того,чтобы изучающие язык могли не тупо «зазубрить» как можно больше слов, а лучшепонять его структуру. Ещё Л. Щерба использовал на своих лекциях примерпредложения, построенного по законам русского языка: «Глокая куздра штекобудланула бокра и курдячит бокренка», – а потом спрашивал у студентов, что этозначит. Несмотря на то, что смысл слов в предложении оставался непонятен (их простоне существует в русском языке), можно было чётко ответить: «куздра» –подлежащее, существительное женского рода, в единственном числе, именительномпадеже, «бокр» – одушевлённое, и т.д. Перевод фразы получается примерно таков:«Нечто женского рода в один прием совершило что-то над каким-то существоммужского рода, а потом начало что-то такое вытворять длительное, постепенное сего детенышем» [46]. Подобным же примером текста (художественного) изнесуществующих слов, построенного полностью по законам языка, является«Бармаглот» Льюиса Кэрролла (в «Алисе в стране чудес» Кэрролл устами своегоперсонажа Шалтая-Болтая объясняет и значение придуманных им слов: «варкалось» –восемь часов вечера, когда уже пора варить ужин, «хливкий» – хлипкий и ловкий,«шорёк» – помесь хорька, барсука и штопора, «пыряться» – прыгать, нырять,вертеться, «нава» – трава под солнечными часами (простирается немного направо,немного налево и немного назад), «хрюкотать» – хрюкать и хохотать, «зелюк» –зелёный индюк, «мюмзик» – птица; перья у неё растрёпаны и торчат во всестороны, как веник, «мова» – далеко от дома) [46].
Одно из основных понятий современной логики и теоретической лингвистики,используемое при исследовании языков различных логико-математическихисчислений, естественных языков, для описания отношений между языками различных«уровней» и для характеристики отношений между рассматриваемыми языками иописываемыми с их помощью предметными областями – понятие метаязыка. Метаязык –это язык, используемый для выражения суждений о другом языке, языке-объекте. Спомощью метаязыка изучают структуру знакосочетаний (выражений) языка-объекта,доказывают теоремы о его выразительных свойствах, об отношении его к другимязыкам и т. п. Изучаемый язык называется также предметным языком по отношению кданному метаязыку. Как предметный язык, так и метаязык могут быть обычными(естественными) языками. Метаязык может отличаться от языка-объекта (например,в учебнике английского языка для русских русский язык является метаязыком, аанглийский – языком-объектом), но может и совпадать с ним или отличаться лишьчастично, например специальной терминологией (русская лингвистическаятерминология – элемент метаязыка для описания русского языка; т. н.семантические множители – часть метаязыка описания семантики естественныхязыков).
Понятие«метаязык» стало весьма плодотворным в связи с изучением формализованныхязыков, строящихся в рамках математической логики. В отличие от формализованныхпредметных языков, в этом случае метаязык, средствами которого формулируетсяметатеория (изучающая свойства предметной теории, формулируемой на предметномязыке), является, как правило, обычным естественным языком, некоторымспециальным образом ограниченным фрагментом естественного языка, не содержащимвсякого рода двусмысленностей, метафор, «метафизических» понятий и т. п.элементов обычного языка, препятствующих использованию его в качестве орудияточного научного исследования. При этом метаязык сам может быть формализован и(независимо от этого) оказаться предметом исследования, проводимого средствамиметаметаязыка, причём такой ряд можно «мыслить» растущим бесконечно.
Логика учитнас плодотворному разграничению языка-объекта и метаязыка. Язык-объект — этосам предмет логического исследования, а метаязык — тот неизбежно искусственныйязык, на котором такое исследование ведется. Логическое мышление как раз исостоит в том, чтобы сформулировать на языке символов (метаязыке) отношения иструктуру реального языка (языка-объекта).
Метаязыкдолжен быть во всяком случае «не беднее» своего предметного языка (т. е. длякаждого выражения последнего в метаязыке должно иметься его имя- «перевод») –иначе, при невыполнении этих требований (что заведомо имеет место вестественных языках, если специальными соглашениями не предусмотрено обратное)возникают семантические парадоксы (антиномии).
По мересоздания все новых и новых языков программирования в связи с проблемойпрограммирования трансляторов появилась острая необходимость в созданииметаязыков. В настоящее время наиболее употребительным для описания синтаксисаязыков программирования является метаязык форм Бэкуса-Наура (сокращенно БНФ).Он представляет собой компактную форму в виде некоторых формул, похожих наматематические. Для каждого понятия языка существует единственная метаформула(нормальная формула). Она состоит из левой и правой частей. В левой частиуказывается определяемое понятие, а в правой — задается множество допустимыхконструкций языка, которые объединяются в это понятие. В формуле используютспециальные метасимволы в виде угловых скобок, в которых заключено определяемоепонятие (в левой части формулы) или ранее определенное понятие (в ее правойчасти), а разделение левой и правой частей указывается метасимволом"::=", смысл которого эквивалентен словам «по определениюесть». Металингвистические формулы в некотором виде заложены втрансляторы; с их помощью ведется проверка конструкций, используемыхпрограммистом, на формальное соответствие какой-нибудь из конструкций,синтаксически допустимых в этом языке. Существуют и отдельные метаязыкиразличных наук – таким образом, знания существуют в виде различных метаязыков.
Логические методы также послужили основой для создания системискусственного интеллекта, основанных на концепции коннекционизма.Коннекционизм – это особое течение в философской науке, предметом которогоявляются вопросы познания. В рамках этого течения предпринимаются попыткиобъяснить интеллектуальные способности человека, используя искусственныенейронные сети. Составленные из большого числа структурных единиц, аналогичныхнейронам, с заданным для каждого элемента весом, определяющим силу связи сдругими элементами, нейронные сети представляют собой упрощённые моделичеловеческого мозга. Эксперименты с нейронными сетями подобного родапродемонстрировали их способность к обучению выполнения таких задач, какраспознавание образов, чтение и определение простых грамматических структур.
Философы начали проявлять интерес к коннекционизму, так какконнекционистский подход обещал обеспечить альтернативу классической теорииразума и широко распространённой в рамках этой теории идеи, согласно котороймеханизмы работы разума имеют сходство с обработкой символического языкацифровым компьютером. Эта концепция весьма спорна, однако в последние годы онанаходит всё больше сторонников.
Логическое изучение языка продолжает соссюровскую концепцию о языке каксистеме. То, что оно постоянно продолжается, ещё раз подтверждает смелостьнаучных догадок начала прошлого века. Последний раздел своей работы я посвящуперспективам развития математических методов в лингвистике в наши дни.
2.4Перспективы применения математических методов в лингвистике
В эпоху компьютерных технологий методы математической лингвистикиполучили новую перспективу развития. Поиск решения проблем лингвистическогоанализа все активнее реализуется теперь на уровне информационных систем. Вместес тем автоматизация процесса обработки языкового материала, предоставляяисследователю значительные возможности и преимущества, неизбежно выдвигаетперед ним новые требования и задачи.
Соединение «точного» и «гуманитарного» знания стало плодородной почвойдля новых открытий в области лингвистики, информатики и философии.
Машинный перевод с одного языка на другой остаётся быстро развивающейсяотраслью информационных технологий. Несмотря на то, что перевод при помощикомпьютера никогда не сравнится по качеству с переводом, сделанным человеком(особенно это касается художественных текстов), машина стала неотъемлемымпомощником человека в переводе больших объёмов текста. Считается, что вближайшем будущем будут созданы более совершенные переводческие системы,основанные, в первую очередь, на семантическом анализе текста.
Не менее перспективным направлением остаётся взаимодействие лингвистики илогики, служащее философским фундаментом для осмысления информационныхтехнологий и так называемой «виртуальной реальности». В ближайшем будущемпродолжится работа над созданием систем искусственного интеллекта – хотя, опятьже, он никогда не будет равен человеческому по его возможностям. Подобнаяконкуренция бессмысленна: в наше время машина должна стать (и становится) несоперником, а помощником человека, не чем–то из области фантастики, а частьюреального мира.
Продолжается изучение языка методами статистики, что позволяет болееточно определить его качественные свойства. Важно, чтобы наиболее смелыегипотезы о языке находили своё математическое, а, следовательно, и логическое,доказательство.
Наиболее значимо то, что различные отрасли применения математики влингвистике, до этого достаточно разрозненные, в последние годы соотносятсямежду собой, соединяясь в стройную систему, по аналогии с системой языка,открытой столетие назад Фердинандом де Соссюром и Иваном Бодуэном де Куртенэ. Вэтом – преемственность научного знания.
Лингвистика в современном мире стала фундаментом для развитияинформационных технологий. Пока информатика остаётся бурно развивающейсяотраслью человеческой деятельности, союз математики и лингвистики продолжитиграть свою роль в развитии науки.
Заключение
За ХХ век компьютерные технологии проделали большой путь – от военногоприменения к мирному, от узкого круга целей до проникновения во все отрасличеловеческой жизни. Математика как наука находила всё новое практическоезначение с развитием вычислительной техники. Этот процесс продолжается исегодня.
Немыслимый раньше«тандем» «физиков» и «лириков» стал реальностью. Для полноценноговзаимодействия математики и информатики с гуманитарными науками потребовалиськвалифицированные специалисты как с той, так и с другой стороны. В то время какспециалистам-компьютерщикам всё более нужны систематические гуманитарные знания(лингвистические, культурологические, философские), чтобы осмыслять измененияв окружающей их реальности, во взаимодействии человека и техники, разрабатыватьвсё новые и новые языковые и мыслительные концепции, писать программы, то любой«гуманитарий» в наше время для своего профессионального роста должен овладетьхотя бы азами работы с компьютером.
Математика, будучи тесновзаимосвязанной с информатикой, продолжает развиваться и взаимодействовать сестественнонаучным и гуманитарным знанием. В новом веке не ослабевает, а,наоборот, усиливается тенденция к математизации науки. На количественных данныхосмысливаются закономерности развития языка, его исторические и философскиехарактеристики.
Математический формализм более всего подходит для описаниязакономерностей в лингвистике (как, впрочем, и в других науках – игуманитарных, и естественных). Ситуация порой складывается в науке так, что безприменения соответствующего математического языка понять характер физического,химического и т.п. процесса невозможно. Создавая планетарную модель атома,известный английский физик XX в. Э. Резерфорд испытал математические трудности.Вначале его теорию не приняли: она не звучала доказательно, и виной томуявилось незнание Резерфордом теории вероятности, на основе механизма которойтолько и возможно было понять модельное представление атомных взаимодействий.Осознав это, выдающийся уже к тому времени ученый, обладатель Нобелевскойпремии, записался в семинар математика профессора Лэмба и в течение двух летвместе со студентами прослушал курс и отработал практикум по теориивероятности. На ее основе Резерфорд смог описать поведение электрона, придавсвоей структурной модели убедительную точность и получив признание. То же – и сязыкознанием.
Напрашивается вопрос, чтоже содержится в объективных явлениях такое математическое, благодаря чему они иподдаются описанию на языке математики, на языке количественных характеристик?Это однородные единицы вещества, распределяемые в пространстве и времени. Тенауки, которые дальше других прошли путь к выделению однородности, иоказываются лучше приспособленными для использования в них математики.
Стремительно развившаясяв 90е годы сеть Интернет объединила под собой представителей различных стран,народов и культур. Несмотря на то, что основным языком международного общенияпродолжает служить английский, Интернет в наше время стал многоязычным. Этообусловило развитие коммерчески успешных систем машинного перевода, широкоиспользующихся в различных областях человеческой деятельности.
Компьютерные сети сталиобъектом философского осмысления – создавались всё новые лингвистические,логические, мировоззренческие концепции, помогающие понять «виртуальнуюреальность». Во многих художественных произведениях создавались сценарии – чащепессимистические – о господстве машин над человеком, а виртуальной реаьности –над окружающим миром. Далеко не всегда подобные прогнозы оказывалисьбессмысленными. Информационные технологии – не только перспективная отрасльвложения человеческих знаний, это ещё и способ контроля над информацией, а,следовательно, и над человеческой мыслью.
У этого явления есть какотрицательная, так и положительная сторона. Отрицательная – потому что контрольнад информацией противоречит неотъемлемому человеческому праву на свободныйдоступ к ней. Положительная – потому что отсутствие этого контроля можетпривести к катастрофическим последствиям для человечества. Достаточно вспомнитьодин из наиболее мудрых фильмов последнего десятилетия – «Когда наступит конецсвета» Вима Вендерса, герои которого полностью погрузились в «виртуальнуюреальность» собственных снов, записываемых на компьютер. Однако ни один учёныйи ни один художник не может дать однозначного ответа на вопрос: что же ждётнауку и технику в будущем.
Ориентировка на«будущее», порой кажущееся фантастическим, была отличительной особенностьюнауки середины ХХ века, когда изобретатели стремились создать совершенныеобразцы техники, которые могут работать без вмешательства человека. Времяпоказало утопичность подобных изысканий. Однако было бы излишним осуждатьучёных за это – без их энтузиазма в 1950е – 60е информационные технологии несделали бы столь мощного скачка в 90е, и мы бы не имели того, что имеем сейчас.
Последние десятилетия ХХвека изменили приоритеты науки – исследовательский, изобретательский пафосуступил место коммерческому интересу. Опять же – это не хорошо и не плохо. Это– реальность, в которой наука оказывается всё более интегрированной вповседневную жизнь.
Наступивший XXI векпродолжил эту тенденцию, и в наше время за изобретениями стоят не только славаи признание, но, в первую очередь, деньги. Ещё и поэтому важно заботиться отом, чтобы новейшие достижения науки и техники не попали в рукитеррористических группировок или диктаторских режимов. Задача сложная доневозможности; максимально осуществить её – задача всего мирового сообщества.
Информация – оружие,причём оружие не менее опасное, чем ядерное или химическое – только действуетоно не физически, а, скорее, психологически. Человечеству надо задуматься отом, что для него в этом случае важнее – свобода или контроль.
Новейшие философскиеконцепции, связанные с развитием информационных технологий и попыткой ихосмыслить, показали ограниченность как естественнонаучного материализма,господствовавшего на протяжении ХIХ – начала ХХ веков, так и крайнегоидеализма, отрицающего значимость материального мира. Современной мысли,особенно мысли Запада, важно преодолеть этот дуализм в мышлении, когдаокружающий мир чётко делится на материальное и идеальное. Путь к этому – диалогкультур, сопоставление разных точек зрения на окружающие явления.
Как ни парадоксально,информационные технологии могут сыграть не последнюю роль в этом процессе.Компьютерные сети, и особенно Интернет – это не только ресурс для развлечения ибурной коммерческой деятельности, это ещё и средство осмысленного, спорногообщения между представителями различных цивилизаций в современном мире, а такжедля диалога прошлого с настоящим. Можно сказать, что Интернет раздвигаетпространственные и временные рамки.
А в диалоге культурпосредством информационных технологий по-прежнему важна роль языка какдревнейшего универсального средства общения. Именно поэтому лингвистика вовзаимодействии с математикой, философией и информатикой пережила своё второерождение и продолжает развиваться поныне. Тенденция настоящего продолжится и вбудущем – «until the end of the world», как 15 лет назад предсказывал всё тотже В. Вендерс. Правда, неизвестно, когда произойдёт этот конец – но важно лиэто сейчас, ведь будущее рано или поздно всё равно станет настоящим.
Приложение 1
Ferdinand de Saussure
The Swiss linguist Ferdinand deSaussure (1857-1913) is widely considered to be the founder of modernlinguistics in its attempts to describe the structure of language rather thanthe history of particular languages and language forms. In fact, the method ofStructuralism in linguistics and literary studies and a significant branch ofSemiotics find their major starting point in his work at the turn of thetwentieth century. It has even been argued that the complex of strategies andconceptions that has come to be called «poststructuralism» – the workof Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, RolandBarthes, and others – is suggested by Saussure's work in linguistics andanagrammatic readings of late Latin poetry. If this is so, it can be seen mostclearly in the way that Saussure's work in linguistics and interpretationparticipates in transformations in modes of understanding across a wide rangeof intellectual disciplines from physics to literary modernism topsychoanalysis and philosophy in the early twentieth century. As AlgirdasJulien Greimas and Joseph Courtés argue in Semiotics and Language: AnAnalytic Dictionary, under the heading «Interpretation,» a new modeof interpretation arose in the early twentieth century which they identify withSaussurean linguistics, Husserlian Phenomenology, and Freudian psychoanalysis.In this mode, «interpretation is no longer a matter of attributing a givencontent to a form which would otherwise lack one; rather, it is a paraphrasewhich formulates in another fashion the equivalent content of a signifying elementwithin a given semiotic system» (159). In this understanding of«interpretation,» form and content are not distinct; rather, every«form» is, alternatively, a semantic «content» as well, a«signifying form,» so that interpretation offers an analogical paraphraseof something that already signifies within some other system of signification.
Such a reinterpretation of form andunderstanding – which Claude Lévi-Strauss describes in one of his mostprogrammatic articulations of the concept of structuralism, in «Structureand Form: Reflections on a Work by Vladimir Propp» – is implicit inSaussure's posthumous Course in General Linguistics (1916, trans., 1959, 1983).In his lifetime, Saussure published relatively little, and his major work, theCourse, was the transcription by his students of several courses in generallinguistics he offered in 1907-11. In the Course Saussure called for the«scientific» study of language as opposed to the work in historicallinguistics that had been done in the nineteenth century. That work is one ofthe great achievements of Western intellect: taking particular words as thebuilding blocks of language, historical (or «diachronic») linguisticstraced the origin and development of Western languages from a putative common languagesource, first an «Indo-European» language and then an earlier«proto-Indo-European» language.
It is precisely this study of theunique occurrences of words, with the concomitant assumption that the basic«unit» of language is, in fact, the positive existence of these«word-elements,» that Saussure questioned. His work was an attempt toreduce the mass of facts about language, studied so minutely by historicallinguistics, to a manageable number of propositions. The «comparativeschool» of nineteenth-century Philology, Saussure says in the Course,«did not succeed in setting up the true science of linguistics»because «it failed to seek out the nature of its object of study»([1959] 3). That «nature,» he argues, is to be found not simply inthe «elemental» words that a language comprises – the seeming«positive» facts (or «substances») of language – but in theformal relationships that give rise to those «substances.»
Saussure's systematic reexamination oflanguage is based upon three assumptions. The first is that the scientificstudy of language needs to develop and study the system rather than the historyof linguistic phenomena. For this reason, he distinguishes between theparticular occurrences of language – its particular «speech-events,»which he designates as parole – and the proper object of linguistics, thesystem (or «code») governing those events, which he designates aslangue. Such a systematic study, moreover, calls for a «synchronic»conception of the relationship among the elements of language at a particularinstant rather than the «diachronic» study of the development oflanguage through history.
This assumption gave rise to what RomanJakobson in 1929 came to designate as «structuralism,» in which«any set of phenomena examined by contemporary science is treated not as amechanical agglomeration but as a structural whole [in which] the mechanicalconception of processes yields to the question of their function»(«Romantic» 711). In this passage Jakobson is articulating Saussure'sintention to define linguistics as a scientific system as opposed to a simple,«mechanical» accounting of historical accidents. Along with this,moreover, Jakobson is also describing the second foundational assumption inSaussurean – we can now call it «structural» – linguistics: that thebasic elements of language can only be studied in relation to their functionsrather than in relation to their causes. Instead of studying particular andunique events and entities (i.e., the history of particular Indo-European«words»), those events and entities have to be situated within asystemic framework in which they are related to other so-called events andentities. This is a radical reorientation in conceiving of experience andphenomena, one whose importance the philosopher Ernst Cassirer has compared to«the new science of Galileo which in the seventeenth century changed ourwhole concept of the physical world» (cited in Culler, Pursuit 24). Thischange, as Greimas and Courtés note, reconceives«interpretation» and thus reconceives explanation and understandingthemselves. Instead of explanation's being in terms of a phenomenon's causes,so that, as an «effect,» it is in some ways subordinate to itscauses, explanation here consists in subordinating a phenomenon to its future-oriented«function» or «purpose.» Explanation is no longerindependent of human intentions or purposes (even though those intentions canbe impersonal, communal, or, in Freudian terms, «unconscious»).
In his linguistics Saussureaccomplishes this transformation specifically in the redefinition of thelinguistic «word,» which he describes as the linguistic«sign» and defines in functionalist terms. The sign, he argues, isthe union of «a concept and a sound image,» which he called «signified[signifié] and signifier [signifiant]» (66-67; Roy Harris's 1983translation offers the terms «signification» and «signal»[67]). The nature of their «combination» is «functional» inthat neither the signified nor the signifier is the «cause» of theother; rather, «each [derives] its values from the other» (8). Inthis way, Saussure defines the basic element of language, the sign,relationally and makes the basic assumption of historical linguistics, namely,the identity of the elemental units of language and signification (i.e.,«words»), subject to rigorous analysis. The reason we can recognizedifferent occurrences of the word «tree» as the «same» wordis not because the word is defined by inherent qualities – it is not a«mechanical agglomeration» of such qualities – but because it isdefined as an element in a system, the «structural whole,» oflanguage.
Such a relational (or«diacritical») definition of an entity governs the conception of allthe elements of language in structural linguistics. This is clearest in themost impressive achievement of Saussurean linguistics, the development of theconcepts of the «phonemes» and «distinctive features» oflanguage. Phonemes are the smallest articulated and signifying units of alanguage. They are not the sounds that occur in language but the «soundimages» Saussure mentions, which are apprehended by speakers –phenomenally apprehended – as conveying meaning. (Thus, Elmar Holensteindescribes Jakobson's linguistics, which follows Saussure in important ways, as«phenomenological structuralism.») It is for this reason that theleading spokesperson for Prague School Structuralism, Jan Mukarovsky, noted in1937 that «structure… is a phenomenological and not an empiricalreality; it is not the work itself, but a set of functional relationships whichare located in the consciousness of a collective (generation, milieu,etc.)» (cited in Galan 35). Similarly, Lévi-Strauss, the leadingspokesperson for French structuralism, noted in 1960 that «structure hasno distinct content; it is content itself, and the logical organization inwhich it is arrested [or apprehended] is conceived as a property of thereal» (167; see also Jakobson, Fundamentals 27-28).
Phonemes, then, the smallestperceptible elements of language, are not positive objects but a«phenomenological reality.» In English, for instance, the phoneme /t/can be pronounced in many different ways, but in all cases an English speakerwill recognize it as functioning as a /t/. An aspirated t (i.e., a t pronouncedwith an h-like breath after it), a high-pitched or low-pitched t sound, anextended t sound, and so on, will all function in the same manner indistinguishing the meaning of «to» and «do» in English.Moreover, the differences between languages are such that phonological variationsin one language can constitute distinct phonemes in another; thus, Englishdistinguishes between /l/ and /r/, whereas other languages are so structuredthat these articulations are considered variations of the same phoneme (likethe aspirated and unaspirated t in English). In every natural language, thevast number of possible words is a combination of a small number of phonemes.English, for instance, possesses less than 40 phonemes that combine to formover a million different words.
The phonemes of language are themselvessystematically organized structures of features. In the 1920s and 1930s,following Saussure's lead, Jakobson and N. S. Trubetzkoy isolated the«distinctive features» of phonemes. These features are based upon thephysiological structure of the speech organs – tongue, teeth, vocal chords, andso on – that Saussure mentions in the Course and that Harris describes as«physiological phonetics» ([1983] 39; Baskin's earlier translationuses the term «phonology» [(1959) 38]) – and they combine in«bundles» of binary oppositions to form phonemes. For instance, inEnglish the difference between /t/ and /d/ is the presence or absence of«voice» (the engagement of the vocal chords), and on the level ofvoicing these phonemes reciprocally define one another. In this way, phonologyis a specific example of a general rule of language described by Saussure: Inlanguage there are only differences. Even more important: a differencegenerally implies positive terms between which the difference is set up; but inlanguage there are only differences without positive terms. Whether we take thesignified or the signifier, language has neither ideas nor sounds that existedbefore the linguistic system. ([1959] 120)
In this framework, linguisticidentities are determined not by inherent qualities but by systemic(«structural») relationships.
I have said that phonology«followed the lead» of Saussure, because even though his analysis ofthe physiology of language production «would nowadays,» as Harrissays, «be called 'physical,' as opposed to either 'psychological' or'functional'» (Reading 49), nevertheless in the Course he articulated thedirection and outlines of a functional analysis of language. Similarly, hisonly extended published work, Mémoire sur le système primitif desvoyelles dans les langues indo-européennes (Memoir on the primitivesystem of vowels in Indo-European languages), which appeared in 1878, was fullysituated within the project of nineteenth-century historical linguistics. Nevertheless,within this work, as Jonathan Culler has argued, Saussure demonstrated«the fecundity of thinking of language as a system of purely relationalitems, even when working at the task of historical reconstruction»(Saussure 66). By analyzing the systematic structural relationships amongphonemes to account for patterns of vowel alternation in existing Indo-Europeanlanguages, Saussure suggested that in addition to several different phonemes/a/, there must have been another phoneme that could be described formally.«What makes Saussure's work so very impressive,» Culler concludes,«is the fact that nearly fifty years later, when cuneiform Hittite wasdiscovered and deciphered, it was found to contain a phoneme, written h, whichbehaved as Saussure had predicted. He had discovered, by a purely formalanalysis, what are now known as the laryngeals of Indo-European» (66).
This conception of the relational ordiacritical determination of the elements of signification, which is bothimplicit and explicit in the Course, suggests a third assumption governingstructural linguistics, what Saussure calls «the arbitrary nature of thesign.» By this he means that the relationship between the signifier andsignified in language is never necessary (or «motivated»): one couldjust as easily find the sound signifier arbre as the signifier tree to unitewith the concept 'tree'. But more than this, it means that the signified isarbitrary as well: one could as easily define the concept 'tree' by its woodyquality (which would exclude palm trees) as by its size (which excludes the«low woody plants» we call shrubs). This should make clear that thenumbering of assumptions I have been presenting does not represent an order ofpriority: each assumption – the systemic nature of signification (bestapprehended by studying language «synchronically»), the relational or«diacritical» nature of the elements of signification, the arbitrarynature of signs – derives its value from the others.
That is, Saussurean linguistics understandsthe phenomena it studies in overarching relationships of combination andcontrast in language. In this conception, language is both the process ofarticulating meaning (signification) and its product (communication), and thesetwo functions of language are neither identical nor fully congruent (seeSchleifer, «Deconstruction»). Here, we can see the alternationbetween form and content that Greimas and Courtés describe in modernistinterpretation: language presents contrasts that formally define its units, andthese units combine on succeeding levels to create the signifying content.Since the elements of language are arbitrary, moreover, neither contrast norcombination can be said to be basic. Thus, in language distinctive featurescombine to form contrasting phonemes on another level of apprehension, phonemescombine to form contrasting morphemes, morphemes combine to form words, wordscombine to form sentences, and so on. In each instance, the whole phoneme, orword, or sentence, and so on, is greater than the sum of its parts (just aswater, H2O, in Saussure's example [(1959) 103] is more than the mechanicalagglomeration of hydrogen and oxygen).
The three assumptions of the Course inGeneral Linguistics led Saussure to call for a new science of the twentiethcentury that would go beyond linguistic science to study «the life ofsigns within society.» Saussure named this science «semiology (fromGreek semeîon 'sign')» (16). The «science» of semiotics,as it came to be practiced in Eastern Europe in the 1920s and 1930s and Parisin the 1950s and 1960s, widened the study of language and linguistic structuresto literary artifacts constituted (or articulated) by those structures.Throughout the late part of his career, moreover, even while he was offering thecourses in general linguistics, Saussure pursued his own «semiotic»analysis of late Latin poetry in an attempt to discover deliberately concealedanagrams of proper names. The method of study was in many ways the opposite ofthe functional rationalism of his linguistic analyses: it attempted, asSaussure mentions in one of the 99 notebooks in which he pursued this study, toexamine systematically the problem of «chance,» which «becomesthe inevitable foundation of everything» (cited in Starobinski 101). Sucha study, as Saussure himself says, focuses on «the material fact» ofchance and meaning (cited 101), so that the «theme-word» whoseanagram Saussure is seeking, as Jean Starobinski argues, «is, for thepoet, an instrument, and not a vital germ of the poem. The poem is obliged tore-employ the phonic materials of the theme-word» (45). In this analysis,Starobinski says, «Saussure did not lose himself in a search for hiddenmeanings.» Instead, his work seems to demonstrate a desire to evade allthe problems arising from consciousness: «Since poetry is not onlyrealized in words but is something born from words, it escapes the arbitrarycontrol of consciousness to depend solely on a kind of linguisticlegality» (121).
That is, Saussure's attempt to discoverproper names in late Latin poetry – what Tzvetan Todorov calls the reduction ofa «word… to its signifier» (266) – emphasizes one of theelements that governed his linguistic analysis, the arbitrary nature of thesign. (It also emphasizes the formal nature of Saussurean linguistics –«Language,» he asserts, «is a form and not a substance»[Course (1959) 122] – which effectively eliminates semantics as a major objectof analysis.) As Todorov concludes, Saussure's work appears remarkablyhomogeneous today in its refusal to accept symbolic phenomena [phenomena thathave intentional meaning]… In his research on anagrams, he pays attentiononly to the phenomena of repetition, not to those of evocation… In hisstudies of the Nibelungen, he recognizes symbols only in order to attributethem to mistaken readings: since they are not intentional, symbols do notexist. Finally in his courses on general linguistics, he contemplates theexistence of semiology, and thus of signs other than linguistic ones; but thisaffirmation is at once limited by the fact that semiology is devoted to asingle type of sign: those which are arbitrary. (269-70)
If this is true, it is because Saussurecould not conceive of «intention» without a subject; he could notquite escape the opposition between form and content his work did so much tocall into question. Instead, he resorted to «linguistic legality.»Situated between, on the one hand, nineteenth-century conceptions of history,subjectivity, and the mode of causal interpretation governed by theseconceptions and, on the other hand, twentieth-century «structuralist»conceptions of what Lévi-Strauss called «Kantianism without atranscendental subject» (cited in Connerton 23) – conceptions that erasethe opposition between form and content (or subject and object) and thehierarchy of foreground and background in full-blown structuralism,psychoanalysis, and even quantum mechanics – the work of Ferdinand de Saussurein linguistics and semiotics circumscribes a signal moment in the study ofmeaning and culture.
Ronald Schleifer
Приложение 2
Фердинанд де Соссюр (перевод)
Швейцарский языковед Фердинанд де Соссюр (1857-1913) считаетсяоснователем современной лингвистики – благодаря своим попыткам описатьструктуру языка, а не историю отдельных языков и словоформ. По большому счёту,основы структурных методов в лингвистике и литературоведении и, в значительноймере, семиотики были заложены в его работах в самом начале двадцатого века.Доказано, что методы и концепции так называемого«постструктурализма», развитые в работах Жака Деррида, Мишеля Фуко,Жака Лакана, Юлии Кристевой, Ролана Барта и других, восходят к лингвистическимтрудам Соссюра и анаграмматическим прочтениям поздней римской поэзии. Следуетзаметить, что работы Соссюра по лингвистике и языковой интерпретации помогаетсвязать широкий круг интеллектуальных дисциплин – от физики до литературныхновшеств, психоанализа и философии начала двадцатого века. А. Дж. Греймас и Ж.Курте пишут в «Семиотике и языке»: «Аналитический словарь с заголовком«Интерпретация» как новый вид интерпретации появился в начале ХХ века вместе слингвистикой Соссюра, феноменологией Гуссерля и психоанализом Фрейда. В такомслучае, «интерпретация – это не приписывание данного содержания к форме,которая иначе испытала бы недостаток в том; скорее это — пересказ, которыйформулирует другим способом то же содержание значимого элемента в пределахданной семиотической системы» (159). В таком понимании «интерпретации»,форма и содержание неразрывны; напротив, каждая форма наполнена семантическимзначением («значимая форма»), поэтому интерпретация предлагает новый,аналогичный пересказ чего-то, значимого в другой знаковой системе.
Подобное понимание формы и содержания,представляемое Клодом Леви-Строссом в одной из программных работструктурализма, («Структура и Форма: Размышления над трудами ВладимираПроппа») – можно увидеть в посмертно вышедшей книге Соссюра «Курс общейлингвистики» (1916, пер., 1959, 1983). При жизни Соссюр мало публиковался, «Курс»– его основная работа – был собран по конспектам студентов, посещавших еголекции по общей лингвистике в 1907-11 гг. В «Курсе» Соссюр призывал к«научному» исследованию языка, противопоставляя его сравнительно-историческомуязыкознанию девятнадцатого века. Эту работу можно считать одним из величайшихдостижений западной мысли: беря за основу отдельные слова как структурныеэлементы языка, историческое (или «диахроническое») языкознание доказывалопроисхождение и развитие западноевропейских языков от общего, индоевропейскогоязыка– и более раннего праиндоевропейского.
Это — точно это исследование уникальных возникновений слов, ссопутствующим предположением, что основная «единица» языка,фактически, положительное существование этих «элементов слова», чтоСоссюр подверг сомнению. Его работа была попыткой сократить множество фактов оязыке, вскользь изученных сравнительной лингвистикой, до небольшого числатеорем. Сравнительная филологическая школа XIX века, пишет Соссюр, «непреуспела в создании настоящей школы лингвистики», так как «она не поняласущности объекта изучения» ([1959] 3). Эта «сущность», утверждает он,заключается не только в отдельных словах – «позитивных субстанциях» языка – нои в формальных связях, помогающих этим субстанциям существовать.
Соссюровская «проверка» языка основана на трёх предположениях. Первое: научноепонимание языка основано не на историческом, а на структурном феномене. Поэтомуон различал отдельные явления языка –«события речи», которые он определяет как«parole» – и надлежащий, по его мнению, объект изучения лингвистики, систему(код, структуру), управляющую этими событиями ( «langue»). Подобноесистематическое изучение, кроме того, требует «синхронной» концепции отношениймежду элементами языка в данный момент, а не «диахронического» исследованияразвития языка через его историю.
Эта гипотеза стала предтечей того, что Роман Якобсон в 1929 назовёт«структурализмом» – теории, где «любой набор явлений, исследованныйсовременной наукой, рассматривается не как механическое скопление, а какструктурное целое, в котором конструктивная составляющая соотносится сфункцией» («Romantic» 711). В этом отрывке Якобсон сформулировалсоссюровскую идею определения языка как структуры в противовес «машинальному»перечислению исторических событий. Кроме того, Якобсон развивает и другоесоссюровское предположение, ставшее предтечей стркутурной лингвистики: базовыеэлементы языка должны изучаться в связи не столько со своими причинами, сколькосо своими функциями. Отдельные явления и события (скажем, история происхожденияотдельных индоевропейских слов) должны изучаться не сами по себе, а в системе,в котрой они соотнесены с подобными же составляющими. Это был радикальныйповорот в сопоставлении явлений с окружающей действительностью, значимостькоторого философ Эрнст Кассирер сравнил с «наукой Галилея, перевернувшей всемнадцатом веке представления о материальном мире". Такой поворот, какзамечают Греймас и Курте, меняет представление о «интерпретации», а,седовательно, и сами объяснения. Явления стали трактоваться не относительнопричин их возникновения, а относительно того эффекта, который они могут оакзатьв настоящем и будущем. Толкование перестало быть независимым от намеренийчеловека(несмотря на то, что намерения могут быть безличными, «бессознательными»во фрейдистском понимании этого слова).
В своей лингвистике Соссюр особенно показывает этот поворот в изменениипонятия слова в лингвистике, которое он определяет как знак и описывает с точкизрения его функций. Знак для него –соединение звучания и смысла, «обозначаемого[signifié] и обозначения [signifiant]» (66-67; в английском переводе1983 года авторства Роя Харриса – «signification» и «signal» [67]).Природа этого соединения – «функциональная» (ни тот, ни другой элемент не могутсуществовать друг без друга); более того, «одно заимствует качества удругого» (8). Таким образом Соссюр определяет основной структурный элементязыка – знак – и делает основой исторического языкознания идентичность знаковсловам, что требует особо строгого анализа. Поэтому мы можем понятьразные значения, скажем, одного и того же слова «дерево» – не потому что словопредставляет собой лишь набор определённых качеств, а потому что оно определенокак элемент в знаковой системе, в «структурном целом», в языке.
Подобное относительное («диакритическое») понятие единствалежит в основе представления о всех элементах языка в структурной лингвистике.Это особенно ясно видно в наиболее оригинальной находкесоссюровскогоязыкознания, в развитии концепции «фонем» и «отличительных особенностей» языка.Фонемы – самые мелкие из произносимых и значимых языковых единиц. Они являютсяне только звуками, встречающимися в языке, но «звуковыми образами», замечаетСоссюр, которые воспринимаются носителями языка как обладающие значением.(Следует заметить, что Элмар Холенштейн называет лингвистику Якобсона, поосновным положениям продолжающего идеи и концепции Соссюра, «феноменологическимструктурализмом»). Именно поэтому ведущий докладчик пражской школыструктурализма, Ян Мукаровский, заметил в 1937 году, что «структура… неэмпирическое, а феноменологическое понятие; это не сам результат, а наборзначимых отношений коллективного сознания (поколения, окружающих и т.д.)».Похожую мысль высказал в 1960 году Леви-Стросс, лидер французского структурализма:«У структуры нет определённого содержания; она сама по себе содержательна, илогическая конструкция, в которую она заключена, представляет собой отпечатокреальности».
В свою очередь, фонемы, как самые мелкие языковыеэлементы, приемлемые для восприятия, представляют собой отдельную цельную«феноменологическую реальность». Например, в английском языке звук «т» можетпроизноситься по-разному, но во всех случаях человек, владеющий английским,будет воспринимать его как «т». Произнесённый с придыханием, с высоким илинизким подъёмом языка, долгий звук «т» и т.п будет одинаково различать значениеслов «to» и «do». Более того – различия между языками таковы, что разновидностиодного звука в одном языке могут соответствовать разным фонемам в другом;например «л» и «р» в английском различны, в то время как в других языках эторазновидности одной фонемы (подобно английскому «т», произнесённому спридыханием и без). Обширный словарный запас любого естественного языкапредставляет собой набор сочетаний гораздо меньшего количества фонем. Ванглийском, например, для произнесения и написания около миллиона словиспользуется всего 40 фонем.
Звуки языка представляют собой системноорганизованный набор черт. В 1920е –1930е, вслед за Соссюром, Якобсон иН.С.Трубецкой выделили «отличительные черты» фонем. Эти черты основаны настроении органов речи – языка, зубов, голосовых связок – Соссюр замечает это в«Курсе общей лингвистики», а Харрис называет «физиологической фонетикой» (вболее раннем переводе Баскина используется термин «фонология») – онисоединяются в «узлы» дург против друга, чтобы издавать звуки. Скажем, in ванглийском разница между «т» и «д» заключается в наличии или отсутствии«голоса» (напряжении голосовых связок), и в уровне голоса, отличающем однуфонему от другой. Таким образом, фонологию можно считать примером общегоязыкового праивла, описанного Соссюром: «В языке есть только различия». Болееважно даже не это: различие обычно подразумевает точные условия, между которымионо и находится; но в языке существуют только различия без точных условий.Рассматриваем ли мы «обозначение» или «обозначаемое» – в языке не существует нипонятий, ни звуков, которые существовали бы до того, как развилась языковаясистема.
В подобной структуре, языковые аналогии определеныне с помощью изначально присущих им качеств, а с помощью системных(«структурных») отношений.
Я уже упомянул, что фонология в своём развитииопиралась на идеи Соссюра. Несмотря на то, что его анализ языковой физиологии внаше время по словам Харриса, «был бы назван «физическим», в противовес«психологическому» или «функциональному», в «Курсе» он отчётливо сформулировалнаправление и основные принципы функционального анализа языка. Его единственнаяизданная при жизни работа, «Mémoire sur le système primitif desvoyelles dans les langues indo-européennes» (Записки о первоначальнойсистеме гласных в индоевропейских языках), изданная в 1878, полностьюнаходилась в русле сравнительно-исторического языкознания XIX века. Тем неменее этим трудом, как говорит Джонатан Каллер, Соссюр показал «плодотворностьпредставления о языке как о системе взаимосвязанных явлений, даже при егоисторической реконструкции». Анализируя взаимосвязи между фонемами, объясняячередования гласных в современных языках индоевропейской группы, Соссюрпредположил, что кроме нескольких разных звуков «а», должны быть и другиефонемы, описываемые формально. «Что производит особое впечатление в трудеСоссюра, – делает вывод Каллер, – то, что почти 50 лет спустя, при открытии ирасшифровке хеттской клинописи, была найдена фонема, на письме обозначаемая«h», которая вела себя так, как предсказывал Соссюр. С помощью формальногоанализа он открыл то, что сейчас известно как гортанный звук в индоевропейскихязыках.
В концепция относительного (диакритического)определения знаков, как явно выраженной, так и подразумеваемой в «Курсе»,существует и третье ключевое предположение структурной лингвистики, названноеСоссюром «произвольной природой знака». Под этим подразумевается, что отношениемежду звучанием и значением в языке ничем не мотивировано: с одинаковойлёгкостью можно соединить слово «arbre» и слово «tree» с понятием «дерево».Более того, это значит, что звучание тоже произвольно: можно определить понятие«дерево» по наличию у него коры (кроме пальм) и по размеру (кроме «низкихдревесных растений» — кустарников). Из этого должно быть понятно, что всепредставляемые мною предположения не делятся на более и менее важные: каждое изних – системный характер знаков (более всего понятный при «синхронном» изученииязыка), их относительная (диакритическая) сущность, произвольная природа знаков– исходит из остальных.
Таким образом, в соссюровском языкознании изучаемыйфеномен понимается как свод сопоставлений и противопоставлений языка. Язык –это и выражение значения слов (обозначение), и их результат (общение) – и этидве функции никогда не совпадают (см. «Деконструкцию языка» Шлейфера). Мы можемзаметить чередование формы и содержания, которое Греймас и Курте описывают вновейшем варианте интерпретации: языковые контрасты определяют его структурныеединицы, и эти единицы взаимодействуют на сменяющих друг друга уровнях, чтобысоздать определённое значимое содержание. Так как элементы языка случайны, никонтраст, ни сочетание не могут быть основой. Значит, в языке отличительныепризнаки формируют фонетический контраст на другом уровне понимания, фонемысоединяются в контрастные морфемы, морфемы – в слова, слова – в предложения ит.д. В любом случае, целая фонема, слово, предложение и т.д. представляет собойнечто большее, чем сумма составляющих (так же как вода, в соссюровском примере– больше, чем сочетание водорода и кислорода).
Три предположения «Курса общей лингвистики» привелиСоссюра к идее новой науки двадцатого века, отдельно от лингвистики изучающей«жизнь знаков в обществе». Соссюр назвал эту науку семиологией (от греческого«semeîon» — знак). «Наука» семиотики, развивавшаяся в Восточной Европе в1920е –1930е и в Париже в 1950е and 1960е, расширила изучение языка илингвистических структур до литературных находок, составленных (илисформулированных) с помощью этих структур. Кроме того, на закате своей карьеры,параллельно своему курсу общей лингвистики, Соссюр занялся «семиотическим»анализом поздней римской поэзии, пытаясь открыть умышленно составленныеанаграммы имён собственных. Этот метод был во многом противоположенрационализму в его лингвистическом анализе: он был попыткой, как пишет Соссюр водной из 99 записных книжек, изучить в системе проблему «вероятности», которая«становится основой всего». Такое исследование, как утверждает сам Соссюр,помогает сосредоточиться на «вещественной стороне» вероятности; «ключевоеслово», анаграмму которого ищет Соссюр, как утверждает Жан Старобинский,«инструмент для поэта, а не источник жизни стихотворения. Стихотворение служитдля того, чтобы поменять местами звуки ключевого слова». По словамСтаробинского, в этом анализе «Соссюр не углубляется в поиски скрытых смыслов».Напротив, в его работах заметно желание избежать вопросов, связанных ссознанием: «так как поэзия выражается не только в словах, но и в том, чтопорождают эти слова, она выходит из-под контроля сознания и зависит только отзаконов языка».
Попытка Соссюра изучить имена собственные в позднейримской поэзии (Цветан Тодоров назвал это сокращением «слова… лишь до егонаписания») подчёркивает одну из составляющих его лингвистического анализа –произвольную природу знаков, а также формальную сущность соссюровскойлингвистики ( «Язык, – утверждает он, «суть форма, а не явление»), чтоисключает возможность анализа смысла. Тодоров делает вывод, что в наши днитруды Соссюра выглядят на редкость последовательными в нежелании изучатьсимволы [явления, имеющие чётко определённое значение]… Исследуяанаграммы, Соссюр обращает внимание только на повторение, но не на предшествующиеварианты… Изучая «Песнь о Нибелунгах», он определяет символы только длятого, чтобы присвоить их ошибочным чтениям: если они неумышленны, символов несуществует. В конце концов, в своих трудах по общей лингвистике он делает предположениео существовании семиологии, описывающей не только лингвистические знаки; но этопредположение ограничивается тем, что семилогоия может описывать толькослучайные, произвольные знаки.
Раз это действительно так, то только потому, что немог представить «намерение» без предмета; он не мог до конца преодолетьпропасть между формой и содержанием – в его трудах это превращалось в вопрос.Вместо этого он обращался к «языковой законности». Находясь между, с однойстороны, концепциями девятнадцатого века, основанными на истории и субъективныхдогадках, и методах случайной интерпретации, основанных на этих концепциях, и,с другой стороны, структуралистскими концепциями, которые Леви-Стросс назвал«кантианством без трансцендентного действующего лица» – стирающимипротивостояние между формой и содержанием (субъектом и объектом), значением ипроисхождением в структурализме, психоанализе и даже квантовой механике – трудыФерлинанда де Соссюра по лингвистике и семиотике обозначают поворотный момент визучении значений в языке и культуре.Рональд Шлейфер
Литература
1. Адмони В.Г. Основы теорииграмматики / В.Г. Адмони; АН СССР.-М.: Наука, 1964.-104с.
2. Апресян, Ю.Д. Идеи и методы современной структурнойлингвистики. М., 1966.
3. Арапов, М.В., Херц, М.М. Математические методы влингвистике. М., 1974.
4. Арнольд И.В. Семантическаяструктура слова в современном английском языке и методика её исследования./И.В. Арнольд– Л.: Просвещение, 1966. – 187 с.
5. Баранов А.Н.Категории искусственного интеллекта в лингвистической семантике. Фреймы исценарии// А.Н. Баранов – М., 1987 – 300 c.
6.Башлыков А.М. Системаавтоматизированного перевода. / А.М. Башлыков, А.А. Соколов. – М.: ООО «ФИМА»,1997. – 20 с.
7.Бодуэн де Куртенэ: Теоретическоенасле дие и современность: Тезисы докладов международной научной конференции /Ред.И.Г. Кондратьева. – Казань: КГУ, 1995. – 224 с.
8. ГладкийА.В., Элементы математической лигвистики. /. Гладкий А.В., Мельчук И.А. –М.,1969. – 198 с.
9. Головин,Б.Н. Язык и статистика. /Б.Н. Головин –М., 1971. – 210 с.
10. Звегинцев,В.А. Теоретическая и прикладная лингвистика. / В.А. Звегинцев –М., 1969. – 143с.
11. Касевич,В.Б. Семантика. Синтаксис. Морфология. // В.Б. Касевич –М., 1988. – 292 c.
12. Лекомцев Ю.К. Введение вформальный язык лингвистики/ Ю.К. Лекомцев. – М.: Наука, 1983, 204 с., ил.
13. Лингвистическое наследие Бодуэнаде Куртенэ на исходе ХХ столетия: Тезисы докладов международскойнаучно-практическтй конференции 15-18 марта 2000 года. – Красноярск, 2000. –125 с.
Матвеева Г.Г. Скрытые грамматическиезначения и идентификация социального лица («портрета») говорящего/ Г.Г.Матвеева. – Ростов, 1999. – 174 с.
14. Мельчук,И.A. Опыт постpоения лингвистических моделей «Смысл Текст»./ И.А. Мельчук. – М., 1974. – 145 c.
15. Нелюбин Л.Л. Перевод и прикладнаялингвистика/Л.Л. Нелюбин. – М.: Высшая школа, 1983. – 207 с.
16. О точных методах исследованияязыка: о так называемой «математической лингвистике»/ О.С. Ахманова, И. А.Мельчук, Е.В. Падучева и др. – М., 1961. – 162 с.
17. Пиотровский Л.Г. Математическаялингвистика: Учебное пособие/ Л.Г. Пиотровский, К.Б. Бектаев, А.А. Пиотровская.– М.: Высшая школа, 1977. – 160 с.
18.Он же.Текст, машина, человек. – Л., 1975. – 213 с.
19. Он же.Прикладное языкознание / Под ред. А.С Герда. – Л., 1986. – 176 с.
20. Ревзин,И.И. Модели языка. М., 1963. Ревзин, И.И. Современная структурная лингвистика.Проблемы и методы. М., 1977. – 239 с.
21. Ревзин,И.И., Розенцвейг, В.Ю. Основы общего и машинного перевода/Ревзин И.И.,Розенцвейг, В.Ю. – М., 1964. – 401 с.
22. Слюсарёва Н.А. Теория Ф.деСоссюра в свете современной лингвистики/ Н.А. Слюсарева. – М.: Наука, 1975. –156 с.
23. Сова, Л.З.Аналитическая лингвистика/ Л.З. Сова – М., 1970. – 192 с.
24. Соссюр Ф. де. Заметки по общейлингвистике/ Ф. де Соссюр; Пер. с фр. – М.: Прогресс, 2000. – 187 с.
25. Он же. Курс общей лингвистики/Пер. с фр. – Екатеринбург, 1999. –426 с.
26. Статистикаречи и автоматический анализ текста / Отв. ред. Р.Г. Пиотровский. Л., 1980. –223 с.
27. Столл, P.Множествa. Логикa. Aксиомaтические теоpии./ Р. Столл; Пер. с англ. – М., 1968.– 180 с.
28. Теньер, Л.Основы структурного синтаксиса. М., 1988.
29. Убин И.И. Автоматизацияпереводческой деятельности в СССР/ И.И. Убин, Л.Ю. Коростелёв, Б.Д. Тихомиров.– М., 1989. – 28 с.
30. Фоp, P.,Кофмaн, A., Дени-Пaпен, М. Совpеменнaя мaтемaтикa. М., 1966.
31. Шенк, Р.Обработка концептуальной информации. М., 1980.
32. Шихaнович,Ю.A. Введение в современную мaтемaтику (нaчaльные понятия). М., 1965
33. Щерба Л.В.Русские гласные в качественном и количественном отношении/ Л.В. Щерба – Л.:Наука, 1983. – 159 с.
34. Абдулла-заде Ф. Гражданин мира// Огонёк – 1996. – №5. –С.13
35. В.А. Успенский. Предварение для читателей «Новоголитературного обозрения» к семиотическим посланиям Андрея НиколаевичаКолмогорова. – Новое литературное обозрение. –1997. – № 24. – С. 18-23
36. Перловский Л. Сознание, язык и культура. – Знание – сила.–2000. №4 – С. 20-33
37. Фрумкина Р.М. О нас – наискосок. //Русский Журнал. –2000. – №1. – С. 12
38. Фитиалов, С.Я. О моделированиисинтаксиса в структурной лингвистике // Проблемы структурной лингвистики. М.,1962.
39. Он же. Об эквивалентностиграмматики НС и грамматики зависимостей // Проблемы структурной лингвистики.М., 1967.
40. Хомский, Н. Логические основылингвистической теории // Новое в лингвистике. Вып. 4. М., 1965
41. Schleifer R. Ferdinandde Saussure// press. jhu.ru
42. www.krugosvet.ru
43. www.lenta.ru
44. phil.ru.ru
45. press. jhu.ru
46. ru.wikipedia.org
47. www.smolensk.ru