1. Насколько линейна реализация фонем в речи?

К оглавлению
1 2 3 4 5 6 7 8 9 10 11 12 13 14 

 

Психофонетика и письмо

В ближайшие годы ожидается резкое увеличение роли обычной устной речи при общении человека с разного рода автоматами и приборами: в управлении автомобилем, в Интернете и в различных коммерческих системах. Автоматическое распознавание и понимание речи, над которым ученые бились полвека, становится одной из важнейших сторон прогресса информационной техники, лежащей в основе жизнедеятельности всех развитых обществ планеты. Римляне считали наши орудия немыvи (в отличие от «полуговорящего» домашнего скота и говорящих орудий - рабов). Мы впервые в истории вида начинаем широко пользоваться техническими говорящими орудиями - иначе говоря, не только изготовлять орудия (чем человек отличается от животных), но и обучать их нашему языку (чем мы начинаем отличаться от всех ранее живших людей). Поэтому кажется возможным сейчас припомнить важнейшие из тех проблем на этом пути, которые до сих пор остаются нерешенными.

В начале лета 1961 г. мне предоставилась возможность поработать в лаборатории Л. А. Чистович в ленинградском Институте физиологии. Я пользовался только что разработанным В. А. Кожевниковым прибором, который давал исключительно точную картину движений разных органов речи при произнесении русской фразы. Целью моей поездки было обсуждение теории соотношения артикуляции и распознавания речи, предложенной Чистович. Но попутно в предпринятой тогда совместной работе мы хотели уточнить и понимание временной организации речи, для чего я старался возможно тщательнее измерить длину соответствующих отдельным фонемам отрезков на кривых, начерченных прибором при записи многократных произнесений одного и того же предложения (вычисления мы еще делали вручную на логарифмической линейке и тратили массу времени на то, что сейчас бы за нас быстро посчитал компьютер). В некоторых случаях обнаружилось несовпадение того, что я видел и измерял на лабораторных кривых, и линейного представления последовательности фонем, с которым мы оперируем теоретически и в так называемой «фонологической транскрипции». Например, в такой русской форме, как швы [svy], две первые согласные фонемы в своей речевой реализации не следуют друг за другом, а произносятся одновременно. Незадолго до того, живя летом в Пицунде, я брал уроки абхазского у одного из местных жителей и среди прочего пытался правильно научиться произносить огубленные шипящие спиранты. Разглядывая и измеряя записи движений языка и губ при произнесении сочетания русских шипящих с губными, я убедился, что произносим мы почти то же, что абхазы. Но фонологическая функция различна. В абхазском это - отдельные фонемы, а для говорящих по-русски - сочетания фонем.

Если движения органов речи, нужные для реализации двух или больше фонем, совместимы друг с другом, они и совершаются в одно время - параллельно, а не последовательно [8]. Мы часто говорим об отдельных явлениях, которые объясняются взаимовлиянием следующих друг за другом фонем; для этого есть обозначения - ассимиляция, лабиализация, палатализация, в более широком понимании - умлаут, сингармонизм. Меньше изучено то, в какой мере одна фонема перетекает в другую, как они сплавляются друг с другом [9], а также и с суперсегментными (просодическими, в частности, тоновыми и акцентуационными, характеризующими целый слог или целое слово) признаками. В те годы (еще перед своей эмиграцией) А. С. Либерман (отчасти продолжая направление последних исследований С. Д. Кацнельсона) начал изучать придыхание и ларингализацию (прежде всего - исландскую) в связи с германской акцентуацией. Еще не зная об этих работах, я в нескольких статьях пытался увидеть связь гортанной смычки или глоттализации с определенным тоном (чаще всего восходящим или высоким) на материале разных языков. Впервые я это заметил, еще занимаясь латышским в студенческие и аспирантские годы; происхождение латышской прерывистой интонации, часто реализующейся как гортанная смычка, из акутового тона в восточно-балтийских парадигмах с подвижным ударением обнаружил патриарх балтийского языкознания Я. Эндзелин, с которым я обсуждал эти процесcы в его поместье «Нака» на Даугаве летом 1953 г. Новые примеры отчасти сходного развития тонов я нашел в енисейских языках - кетском и вымиравшем югском, которые я изучал во время экспедиции в Западную Сибирь в 1962 г. (по новейшим реконструкциям С. А. Старостина, эти тоны как просодическое явление находят соответствие в других ветвях сино-кавказской макросемьи, в частности, в таких признаках северно-кавказских cогласных, для которых ранее было предположено, что они как просодическое явление распространяются на все слово и поэтому должны быть отнесены к области просодии, а не сегментных фонем [10]). А еще позднее типологией взаимозависимости глухости-звонкости и высокого-низкого тона, описанной в некоторых языках Новой Гвинеи, да и в нескольких других, я пытался объяснить явления, отвечающие закону Вернера в германском (в частности, звонкость начального согласного в готской приставке ga-, немецк. ge-, родственной лат. com и восходящей к той же индоевропейской энклитике, что и тождественное по происхождению русск. к, санскритск. kam, хеттское -kan).

Находившаяся в становлении область занятий, которая увлекала в ту пору меня и Чистович, была по сути современным вариантом «психофонетики» Бодуэна [11] и Поливанова, который уже писал о возможной одновременности кинем - произносительных единиц, выделявшихся им (вслед за Бодуэном) внутри фонемы [12]. Поливанову же принадлежит и другая плодотворная идея, важная для понимания обсуждаемого круга явлений. Он хорошо знал китайскую традицию, описываюшую звуковую структуру слога через понятия инициали - начального элемента и финали - конечных эдементов. Отсутствие фонемы как дискретной единицы в этих раннекитайских лингвистических описаниях сейчас скорее выглядит как их недостаток [13].

Поливанов отнесся к этой проблеме более конструктивно: он предположил, что в языках типа китайского основной фонологической единицей может быть не фонема, а силлабема. Слог в целом, а не отдельные его дискретные части оказывается главным объектом фонологического исследования. Выявление слога как особой фонологической единицы согласуется и со свидетельством слоговых систем письма (как японские катакана и хирагана) или систем, включающих слоговой принцип (как, например, крито-микенское линеарное B письмо). Для дешифровки таких систем письма оказывается нужным составление решетки слогов, состоящих из комбинаций согласного с гласным, как это было сделано и учеными, прочитавшими иероглифические лувийские тексты [14].

Одно из преимуществ подхода к силлабеме у Поливанова я вижу в том, что снимается различие между частями слога - силлабемы и тоном (интонaцией), принадлежащей слогу в целом. При диахроническом исследовании мы можем, например, проследить, что исчезновение праиндоевропейских ларингальных фонем вело в балто-славянском не только к появлению новых долгих гласных [15], но и к возникновению в соответствующих слогах акутовой интонации. Если полагать, что речь идет об изменении слога в целом, такое изменение получает вполне простую фонологическую формулировку. Несколько позднее я пришел к двойственному пониманию фонологии и того, что Поливанов называл «психофонетикой». Звуки речи можно рассматривать по меньшей мере с двух совершенно разных точек зрения. Одна - внешнего наблюдателя, который слышит речевой поток, записывает его или производящие его движения, как прибор Кожевникова или спектрограф, пробует, как любой фонетист, сегментировать этот поток или его запись прибором и описать их согласно принятой общефонетической схеме. Для такого стороннего наблюдателя в принципе безразлично, кто или что произносит анализируемые звуки - человек, синтезатор речи или компьютер. Другая точка зрения - изнутри говорящего, который знает, какие слова и в каких сочетаниях он хочет произнести. Этот последний взгляд - субъективный, он и касается фонологической структуры языка как такового [16]. Само разбиение непрерывного звукового потока на фонемы определяется унаследованными характеристиками памяти человека: фонологическая система зависит от ограничений, наложенных эволюцией на устройство, которое этой системой пользуется. Позднее, участвуя в совместных обсуждениях с теми, кто готовился к возможному общению с внеземными цивилизациями, я пробовал им объяснить, что система с другими параметрами могла бы и не делить речевой поток на части так, как мы это делаем. Какие отделы центральной нервной системы во взаимодействии друг с другом отвечают не только за речевые движения, но и за построение и использование всей системы фонем и других уровней языка, начинает открывать нейролингвистика. Кроме заинтересовавшего нас вслед за Якобсоном и Лурия (в лаборатории которого с его сотрудниками в Институте нейрохирургии я с начала 1960-х гг. занимался лингвистическим анализом афазий) патологического материала, относящегося к нарушениям этих систем, в последнее время становится доступной для наблюдения (по мере внедрения новых и пока еще весьма несовершенных методов получения образов мозга и кровотока в нем) и обычная работа речевых зон мозга в норме [17].

О самых ранних этапах истории размещения речи и других систем знаков (в частности, жестов) в мозге наших предков и о дальнейшей их эволюции и функционировании в нервной системе современных людей мы теперь каждый год узнаем много нового благодаря экспериментальным возможностям, несколько лет назад открытым приматологией - наукой о наших ближайших родственниках-антропоидах (шимпанзе, гориллах, орангутанах) и обезьянах, и начавшемуся широкому применению новых методов наблюдения за работой мозга (посредством магнитно-резонансных образов, позиционно-эмиссионной томографии, исследования кровоснабжения). Благодаря этим методам впервые стало возможным изучать разные виды деятельности всего мозга как единого целого, а не только отдельных его зон, чем раньше в основном занималась нейропсихология, основывавшаяся на клинических данных, которые относились к патологии, а не к норме, лишь сейчас ставшей объектом точных исследований. Поток работ и открытий в этой области нарастает лавинообразно. Генетики начинают постепенно открывать наследственные механизмы, связанные с владением речью и другими высшими психическими функциями. Удивительность человеческого языка с эволюционной точки зрения состоит и в том, что органы, ставшие нужными для речи (но в начале имевшие другие функции), были использованы в качестве клавиатуры столь сложно построенного инструмента. Рядом с этим шло и развитие управляющих ими систем. Новые исследования позволяют отнести формирование таких частей нейролингвистической организации человека, как речевая зона Вернике, по меньшей мере на 8 миллионов лет вглубь нашей эволюционной предыстории [18]. А cпецифический нервный путь фильтрования звуковой информации с целью обнаружения в ней полезных коммуникационных сигналов (в отличие от других, в частности от используемых для ориентации в пространстве) восходит к гораздо более ранней предыстории приматов (он был обнаружен сперва у обезьян и лишь недавно получил подтверждение в исследованиях параллелизма оптического и акустического восприятия у человека [19]). Среднее число фонем в языках мира (от 11-15 в языках тихоокеанского и частично южноамериканского [20] ареала - типа айнского и полинезийских с минимальным числом согласных, о чем в свое время специально писал Одрикур, - и до 81 в абхазском) соответствует среднему числу сигналов у приматов и других млекопитающих. Но в дочеловеческих системах каждый сигнал имел свою смысловую функцию, а у человека фонемы служат для различения элементов высших уровней - словоформ. Развитие у человека пошло по пути не увеличения числа элементов системы, а введения иерархических уровней, надстроенных над запасом, который унаследован от более ранних этапов эволюции. Если успехи гуманитарного знания в наступившем веке будут зависеть (как предполагали многие) от соединения достижений естественных наук, прежде всего - биологии, с еще мало изученным с этой точки зрения материалом наук о человеке, то нейролингвистика и психофонетика окажутся теми областями, где продвижение в этом направлении уже начинается.

Одной из первых работ, где убедительно была показана психологическая реальность фонем (или «звукопредставлений» в ранней терминологии Бодуэна и Поливанова), была статья Сепира, который пользовался в качестве аргументов примерами того, как индейцы записывают фонемы своих языков (я бы мог привести аналогичные примеры из наблюдений над тем, как кеты, после ареста создателя их первого лaтинского алфавита Каргера не имевшие своего признанного советской властью письма, тем не менее успешно записывали свой язык в 1960-е гг.). Письмо представляет значительную ценность для понимания психологии фонологического анализа у того, кто им пользуется, как показал Лурия в пионерских исследованиях, где на материале аграфии он сравнил (мор)фонологическое письмо (русское) с полуиероглифическим или полулогографическим (французским). В самое последнее время выявлены левополушарные механизмы, дающие возможность воспринять фонологическое слово и его зрительное буквенное соответствие, отличающееся от простого набора согласных [21].

Для обоснования тезиса о нелинейном характере восприятия звукового облика слова, во всяком случае в тоновых моносиллабических языках, значительный интерес представляет письменность pahawh Hmong языка хмонг (Лаос и сопредельные страны Юго-Восточной Азии), открытая Шонг Луэ Янгом (по мнению его последователей, в качестве божественного откровения) в 1950-1960-х гг. XX в. В этой оригинальной системе письма записывается сперва гласная фонема слога и тон и лишь после этого (в отличие от порядка фонем в устной речи) согласный, которым начинается произносимое слово [22].

Кажется возможным обратить внимание по меньшей мере на две средневековые евразийские сиcтемы письма, в которых отражены существенные свойства взаимодействия фонем на протяжении сингармонического слога и слова (а иногда и более длинной последовательности). Я имею в виду тот вариант курсивного письма брахми, которым пользовались во второй половине I тыc. н. э. для записи тохарских (А и B) текстов, а также древнетюркское руническое письмо, вероятно, испытавшее структурное влияние тохарского варианта брахми (хотя возможно, что сами по себе рунические тюркские знаки были заимствованы из согдийского письма). В тохарском письме кроме перенятых из древнеиндийского знаков в форме, обычной для центральноазиатского брахми, есть ряд дополнительных cлоговых знаков, в том числе для передачи гласного переднего ряда 'ä, и целый класс «чужих знаков». Последние в соответствии с их истолкованием Дж. Рейтером и Н. Д. Мироновым могут пониматься как обозначение палатализованных фонем [k’], [t’], [p’], [s’], [tš’], [ş’], [š’], [ts’], [n’], [m’], [l’] либо в сочетании с последующим гласным переднего ряда ä, либо в позиции в конце слова и в некоторых других не перед этим гласным. Признак палатализации может при этом распространяться и на соседние слоги и слова, а не на один только слог, обозначаемый данным «чужим знаком» в комбинациях с другими (причем, как и во всех лигатурах в древнеиндийских системах письма, расположение элементов не линейное, а вертикальное, что при строго фонетическом характере письма иконически вопроизводит одновременность произнесения). Образуется длинная последовательность, которая вся в целом обладает различительным признаком палатализованности. Так, например, сплошной последовательностью «чужих знаков» передается числительное тохарск. B pan kānt [23] - ‘500’ (родственно рус. пятьсот).

Точно так же построена система тюркского рунического письма, делящая все согласные в зависимости от того, следуют ли за ними гласные переднего или заднего ряда: в пределах сингармонического слова соблюдается и слоговой сингармонизм. Типологически сходное явление, отраженное и в старославянском письме (но без введения специальных отдельных знаков для большинства палатализованных согласных и при наличии лишь дополнительных знаков их смягчения), дало основание Роману Якобсону реконструировать слоговой сингармонизм для славянского, входившего, как и тюркский и тохарский, в выявленный тем же Якобсоном евразийский языковой союз. Важнейшей приметой этой языковой зоны было наличие парных противопоставлений палатализованных и непалатализованных согласных. Для теории языка кажется важным то, что распространение признака палатализованности на длинную последовательность фонем препятствует дискретному восприятию каждой из них. В сингармоническом палатализующем («палатализованном» по терминологии Поливанова) языке слог и слово, а не фонема становятся основными фонологическими единицами, а признак палатализованности может охватывать целую слоговую и словесную цепочку [24].

Открытие фонем как дискретных единиц в XX в. было связано с той тенденцией к обнаружению роли дискретного (прерывного), которую многие ученые признавали одной из главных интеллектуальных характеристик этой эпохи [25].

На этом пути естественны были и некоторые преувеличения: на время отошел на задний план центральный для фонетики и ее практических приложений вопрос о том, как непрерывная последовательность звуков перекодируется в линейный ряд дискретных элементов - фонем или букв алфавита. Далее применение принципа изоморфизма разных уровней языка вело к предположению, что и «план содержания» (семантическая структура языка) может быть построен из таких же дискретных элементов, как «план выражения» (его фонологическая система). Эта точка зрения была исходной для целого ряда выдвинутых на протяжении второй половины минувшего века семантических теорий. На идеи Лейбница, склонявшегося и в математике к исследованию «зернистых» структур (о чем в упомянутой статье писал Лузин [26]), опиралась и их развивала А. Вержбицкая. Однако можно усомниться в том, насколько дискретными можно считать такие исходные понятия ее семантической системы, как «мир» и «Бог». Кажется вероятным, что для наступающей интеллектуальной эпохи особенно важным может оказаться поиск равновесия и взаимного соответствия дискретного и непрерывного в языке и других видах знаковой деятельности (как кино, где при очевидной значимости непрерывной передачи информации в XX в. особое внимание обращалось на дискретный прием монтажа). Уже популярность фракталов может говорить о смене интеллектуальной доминанты. Для эпохи квантовых компьютеров и соответствующих им моделей мозга идея непрерывности может оказаться снова (как при Ньютоне) не менее важной, чем дискретность была для рубежа 19 и 20 веков.