Первая страница
Наша команда
Контакты
О нас

    Главная страница


Книга объясняет тайны удивительных явлений, связанных с языком, таких как «мозговитые»




страница21/51
Дата11.01.2017
Размер7.92 Mb.
ТипКнига
1   ...   17   18   19   20   21   22   23   24   ...   51
Глава 7. Говорящие головы
любой из компьютеров. Тем не менее, около половины арбитров спутали выигравшую

программу с человеком.


Это достижение является менее впечатляющим, чем кажется. Правила связали

арбитрам руки: «неестественные хитрости и уловки» — это иное название любой

попытки установить, разговариваешь ты с человеком или с машиной, что и является

смыслом конкурса! Кроме того, программист-победитель тонко использовал

возможность выбирать тему беседы для своей программы. Он выбрал «эксцентричную

беседу», которая является сомнительным примером «темы» и сама по себе может быть

полна непоследовательностей:
Арбитр: Как долго тянется этот день! Но теперь, мне кажется, я готов немного

поразвлечься. Погода сегодня не очень хорошая. Знаешь ли ты какие-нибудь шутки,

которые могли бы разогнать облака?
Компьютер: Все говорят о погоде, но, похоже, никто ничего с ней не делает.

Почему тебе обязательно нужно было мне сказать, что теперь ты готов немного

поразвлечься? О-о-о-ох...
Арбитр: Ты хочешь запутать меня, да? Я просто объяснил, что готов поразвлечься!
Компьютер: Не лучше ли сказать, если бы это была неправда, что я пытаемся4*

запутать тебя, да? Я просто объяснил, что готов поразвлечься! Я, следовательно,

я вычисляю... Почему ты думаешь, что я пытаюсь запутать тебя, не правда ли?
Арбитр: Не могу сказать, что понимаю вопрос... Но эксцентричность поэта — это

одно, а эксцентричность большинства из нас — другое.


Компьютер: Откуда ты знаешь, что не можешь сказать, что понял вопрос... Но

эксцентричность поэта — это одно, а эксцентричность большинства из нас — другое.


По сути программист просто усовершенствовал технологию, изобретенную в 1965 г.

ученым-компьютерщиком Джозефом Вейценбаумом. Вейценбаум написал туповатую

программу, названную ELIZA в честь героини Бернарда Шоу; эта программа искала

несколько ключевых слов во вводимой строке, извлекала фиксированный ответ из

списка и вставляла фрагменты вводимой строки в ответ (с некоторыми небольшими

изменениями, например «ты» вместо «я»). Таким образом в примитивной форме

имитировалась беседа. Один вариант программы под названием Doctor копировал

поведение психотерапевта — приверженца философии Карла Роджерса, считавшего, что

терапевт должен повторять пациенту его же собственные утверждения для их

осмысливания. Эта версия программы позже продавалась как компьютерная игра в

магазинах «Рейдио Шэк»5), а другая версия поступает в комплекте с моим текстовым

редактором GNU Emacs. (В документации сказано: «Если при использовании


4) Грамматические и синтаксические ошибки в речи компьютера присутствуют и в

оригинальном тексте. — Прим, перев.


5' Сеть магазинов, специализирующихся на продаже бытовых товаров

радиоэлектроники и компьютеров. — Прим. ред.


Как мы понимаем язык и используем его в речи 185
Emacs что-то не получается, и ни один из указанных выше приемов не решает

проблему, Emacs все же может вам помочь. Наберите: „М-х doctor RET**».) Вот

типичный диалог:
Пользователь: В последнее время я чувствую себя порядком подавленным.
Компьютер: Вы часто чувствуете себя подавленным?
Пользователь: Да, почти все время.
Компьютер: Почему вы говорите «да, почти все время»?
Пользователь: Вот сейчас я чувствую, что готов заплакать.
Компьютер: Вы пришли ко мне потому, что сейчас чувствуете, что готовы заплакать?
К ужасу Вейценбаума, однажды он увидел, как его секретарша припала к терминалу и

изливает душу программе.


У большинства ученых-компьютерщиков конкурс на премию Лобне-ра вызывает

раздражение. Они считают его не имеющим научной ценности рекламным трюком,

задача которого — обвести вокруг пальца непрофессионала, а не научить компьютер

речи. (Разработчикам искусственного интеллекта и другим профессионалам,

разбирающимся в проблемах языка, не разрешили быть арбитрами, но ни один из них

и не рвался участвовать в конкурсе, заявки поступали от любителей.) Этот конкурс

примерно так же продуктивен, как будет продуктивна реклама биологических

исследований, если на премию выдвинуть создателя искусственного цветка из шелка,

самого похожего на естественный; или как будет продуктивна работа над

космической программой, где высадка на Луну осуществится на съемочной площадке

Голливуда. Была проведена интенсивная работа по созданию компьютерных систем,

понимающих язык, но ни у одного серьезного инженера не хватит дерзости

утверждать, что система, дублирующая языковые способности человека, появится в

недалеком будущем.


В действительности, с точки зрения ученого, люди не имеют права так хорошо

понимать предложения, как они это делают. Они не просто решают до абсурда

сложную задачу, но еще и делают это быстро. Понимание, как правило, происходит в

режиме «реального времени». Слушающий действует синхронно с говорящим, а не ждет

конца отрезка речи, чтобы истолковать его через соразмерный промежуток времени,

подобно критику, пишущему рецензию на книгу. А временной промежуток между тем,

что произнес говорящий, и тем, что воспринял слушающий, чрезвычайно короток:

один или два слога за половину секунды. Некоторые люди могут понимать и

повторять предложения, следуя за речью говорящего с отставанием на четверть

секунды!
Понимание процесса понимания имеет и иное практическое применение, помимо

создания машин-собеседников. Понимание предложений людьми происходит быстро и

эффективно, но не идеально. Оно работает, когда воспринимаемый поток речи или

текст определенным образом структурирован. В противном случае процесс может

забуксовать, пойти


186
Глава 7. Говорящие головы
в обратном направлении, и возникнет неправильное понимание. Исследуя понимание

языка в этой главе, мы выясним, какие виды предложений могут путаться в сознании

человека, воспринимающего речь. Один из практических источников информации — это

набор рекомендаций для написания ясной прозы, научное руководство по стилистике,

например то, что написано Джозефом Уильямсом в 1990 г., — «Стиль: как добиться

ясности и изящества», в нем содержатся многие лингвистические находки, которые

мы будем рассматривать.
Другое практическое применение связано с областью права. Судьи часто

сталкиваются с тем, что им приходится гадать, как среднестатистический человек

воспримет двусмысленный отрывок текста, например, при изучении клиентом

контракта, заслушивании инструкций присяжными и чтении представителем

общественности потенциально клеветнической характеристики. Многие из

человеческих привычек толкования текста были определены благодаря лабораторным

исследованиям, а лингвист и юрист Лоренс Солэн объяснил связь между языком и

правом в своей интересной книге 1993 г. «Язык судей», к которой мы еще

обратимся.
* * *
Как происходит понимание предложения? Первый этап — это синтаксический разбор.

Он не имеет отношения к тем упражнениям, которые вы, стиснув зубы, делали в

начальной школе, и о которых у Дейва Барри, ведущего газетной рубрики «Спроси у

Господина Языка», осталось такое воспоминание:


Вопрос: Пожалуйста, объясните, как составить схему предложения.
Ответ: Прежде всего расположите предложение на чистой ровной поверхности,

например, на гладильной доске. Затем, используя остро отточенный карандаш или

скальпель, вычлените «сказуемое», которое показывает, где произошло действие, и

обычно расположено прямо за жабрами. Например, в предложении «ЛаМонт никогда не

привести в порядок лесникам» действие, очевидно, происходит в лесу. Таким

образом, ваша схема будет напоминать по форме деревце, с ветвями, выпирающими из

него, чтобы указать на расположение различных частиц речи, таких как ваши

герундии, провербы, второстепенности и т.д.


Но понимание действительно включает сходный с этим процесс нахождения

подлежащего, сказуемого, дополнения и т.д., который происходит бессознательно.

Если только вы не Вуди Аллен, в ускоренном темпе читающий «Войну и Мир», вам

нужно сгруппировать слова в синтаксические группы, определить, что является

группой подлежащего при каком сказуемом, и так далее. Например, чтобы понять

предложение The cat in the hat came back 'Кошка в шляпе вернулась' нужно

объединить в одну группу слова the cat in the hat 'кошка в шляпе', чтобы понять,

что это кошка вернулась, а не шляпа. Чтобы отличить предложение Dog bites man

'Собака кусает человека' от Man bites dog 'Человек кусает собаку' нужно найти

подлежащее и объект. А чтобы различить предложения Man bites dog 'Человек кусает

собаку', Man is bitten by dog 'Человек искусан
Как мы понимаем язык и используем его в речи 187
собакой' и Man suffers dog bite 'Человек перенес укус собаки', нужно обратиться

к словарным статьям упомянутых глаголов в ментальном словаре, чтобы определить,

что происходит с подлежащим человек.
Сама грамматика является просто кодом или протоколом, статичной базой данных,

определяющей, какие виды звуков соответствуют каким видам значения в

определенном языке. Это не рецепт и не программа для говорения и понимания.

Говорение и понимание основаны на одной и той же базе данных (язык, на котором

мы говорим, это тот же язык, который мы понимаем), но им также необходимы

процедуры, которые бы четко, шаг за шагом, обозначили, что необходимо делать

сознанию, когда становятся слышимыми слова, или когда сам собираешься начать

говорить. Ментальная программа, анализирующая структуру предложения во время

восприятия речи, называется «синтаксическим анализатором» («parser»).
Наилучший способ понять, как работает процесс понимания, это проследить за

синтаксическим разбором простого предложения, порожденного какой-нибудь

простенькой грамматикой, например той, что упоминалась в главе 4, и которую я

повторяю здесь:


S -> NP VP
«Предложение может состоять из именной группы и глагольной группы».
NP -» (det) N (PP)
«Именная группа может состоять из присутствующего факультативно де-
терминатора, имени существительного и присутствующей факультативно
предложной группы».
VP -» V NP (PP)
«Глагольная группа может состоять из глагола, именной группы и факультативно

присутствующей предложной группы».


PP -> P NP
«Предложная группа может состоять из предлога и именной группы».
N -> boy 'мальчик', girl 'девочка', dog 'собака', cat 'кошка', ice-cream

'мороженое', candy 'конфета', hot dogs 'сосиски'


«К именам существительным в ментальном словаре относятся слова: мальчик,

девочка, ...»


V -> eats 'ест', likes 'любит', bites 'кусает'
«К глаголам в ментальном словаре относятся слова: eats 'ест', likes 'любит',

bites 'кусает'».


P —> with 'с', in 'в', near 'около'
«К предлогам относятся слова: with 'с', in 'в', near 'около'».
det —> а 'какой-то', the 'этот', one 'один какой-то'
«К детерминаторам относятся слова: а 'какой-то', the 'этот', one 'один

какой-то'».


188
Глава 7. Говорящие головы
Возьмем предложение The dog likes ice-cream 'Эта собака любит мороженое'. Первое

слово, с которым сталкивается ментальный синтаксический анализатор — это the.

Синтаксический анализатор наводит о нем справки в ментальном словаре; это то же

самое, что обнаружить данное слово в правой части правила и выяснить его

категорию, указанную в левой части. Это детерминатор (determiner, det).

Следовательно синтаксический анализатор может вырастить первую веточку

предложения на дереве. (Правда, дерево, растущее сверху вниз от листьев к корням

невозможно в ботанике.)


det
the...
Детерминаторы, как и все слова, должны быть частью какой-либо большей

синтаксической группы. Синтаксический анализатор может вычислить, какая именно

синтаксическая группа имеется в виду, проверив, в правой части какого правила

имеется «det». Это будет правило, определяющее именную группу, NP. Дерево может

быть продолжено:
NP
det N
the...
Эта обособленная структура должна быть удержана в некой определенной памяти.

Синтаксический анализатор запоминает, что находящееся в нашем распоряжении слово

the является частью именной группы, которая скоро должна быть укомплектована

словами, которые заполнили бы остальные слоты, в данном случае — по меньшей мере

одним существительным.
Тем временем дерево продолжает расти, поскольку именные группы не могут

оставаться ни к чему не присоединенными. Проверив, правая сторона каких правил

содержит символ NP, синтаксический анализатор имеет несколько вариантов на

выбор. Только что построенная именная группа может быть частью предложения,

частью глагольной группы или частью предложной группы. Эту задачу выбора можно

решить, исходя из главного: все синтаксические группы должны быть в итоге

включены в предложение (S), а предложение должно начинаться с именной группы,

поэтому, чтобы продолжить дерево, логично использовать правило построения

предложения:
Как мы понимаем язык и используем его в речи
189

NP VP
det N


the...
Обратите внимание, что теперь синтаксический анализатор удерживает в памяти две

неукомплектованных ветви: именная группа, для укомплектования которой требуется

имя существительное, и предложение, для укомплектования которого требуется

глагольная группа.


Обособленная именная ветвь аналогична предсказанию того, что следующее слово

должно быть именем существительным. И когда дело доходит до следующего слова dog

'собака', просмотр правил подтверждает такое предсказание: слово dog — это часть

правила для имени существительного. Это позволяет слову dog быть включенным в

дерево, укомплектовывая именную конструкцию:

dog...
Синтаксическому анализатору больше не нужно помнить, что следует укомплектовать

NP, все, что нужно держать в памяти, — это неукомплектованное S.
На данном этапе можно в какой-то степени предположить значение предложения.

Вспомните о том, что одно существительное в именной группе является ядром —

вершиной (то, о чем говорит вся группа), а остальные синтаксические группы в

составе именной могут определять это существительное. Найдя определения слов dod

и the в их словарных статьях, синтаксический анализатор может отметить, что

именная группа говорит о какой-то ранее упоминавшейся собаке.


Следующее слово likes 'любит' оказывается глаголом. Глаголу не откуда было

взяться, кроме как из глагольной группы, VP, существование которой, к счастью,

уже было предсказано, поэтому два этих элемента можно соединить друг с другом.

Глагольная группа содержит больше, чем один глагол, она содержит также и именную

группу (свое допол-
190
Глава 7. Говорящие головы
нение). Таким образом, синтаксический анализатор предсказывает, что следующее, с

чем мы будем иметь дело — это именная группа:


dog likes...


Следующее на очереди — ice-cream 'мороженое' — существительное, которое может

быть частью именной группы — в точности как предсказывает обособленная ветвь NP.

Последние кусочки головоломки идеально укладываются на свое место:
NP

ice-cream


Слово ice-cream 'мороженое' укомплектовало именную группу, поэтому ее нет

необходимости больше держать в памяти; NP укомплектовала глагольную группу,

поэтому и о ней тоже можно забыть, a VP укомплектовала предложение. Когда память

освобождается от всех неукомплектованных обособленных ветвей, мы чувствуем в

сознании «щелчок», который свидетельствует о том, что мы только что услышали

полностью укомплектованное грамматически правильное предложение.


Одновременно с выращиванием ветвей дерева синтаксический анализатор также

выстраивал значение предложения, используя определения в ментальном словаре и

принципы их сочетаемости. Глагол является вершиной своей глагольной группы,

поэтому VP говорит о любви к чему-либо. NP ice-cream 'мороженое' в составе VP

является дополнением глагола. Словарная статья для слова likes 'любит' говорит о

том, что дополнением к этому глаголу будет нечто, вызывающее любовь; отсюда

следует, что VP сообщает о любви к мороженому. NP слева от спрягаемого глагола —

это
Как мы понимаем язык и используем его в речи 191


подлежащее; словарная статья для likes говорит о том, что подлежащим при этом

глаголе будет то, что может испытывать любовь. Совмещая семантику подлежащего с

семантикой VP, синтаксический анализатор определил, что в предложении

утверждается факт любви вышеупомянутого представителя семейства псовых к

замороженным сладостям.
* * *
Почему же так сложно запрограммировать компьютер на выполнение такой же

операции? Почему и для людей она тоже внезапно становится трудной при чтении

бюрократических документов и других образцов плохого стиля? Пройдя по

предложению в роли синтаксического анализатора, мы столкнулись с двумя

трудностями на пути к получению результата. Первая — это память: нам нужно было

удерживать в памяти неукомплектованные группы, которые требовали для

комплектации определенные виды слов. Вторая — это принятие решения: когда

синтаксическая группа находилась с правой стороны двух различных правил, нам

нужно было принять решение, какое из них использовать, чтобы вырастить следующую

ветвь дерева. В соответствии с первым правилом искусственного интеллекта о

легкости сложных проблем и сложности легких выходит, что часть, относящаяся к

памяти, легка для компьютеров и тяжела для людей, а часть, относящаяся к

принятию решений, легка для людей (по крайней мере, если предложение было

правильно построено) и тяжела для компьютеров.


Синтаксический анализатор предложения требует наличия многих видов памяти, но

та, необходимость в которой очевиднее всего, — это память на неукомплектованные

конструкции, запоминание того, что подвергается синтаксическому разбору.

Компьютеры должны отвести для этой цели набор ячеек в своей памяти, так

называемый «стеллаж»; ведь именно это и позволяет синтаксическому анализатору

использовать грамматику структуры непосредственно составляющих, а не быть

простым генератором цепочек слов. Люди также должны выделять некоторый объем

своей оперативной памяти под неукомплектованные синтаксические группы. Но

оперативная память — это и есть основное «узкое место» в процессе переработки

человеком информации. Только несколько единиц — как правило — семь, плюс-минус

две — могут одновременно удерживаться в сознании; и к тому же они немедленно

начинают «растворяться», или их начинают вытеснять другие. На примере следующих

предложений, вы можете увидеть, к чему приводит слишком долгое удерживание в

памяти неукомплектованной группы:


Не gave the girl that he met in New York while visiting his parents for ten days

around Christmas and New Year's the candy.


'Он подарил девушке, с которой он встретился в Нью-Йорке, гостя у своих

родителей десять дней на рождественские и новогодние праздники, конфеты'.


192
Глава 7. Говорящие головы
Не sent the poisoned candy that he had received in the mail from one of his

business rivals connected with the Mafia to the police.


Юн отправил отравленную конфету, полученную по почте от одного из своих

связанных с мафией конкурентов, полиции'.


She saw the matter that had caused her so much anxiety in former years when she

was employed as an efficiency expert by the company through.


Юна подвергла вопрос, причинивший ей столько беспокойства в прошлые годы, когда

она была экспертом по оценке эффективности на своей фирме, анализу'.


That many teachers are being laid off in a shortsighted attempt to balance this

year's budget at the same time that the governor's cronies and bureaucratic

hacks are lining their pockets is appalling.
'To, что многих учителей увольняют из-за недальновидных попыток сбалансировать

бюджет текущего года, в то время, как дружки губернатора и бюрократы набивают

карман, возмутительно*.
Эти заставляющие память растягиваться предложения называются в пособиях по

стилистике «предложениями с отягощенным началом». В языках, где о значении слов

сообщают падежи, тяжелая составляющая может быть просто перенесена в конец

предложения, чтобы слушатель мог переварить начало, не имея необходимости

удерживать тяжелую составляющую в памяти. Английский язык деспотичен по

отношению к порядку слов, но даже он предоставляет альтернативные варианты, в

которых порядок составляющих будет изменен. Если внимательно подойти к

составлению текста, то эти альтернативы можно использовать, чтобы отодвинуть

самую тяжелую составляющую в конец, облегчая задачу для слушателя. Обратите

внимание, насколько легче воспринимать эти предложения:


Не gave the candy to the girl that he met in New York while visiting his parents

for ten days around Christmas and New Year's.


Юн подарил конфеты девушке, с которой он встретился в Нью-Йорке, гостя у своих

родителей десять дней на рождественские и новогодние праздники'.


Не sent to the police the poisoned candy that he had received in the mail from

one of his business rivals connected with the Mafia.


Юн отправил полиции отравленную конфету, полученную по почте от одного из своих

конкурентов, связанных с мафией'.


She saw the matter through that had caused her so much anxiety in former years

when she was employed as an efficiency expert by the company.


Юна подвергла анализу вопрос, причинивший ей столько беспокойства в прошлые

годы, когда она была экспертом по оценке эффективности на своей фирме'.


It is appalling that teachers are being laid off in a shortsighted attempt to

balance this year's budget at the same time that the governor's cronies and

bureaucratic hacks are lining their pockets. *
Как мы понимаем язык и используем его в речи 193
'Возмутительно, что многих учителей увольняют из-за недальновидных попыток

сбалансировать бюджет текущего года, в то время, как дружки губернатора и

бюрократы набивают карман'.
Многие лингвисты полагают, что языки допускают перестановку составляющих или

предоставляют выбор из более или менее синонимичных высказываний для того, чтобы

облегчить нагрузку на память слушателя.
До тех пор, пока слова в предложении могут быть немедленно объединены в

укомплектованные группы, предложение может быть довольно сложным, но тем не

менее понятным:
Remarcable is the rapidity of the motion of the wing of the hummingbird.

'Замечательна скорость движения крыла колибри'.


This is the cow with the crumpled horn that tossed the dog that worried the cat

that killed the rat that ate the malt that lay in the house that Jack built.


'Вот корова со сломанным рогом, что бодала собаку, что гонялась за кошкой, что

убила ту крысу, что съела весь солод, лежавший в подвале в доме, который

построил Джек'.
Then came the Holy One, blessed be He, and destroyed the angel of death that

slew the butcher that killed the ox that drank the water that quenched the fire

that burned the stick that beat the dog that bit the cat my father bought for

two zuzim.


'Затем явился Святой, будь Он благословен, и уничтожил ангела смерти,

поразившего мясника, что зарезал быка, выпившего воду, что погасила огонь,

спаливший палку, которой побили собаку, укусившую кошку, что мой отец купил за

два зузима'.


Такие предложения называются «с ветвлением в правую сторону» из-за строения

своего синтаксического дерева. Обратите внимание на то, что при продвижении

слева направо только одна ветвь в один момент времени остается

неукомплектованной:


Remarkable is the rapidity of the motion of the wing of the hummingbird


194

Каталог: data -> 2011
2011 -> Программа дисциплины «История и теория литературы»
2011 -> Г. В. Гриненко история философии
2011 -> Дэвид Ванн, Томас X. Нэйлор, Джон Де Грааф Потреблятство. Болезнь, угрожающая миру
2011 -> Жильсон Этьен Философия в средние века
2011 -> Выражаем глубокую признательность Международному фонду «Культурная инициатива» и лично Джорджу Соросу за финансовую поддержку серии Лики культуры
2011 -> Фуко М. Надзирать и наказывать. Рождение тюрьмы
2011 -> Сочинения в двух томах
1   ...   17   18   19   20   21   22   23   24   ...   51