О смысле информации

Источник: журнал «Знание – сила», №6, 1970 г. Автор: Ю. Шрейдер, канд. физ-мат. наук. Полное название статьи: «О смысле информации, или серьёзно о шутках».


Юлий Анатольевич Шрейдер уже знаком нашим читателям (см. статью «Мы только знакомы...» («Знание – сила», №12 за 1969 год) [в той подборке номеров, которую скачал я, этого номера не было, так что о чём там идёт речь – не знаю. – прим. D.], но эта его статья о другом: он ввёл в научный обиход новый термин «тезаурус» для того, чтобы оценивать смысловую – семантическую – сторону информации. Это новое направление в науке об информации после почти двадцатилетнего единовластия статистической теории.

 

Представим себе, что к нам явился посланец из ХХХХ века и подарил техническое описание машины времени. После первых восторгов неизбежно наступит разочарование: мы не в состоянии понять ни принципов работы этого устройства, ни технологии его изготовления. В течение следующих двадцати столетий это описание хранится в архивах Академии наук, пока, наконец, учёные ХХХХ века не разберутся в его научных и технических основах. На изготовленной ими машине времени эти учёные отправляются в наш родной XX век и... сдают техническое описание машины в архив АН СССР.

Этот вариант сюжета на тему путешествий во времени, кажется, ещё не был реализован фантастами. Но нам он интересен другим – пример этот хорошо иллюстрирует, что такое семантические, то есть смысловые, свойства информации.

Для того чтобы получить хоть какую-нибудь информацию, нужно уже заранее обладать некоторой информацией. Мы ровным счётом ничего не поймём даже в самом глубокомысленном высказывании, если не будем знать о некоторых объектах, действующих лицах, классах предметов, свойствах, которые присущи им, и логических связях между ними. Этот запас первоначальной – априорной – информации принято называть «тезаурусом».

Слово «тезаурус» в древнегреческом означало «сокровище». Затем им стали называть одноязычные словари, в которых указаны смысловые связи между словами – например, группы синонимов или почти синонимов (двигатель-мотор), или отношения типа «часть-целое» (колесо-автомобиль), «частное-общее» (стул-мебель), или типа усиления (дождь-ливень) и т. п. Эти словари, первоначально задуманные как разновидность толковых, теперь широко применяются для автоматического поиска информации.

Информацию «вообще», как известно, можно измерять в битах. Но как быть не с информацией вообще, а с её смысловой частью? Центральная идея теории передачи информации может быть сформулирована так: «количество информации, характеризующее данное сообщение, определяется множеством всех возможных сообщений и их вероятностями и не зависит от смыслового содержания сообщения». С этой точки зрения поровну информации в известии о рождении девочки (а не мальчика) и о том, что выпала решка (а не орёл). Но поставьте себя на место отца или матери этого ребёнка, и вы почувствуете, как трудно вам согласиться с законом, открытым Клодом Шенноном. Как же быть? Можно ли как-то измерять смысловую часть информации? В попытках ответить на этот вопрос и родилось общее понятие тезауруса, о котором шла речь выше. Идея заключается в том, что количество семантической информации, заключённой в данном сообщении, можно оценивать как степень изменения тезауруса приёмника этой информации под действием данного сообщения.

Когда исходная информация, заключённая в тезаурусе, мала, то данное сообщение понимается плохо. Развивается тезаурус – растёт и количество воспринимаемой информации. Дойдя до максимума, оно начнёт уменьшаться, поскольку тезаурус будет заранее обладать всё большей и большей долей этой информации. Иными словами, информация постепенно с развитием тезауруса теряет новизну и становится банальной. Зависимость между информацией, которую данный тезаурус получает из данного сообщения, от исходной информации в тезаурусе изображена на графике:

Здесь Iпор.– пороговая информация тезауруса, при которой он вообще способен понимать данное сообщение. iопт.– оптимальная исходная информация тезауруса, при которой данное сообщение доставляет максимум информации, iмакс.– максимальное количество информации, содержащейся в данном сообщении, aiнас.– то количество информации, при котором данное сообщение как бы заранее содержится в тезаурусе (информация насыщения).

Предположим, что сообщением является учебник по теории вероятностей. Не получив некоторого уровня математического образования, человек не извлечёт из него никакой информации, Это значит, что его априорная информация меньше, чем необходимое значение пороговой информации тезауруса. Школьник старших классов сможет уже кое-что понять. Студент, знакомый с основами математического анализа, сможет с пользой для себя изучать учебник – его априорная информация уже близка к оптимальной. Научному работнику понять этот учебник будет ещё легче, но читать ему будет скучнее: его априорная информация выше оптимальной. Наконец, квалифицированный научный работник, чьи сведения превосходят информацию насыщения, просто не станет читать учебник – он для него не несёт новой информации.

По отношению к техническому описанию машины времени все мы сейчас имеем априорную информацию ниже пороговой. Но в ХХХХ столетии априорная информация гениальных физиков того времени приблизится к Iпор., и они смогут понять это описание. Но это значит, что они уже в сущности подготовлены к открытию принципа путешествий во времени.

Если люди в состоянии понимать друг друга, значит, их тезаурусы некоторым образом согласованы. Для этого недостаточно, чтобы они говорили на одном языке. Специалисты, работающие над близкими проблемами, хорошо понимают друг друга, даже если они очень слабо знают язык друг друга. Важна именно общность тезауруса. Именно она и выделяет людские коллективы – общность знания фактов, оценок, эмоционального отношения к тем или иным явлениям.

И поэтому хорошим тестом на вхождение в коллектив может служить восприятие юмора. Ведь высказывание будет воспринято как остроумное, если только слушатель (зритель, читатель) обладает нужным для этого тезаурусом. И потому на не слишком серьёзном примере – понимании людьми шуток – хорошо проиллюстрировать идею о важности семантической стороны информации.

– Вчера вы изволили фокусы

делать...

– Я? – воскликнул в изумлении

маг. – Помилосердствуйте! Мне это

даже как-то не к лицу!

М. Булгаков, «Мастер и Маргарита».

Раз нет единого для всех тезауруса, то нет и универсального понимания юмора, а есть лишь понятие о том, что смешно в данной среде. Правда, различные остроты имеют больший или меньший круг ценителей. Если допустить – а это весьма правдоподобно, – что все люди имеют нечто общее в своём сознании и в способе мышления, то должны существовать и шутки, которые способен воспринимать любой человек (в момент, когда он вообще в состоянии воспринимать юмор). В рассказе одного американского фантаста земной звездолёт находит контакт с чужим только после того, как выясняется, что члены экипажей способны смеяться над одними и теми же анекдотами. Эта всечеловеческая общность никак не противоречит тому, что общество расслаивается на сложную структуру коллективов, каждому из которых присуще и своё собственное понимание смешного.

Только злокачественные коллективы (бандитская шайка, наёмные войска и т. п.) герметически отделяют себя от других. Одни из признаков такой злокачественности – отказ воспринимать инородный юмор, уверенность в том, что свои, локальные шутки лучше любых других. Может быть, этот признак можно использовать для ранней диагностики злокачественных образований в обществе?

Но эту идею мы подарим социальным психологам, а сами рассмотрим несколько типичных ситуаций, когда восприятие некоторого текста как остроумного определяется общностью коллективного тезауруса. Чтобы увидеть эту общность, лучше всего посмотреть на неё извне, глазами стороннего наблюдателя, – как в шарообразность Земли лучше всего верится, когда посмотришь на снимки, сделанные со спутников.

В обществе друзей, среди коллег мы часто смеёмся весьма непритязательным шуткам. Если же попытаться пересказать их «чужим», получится совсем не смешно. Оно и понято: мы воспринимали эти фразы как остроумные из-за той системы ассоциаций, того настроя, которые создались в нашем узком кружке.

Вот два примера. Реплика «раз сказано в рифму, значит истинно» вряд ли рассмешит широкий круг людей. Это типичный пример чисто ситуационного – не воспроизводимого в передаче юмора. Нелепая фраза «вот коалиция, она уж развалилась» вызвала как-то искренний смех в туристской группе.

Есть целый класс шуток, которые хороши только в кругу лиц определённой профессии, потому что заключённое в них остроумие связано с профессиональными знаниями. Много острот такого типа собрано в сборниках «Физики шутят», «Физики продолжают шутить» и «Физики ещё будут шутить».

Выражение «все константы равны единице – кроме нуля» для физиков как раз бессмысленно: в их науке константы бывают какие угодно в любых диапазонах. Наоборот, в физике численное значение константы взаимодействия ведёт к качественному различию, скажем, электромагнитных и сильных ядерных сил. Но для математиков это выражение (автор его – И. М. Гельфанд) и остроумно, и полно глубокого смысла.

Люди, говорящие на некотором языке также образуют коллектив: они совместно владеют общеязыковым тезаурусом и потому готовы оценить остроты, основанные на различном толковании слов или на нюансах перевода.

Непереводимый каламбур связан с фамилией императора Наполеона (Buonaparte). На вопрос, правда ли, что все корсиканцы бандиты, следовал ответ «Non tutti, ma buonaparte» (не все, но добрая часть). Любопытно, что каламбуры после перевода воспринимаются довольно часто как остроты, в то время как профессиональные остроты даже после объяснения обычно не очень смешны. Дело, по-видимому, в том, что мы легко можем усвоить фрагментарное представление о чужом языке, но очень трудно хорошо понимать фрагмент науки, не имея в ней твёрдых основ.

Язык пантомимы ломает обычные языковые барьеры. Но и здесь для полного восприятия мысли мима необходима предварительная подготовка. Нас обычно восхищает профессиональное умение – будь это мастерство акробата, музыканта, ремесленника, учёного. Но вот Леонид Енгибаров на арене цирка непринуждённо встаёт на одной руке и... дальше недоуменно потирает ногу об ногу. Он «не знает», что делать дальше, куда приложить это умение. Он смеётся над бессмысленным мастерством, лишённым человеческой задачи, внутреннего оправдания, – над суетой человеческих стремлений. И, поскольку каждый из нас хоть единожды задумывался об этом, «номер» Евгибарова воспринимается как смешная и грустная ирония.

Очень характерный тип коллективов определяется культурной общностью. В таком кругу имеют хождение остроты, основанные на использовании хорошо известных (в данном кругу!) литературных ситуаций или хрестоматийных цитат.

Очень смешны удачные пародии на известного поэта – например, пародия М. Архангельского на светловскую «Гренаду». Но до чего же скучны пародии на никому не знакомых поэтов, несмотря на то, что пародируемая цитата старательно вынесена в эпиграф! И здесь успех остроумия связан с опорой на хорошо известные сведения.

Некоторые коллективы характеризуются общностью переживаемых событий. Восстановив эти события (реконструировав тезаурус), мы можем понять и остроумие, первоначально заложенное о донесённых до нас сквозь тьму времён текстах. Есть восточная притча: придворные мудрецы спросили эмира, какое ему следует присвоить прозвище для истории. Он ответил, не долго думая: «Пусть я буду Беслан Справедливый». После этого мудрецы пошли с тем же вопросом к первому визирю. Тот осведомился, что ответил эмир. Узнав его прозвище, он сказал мудрецам: «Ну, тогда я должен называться Юсуф Кудрявый». Рассказ этот абсолютно не смешон. Но если предположить, что в том восточном государстве все знали, что визирь лыс как колено, первоначальным юмор рассказа сразу восстанавливается.

При нынешней популярности старинной иконописи многие, вероятно, знают надпись на кресте «Иисус Назаретянин – царь Иудейский» [IESVS NAZARENVS REX INDAEORVM, аббревиатуру INRI используют в алхимическом заклинании: Igne Natura Renovatur Integra, что можно перевести как: природа полностью обновляется огнём. – прим. D.]. Но, может быть, не всем приходило в голову, что этот, воспринимаемый сейчас как серьёзный, текст первоначально был остротой. Издевательской, палаческой, но остротой. Назвать 1937 лет назад нищего бродягу царём Иудеи – наследником трона Давида, было в глазах палачей высшим издевательством. Впрочем, эта схема дешёвого остроумия не умерла и сейчас. Порой чемпиона класса по шахматам дразнят гроссмейстером, а отличника – академиком. Иногда такое остроумие ценят и некоторые взрослые дяди, улюлюкающие неугодному поэту: тоже мне, Пушкин!

«Остроумием называем мы… способность

сближать понятия и выводить

из них новые и правильные заключения».

А. С. Пушкин

Итак, – чтобы не забыть – ещё раз наша исходная точка зрения: семантическую информацию надо измерять; мера её – изменение тезауруса приёмника информации под влиянием данного сообщения; объект для экспериментальной проверки этого предложения – восприятие юмора. Теперь продолжим.

Верное и логически непротиворечивое в рамках некоторого тезауруса высказывание никогда не бывает остроумным. Разумеется, неверна шутка И. М. Гельфанда, будто все постоянные величины равны 0 или 1: число «пи» – очевидное тому опровержение.

Хорошие остроты утверждают нечто противоречащее привычной логике. Тезаурус, которому адресована острота, должен быть достаточно богат, чтобы обнаружить запрятанное противоречие. Но ведь не любая нелепица остроумна? Важный признак остроумного высказывания в том, что оно почти верно. Более того, преобразовав это высказывание в соответствии с правилами, заложенными в тезаурусе, можно после незначительных уточнении получить верное и содержательное утверждение.

Слабый тезаурус обнаруживает только нелепицу суждений и получает нулевую информацию, но достаточно развитый – быстро совершает нужные преобразования и постигает скрытую информацию.

Хороший пример – это остроумие слов и поведения Йозефа Швейка, героя замечательной книги чешского писателя Ярослава Гашека.

Тупицы вроде подпоручика Дуба или полковника Шредера уверены, что Швейк идиот. Невменяемым идиотом его признала официальная врачебная комиссия. Поведение Швейка состоит в том, что он доводит до полного абсурда нелепые нормы бюрократического, беспощадного в своей бессмысленности государства – Австро-Венгерской империи. В сущности это последний рубеж защиты личности, требующий глубокого и трезвого ума, чтобы на нём держаться.

Прощелыга и пьяница фельдкурат Отто Кац, распутник и служака поручик Лукаш, пороки которых более человечны, чем у остальных героев романа Гашека, интуитивно ощущают значительность Швейка и, в общем, ему симпатизируют, несмотря на то, что сами страдают от его выходок. Но безличный винтик армейской машины Дуб может только люто ненавидеть Швейка и – в своей беспредельной ограниченности – верить в своё умственное превосходство. Ему не дано увидеть в нелепости швейкования недюжинный ум и цельность личности.

Впрочем, швейкование на это и рассчитано.

Однако природа остроумия не ограничивается насмешкой над нелепостями. Противоречия (или, говоря более высоким стилем, антиномии) свойственны нашему миру и являются движущей силой его развития. Способность сближать далёкие и противоречивые понятия и получать отсюда правильные заключения необходимо для постижения мира и его диалектики.

Остроумные решения (но отнюдь не смешные) можно найти в хорошей научной работе, в любой человеческой деятельности. Остроумие может проявиться и в том, как к решению некоторой научной задачи привлекаются методы из очень далёкой области. Может быть, остроумие в том и состоит, что противоречивость и разнородность сталкивающихся понятий вместо того, чтобы препятствовать пониманию истины, внезапно начинает помогать деятельности ума?

Верная теория, банально вытекающая из посылок, и окрошка из лишённых смысла высказываний одинаково неостроумны. Остроумным становится высказывание или действие, приобретающее смысл из-за неожиданного столкновения разнородных или противоречивых понятий. Но ведь понятия далёкие и не связанные в одном тезаурусе, могут оказаться совсем не таковыми в другом. Значит, то, что воспринимается как острота в одном тезаурусе, может быть банальностью в другом.

Как видите, общность восприятия юмора характеризует человеческие коллективы. Ходячая шутка, как популярная мелодия или знакомое стихотворение, может приобрести функции пароля, киплингского клича «мы одной крови, ты и я!». Она становится информацией-меткой о принадлежности к данному коллективу. Хотя как собственно шутка она давно стёрлась и вышла за пределы информации насыщения.

Так как многие процессы передачи и восприятия информации успешно реализуются машинами, то возникает естественное желание выяснить, можно ли научить машину генерировать остроты?

Тонкость состоит в том, что, прививая машине навыки игры в шахматы, можно использовать опыт обучения людей этой же игре. Но никто не знает, как научить человека остроумию или воспитать в нём чувство юмора. Можно только сказать, что остроумие тесно связано с общим уровнем интеллекта.

В русском языке есть точное различие между остряком и остроумным человеком. Остряк – это человек, непрерывно генерирующий остроты. Он бывает ещё более несносным, чем владелец транзисторного приёмника [Объясню шутку для тех, кто родился в XXI веке. Когда после гигантских ламповых приёмников появились миниатюрные транзисторные, молодёжь (и не только) постоянно таскала их с собой, громко слушая различные радиопередачи, чем мешала покою окружающих. – прим. D]. Остряка определяет живость темперамента, неуёмное желание привлекать внимание. Остроумный человек, это тот, кто, по словам А. С. Пушкина, способен сближать понятия и выводить из них новые и правильные заключения. Следственно, остроумие – есть «примета ума глубокого».

В сущности, очень легко создать машину-остряка. Для этого достаточно выбрать одну из простейших формальных схем острот и запрограммировать по ней машину. Например, любому предмету сопоставляется сходное (по созвучию, по функции, по форме) слово из табуированной лексики. За час машинного времени можно будет получить тысячи словесных реализаций такой или более сложной схемы – необходимо только ввести в машину словарь и критерии сходства слов. Машина будет иметь явное преимущество перед человеком, поскольку её несложно выключить.

Гораздо сложней создать остроумную машину. Для этого нужно смоделировать в машине развитый тезаурус и создать алгоритм, отыскивающий нетривиальные цепочки связей между понятиями, включёнными в него. Вдобавок эти цепочки не должны логически вытекать из запаса сведений, хранящихся в тезаурусе, а должны быть «алогичными» сокращениями сложных логических связей.

Дело не в том, может ли машина мыслить, а в том, будут ли её мысли умными!

А в этой статье речь шла только о том, что анализ семантических свойств информации уже на простых рассуждениях об остроумии показывает: количественный подход к информации недостаточен, надо ещё научиться оценивать её качественно.




www.etheroneph.com