Размышления
August 25, 2022

Минималистическіе искусственные языки

Забавный фактъ¹ даетъ поводъ для размышленія: можно ли создать искусственный языкъ, который бы былъ максимально простымъ во всѣхъ своихъ аспектахъ — фонетика, словарь, грамматика, синтаксисъ и т. д.? Можно ли еще упростить языкъ по одному изъ выбранныхъ параметровъ, жертвуя остальными лишь въ минимально возможной степени? Скажемъ, можно ли будетъ вывести закономѣрность, когда X дополнительныхъ звуковъ сокращаетъ словарь на языка на Y %? Теоретически отвѣтъ, очевидно, утвердительный, если подъ простотой понимать минимальное число элементовъ (звуковъ, корней, правилъ). Однако если въ понятіе простоты добавить скорость усвоенія языка человѣкомъ, удобство использованія, безошибочность передачи информаціи по основнымъ каналамъ (рѣчь и письмо), то критеріи становятся менѣе очевидными.

Въ приведенномъ примѣрѣ изъ языка токипона,² явно намного болѣе избыточномъ, чѣмъ естественные языки, «mute mute mute mute luka luka luka tu wan» (что означаетъ «20+20+20+20+5+5+5+2+1»), съ помощью введенія лишь одного дополнительнаго правила можно сократить шестнадцать слоговъ до десяти: «tu tu mute tu wan luka tu wan» (что означаетъ «(2+2)×20+(2+1)×5+2+1». Но сдѣлало бы это языкъ въ цѣломъ проще, вѣдь само новое правило «если меньшее числительное предшествуетъ большему, то меньшее умножается на большее» должно быть изложено на какомъ-то формальномъ языкѣ, въ которомъ помимо операціи «сложить» появится новая операція «умножить», а также категоріи «больше» и «меньше»?³

Похоже, что естественные языки даютъ опредѣленный оріентиръ, гдѣ можетъ проходить реально достижимая граница простоты. Въ какихъ-то аспектахъ такіе языки по необходимости избыточны, другіе же измѣняются вслѣдствіе эволюціоннаго давленія. Напримѣръ, русское «девяносто восемь» — это шесть слоговъ, французское «quatre-vingt-dix-huit» — пять, нѣмецкое «achtundneunzig» — четыре, англійское «ninety eight» — три. Въ другихъ языкахъ навѣрняка можетъ быть больше, но врядъ ли гдѣ-то повстрѣчается меньше трехъ слоговъ. Сокращеніе до двухъ слоговъ, скажемъ при переходѣ къ позиціонной системѣ («девять-восемь») чревато невосполнимыми потерями информаціи при передачѣ,⁴ а этого себѣ естественные языки уже не могутъ позволить. Въ двоичной системѣ потребовалось бы минимумъ семь словъ, которые могли быть односложными. Въ сторичной бы было достаточно одного, не тогда бы сами слова стали длиннѣе. (Односложные бы потребовались для обозначенія другихъ, болѣе часто встрѣчающихся въ рѣчи понятій, гдѣ могли бы принести больше пользы). Интуитивно кажется, что англійскій языкъ используетъ больше односложныхъ и многозначныхъ словъ, чѣмъ, скажемъ, русскій, но «цѣна», которую за это платитъ — сложность фонетики, синтаксиса и довольно непростыя правила разрѣшенія многозначности (disambiguation) въ нѣкоторыхъ случаяхъ.

Изъ искусственныхъ языковъ, кажется, что эсперанто — достаточно хорошее приближеніе къ идеалу простого во всѣхъ отношеніяхъ языка, хоть онъ и былъ созданъ любителемъ, опиравшемся на свою языковую интуицію. «Девяносто восемь» на этомъ языкѣ будетъ «naŭdek ok» — тѣ же три слога, какъ въ англійскомъ, при томъ, что фонетика эсперанто намного проще англійской. Видно, что простота грамматики, связанной съ глаголомъ, какъ въ славянскихъ языкахъ, въ сочетаніи съ характернымъ для романскихъ языковъ отсутствіемъ склоненія у именъ (за исключеніемъ винительнаго падежа) не лишили эсперанто универсальныхъ выразительныхъ качествъ. Съ другой стороны, словообразованіе при помощи суффиксовъ въ этомъ языкѣ иногда можетъ быть показаться неуклюжимъ. Скажемъ, въ простѣйшихъ случаяхъ образованіе «bovino» (корова) отъ «bovo» можетъ быть оправданнымъ, тогда какъ трехсложное слово «patrino» (мать), образованное отъ «patro» (отецъ), могло бы имѣть свой собственный корень. Вопросъ въ томъ, можно ли сдѣлать простой искусственный языкъ еще проще, чѣмъ это получилось у Зименгофа.

Мнѣ неизвѣстно, ведетъ ли кто-то изслѣдованія въ этомъ направленіи, но сама идея созданія искусственнаго интеллекта, который бы былъ способенъ генерировать искусственные языки и изслѣдовать ихъ свойства, кажется весьма привлекательной. Конечно, можно было бы обратиться къ какому-то то изъ существующихъ апріорныхъ логическихъ языковъ вродѣ логлана или ложбана, но при переводѣ на нихъ текстовъ съ естественныхъ языковъ возможна потеря значимой информаціи. Скажемъ, союзы «и», «или», «если» и отрицательныя частицы имѣютъ въ языкѣ собственное значеніе, которое не всегда удается свести къ соотвѣтствующимъ имъ логическимъ операторамъ. Практическое примѣненіе сгенерированныхъ искусственнымъ интеллектомъ языковъ съ эталонной сложностью можно было бы найти, напримѣръ, для измѣренія количества информаціи въ естественныхъ информаціонныхъ системахъ, гдѣ шумъ и избыточность могутъ быть слѣдствіемъ использованія естественнаго языка.⁵


¹ О дзенъ-числительномъ.

² Минималистическій искусственный языкъ, созданный, по словамъ его автора Сони Лангъ, въ соотвѣтствіи съ принципами дзена. Википедія: Токипона.

³ Здѣсь возникаетъ еще одинъ интересный вопросъ: возможно ли описаніе языка и всѣхъ его правилъ на немъ самомъ? Похоже, что въ принципѣ это возможно, но такое описаніе само должно основываться на нѣкоторомъ нередуцируемомъ наборѣ правилъ, «внеположенномъ» самому языку, причемъ чѣмъ меньше этотъ наборъ, тѣмъ болѣе избыточнымъ получается описаніе. Чтобы описаніе было компактнымъ, нужно воспользоваться болѣе богатымъ, но спеціализированнымъ «внѣшнимъ» языкомъ. Программисты знаютъ, къ примѣру, форму Бэкуса — Наура.

⁴ Напримѣръ, при диктовкѣ длинныхъ чиселъ слушатель можетъ пропустить нѣсколько словъ и тогда онъ легко ошибется на нѣсколько порядковъ. Если же говорящій будетъ произносить избыточныя слова, такіе какъ «тысяча», «милліонъ» и т. п., потенціальная ошибка слушателя будетъ меньше, по крайней мѣрѣ порядокъ онъ опредѣлитъ точнѣе. Исключеніе — диктовка номеровъ телефоновъ и другихъ подобныхъ цифровыхъ идентификаторовъ, длина которыхъ фиксирована и ошибка передачи обнаруживается сразу.

⁵ Напримѣръ, Энтропія и сложность права.

Этотъ текстъ существуетъ также въ новой орѳографіи: Минималистические искусственные языки.