Компьютер ищет исторические корни современных языков На Фиджи звезда зовётся kalokalo. На пазехском языке Тайваня это mintol, а для меланау с Борнео — bitén. Но все эти слова восходят к одному корню. К какому же? Алгоритм, разработанный группой учёных из Канады и США, предлагает такой ответ: bituqen. Программа способна реконструировать давно потерянные корни современных языков на основании того, как звукам свойственно меняться со временем. Ранее это приходилось делать вручную. Попытки автоматизировать лингвистические реконструкции уже предпринимались, но Александр Бушар-Коте из Университета Британской Колумбии (Канада) и его коллеги утверждают, что предыдущие алгоритмы были в значительной мере трудноконтролируемыми и нормативными. Новый метод позволяет обрабатывать больше языков, повышая качество реконструкции, и к тому же предполагает гибкий, вероятностный образ звуковых изменений. Программа требует ввода списка слов на нескольких языках с указанием их значений и филогенетического древа, показывающего отношения между языками. Такие деревья лингвисты строят, заимствуя приёмы эволюционной биологии. Алгоритм автоматически определяет однокоренные слова в разных языках, а затем пытается вывести их общего предка на основании давно замеченных правил. Например, если звуки всегда сопряжены, то с течением времени они могут слиться в один без потери смысла. Метод тестировался на 637 австронезийских языках, которые распространены главным образом на островах Юго-Восточной Азии и Тихого океана, в том числе в Малайзии, на Филиппинах и в Индонезии. Реконструкции общего для них праязыка, выполненные вручную, указывали на Тайвань как прародину данного семейства. Г-н Бушар-Коте и его коллеги обнаружили, что автоматическая реконструкция совпадает с ручной в 85% случаев (bituqen не исключение). «Наша система учитывает лишь часть факторов, принимаемых во внимание лингвистами, поэтому большинство несоответствий связано с несовершенством нашего метода, которые будут исправлены», — отмечает ведущий автор. Кроме того, алгоритм использовался для проверки гипотезы об эволюции языков, предложенной в 1955 году. В ней говорится, что звуки, играющие смыслоразличительную роль, более устойчивы к изменениям. Доказать это предположение, сравнив лишь несколько языков, невозможно, поэтому «гипотеза функциональной нагрузки» воспринималась с некоторым скептицизмом, но сравнение 637 языков показало, что она верна. Результаты исследования опубликованы в журнале Proceedings of the National Academy of Sciences. Подготовлено по материалам Nature News.
Automated reconstruction of ancient languages using probabilistic models of sound changehttp://www.pnas.org/content/early/2013/02/05/1204678110