Что изучает математическая лингвистика

10.04.202212.04.2022 admin 0 Comments

Математическая лингвистика

Математи́ческая лингви́стика (также вычисли́тельная лингви́стика или компью́терная лингви́стика) — направление искусственного интеллекта, которое ставит своей целью использование математических моделей для описания естественных языков.

Компьютерная лингвистика частично пересекается с обработкой естественных языков. Однако в последней акцент делается не на абстрактные модели, а на прикладные методы описания и обработки языка для компьютерных систем.

Содержание

Истоки

Математическая лингвистика является ветвью науки искусственного интеллекта. Всё началось в Соединённых Штатах Америки, в 1950-х годах. С изобретением транзистора и появлением нового поколения компьютеров, а также первых языков программирования, начались эксперименты с машинным переводом, особенно русских научных журналов. В 1960-х годах подобные исследования проводились и в СССР (например, статья о переводе с русского на армянский в сб. «Проблемы кибернетики» за 1964 год). Однако качество машинного перевода до сих пор сильно уступает качеству перевода, произведённого человеком. Были созданы первые системы искусственного интеллекта, такие как SHGSL. Они, правда, устарели, но пользуются популярностью у студентов и научных сотрудников Академий Наук, занимающихся компьютерной лингвистикой.

С 15 по 21 мая 1958 г. в I МГПИИЯ состоялась первая Всесоюзная конференция по машинному переводу. Оргкомитет возглавляли В. Ю. Розенцвейг и ответственный секретарь Оргкомитета Г. В. Чернов. Полностью программа конференции опубликована в сборнике «Машинный перевод и прикладная лингвистика», вып. 1, 1959 г. (он же «Бюллетень Объединения по машинному переводу № 8»). Как вспоминает В. Ю. Розенцвейг, опубликованный сборник тезисов конференции попал в США и произвел там большое впечатление.

В апреле 1959 года в Ленинграде состоялось I Всесоюзное совещание по математической лингвистике, созванное Ленинградским университетом и комитетом прикладной лингвистики. Главным организатором Совещания был Н. Д. Андреев. В Совещании приняли участие ряд видных математиков, в частности, С. Л. Соболев, Л. В. Канторович (впоследствии — Нобелевский лауреат) и А. А. Марков (последние двое выступали в прениях). В. Ю. Розенцвейг выступил в день открытия Совещания с программным докладом «Общая лингвистическая теория перевода и математическая лингвистика».

Источник

Математическая лингвистика

математическая дисциплина, предметом которой является разработка формального аппарата для описания строения естественных и некоторых искусственных языков. Возникла в 50‑х гг. 20 в.; одним из главных стимулов появления М. л. послужила назревшая в языкознании потребность уточнения его основных понятий. Методы М. л. имеют много общего с методами математической логики — математической дисциплины, занимающейся изучением строения математических рассуждений, — и в особенности таких её разделов, как теория алгоритмов и теория автоматов. Широко используются в М. л. также алгебраические методы. М. л. развивается в тесном взаимодействии с языкознанием. Иногда термин «М. л.» используется также для обозначения любых лингвистических исследований, в которых применяется какой-либо математический аппарат.

Математическое описание языка основано на восходящем к Ф. де Соссюру представлении о языке как механизме, функционирование которого проявляется в речевой деятельности его носителей; её результатом являются «правильные тексты» — последовательности речевых единиц, подчиняющиеся определённым закономерностям, многие из которых допускают математическое описание. Разработка и изучение способов математического описания правильных текстов (в первую очередь предложений) составляет содержание одного из разделов М. л. — теории способов описания синтаксической структуры. Для описания строения предложения — точнее, его синтаксической структуры — можно либо выделить в нём составляющие — группы слов, функционирующие как цельные синтаксические единицы, либо указать для каждого слова те слова, которые ему непосредственно подчинены (если такие есть). Так, в предложении «Ямщик сидит на облучке» (А. С. Пушкин) при описании по 1‑му способу составляющими будут все предложение П, каждое его отдельное слово и группы слов A = сидит на облучке и B = на облучке (см. рис. 1; стрелки означают «непосредственное вложение»); описание по 2‑му способу даёт схему, показанную на рис. 2. Возникающие при этом математические объекты называются системой составляющих (1‑й способ) и деревом синтаксического подчинения (2‑й способ).

Точнее, система составляющих — это множество отрезков предложения, содержащее в качестве элементов всё предложение и все вхождения слов в это предложение («однословные отрезки») и обладающее тем свойством, что каждые два входящих в него отрезка либо не пересекаются, либо один из них содержится в другом; дерево синтаксического подчинения, или просто дерево подчинения, есть дерево, множеством узлов которого служит множество вхождений слов в предложение. Деревом в математике называется множество, между элементами которого — их называют узлами — установлено бинарное отношение — его называют отношением подчинения и графически изображают стрелками, идущими от подчиняющих узлов к подчиненным, — такое, что: 1) среди узлов имеется точно один — его называют корнем, — не подчинённый никакому узлу; 2) каждый из остальных узлов подчинен точно одному узлу; 3) невозможно, отправившись из какого-либо узла вдоль стрелок, вернуться в тот же узел. Узлы дерева подчинения — это вхождения слов в предложения. При графическом изображении система составляющих (как на рис. 1) также приобретает вид дерева (дерева составляющих). Построенное для предложения дерево подчинения или систему составляющих часто называют его синтаксической структурой в виде дерева подчинения (системы составляющих). Системы составляющих используются преимущественно в описаниях языков с жёстким порядком слов, деревья подчинения — в описаниях языков со свободным порядком слов (в частности, русского), формально для каждого (не слишком короткого) предложения можно построить много разных синтаксических структур любого из двух видов, но среди них только одна или несколько являются правильными. Корнем правильного дерева подчинения служит обычно сказуемое. Предложение, имеющее более одной правильной синтаксической структуры (одного вида), называется синтаксически омонимичным; как правило, разные синтаксические структуры отвечают разным смыслам предложения. Например, предложение «Школьники из Ржева поехали в Торжок» допускает два правильных дерева подчинения (рис. 3, а, б); первое из них отвечает смыслу «Ржевские школьники поехали (не обязательно из Ржева) в Торжок», второе — «Школьники (не обязательно ржевские) поехали из Ржева в Торжок».

В русском и ряде других языков деревья подчинения предложений «делового стиля» подчиняются, как правило, закону проективности, состоящему в том, что все стрелки можно провести над прямой, на которой записано предложение, таким образом, что никакие две из них не пересекутся и корень не будет лежать ни под какой стрелкой. В языке художественной литературы, особенно в поэзии, отклонения от закона проективности допустимы и чаще всего служат задаче создания определённого художественного эффекта. Так, в предложении «Друзья кровавой старины народной чаяли войны» (Пушкин) непроективность приводит к эмфатическому выделению слова «народной» и одновременно как бы замедляет речь, создавая этим впечатление известной приподнятости, торжественности. Имеются и другие формальные признаки деревьев подчинения, которые могут использоваться для характеризации стиля. Например, максимальное число вложенных друг в друга стрелок служит мерой «синтаксической громоздкости» предложения (см. рис. 4).

Для более адекватного описания строения предложения составляющие обычно помечаются символами грамматических категорий («именная группа», «группа переходного глагола» и т. п.), а стрелки дерева подчинения — символами синтаксических отношений («предикативное», «определительное» и т. п.).

Аппарат деревьев подчинения и систем составляющих используется также для представления глубинно-синтаксической структуры предложения, которая образует промежуточный уровень между семантической и обычной синтаксической структурой (последнюю часто называют поверхностно-синтаксической).

Более совершенное представление синтаксической структуры предложения (требующее, однако, более сложного математического аппарата) дают системы синтаксических групп, в которые входят как словосочетания, так и синтаксические связи, причём не только между словами, но и между словосочетаниями. Системы синтаксических групп позволяют совмещать строгость формального описания строения предложения с гибкостью, присущей традиционным, неформальным описаниям. Деревья подчинения и системы составляющих являются предельными частными случаями систем синтаксических групп.

Другой важный тип формальной грамматики — доминационная грамматика, которая порождает множество цепочек, интерпретируемых обычно как предложения вместе с их синтаксическими структурами в виде деревьев подчинения. Грамматика синтаксических групп порождает множество предложений вместе с их синтаксическими структурами, имеющими вид систем синтаксических групп. Имеются также различные концепции трансформационной грамматики (грамматики деревьев), служащей не для порождения предложений, а для преобразования деревьев, интерпретируемых как деревья подчинения или деревья составляющих. Примером может служить Δ-грамматика — система правил преобразования деревьев, интерпретируемых как «чистые» деревья подчинения предложений, т. е. деревья подчинения без линейного порядка слов.

Особняком стоят грамматики Монтегю, служащие для одновременного описания синтаксических и семантических структур предложения; в них используется сложный математико-логический аппарат (так называемая интенсиональная логика).

Формальные грамматики находят применение для описания не только естественных, но и искусственных языков, в особенности языков программирования.

В М. л. разрабатываются также аналитические модели языка, в которых на основе тех или иных данных о речи, считающихся известными, производятся формальные построения, результатом которых является описание некоторых аспектов строения языка. В этих моделях обычно используется несложный математический аппарат — простые понятия теории множеств и алгебры; поэтому аналитические модели языка иногда называют теоретико-множественными. В аналитических моделях наиболее простого типа исходными данными служат множество правильных предложений и система окрестностей — совокупностей «слов», принадлежащих одной лексеме (например, <дом, до́ма, дому, домом, доме, дома́, домов, домам, домами, домах>). Простейшим производным понятием в таких моделях является замещаемость: слово a замещаемо на слово b, если всякое правильное предложение, содержащее вхождение слова a, остаётся правильным при замене этого вхождения вхождением слова b. Если а замещаемо на b и b на a, говорят, что a и b взаимозамещаемы. (Например, в русском языке слово «синий» замещаемо на слово «голубой»; слова «синего» и «голубого» взаимозамещаемы.) Класс слов, взаимозамещаемых между собой, называется семейством. Исходя из окрестностей и семейств, можно получить ряд других лингвистически значимых классификаций слов, одна из которых приблизительно соответствует традиционной системе частей речи. В другом типе аналитических моделей вместо множества правильных предложений используется отношение потенциального подчинения между словами, означающее способность одного из них подчинять себе другое в правильных предложениях. В таких моделях можно получить, в частности, формальные определения ряда традиционных грамматических категорий — например, формальное определение падежа существительного, представляющее собой процедуру, которая позволяет восстановить падежную систему языка, зная только отношение потенциального подчинения, систему окрестностей и множество слов, являющихся формами существительных.

В аналитических моделях языка используются простые понятия теории множеств и алгебры. К аналитическим моделям языка близки дешифровочные модели — процедуры, позволяющие по достаточно большому корпусу текстов на неизвестном языке без каких-либо предварительных сведений о нём получить ряд данных о его структуре.

По своему назначению М. л. является прежде всего инструментом теоретического языковедения. В то же время ее методы находят широкое применение в прикладных лингвистических исследованиях — автоматической обработке текста, автоматическом переводе и разработках, связанных с так называемым общением между человеком и ЭВМ.

Источник

Математическая лингвистика

Полезное

Смотреть что такое «Математическая лингвистика» в других словарях:

МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА — математическая дисциплина, предметом которой является разработка формального аппарата для описания строения естественных и некоторых искусственных языков … Большой Энциклопедический словарь

МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА — МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА. Смежная для методики обучения языкам наука; раздел лингвистики, использующий математические методы исследования языка и речи. Данные М. л. применяются для проведения экспериментов в методике … Новый словарь методических терминов и понятий (теория и практика обучения языкам)

Математическая лингвистика — (также вычислительная лингвистика или компьютерная лингвистика) направление искусственного интеллекта, которое ставит своей целью использование математических моделей для описания естественных языков. Компьютерная лингвистика частично… … Википедия

математическая лингвистика — математическая дисциплина, предметом которой является разработка формального аппарата для описания строения естественных и некоторых искусственных языков. * * * МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА, математическая дисциплина,… … Энциклопедический словарь

МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА — математическая дисциплина, предметом к рой является разработка и изучение понятий, образующих основу формального аппарата для описания строения естественных языков (т. е. метаязыка лингвистики). Возникновение М. л. можно отнести приблизительно к… … Математическая энциклопедия

математическая лингвистика — 1. Изучает особенности семиотического и математического моделирования естественного языка (и речи) с целью перевода информации, содержащейся в неформализованном виде в тексте, на формализованный искусственный язык (например, на некоторый… … Толковый переводоведческий словарь

Математическая лингвистика — Математическая лингвистика математическая дисциплина, предметом которой является разработка формального аппарата для описания строения естественных и некоторых искусственных языков. Возникла в 50‑х гг. 20 в.; одним из главных стимулов появления… … Лингвистический энциклопедический словарь

МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА — матем. дисциплина, предметом к рой является разработка формального аппарата для описания строения естественных и нек рых искусств, языков … Естествознание. Энциклопедический словарь

математическая лингвистика — Отрасль языкознания, занимающаяся изучением возможностей применения математических методов к изучений и описанию языка … Словарь лингвистических терминов

математическая лингвистика — Направление, возникшее в XX в. на стыке языкознания, математики и математической логики и занимающееся разработкой формального аппарата описания языка, применяемого в частности, в диалоге человек – ЭВМ … Словарь лингвистических терминов Т.В. Жеребило

Источник

МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА

Таким образом, можно выделить три аспекта формального описания языка: описание строения языковых объектов различных уровней, описание нек-рых специальных отношений и классификаций на множествах этих объектов и описание преобразований одних объектов в другие, а также строения множеств «правильных» объектов. Этим аспектам отвечают три основных раздела М. л.: 1) разработка и изучение способов описания строения отрезков речи; 2) изучение лингвистически значимых отношений и классификаций на множествах языковых объектов (построенные для этой цели формальные системы обычно называют аналитическими моделями языка);3) теория формальных грамматик.

Для описания строения отрезков речи используются синтаксич. структуры, представляющие собой графы или биграфы специального вида, обычно с помеченными вершинами и/или дугами. Лучше всего разработана теория описания «поверхностных» уровней (т. е. наиболее далеких от «смыслового»); на этих уровнях структуры обычно являются деревьями. Интенсивно разрабатываются способы описания более «глубинных» уровней. Для этого, в частности, предложен аппарат т. н. лексических функций, играющих при описании смысловой сочетаемости слов роль, сходную с той, к-рую традиционные категории рода, падежа, числа и т. п. играют при описании синтаксич. сочетаемости. Средств строгого описания «смыслового» уровня пока нет, но многим исследователям представляется вероятным, что на таком пути «последовательного приближения» можно надеяться выработать подход к формальному описанию смысла. Это не исключает и иных подходов; в частности, много исследований посвящено способам выражения в естественных языках предикатов, пропозициональных связок, кванторов, «переводу» с формально-логич. языков на естественные и обратно. Сюда же примыкают работы по конструированию так наз. семантических языков, в к-рых смыслы сопоставляются текстам простыми и строго формальными способами.

Аналитич. модели языка важны, в частности, ввиду того, что они позволяют уточнить логич. природу многих понятий и категорий традиционного языковедения. Эти модели не всегда носят характер эффективных процедур, поскольку в них могут входить такие понятия, как (бесконечное) множество грамматически правильных предложений нек-рого языка, считающееся заданным. Однако в ряде моделей все исходные данные представляют собой конечные множества и финитные отношения; в этих случаях входящие в модель процедуры эффективны. К теории аналитич. моделей языка примыкает теория лингвистической д е ш и ф р о в к и: ее предметом является построение процедур, применяемых, подобно аналитич. моделям, к «неупорядоченным» эмпирич. данным о языке, но всегда эффективных и позволяющих получать не только абстрактные определения, но и конкретные сведения о строении конкретных языков (напр., алгоритмы, осуществляющие автоматич. разбиение множества фонем языка на классы гласных и согласных без использования каких-либо сведений о языке, кроме нек-рого достаточно длинного текста).

Теория формальных грамматик наряду с «традиционными» для нее лингвистич. приложениями нашла применение в теории программирования для описания языков программирования и трансляторов. Особенно широко применяются для этих целей бесконтекстные грамматики, но используются и грамматики более общего вида.

Лит.:[1] Xомский Н., в кн.: Новое в лингвистике, в. 2, М., 1962, с. 412-527; [2] Гладкий А. В., Мельчук И. А., Элементы математической лингвистики, М., 1969.

Источник

Лингвистический энциклопедический словарь

Математи́ческая лингви́стика —

Источник

Что и для чего?

Что изучает математическая лингвистика

Математическая лингвистика

Содержание

Истоки

Математическая лингвистика

Математическая лингвистика

Полезное

Смотреть что такое «Математическая лингвистика» в других словарях:

МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА

Лингвистический энциклопедический словарь

Математи́ческая лингви́стика —

Добавить комментарий Отменить ответ

Математическая лингвистика

Содержание

Истоки

Математическая лингвистика

Математическая лингвистика

Полезное

Смотреть что такое «Математическая лингвистика» в других словарях:

МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА

Лингвистический энциклопедический словарь

Математи́ческая лингви́стика —

Вам также понравится

Что значит слово рассказывать

Что значит татуировка кленовый лист

Что открыл аристотель в географии 5 класс кратко

Добавить комментарий Отменить ответ