Статистическая лингвистика

Большая Советская Энциклопедия. Статьи для написания рефератов, курсовых работ, научные статьи, биографии, очерки, аннотации, описания.


А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я 1 2 3 4 8 A L M P S T X
СI СА СБ СВ СГ СД СЕ СЁ СЖ СИ СК СЛ СМ СН СО СП СР СС СТ СУ СФ СХ СЦ СЧ СШ СЪ СЫ СЬ СЭ СЮ СЯ
СТА
СТВ
СТЕ
СТЁ
СТИ
СТЛ
СТО
СТР
СТУ
СТШ
СТЫ
СТЬ
СТЭ
СТЮ
СТЯ

Статистическая лингвистика, дисциплина, изучающая количественные закономерности естественного языка, проявляющиеся в текстах. В основе Статистическая лингвистика лежит предположение, что некоторые численные характеристики и функциональные зависимости между ними, полученные для ограниченной совокупности текстов, характеризуют язык в целом или его функциональные стили (публицистический, научный, художественный и т.п.). Практически важной и наиболее изученной числовой характеристикой является относительная частота употребления различных лингвистических единиц (букв, фонем, слогов, слов, синтаксических конструкций), их классов (например, гласных, согласных, частей речи) и сочетаний (например, последовательностей из n букв). Данные о частоте слов (иногда словосочетаний) отражаются в частотных словарях. Важную роль в Статистическая лингвистика играет функциональная зависимость, приближённо описывающая связь между частотой слова и его номером (рангом) в последовательности по убыванию частот — Ципфа — Мандельброта закон. Статистическая лингвистика изучает также зависимости между частотой и длиной слова (в числе слогов), числом его значений и возрастом. Накопленные данные используются для выявления особенностей стиля отдельных авторов, атрибуции текстов, дешифровки исторических письменностей, для решения задач стенографии, теории связи, а также информатики. Статистическая лингвистика при получении численных характеристик использует методы математической статистики и некоторые методы теории информации (для определения энтропии и избыточности языка, см. Информации теория), а для установления связи между наблюдаемыми характеристиками и выбора наиболее существенных из них — метод математических моделей, базирующихся на понятиях теории вероятностей (см. Вероятностей теория) и математической лингвистики. Возможно более широкое понимание Статистическая лингвистика как использования методов статистики для проверки лингвистических гипотез, которые могут носить и качественный характер.

 

  Лит.: Головин Б. Н., Язык и статистика, М., 1971; Фрумкина Р. М., Статистические методы и стратегия лингвистического исследования, «Изв. АН СССР. Серия литературы и языка». 1975, т. 34, №2; Штейнфельдт Э. А., Частотный словарь современного русского языка, Таллин, 1963; Herdan G., The advanced theory of language as choice and chance, B.,1966; Mulier Ch., Initiation a la statistique linguistique, P., 1968.

  М. В. Арапов.

 

Так же Вы можете узнать о...


Метро, то же, что метрополитен.
Наленч Мачей Наленч (Nałęz) Мачей (р.
Одинцов Виктор Петрович [11(23).10.1876, Уфа, — 21.
Педагогические курсы, одна из форм повышения квалификации и подготовки учителей общеобразовательной школы и преподавателей специальных учебных заведений.
Понтий Пилат (Pontius Pilatus), римский прокуратор Иудеи в 26—36.
Ракетно-ядерное оружие, оружие, в котором средством поражения является ядерный заряд, а средством доставки к цели ракета.
Самнер Уильям Грэм Самнер (Sumner) Уильям Грэм (30.10.1840, Патерсон, штат Нью-Джерси, — 12.
Скотт Сирил Меир Скотт (Scott) Сирил Меир (27.9.1879, Окстон, Чешир, — 31.
Стрипперование слитков (от англ. strip — раздевать), раздевание слитков, операция по отделению стального слитка от изложницы.
Тифлопедагогика (от греч. typhlos — слепой и педагогика), отрасль дефектологии, разрабатывающая проблемы воспитания, образования, обучения и трудовой подготовки лиц с нарушением зрения (слепых от рождения, ослепших, частичновидящих, слабовидящих, слепоглухих).
«Устав об управлении инородцев» 1822, в дореволюционной России законодательный акт, определявший наряду с «Уставом о сибирских киргизах» систему управления нерусскими народами Сибири.
Харьковская область, в составе УССР. Образована 27 февраля 1932.
Чикопи (Chicopee), город в США, штат Массачусетс, на р.
Эликсир, элексир (от араб. аль-иксир — философский камень), 1) крепкий настой или вытяжка из растительных веществ на спирту, эфирных маслах, кислотах, применяемый в медицине, косметике.
Аил ,
Арчинцы, один из малых народов Зап. Дагестана.