Зарегистрироваться

Коллокация

Категории Корпусная лингвистика | Под редакцией сообщества: Филология

Коллокация (collocation) – в корпусной лингвистике под коллокацией понимается последовательность слов или терминов, частотность совместного появления которых в корпусе выше, чем ожидаемая вероятность их совместного появления. Примерами коллокаций являются: средний класс, кристально честный, пластическая операция и т.п.

В отличие от свободного словосочетания (красивый мальчик/хороший мальчик/красивый цветок), коллокация определяет, какие слова могут быть использованы вместе, например, какими предлогами управляет тот, или иной глагол (уйти от кого-то, чего-то, но прийти к кому-то/чему-то), или какие глаголы и существительные обычно используются вместе. Например, можно сказать мощный двигатель и крепкий чай, но нельзя, не меняя значения, заменить эти коллокации на словосочетания крепкий двигатель и мощный чай соответственно.

С другой стороны, важно отличать коллокации от идиом, хотя значение и тех, и других в определённой степени некомпозиционально, то есть значение целого не равно сумме значений частей. Коллокации и идиомы различаются степенью некомпозициональности значения: значение идиом полностью некомпозиционально (часто метафорично) (русск. сыграть в ящик, англ. to kick the bucket, нем. den ffel abgeben), тогда как значения коллокаций по большей части композициональны.

Одна из задач, для решения которой корпус служит необходимым инструментом, это задача исследования сочетаемости слов в реальных текстах, выделение устойчивых связей в тексте, то есть коллокаций.

С помощью компьютерных технологий коллокации могут автоматически извлекаться из корпуса. Для этого используются различные меры ассоциативной связи, которые оценивают, является ли взаимное появление лексических единиц случайным, или оно статистически значимо. Однако часто совместное появление двух слов, не образующих коллокации, расценивается как статистически значимое (например, словосочетание Гарри Поттер в текстах про Гарри Поттера), поэтому мера ассоциативной связи используется просто для ранжирования результатов. Для измерения ассоциативной связи используются такие статистические методы, как взаимная информация, t-критерий Стьюдента, критерий χ2 и другие.

Многие корпусные менеджеры могут представлять пользователю информацию о сочетаемости слова или языкового выражения в виде ранжированного списка, в котором указано ключевое слово и встретившийся в пределах некоторого контекста потенциальный "коллокат". Место такой пары слов в списке говорит о том, в какой степени устойчиво эти слова встречаются в тексте совместно.

Пример генератора коллокаций:

www.collins.co.uk/corpus/

Редактор статьи Архипов Александр Владимирович, кандидат филологических наук, доцент филологического факультета  МГУ.

 

Эта статья еще не написана, но вы можете сделать это.