Что такое корпус

Автор работы: Пользователь скрыл имя, 10 Декабря 2011 в 08:57, реферат

Описание

Корпус — это информационно-справочная система, основанная на собрании текстов на некотором языке в электронной форме. Национальный корпус представляет данный язык на определенном этапе (или этапах) его существования и во всём многообразии жанров, стилей, территориальных и социальных вариантов и т. п.

Работа состоит из  1 файл

Что такое Корпус.docx

— 88.36 Кб (Скачать документ)

7. Краткость 

кр — Краткая  форма (прилагательного или причастия): короток, рассмотрен 

Полная форма прилагательного  или причастия не указывается  в явном виде и характеризуется  отсутствием характеристики кр.

8. Репрезентация 

инф — Инфинитив 

прич — Причастие 

деепр — Деепричастие 

Личная форма глагола (четвертое значение категории репрезентации) не указывается в явном виде и  характеризуется отсутствием характеристик  инф, прич и деепр

9. Наклонение 

изъяв — Изъявительное  наклонение 

пов — Повелительное  наклонение 

Сослагательное наклонение в русском языке (поехал бы) выражается только аналитически и характеризует  словосочетания, а не отдельные словоформы.

10. Вид 

несов — Несовершенный  вид 

сов — Совершенный  вид

11. Время 

непрош — Непрошедшее (настоящее-будущее) время: читаю, прочитаю 

прош — Прошедшее  время: читал, прочитал, был 

наст — Настоящее  время: есть, суть 

Настоящее время  приписывается только глаголу быть в личной форме.

12. Лицо 

1-л — Первое  лицо 

2-л — Второе  лицо 

3-л — Третье  лицо 

Характеристики лица приписываются только глаголам. Личным местоименным существительным, для  которых категория лица не является словоизменительной, эти характеристики не приписываются.

13. Залог 

страд — Страдательный  залог: читается, читаемый, читанный, читавшийся 

Действительный залог  не указывается в явном виде и  характеризуется отсутствием пометы страд.

14. Дополнительные  характеристики 

сл — Форма, используемая в словосложении: водо, турецко, физико, дву, гос

Словоформы с характеристикой  сл могут входить в состав парадигм существительных (вода – водо, нефть  – нефте), прилагательных (турецкий – турецко, физический – физико, государственный - гос) или числительных (два – дву). Обычно они выступают  в составе сложных слов: водоснабжение, турецко-русский, физико-технический, господдержка, однако иногда встречаются  и отдельно, в основном в составе  однородных конструкций (водо- и теплоснабжение, турецко- и персидско-русские словари). Необходимо отличать словоформы существительных, прилагательных, числительных, имеющие  характеристику сл, от композитов, т.е. слов, принадлежащих части речи COM: в отличие от первых, парадигмы композитов состоят из единственной словоформы, и их леммы физически совпадают с этой словоформой. Композиты также используются в словосложении (анти, контра, противо, про, квази, вице, теле, авиа, видео и пр.) и также могут выступать как в составе сложных слов (антитеррористический) так и отдельно (авиа- и железнодорожные перевозки).  

смяг — Смягченная сравнительная степень: поумнее, пораньше

Таким формам, наряду с характеристикой смяг, приписана  и характеристика срав.

Синтаксическая структура 

Синтаксическая структура  предложения представляет собой  дерево зависимостей, где каждая дуга (стрелка) идет из главного слова («хозяина») в зависимое слово («слугу») и  помечена именем какого-либо синтаксического  отношения. Каждое слово предложения, кроме одного (называемого вершиной предложения), зависит от какого-то слова по одному из синтаксических отношений. Отношения связывают  только отдельные слова, а не словосочетания.  

В случае так называемых синтаксических групп один из членов группы выступает в качестве представителя  группы во внешних связях (локальной  вершины группы) и подчиняет остальные  члены группы.  

В приводимых ниже примерах локальная вершина группы для  наглядности дается прописными буквами, а сама группа заключена в скобки. Ср. следующие фрагменты деревьев, включающих:

предложную группу: пошел → (В → лес)

элективную группу: пришел → (ОДИН → из → мальчиков)

сочинительную группу: собирали → (ГРИБЫ → и → ягоды)

придаточное предложение: приду → (ЕСЛИ → освобожусь рано) 

Каждое отношение  соответствует определенному классу синтаксических конструкций. Особенностью синтаксической модели, на основе которой  строятся  структуры в данном корпусе, является то, что в ней  различается много типов конструкций  и, соответственно, используется большое  число отношений (около 65). 

Основанием для  различения синтаксических отношений  являются различия в синтаксических средствах, скоррелированные с различием  в значении.  

В качестве синтаксических средств учитываются части речи, морфологические характеристики, порядок  слов, интонация, знаки препинания, а также синтаксические признаки и те семантические признаки (дескрипторы) слов, которые влияют на их синтаксическое поведение.  

Ниже приводится комментированный перечень русских  синтаксических отношений. Буквой X в этом перечне обозначается «хозяин» синтаксической связи, буквой Y — «слуга». Вместо лексем с морфологическими характеристиками (как это делается в самом корпусе текстов) мы для простоты будем приводить словоформы, т.е., например, вместо ЧИТАТЬ [V, несов, прич, прош, страд, ед, жен, вин] будем писать читавшуюся. 

В приводимом ниже перечне  синтаксические отношения (СинтО) подразделяются на четыре группы: 1) актантные, 2) атрибутивные, 3) сочинительные и 4) служебные. 

В скобках после  названия отношения приводится его  сокращенное наименование — именно оно используется в Корпусе.

1. Актантные СинтО 

Главной особенностью актантных СинтО является тот  факт, что они связывают предикатное  слово [X] со словом [Y], заполняющим некоторую синтаксическую валентность этого предикатного слова.  

1.1. Предикативное  СинтО (предик) связывает сказуемое  X в качестве хоязина с подлежащим Y в качестве слуги.  

В самом простом  случае, когда сказуемое выражено личным глаголом в действительном залоге, а подлежащее — существительным  в им. падеже, подлежащее заполняет  первую синтаксическую валентность  сказуемого (ср. Петя [Y] читает [X]). Если сказуемое выражено личным глаголом в страдательном залоге, то подлежащее в именительном падеже заполняет вторую синтаксическую валентность сказуемого (ср. Комитет изучает заявку — Заявка [Y] изучается [X]).  

В более сложных  предикативных конструкциях сказуемое  может быть не только глагольным, а  подлежащее — не только существительным  в именительном падеже. Примерами  неглагольного сказуемого могут  служить:

существительные (Москва [Y] — столица [X] России);

прилагательные (Петя [Y] какой-то странный [X]; Вы [Y] очень добры [X]; Я [Y] должен [X] уходить);

краткие причастия (Письмо [Y] доставлено [X]);

наречия (Иван  [Y] все еще там [X]). 

Примерами «неименительного»  подлежащего могут служить:

существительное в  род. или парт. падеже: Хлеба [Y] не оказалось [X]; Сахару [Y] хватит [X] на всех;

распределительная или аппроксимативная предложная группа (Пришло [X] до [Y] десяти человек;  Нам досталось [X] по [Y] груше);

группа, вводимая количественным наречием (В углу стояло [X] много [Y] стульев);

инфинитив (Дозвониться [Y] до него стало [X] проблемой, тебя невозможно [X] узнать [Y]);

придаточное-подлежащее, вводимое союзом (Мне нравится [X], что [Y] Вы больны не мной), союзным словом (Любопытно [X], куда он пошел [Y]) или вопросительной частицей (Приедет [X] ли он, большой вопрос [Y]). 

1.2. Дательно-субъектное  СинтО (дат-субъект). Х — слово,  обозначающее состояние, Y — существительное в дательном падеже, обозначающее субъект этого состояния: Пете [Y] это совсем неинтересно [X]; Мне [Y] можно [X] уйти? 

1.3.Агентивное СинтО  (агент). X — глагол в страдательном залоге или отглагольное существительное — имя действия; Y — существительное в форме творительного падежа, указывающее на субъект действия: Вопрос рассматривается [X] комиссией [Y]; рассматриваемый [X] комиссией [Y] вопрос; прием [X] президентом [Y] представителей Думы. 

1.4. Квазиагентивное  СинтО (квазиагент). X — предикатное существительное, Y — слово, реализующее первую синтаксическую валентность этого слова, т.е. указывающее на его субъект. Y может быть существительным в родительном падеже (приход [X] друга [Y]; его [Y] приход [X]) или предложной группой (заявления [X] от [Y] граждан, возражение [X] со стороны [Y] администрации, прибытие  [X] около [Y] сотни наблюдателей). 

Обратим внимание, что  связь между отглагольным существительным  и словом, заполняющим его первую валентность, оформляется разными  СинтО в зависимости от того, в  какой форме стоит зависимое  слово. Для творительного падежа испольуется агентивное СинтО, для  родительного — квазиагентивное: ср. приглашение [X] президентом [Y, агент] посла, но приглашение [X] президента [Y, квазиагент], направленное послу. 

Если при некотором  существительном X зависящее от него существительное Y в форме родительного падежа характеризует не первую синтаксическую валентность X-a, а какую либо его другую валентность, то связь между X и Y оформляется с помощью одного из комплетивных СинтО (см. ниже, п. 1.6). Если же зависящее от Х-а слово в род падеже является неактантной, то Х и Y связываются атрибутивным СинтО (см. ниже п. 2.2.1). 

1.5. Несобственно-агентивное  СинтО (несобст-агент). Описывает  сложные случаи смещения элемента  Y, характеризующего первую валентность существительного, к глаголу, подчиняющему X: Между [Y] Англией и Францией шла [X] война. 

Синтаксически здесь  группа между Англией и Францией относится к глаголу шла, хотя семантически — к слову война. При изменении порядка слов группа возвращается к своему «законному хозяину» — слову война: Шла война [X] между [Y, квазиагент] Англией и Францией.  

1.6. Комплетивные  СинтО (1-компл, 2-компл, 3-компл, 4-компл, 5-компл). Эти СинтО связывают предикатное  слово (глагол, существительное,  прилагательное или наречие) с  его (не первыми) синтаксическими  актантами, а именно: 1-ое комплетивное  СинтО связывает слово с его  вторым актантом, 2-е комплетивное  — с 3-им актантом и т.д.  Как правило, прямое дополнение  переходного глагола присоединяется  к нему по 1-му комплетивному  СинтО: Я люблю [X] тебя [Y]. Способы заполнения валентностей предикатных слов определяются их управляющими свойствами (зафиксированными в модели управления этих слов). Например, в предложении, Фермер арендовал [X] гектар [Y1] земли у [Y2] совхоза за [Y3] 50000 руб. на [Y4] пять лет пятивалентный глагол арендовать подчиняет прямое дополнение Y1 по 1-му комплетивному отношению, а косвенные дополнения Y2, Y3 и Y4 — соответственно по 2-му, 3-му и 4-му комплетивным отношениям.  

Приведем еще несколько  примеров комплетивных конструкций: Попил [X] кваску [Y, 1-компл]; Не принес [X] хлеба [Y, 1-компл]; Я вас [Y, 1-компл] предупреждал [X], чтобы [Y, 2-компл] вы не торопились;  Транспортировка [X] грузов [Y, 1-компл] от [Y, 2-компл] причала к [Y, 3-компл] складу; Он принялся [X] петь [Y, 1-компл]; ответ, равносильный [X] отказу [Y, 1-компл]. 

Первый синтаксический актант предикатного слова связывается  с Х-ом не комплетивными СинтО, а  одним из отношений, охарактеризованных выше в пп. 1.1–1.4. 

Подчеркнем, что у  одновалентных глаголов (спать, бодрствовать, плакать, светать и т.д.) комплетивных зависимых, естественно, нет. 

1.7. Присвязочное  СинтО (присвяз). Х — глагол-связка (быть, оказываться и т.п.), Y — именная часть сказуемого. В качестве зависимого элемента может, в частности, выступать а) слово в именительном падеже (Он был [X] титулярный советник [Y]; Результат был [X] ошибочный [Y]); б) слово в творительном падеже (Он был [X] учителем [Y]; Петя казался [X] больным [Y]); в) слово в родительном падеже (Брынза не бывает [X] зеленого цвета [Y]); г) краткое прилагательное (Он был [X] очень умен [Y]); д) предикативное наречие (Жаль [Y] было [X] расставаться с ним); е) предложная группа (Степа оказался [X] в [Y] Ялте); ж) союзная группа (Он был [X] как [Y] выстрел на рапире) и т.д. 

Фактически присвязочное СинтО оформляет связь между  связкой и ее вторым синтаксическим актантом. От 1-го комплетивного СинтО (см. выше) присвязочное СинтО отличает тот факт, что последнее не опирается  на модель управления связки. В отличие  от полнозначных глаголов, вторая валентность  связочного глагола может заполняться  самыми разнообразными элементами.  

Синтаксическая связь  между глаголом быть и страдательным  причастием (портфель был украден), представляющая собой аналитическую  форму страдательного залога, оформляется  не с помощью присвязочного, а  с помощью пассивно-аналитического СинтО (см.ниже п. 4.2). 
 

1.8. Несобственно-комплетивные  СинтО(1-несобст-компл, 2-несобст-компл, 3-несобст-компл) описывают сложные  случаи смещения дополнений от  существительного к подчиняющему  его функциональному глаголу: 

Если смещается  первое дополнение, то связь оформляется  с помощью 1-го несобственно-комплетивного  СинтО: С [Y] ним они ведут [X] спор со вчерашнего дня( ср. Они ведут спор [X] с [Y, 1-компл] ним).

При смещении второго  дополнения связь оформляется с  помощью 2-го несобственно-комплетивного  СинтО: Об [Y] этом они ведут [X] спор со вчерашнего дня (ср. Они ведут спор [X] об [Y, 2-компл] этом).

Информация о работе Что такое корпус