Синонимы антонимы гиперонимы гипонимы

Одной из важных тем по развитию речи является изучение лексической
парадигматики, т.е. разрядов слов, вступающих между собой в определенные
отношения. К таким разрядам относятся синонимы, антонимы, гиперонимы и гипонимы.
Изучение синонимов и антонимов начинается еще в первом классе и продолжается в
течение всего периода обучения в школе. Такие разряды слов, как гиперонимы и
гипонимы (слова, имеющие родо-видовые отношения), чаще всего на уроках не
рассматриваются. Хотя гиперо-гипонимические отношения охватывают и структурируют
значительную часть словарного состава языка. Они являются самыми
распространенными парадигматическими связями слов. Разработанные уроки
направлены на развитие у детей языкового чутья, на умение анализировать слова и
их значения, устанавливать между ними логические связи и отношения. Данные уроки
могут проводиться во 2-4 классах независимо от уровня подготовки учащихся и УМК,
по которому обучаются дети.

Цель урока: познакомить учащихся с лексической парадигматикой.

Задачи урока:

  • закрепить у учащихся имеющиеся сведения по теме и дополнить их новыми;
  • учить находить для слова соответствующую пару, в зависимости от вида
    отношений между словами;
  • развивать языковое чутье;
  • развивать интерес к предмету;
  • воспитывать любовь к родному языку.

Методы: объяснительно-иллюстративный, частично-поисковый, ИКТ,
технология критического мышления.

Формы работы: фронтальная, индивидуальная, парная.

Ход урока

1. Вступительное слово учителя.

– Сегодня на уроке мы будем говорить о лексике, т.е. о словарном составе
языка. Нам предстоит выяснить, какие отношения могут быть между словами. Часть
информации по этой теме вам знакома. Поэтому вам нужно будет вспомнить се, что
вы знаете по этой теме и дополнить свои знания новой информацией.

2. работа по теме урока.

1. Синонимы.

– Теория.

Учащиеся вспоминают все, что им уже известно о синонимах. Они дают
определение и приводят примеры. После этого на экране появляется определение и
схема.

Практика.

Презентация. Слайд 3.

Учащимся предлагается задание, направленное на формирование умения подбирать
к словам синонимы.

Задание: подбери синонимы к словам.

Слова: бежать, доктор, морозный, недалеко.

Слайд 4.

Учащимся предлагается найти и объяснить смысловые и стилистические различие
синонимов на примере синонимического ряда: очи, глаза, гляделки.

– Работа с интерактивной доской. Переход на слайды доски осуществляется по
гиперссылкам (звездочкам) в правом углу слайда.

Слайд 1.

Учащимся предлагается соотнести объемы значений синонимов голубой и бирюзовый
(отношения пересечения).

2. Антонимы.

– Теория.

Учащиеся вспоминают все, что они знают об антонимах, дают определение,
приводят примеры. Сравнивают свои ответы, с той информацией, которая появляется
на экране (слайд 5).

– Практика.

Слайд 6.

Учащимся предлагается подобрать антонимы к словам.

Слова: глупец, легкий, обрадовать.

Слайды 7, 8.

Учащимся предлагается подобрать антонимы по картинам.

Слайд 9.

Учащимся нужно найти антонимы в пословицах. Объяснить значение пословиц.

Физкультминутка (слайд 10).

Физкультминутка проходит в форме игры. Правила игры: если на экране появляется
слово, к которому можно подобрать антоним – дети приседают, если появляется
слово, к которому антоним подобрать нельзя – дети поднимают руки вверх. Учащиеся
должны не только выполнить упражнение, но и подобрать к слову антоним.

– Работа с интерактивной доской.

Слайд 2.

Нужно соотнести объемы значений слов ясный и пасмурный (не пересекаются).

3. Гиперонимы и гипонимы.

– Теория.

Слайд 11.

Учащиеся сначала сами должны попытаться дать определение понятиям гипероним и
гипоним на примере гиперо-гипонимической цепочки слов.

Гиперо-гипонимическая цепочка

Деревья: дуб, ива, ель, клен.

Учащиеся должны сформулировать самостоятельно или с помощью учителя, что
гипероним (слово дерево) называет общее (родовое) понятие, а гипонимы (слова
дуб, ива, ель, клен) называют частные (видовые) понятия. После этого на экране
появляется определения гиперонима и гипонима (слайд 12).

– Практика.

Работа с интерактивной доской.

Слайд 3.

Из слов (тюльпан, ландыш, цветы, хризантема) учащимся нужно составить
гиперо-гипонимическую цепочку.

Слайд 4.

Среди предложенных слов (окунь, щука, карась, сом) нужно найти гипероним и
гипонимы. Среди этих слов нет гиперонима, его нужно дописать.

Слайд 5.

Среди предложенных слов (орел, воробей, лягушка, кукушка, дятел, иволга)
нужно найти гипероним и гипонимы. Среди предложенных слов нет гиперонима и есть
“лишнее” слово.

Слайд 6.

Учащимся нужно соотнести объемы понятий слов книга и учебник (отношения
включения).

3. Рефлексия.

Слайд 13.

Задание выполняется по рядам. Среди предложенных слов учащимся первого ряда
необходимо выписать синонимы, учащимся второго ряда – антонимы, учащимся
третьего ряда – гипероним и гипонимы.

Слова: зеленый, купить, одежда, красный, изумрудный, продать, платье, костюм,
брюки, тарелка, гулять.

Учащиеся записывают выбранные слова на стикерах. На доску вывешиваются 3
ватмана с заголовками синонимы, антоним, гиперонимы и гипонимы. Дети выходят к
доске и приклеивают сои листики. Обсуждение задания будет происходить на
следующем уроке, на котором знания по этой теме будут закрепляться и
углубляться.

4. Домашнее задание.

Слайд 14.

Составить 3 пары слов (синонимы, антонимы, гипероним и гипонимы) и придумать
с ними предложения.

Приложение 1,
Приложение 2, Приложение 3

Синонимы
— это слова, различные по звучанию,
оформлению, но тождественные или близкие
по значению.

По
закрепленности в языке выделяют языковые,
или узуальные (от лат. usus — обычай), и
контекстуальные, или окказиональные
(от лат. occasionalis — случайный) синонимы.

Языковые
синонимы можно разделить на:

1. Полные
(абсолютные, дублетные) — полностью
совпадают по своим значениям и характерной
сочетаемости. Наибольшее количество
таких слов приходится на долю научной
терминологии. Чаще всего это исконно
русский и заимствованный термины:
алфавит — азбука, лингвистика — языкознание,
фрикативный-щелевой, орфография —
правописание; голкипер — вратарь,
гиппопотам — бегемот, аллигатор — крокодил.

Различия,
однако, могут быть и между ними. Ср.:
азбука Морзе, но не алфавит Морзе.

2. Частичные
(относительные) — слова, которые частично
совпадают по значению и употреблению.
По качеству различий частичные синонимы
делятся на:


семантические
(идеографические,
понятийные) — выражают общее понятие,
но вместе с тем отличаются определенными
элементами своих значений: узкий
(‘небольшой в ширину’: узкая полоска) —
тесный (‘недостаточный, небольшой по
пространству’: тесная квартира) -тонкий
(‘небольшой в обхвате, по толщине’: тонкий
слой); ключ (‘источник, из которого вода
выходит с напором, силой’) -родник
(‘источник, из которого вода просачивается
на поверхность земли’);

— стилистические
— различаются стилистической окраской:
глаза, очи, зенки; красть, умыкать,
уводить, утащить, стащить, слямзить,
стырить; убегать, удирать, драпать,
смываться;


семантико-стилистические
— отличаются
и оттенками значений, и стилистической
окраской: говорить (нейтр.) — тараторить
(‘говорить быстро’, разг.); ссора — перепалка,
перебранка (‘крикливая ссора из-за
пустяка’, разг.).

Контекстуальные
синонимы
употребляются в авторской
речи, индивидуальны, характерны для
художественных текстов, таких синонимов
нет в словарях. Например: в предложении
Вышла румяная девка и стукнула на стол
самовар (Горький) слово стукнула выступает
синонимом к слову поставила, хотя в
общелитературном языке эти слова
синонимами не являются.

Синонимический
ряд — исторически сложившаяся группа
слов, объединенная системными
синонимическими отношениями. В
синонимический ряд могут войти не только
слова литературного языка, но и
просторечия, разговорная и диалектная
лексика. Слова в ряду выстраиваются по
убыванию или нарастанию признака.
Стилистически окрашенное слово следует
за нейтральным. Главное место в
синонимическом ряду занимает доминанта.
Доминанта открывает синонимический
ряд, в ней сосредоточено самое важное
значение всей группы. Доминанта
стилистически нейтральна, не имеет
эмоциональной окраски. Например:

Легкий —
нетрудный, простой, элементарный,
немудреный, нехитрый, пустяковый, пустой,
плевый.

Возникновение
в языке синонимов обусловлено рядом
причин:

— стремление
человека найти в предмете или явлении
действительности какие-то новые черты
и обозначить их новым словом;


заимствование;

— в
различных стилях речи один и тот же
предмет, одно и то же явление может быть
названо по-разному.

Одним из
источников возникновения синонимии
являются табу. Табу — первоначально,
в первобытном обществе, система запретов
на совершение определенных действий,
употребление каких-либо предметов,
произнесение слов, нарушение которых
карается сверхъестественными силами.
Например, идя на охоту, не называли
животное, на которое будут охотиться,
чтобы злые духи не подслушали и не лишили
удачи (вместо лось говорили сохатый,
вместо медведь — косолапый и т. д.). Не
произносили слова домовой, говорили:
хозяин. Так рождались синонимы к словам,
так появились и загадки.

Роль
синонимов в речи исключительно велика:
они помогают избежать ненужных повторений
одного и того же слова (тавтологии),
точнее передают мысли.

Эвфемизмы
(слова-заменители) — явление, связанное
с использованием синонимии. Эвфемизмы
используются вместо неприятных или
неприличных в данной речевой ситуации
прямых названий: полный вместо толстый,
ошибаться вместо врать, задерживаться
вместо опаздывать, в почтенном возрасте
вместо старый, неумный вместо дурак,
пользоваться носовым платком вместо
сморкаться, а также с целью ухода от
прямых названий, цензурного запрета:
хранилище № 1 (о радиоактивных отходах).

Антонимы
— это слова одной и той же части речи с
противоположным значением.

Противопоставляться
могут только соотносимые явления, в
основу которых положен один и тот же
общий признак. Так, светлый является
антонимом к темному по признаку цвета;
красивый — антонимом к безобразному по
признаку красоты.

По
закрепленности в языке выделяют языковые,
или узуальные, и контекстуальные
антонимы.

Языковые
антонимы можно разделить на
:

1.
Внутрисловные
— противопоставление
значений внутри одного слова. Явление
энантиосемии (совмещение в одном слове
двух противоположных значений): одалживать
— ‘взять в долг’ (одалживать у Кати) и
‘дать в долг’ (одалживать Кате); просмотреть
— ‘увидеть’ (просмотреть всю работу) и
‘не увидеть’ (просмотреть две ошибки);
залечивать — ‘вылечить’ (залечить рану)
и ‘слишком много и ненужно лечить’
(Залечили тебя там). Более распространенной
является речевая энантиосемия: «Ох, и
умен!» (т. е. ‘глуп’); «Ну и чистый!» (т. е.
‘грязный’).

2. Межсловные.
По качеству противопоставления межсловные
антонимы делятся на:

— контрарные
(градуальные, противоположные) — образуют
градуальную (ступенчатую) оппозицию,
которая отражает постепенное изменение
качества, свойства, признака.


комплементарные
(дополнительные) —
образуют только двучленные оппозиции,
отрицание одного означает утверждение
другого: война — мир (если не мир, то
война), жизнь -смерть, есть — нет, можно
— нельзя, мужчина — женщина; между
комплементарными антонимами не должно
быть среднего члена;

Жизнь иногда
стирает эту классификацию: И нельзя и
можно; И да, и нет; Ни жить ни умереть не
дают; Он не совсем здоров; Это было
полуправдой. Однако такие примеры
рассматриваются как аномалии.

— антонимы,
выражающие противоположную направленность
действий, свойств и признаков
: входить
— выходить, подниматься — опускаться,
одеваться — раздеваться, ускорять —
замедлять, восход — заход, сборка —
разборка, увеличение — уменьшение;
законный — противозаконный, вперед —
назад.

В
контекстуальных антонимах

противопоставленность значений
проявляется только в контексте: блеск
— нищета, работать — лежать, веселый —
несчастный. Ср.: Они сошлись. Вода и
пламень, стихи и проза, лед и камень не
столь различны меж собой (Пушкин).

Употребление
антонимов делает речь более выразительной.
В художественном стиле антонимы часто
используют для создания таких фигур,
как антитеза и оксюморон.

Антитеза
противопоставляет разные объекты: Дома
новы, но предрассудки стары (Грибоедов),
оксюморон приписывает противоположные
(несовместимые) качества одному предмету
или явлению: женатый холостяк; и нельзя
и можно; и хочется и колется.

Гипо́ним
(греч. ὑπό — под, внизу + όνομα — имя) —
понятие, выражающее частную сущность
по отношению к другому, более общему
понятию.

Гиперо́ним
(Ὑπερ — сверх-) — слово с более широким
значением, выражающее общее, родовое
понятие, название класса (множества)
предметов (свойств, признаков).

Гипероним
(в лингвистике) — понятие в отношении
к другому понятию, выражающее более
общую сущность. В отношении некоторого
множества объектов гиперонимом является
понятие, отражающее надмножество к
исходному. Гипероним является
результатом логической операции
обобщения. Тогда как гипоним — ограничения.

Примеры:

Термин
«зверь» является гиперонимом по отношению
к термину «собака», а термин «собака»
в свою очередь — гипероним по отношению
к термину «бульдог». И наоборот — термин
«бульдог» — гипоним по отношению к
термину «собака», а «собака» — гипоним
по отношению к термину «зверь».

Соседние файлы в предмете Современный русский язык

  • #
  • #
  • #
  • #
  • #
  • #
  • #

Международное обозначение

… I

Знак препинания, многоточие.

Семантические свойства

Значение

  1. в конце предложения указывает на незаконченность высказывания, недоговорённость, возможность продолжения перечисления, а также на особый смысл (многозначительность), подтекст ◆ Отсутствует пример употребления (см. рекомендации).
  2. в начале абзаца употребляется для обозначения логического или содержательного разрыва в тексте, резкого перехода от одной мысли к другой ◆ Отсутствует пример употребления (см. рекомендации).
  3. внутри предложения употребляется для передачи прерывистого характера речи, её затруднённости ◆ Отсутствует пример употребления (см. рекомендации).
  4. внутри предложения может указывать на несовместимость значений слов, на необычность их сочетания ◆ Отсутствует пример употребления (см. рекомендации).
  5. в начале, в середине или в конце цитаты употребляется для обозначения пропуска ◆ Отсутствует пример употребления (см. рекомендации).

Фразеологизмы и устойчивые сочетания

  • ?..
  • !..

Библиография

  • Правила русской орфографии и пунктуации. — М., 2013. — С. 177, 178, 180, 187, 242, 244, 245, 271.

… II

Азбука Морзе

Произношение

  •  

Семантические свойства

Значение

  1. визуальное изображение для С (кириллица) ◆ Отсутствует пример употребления (см. рекомендации).
  2. визуальное изображение для S (латиница) ◆ Отсутствует пример употребления (см. рекомендации).

Синонимы

  1. ?

Антонимы

  1. ?

Гиперонимы

  1. ?

Гипонимы

  1. ?

Фразеологизмы и устойчивые сочетания

Этимология

От ??


1


Тема: Синонимы, антонимы, гиперонимы и гипонимы


2


Синонимы – слова, тождественные или близкие по значению, но разные по форме. форма значение форма значение


3


бежать Синонимы нестись, мчаться доктор врач морозный холодный недалеко близко


4


очиглазагляделки возвышенное нейтральное стилистически сниженное Смысловые и стилистические различия синонимов


5


Антонимы – слова с противоположным значением значение форма


6


глупец мудрец Антонимы лёгкий тяжёлый обрадовать огорчить


7


день ночь


8


мороз тепло морозный тёплый


9


Найди антонимы в пословицах 1. Сытый голодного не разумеет. 2. Свалить с больной головы на здоровую. 3. Без труда и отдыха нет.


10


Слово имеет антоним — присесть Слово не имеет антоним – руки поднять вверх чистый грязный добро зло забывать помнить тетрадь рисовать минус плюс школа тишина шум


11


Деревья: дуб, ива, ель, клён деревья ива ель клён дуб


12


Гипероним – слово с широким значением, выражающее общее, родовое понятие. наука Гипонимы – слова, называющие предметы как элементы множества. математика грамматика астрономия биология


13


Найдите 1 ряд 2 ряд 3 ряд синонимы антонимы гипероним и гипонимы зелёный, купить, одежда, красный, изумрудный, продать, платье, костюм, брюки, тарелка, гулять


14


Домашнее задание Составить 3 пары слов: синонимы: антонимы; гипероним и гипонимы. С одной парой слов придумать предложения.


15


Спасибо за работу!!!


16


Используемые ресурсы: 1. Фотографии из личного архива 2. Анимашки: villik005.narod.ru

Под ресурсом понимаются данные и их производные, используемые в процессе обработки естественного языка: корпусы текстов, тезаурусы, словари.

Словарь

Словарь — собрание слов (иногда также морфем или словосочетаний), расположенных в определённом порядке, используемое в качестве справочника, который объясняет значения описываемых единиц, даёт различную информацию о них или их перевод на другой язык либо сообщает сведения о предметах, обозначаемых ими.[1]

Название Описание Разметка Млн. словоформ Статус Языки
Словарь OpenCorpora Морфологический словарь открытого корпуса части речи, грамматические характеристики слов, связи между леммами 5 Открытый, свободный русский
АОТ Русский морфологический словарь системы «ДИАЛИНГ» части речи, грамматические характеристики слов, ударения 5 Открытый, свободный русский
hunspell-ru Русский словарь hunspell части речи, грамматические характеристики слов н/д Открытый, свободный русский
Семантический словарь русского языка Семантический словарь для решения проблемы семантического анализа текстов на русском языке толкования на семантическом языке 0,1 Открытый, несвободный русский
Акцентуированная парадигма Полная акцентуированная парадигма по А. А. Зализняку ударения 3 Открытый, свободный русский
Грамматический словарь русского языка Электронная версия грамматического словаря по А.А. Зализняку (проект Starling) грамматические характеристики слов, ударение н/д Открытый, свободный русский
oDict.ru Форк проекта Starling: добавлено более 3000 личных имен и топонимов в формате А.А. Зализняка грамматические характеристики слов, ударения, видовые пары, пары «топоним — прилагательное» (Москва — московский) 4 Открытый, свободный русский
Визуальный словарь Электронный словарь толкования, синонимы н/д частично открытый русский
Словеса Электронный словарь ассоциаций признаки, действия, синонимы 0.05 н/д русский
Русский ассоциативный словарь Электронный словарь ассоциаций реакции, частотность н/д н/д русский
ABBYY Lingvo Электронный словарь толкования, переводы н/д Закрытый русский, английский, немецкий, французский, др.
Pop-Up Dictionary Электронный словарь толкования, переводы 0.001–1 Открытый (частично) русский, английский, немецкий, французский, др.
Мультитран Электронный словарь переводы 8 Закрытый русский, английский, немецкий, французский, др.
Словари на основе НКРЯ Частотный словарь, Грамматический словарь новых слов, Непредметные имена (глагольная сочетаемость), Прилагательные и наречия высокой степени (сочетаемость) — электронные словари частотность, части речи, грамматические характеристики, сочетаемость 0,05 [2] Открытый русский
Словарь Мюллера Электронный словарь переводы 0.07 н/д русский, английский
Открытая семантика русского языка Разметка слов и выражений русского языка по семантическим срезам семантические метки (материальность, живое, предмет и т.д.) 0.01 открытый, несвободный русский

Тональные словари

Тональный словарь — собрание слов (иногда словосочетаний), снабжённых оценочной меткой («хорошо», «плохо», «нейтрально») или числовым значением оценки из непрерывного числового диапазона (зачастую [-1, 1]).

Название Описание Разметка Источник данных Объём Лицензия, условия использования Языки
КартаСловСент Тональный словарь русского языка оценочная метка, скалярное значение из диапазона [-1, 1] краудсорсинг 46127 слов CC BY-NC-SA 4.0 русский
LINIS Crowd SENT Тональный словарь и коллекция текстов с тональной разметкой список дискретных оценок от -2 до 2 для каждого слова краудсорсинг 9702 слов CC BY-NC-SA 4.0 русский
РуСентиЛекс Словарь оценочных слов и выражений русского языка полярность слова (то же, что «оценочная метка»), источник тональности, учёт многозначности эксперт 12000+ слов и выражений не указано русский

Тезаурус

Тезаурус (от греч. thesaurós — сокровище, сокровищница) — множество смысловыражающих единиц некоторого языка с заданной на нём системой семантических отношений.[1]

Название Описание Структура Тыс. понятий Статус Языки
Викисловарь Многофункциональный многоязычный словарь и тезаурус синонимы, антонимы, гиперонимы, гипонимы, родственные слова 450 Открытый, свободный русский
Russian Distributional Thesaurus (RDT) Дистрибутивный тезаурус русского языка семантически близкие слова (semantically related words), гиперонимы 932 Открытый, свободный русский
Словарь системы ASIS Большой словарь-справочник синонимов русского языка системы ASIS синонимы 434 Закрытый русский
Словарь Абрамова Словарь русских синонимов и сходных по смыслу выражений синонимы, родственные слова 20 Открытый, устаревший русский
WordNet Тезаурус синонимы, антонимы, гиперонимы, гипонимы, меронимы, логическое следование, каузация н/д Открытый, свободный русский (не поддерживается), английский, голландский, итальянский, испанский, немецкий, французский, чешский, эстонский
YARN Тезаурус синонимы 15 Открытый, свободный русский
BabelNet Лингвистическая онтология синонимы, антонимы, гиперонимы, гипонимы, меронимы, определения 985 Открытый, несвободный русский, английский, немецкий, французский, итальянский, испанский
«Универсальный словарь концептов» UNL описание Тезаурус синонимы, антонимы 964 Открытый, свободный русский, английский, французский, хинди, испанский, малайский, вьетнамский
РуТез Лингвистическая онтология синонимы, антонимы, гиперонимы, гипонимы, меронимы 158 Открытый, несвободный русский
ОРФО Тезаурус синонимы, антонимы, родственные слова 70 Закрытый русский
ABBYY Lingvo Тезаурус синонимы, антонимы, родственные слова н/д Закрытый русский, английский, немецкий, французский, испанский, итальянский, португальский, греческий, финский, китайский, латинский, турецкий, украинский, казахский, татарский, польский, венгерский, датский, нидерландский, норвежский
Идеографический словарь русского языка Тезаурус иерархическая система понятий 7.8 Открытый русский
Славянский ассоциативный словарь Тезаурус синонимы н/д Открытый русский
InTez Тезаурус иерархическая система понятий н/д Открытый, несвободный русский

Корпус текстов

Корпус текстов — собрание текстов на данном языке в электронной форме, специальным образом обработанное («аннотированное»), так, чтобы исследователь языка мог быстро и в полном объеме найти в корпусе интересующую его информацию о языке. В зависимости от характера аннотации, возможен поиск по грамматическим характеристикам слов и предложений языка (морфологическим, синтаксическим, семантическим параметрам), а также по разнообразным характеристикам самих текстов, входящих в корпус: по автору, дате создания текста, жанру, тематике и т.п.[3]

Название Описание Разметка Млн. словоформ Статус Языки
OpenCorpora Открытый корпус русского языка графематическая, морфологическая 1,3 Открытый, свободный русский
ГИКРЯ Генеральный интернет-корпус русского языка графематическая, морфологическая, пунктуация, метатекстоваяя разметка (гендерная, географическая, возрастная и т.д.) 20000 Требуется регистрация (онлайн-версия), есть свободно распространяемый подкорпус русский
НКРЯ Национальный корпус русского языка лексическая, морфологическая, синтаксическая, лексико-семантическая, акцентная, пунктуация; метрика и рифмовка (поэтический корпус), жестовая, речевые действия, орфоэпическая и вокалическая структуры (мультимедийный корпус), мультиязычная (параллельные корпуса), оригинальная орфография (исторические корпуса) 500 Открытый (онлайн-версия), несвободнораспространяемый русский, параллельный корпус также: английский, немецкий, французский, испанский, итальянский, польский, украинский, белорусский
MTEngine Параллельный корпус текстов графематическая, мультиязычная 0,1 Открытый русский, английский
Leipzig Corpora Параллельный корпус текстов мультиязычная 0,2 Открытый русский, английский, немецкий, др.
Корпус Яндекс.перевод Параллельный корпус текстов мультиязычная 1 (предложений) Открытый русский, английский.
Корпус EuroParl Корпуса текстов заседаний Европарламента; параллельные корпуса (для пар с участием английского); инструмент для предобработки и выравнивания Метатекстовая (CHAPTER, PARAGRAPH, SPEAKER), мультиязычная (для пар с участием английского); в среднем около 30 Открытый 21 язык
Корпус несовершенных переводов Параллельный многовариантный корпус переводов, содержащих ошибки мультиязычная 0,8 Открытый русский, английский.
UMC Параллельный корпус на основе новостных текстов мультиязычная 0,1 Открытый русский, английский, чешский
Корпус на основе Twitter Корпус коротких текстов на русском языке на основе постов Twitter тональность н/д Открытый русский
Wikipedia Monolingual Corpora Одноязычный корпус текстов на основе Википедии нет 5000 Открытый русский, английский, немецкий и др.
Common Crawl Корпус данных веб-страниц метатекстовая, исходная HTML-разметка н/д (541 TB данных. Содержит дубликаты, см. также https://wwwdb.inf.tu-dresden.de/misc/dwtc/) Открытый русский, английский, немецкий и др.
ParaPhraser Корпус текстов для перефразирования парафраз н/д Открытый русский
Сентинет Игра по разметке тональности тональность в именных группах н/д Открытый русский
Linis Crowd Тональная разметка словаря и текстов тональность н/д Открытый русский
sentimeter Разметка тональности текстов социальных сетей тональность н/д Открытый русский
Корпус биографических текстов Корпус на основе биографических текстов из Википедии. Тексты разбиты на предложения, предложения имеют тематическую разметку тематика (тип биографической информации) н/д Открытый русский
Auto_reviews Отзывы на автомобили с оценкой по 5-балльной шкале. тональность н/д Открытый русский
PaRuS Морфологически и синтаксически аннотированный корпус предложений русского литературного языка. морфологическая и синтаксическая (порождена автоматически) ≈2700 Открытый, CC BY 4.0 русский
Taiga An open-source corpus for machine learning. морфологическая и синтаксическая (порождена автоматически), метаданные документов ≈5000 Открытый, CC BY-SA 3.0 русский
RusAge Russian corpus of fiction book previews with age rating labels. Ознакомительные фрагменты и аннотации книг с возрастным рейтингом: 1) взрослые/детские; 2) возрастная категория (0+, 6+, 12+, 16+, 18+) н/д Открытый русский
RuMedBench Корпус биомедицинских текстов Тематическая классификация; Вопросно-ответная; Логический вывод; н/д Открытый русский

Коллекции н-грамм

Коллекции н-грамм — н-граммы (последовательности из n слов) и их частоты в больших массивах текстов

Название Описание Разметка Млн. нграмм Статус Языки
Google Ngrams н-граммы, рассчитанные по Google Books метатекстовая (год создания книги из Google Books), морфологическая(часть речи) свободная (CC BY 3.0) английский, китайский, французский, немецкий, иврит, итальянский, русский, испанский
н-граммы словоформ в НКРЯ н-граммы, рассчитанные по НКРЯ открытая русский
н-граммы по Common Crawl н-граммы, рассчитанные по Common Crawl открытая русский, английский, немецкий и др.
data.statoperator.com н-граммы, рассчитанные по главным страницам доменов Alexa top 1M отчёт с рассчитанными н-граммами для каждого домена из списка 588 открытая русский, английский, немецкий и др.

Банк данных

Название Типы ресурсов Языки Лицензия
VoxForge акустические модели, аудиофайлы, грамматики 13 языков, включая русский, украинский GPL
Festvox аудиофайлы OS (Carnegie Mellon University)
Linguistic Data Consortium аудиофайлы (различные источники и темы) коммерческая
AMI Meeting Corpus аудиофайлы (совещания), аннотированный английский The University of Edinburgh EULA (Noncommercial)
EUSTACE аудиофайлы, просодическая разметка английский The University of Edinburgh EULA (For noncommercial use)
Data Archive (the Max Planck Institute) аудио- и видеофайлы, аннотированный более 200 языков некоммерческая (см. Правила использования)

Размеченная коллекция изображений

Размеченная коллекция изображений — собрание графических изображений, к которым приписаны метки, описывающие представленные иконки, пиктограммы, силуэты.

Название Изображения Разметка Языки Лицензия
The Noun Project распространённые имена существительные метки русский, английский CC0 или CC BY
OpenClipArt клипарт метки английский общественное достояние
Basic English picture wordlist распространённые имена существительные метки английский CC BY-SA
ImageNet имена существительные из WordNet ссылки на WordNet английский н/д
Pictogram популярные слова метки английский, русский н/д

Примечания

  1. 1,0 1,1 Большая советская энциклопедия: В 30 т. — М.: «Советская энциклопедия», 1969–1978.
  2. [http://corplingran.ru/ Введение к частотному словарю современного
    русского языка, п. 5.1]
  3. Программа фундаментальных исследований Президиума РАН «Корпусная лингвистика»

Понравилась статья? Поделить с друзьями:
  • Синонимы антонимы буря горе
  • Синонимы антонимы паронимы презентация
  • Синонимы антонимы бить баклуши
  • Синонимы антонимы паронимы правила
  • Синонимы антонимы английских слов