Постоянная ссылка (СИД2) |
J2032810646 |
Название |
Создание списка стоп-слов русского языка |
Автор |
Яцко В. А. |
Источник |
Научно-техническая информация (НТИ). сер. 2. Информационные процессы и системы/ Всероссийский институт научной и технической информации РАН |
Страницы/Объём |
25-31 |
Сокращ. назв. источника |
НТИ. сер. 2. Инф. процессы и системы/ ВИНИТИ РАН |
Год |
2022 |
Номер |
5 |
DOI |
10.36535/0548-0027-2022-05-4 |
Постоянная ссылка (СИД) |
J20328106 |
Ключевые слова (авторские) |
списки стоп-слов, фильтрация, признаки и методы идентификации, принципы создания, русский язык |
Дата регистрации в ВИНИТИ |
12.04.2022 |
Место хранения |
Удаленный доступ. Эл. регистрация |
Язык текста |
русский |
Библиография (кол-во источников) |
10 |
Аннотация |
Описываются признаки, необходимые для идентификации стоп-слов: статистический, семантический и морфологический. На их основе формулируются новые принципы создания списков стоп-слов. Показывается применение этих принципов для создания списка стоп-слов русского языка. На основе анализа существующих списков и распределения терминов в Национальном корпусе русского языка создан список универсального типа, включающий 535 стоп-слов. |
Адрес полного текста в открытом доступе |
|
Тематический раздел |
Информатика |
Издательский номер в РЖ |
23.04-59.206 |
Шифр ГРНТИ |
20.19.27 |
Ключевые слова |
обработка текста, списки стоп-слов, фильтрация, идентификация, русский язык |