Исследование сложности предложений, составляющих тексты правовых актов органов власти Российской Федерации

  • Д.А. Савельев
Ключевые слова: правовой акт, правовая информация, законотворчество, корпус, лингвистика, экспертиза, лексическое разнообразие, открытые данные, вычислительная лингвистика, анализ текста

Аннотация

Для качественной правореализации недостаточно только факта официального опубликования нормативных актов. Важна ясность правовых текстов, доступность их для понимания. Лингвистическое и юридическое качество текста взаимосвязаны. Создание качественного текста будет способствовать более четкому формулированию идей, заложенных в правовой или судебный акт. В статье содержатся методика и результаты исследования текстов законодательства России, проведенного в целях совершенствования правореализации и правоприменения, снижения затрат времени на восприятие правовых норм, улучшения качества правовых актов. Использованы тексты 199 тыс. правовых актов. Проведена сегментация текстов на 5,5 млн. предложений; автоматизированная морфосинтаксическая разметка предложений с выделением частей речи и их свойств. На этой основе рассчитаны метрики лексической и синтаксической сложности каждого предложения: длина, лексическое разнообразие, длины зависимостей частей речи, длины слов в слогах и др. Выбраны метрики, позволяющие количественно оценить сложность предложений правового текста, которая отличается от литературного текста. Предложена методика автоматизированного определения предложений, которые можно отнести к наиболее трудночитаемым, без использования ручного труда. На основе этой работы созданы и опубликованы примеры плохо читаемых предложений правовых актов. Сведения о предложениях проанализированы статистически. Определены органы власти, которые пишут сложнее, и тематики документов, в которых встречается больше сложно написанных предложений. Показано, что число длинных предложений в законодательстве существенно (в пять раз) возросло по сравнению с первыми годами современной российской государственности. В частности, половина предложений актов Конституционного Суда состоит более чем из 40 токенов каждое. Выделены наиболее часто встречающиеся словосочетания и обороты, которые характеризуют тематику текстов, в которых встречаются наиболее сложные предложения. Опубликованный информационный ресурс может стать в дальнейшем предметом для более детальных работ по совершенствованию юридической техники и содержания правовых и судебных актов.
Для цитирования: Савельев Д.А. Исследование сложности предложений, составляющих тексты правовых актов органов власти Российской Федерации // Право. Журнал Высшей школы экономики. 2020. № 1. С. 50–74. УДК: 340 DOI: 10.17323/2072-8166.2020.1.50.74
Опубликован
2020-03-12
Как цитировать
СавельевД. (2020). Исследование сложности предложений, составляющих тексты правовых актов органов власти Российской Федерации. Право. Журнал Высшей школы экономики, (1), 50-74. https://doi.org/10.17323/2072-8166.2020.1.50.74
Раздел
Правовая мысль: история и современность