Пишем

Как ценности прорастают в языке

Hиже мы представляем исследование ценностных содержаний русского культурного кода, передаваемого языковыми средствами, системой интеллектуального анализа больших данных iFORA (Intelligent Foresight Analytics), выполненное экспертами Высшей школы экономики (ВШЭ) по заказу экспертов Федерального центра гуманитарных практик (ФЦГП).

Эксперты Федерального центра гуманитарных практик синтезировали систему ценностей и ценностных содержаний русского культурного кода, пользуясь методами философской герменевтики и феноменологии и принципами очевидности, органичности, системности, многообразия, возвращения к нормальности, интуитивности и понимания языка как важнейшего элемента коммуникации, лежащего в основе цивилизации и транслирующего смыслы.

Цель проведённого исследования — проверить гипотезу экспертов Федерального центра гуманитарных практик о ценностных содержаниях русского культурного кода, передаваемого языковыми средствами, в том числе через тексты классической русской литературы. В качестве метода проверки корпуса текстов мы использовали систему интеллектуального анализа больших данных iFORA.

В ходе автоматического поиска ценностей и связанных с ними понятий на основе размеченного и подготовленного Корпуса русского романа XIX–XX веков (задача первая) были достигнуты следующие результаты: выделено более 80 часто встречающихся понятий, описываемых как ценности, определены взаимосвязи между ними на основе совстречаемости, выявлена чёткая корреляция с 12 базовыми ценностями.

В ходе сравнения результатов автоматического исследования с положениями отечественной мировоззренческой системы «Четыре грани человечности» (ЧГЧ) для коррекции и обогащения (задача вторая) было принято решение о создании кластеров ценностей и связанных понятий (20-25) вокруг каждого блока из четырёх базовых ценностей и сформирован образ цифрового продукта в помощь гуманитарным исследователям при работе с ценностями.

В ходе исследования ценностных содержаний русского культурного кода, передаваемого языковыми средствами, в том числе через тексты классической русской литературы, системой интеллектуального анализа больших данных iFORA были выявлены слова-маркеры, относящиеся к смысловому полю аксиологии. Однако в представленных результатах мы не видим содержания ценностных понятий, видим только языковую форму (знаки, вырванные из контекста, а потому лишённые значений).

По результатам проведённого исследования были выделены следующие особенности анализа корпуса русскоязычного текста с целью выявления в нём ценностных понятий системой интеллектуального анализа iFORA:

Системе удаётся выявлять в массиве текста слова и понятия, предложенные в экспертно-синтезированной системе ценностей, и с переменным успехом подбирать связанные слова и понятия.

Системе не удаётся анализировать контекст, в котором было обнаружено то или иное понятие, представленное в экспертно-синтезированной системе ценностей, из-за чего само понятие часто лишается своей ценностной окраски.

Стало понятно, что для дальнейшего исследования аксиологического поля средствами искусственного интеллекта необходимо дополнительное глубокое машинное обучение с привлечением экспертов по направлениям знания, что позволит добиться не только сведений о частоте упоминаний того или иного слова, но и учета контекста, в котором понятие создаётся и используется автором текста. Это проблема не относится к числу неразрешимых, но требует дополнительных затрат, как финансовых, так и временных (долгосрочная задача).

Более перспективным на сегодняшний день кажется нам анализ текстов русской литературы и культуры, выполненный представителями научного и экспертного сообщества.

Исследование может быть расширено за счёт:

1. анализа дополнительных корпусов текстов, таких как фольклор, современная русскоязычная литература (позволит выявить ценности, транслируемые авторами настоящего времени), учебные пособия (позволит выявить ценности, транслируемые не только в литературе, но и в иных источниках информации, изучаемых в образовательных учреждениях), тексты СМИ и инфлюенсеров (позволит выявить ценности, транслируемые не только в традиционных источниках, но и в Интернете — особенно актуальном для молодёжи источнике информации);

2. проведения углублённого анализа с использованием системы интеллектуального анализа больших данных iFORA, включающего такие этапы, как сентимент-анализ (определение эмоционального окраса тех или иных ценностей), выявление высокоспецифичных тематик (анализ узкоспециализированных и многосоставных установок) и выявление понятий, связанных с формированием ценностей, через определение семантических взаимосвязей в текстах;

3. проведения мониторинга ценностей — исследования, позволяющего регулярно отслеживать их динамику и трансформацию под влиянием тех или иных факторов.

Исследование будет продолжено за счёт семантического исследования эпистолярного наследия. Задачи нового исследования мы формулируем следующим образом:

Задача 1.

Расширение массива данных для исследования за счёт:

· древнерусской письменности и литературных памятников (до XVIII века);

· художественной литературы и публицистики (XVIII–XXI века);

· русской религиозной философии (Николай Бердяев, Семён Франк, Иван Ильин, Лев Шесто́́в и другие).

Задача 2.

Привлечение широкого экспертов гуманитарных специальностей для:

· разметки массива данных для глубокого машинного обучения;

· анализа и коррекции выводов;

· обобщения результатов, обогащения и углубления ЧГЧ.

В результате мы надеемся получить более точную карту выявленных в массиве текстов ценностных ориентиров российского общества и государства в исторической динамике с возможностью её экстраполяции в будущее.

Хотелось бы ещё раз указать, что, несмотря на все недочёты исследования, существующие на данном этапе его разработки, оно даёт основания для дальнейшего развития; однако продолжение исследования видится нам возможным только при длительной подробной проработке и разметке всего русского литературного, публицистического и научного (в первую очередь гуманитарного) наследия, а также глубокого машинного обучения с привлечением экспертов по направлениям знания.

При этом стоит заметить, что в целом на этом пробном этапе исследования ценностных содержаний русского культурного кода, передаваемого языковыми средствами, система интеллектуального анализа iFORA подтвердила основную гипотезу экспертов о содержании экспертно-синтезированной системы ценностей.

Опубликовано: Инструментариум. Вып. 1. Исправление имён. М.: ФЦГП, 2023. С. 22–25.