Социология ценностей: опыт построения таксономии путем использования технологии анализа естественного языка
https://doi.org/10.26425/2658-347X-2023-6-1-48-58
Аннотация
Современные исследования в области социологии науки становятся все более сложными из-за постоянно растущей публикационной активности авторов. Для отслеживания трендов в отраслевых социологиях ученые обращаются к методам наукометрии, однако их оказывается недостаточно. Предметом исследования выступила тенденции развития социологии ценностей как отрасли социологии. Цель статьи – оценка возможностей использования методов анализа естественного языка NLP/NLA (англ. natural language processing – обработка текста на естественном языке, natural language assessment – оценка естественного языка) для тематической и теоретической кластеризации исследований в социологии ценностей. Дизайн исследования количественно-качественный, работа проводилась в два этапа. На первом этапе с помощью интеллектуального анализа текста проанализирована 121 аннотация научной статьи, после чего их общий массив был разбит на кластеры. На втором этапе результаты машинной кластеризации проверялись методом качественного анализа текста, на основе чего выделялись ограничения и возможности метода NLP/NLA для решения задачи кластеризации научных текстов. В ходе анализа обнаружено, что статьи с более консервативным ядром теоретических категорий (гендерные исследования, миграционные исследования, теория глобализма) лучше поддаются кластеризации, а теории со слабо структурированным теоретическим ядром (теории с использованием экологической терминологии, теории неравенства) поддаются кластеризации значительно хуже. Полученные результаты позволяют сформировать новое направление работы с большими массивами научных текстов, связанное с их кластеризацией с помощью NLP/NLA. Построение кластеров дает возможность исследователям изучать все тексты данной тематической области, а не только самые цитируемые. Это, в свою очередь, обеспечивает видимость всех научных идей, в том числе не получивших популярности/известности.
Об авторах
М. А. КашинаРоссия
Кашина Марина Александровна, д-р полит. наук, проф. каф. социальных технологий
г. Санкт-Петербург
С. Ткач
Россия
Ткач Сергей, программист
г. Санкт-Петербург
Список литературы
1. Александров Д.А. (1998). Научные школы как социальные сети // Академические научные школы Санкт-Петербурга. К 275-летию Академии наук. СПб.: СПбНЦ РАН. С. 11–18.
2. Вебер М. (1990). Избранные произведения. Пер.с нем., общ. ред. Давыдов Ю.Н. М.: Прогресс. 808 c.
3. Кашина М.А., Ляшко С.В., Ткач С. (2021). Актуальная повестка исследования ценностей в зарубежной социологии: тематика, теории, методологии // Управленческое консультирование. №10. С. 62–82. https://doi.org/10.22394/1726-1139-2021-10-62-82
4. Кононенко Е.И. (2021). Еще раз о симуляции научной деятельности в гуманитарных дисциплинах // Вестник Санкт-Петербургского университета. Искусствоведение. Т. 11, № 2. С. 327–349. https://doi.org/10.21638/spbu15.2021.209
5. Максименко А.А. (2011). Социологическая интерпретация понятия «ценность» // Вестник Костромского государственного университета. Т. 17, № 2. С. 284–291.
6. Юдина М.А. (2017). Индустрия 4.0: перспективы и вызовы для общества // Государственное управление. Электронный вестник. № 60. С. 197–215.
7. Arnarsson I.Ö., Frost O., Gustavsson E., Jirstrand M., Malmqvist J. (2021). Natural language processing methods for knowledge management – Applying document clustering for fast search and grouping of engineering documents // Concurrent Engineering Research and Applications. V. 29, no. 2. Pp. 142–152. https://doi.org/10.1177/1063293X20982973
8. Black M. (1955). Metaphor. Proceedings of the Aristotelian Society // New Series. V. 55. Pp. 273–29.
9. Bourdieu P. (2020). Habitus and Field: General Sociology. V. 2 (1982–1983). NJ: Wiley. 446 p.
10. Calambas M.A., Ordonez A., Chacon A., Ordonez H. (2015). Judicial precedents search supported by natural language processing and clustering // 10th Colombian Computing Conference, 10CCC (2015). Art. no. 7333448. Pp. 372–377. https://doi.org/10.1109/ColumbianCC.2015.7333448
11. Collins H., Evans R. (2007). Rethinking expertise. University Chicago: Chicago Press. 159 p.
12. Collyer F. (2011). Reflexivity and the sociology of science and technology: The invention of “Eryc” the antibiotic // Qualitative Report. V. 16, no. 2. Pp. 316–340.
13. Foucault M. (2002). Archaeology of knowledge. London New York: Routledge. 256 p.
14. Lakoff G., Johnson M. (1980). Metaphors we live by. Chicago: University of Chicago Press. 242 p.
15. Latour B. (1987). Science in action: how to follow scientists and engineers through society. Cambridge: Harvard University Press. Print.
16. Liu S., Emirbayer M. (2016). Field and ecology // Sociological Theory. V. 34, no. 1. Pp. 62–79.
17. Lyotard J.F. (1997). The postmodern condition. Minnesota: University of Minnesota. 144 p.
18. McDonald S.P., Kelly G.J. (2012). “Beyond argumentation: Sense-making discourse in the science classroom” // Perspectives on Scientific Argumentation: Theory, Practice and Research. V. 9789400724709. Pp. 265–281. https://doi.org/10.1007/978-94-007-2470-9_13
19. Merton R.K. (1979). The Normative Structure of Science // The Sociology of Science: Theoretical and Empirical Investigations. Chicago: University of Chicago Press. 636 p.
20. Schneider J.W. (2013). Caveats for using statistical significance tests in research assessments // Journal of Informetrics. V. 7, no. 1. Pp. 50–62.
21. Shutova E., Kiela D., Maillard J. (2016). “Black holes and white rabbits: Metaphor identification with visual features” // 2016 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, NAACL HLT 2016 – Proceedings of the Conference. Pp. 160–170. http://dx.doi.org/10.18653/v1/N16-1020
22. Spates James L. (1983). The sociology of values // Annual Review of Sociology. V. 9. Pp. 27–49.
23. Tao R., Wei Y., Yang T. (2021). Metaphor analysis method based on latent semantic analysis // Journal of Donghua University (English Edition). V. 38, no. 1. Pp. 83–90. http://dx.doi.org/10.1016/S1532-0464(02)00004-7
24. Young T., Hazarika D., Poria S., Cambria E. (2018). Recent trends in deep learning based natural language processing [Review Article] // IEEE Computational Intelligence Magazine. V. 13, no. 3. Art. no. 8416973. Pp. 55–75. https://doi.org/10.48550/arXiv.1708.02709
25. Zinnatullin V., Koledin S. (2020). Analysis of scientists work directions based on natural language processing and clustering // CEUR Workshop Proceedings. No. 2667. Pp. 57–61.
26. Žižek S., Damià A. (2020). Пандемия: Covid-19 сотрясает мир [Pandemia: la covid-19 estremece al mundo]. Barcelona: Editorial Anagrama. 120 p. (Исп. яз.).
Рецензия
Для цитирования:
Кашина М.А., Ткач С. Социология ценностей: опыт построения таксономии путем использования технологии анализа естественного языка. Цифровая социология/Digital Sociology. 2023;6(1):48-58. https://doi.org/10.26425/2658-347X-2023-6-1-48-58
For citation:
Kashina M.A., Tkach S. Sociology of values: experience of building a taxonomy by using natural language analysis technology. Digital Sociology. 2023;6(1):48-58. (In Russ.) https://doi.org/10.26425/2658-347X-2023-6-1-48-58