<?xml version="1.0"?>
<!DOCTYPE article
PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.4 20190208//EN"
       "JATS-journalpublishing1.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" article-type="research-article" dtd-version="1.4" xml:lang="en">
 <front>
  <journal-meta>
   <journal-id journal-id-type="publisher-id">Journal of sociological research</journal-id>
   <journal-title-group>
    <journal-title xml:lang="en">Journal of sociological research</journal-title>
    <trans-title-group xml:lang="ru">
     <trans-title>Журнал социологических исследований</trans-title>
    </trans-title-group>
   </journal-title-group>
   <issn publication-format="online">2500-0500</issn>
  </journal-meta>
  <article-meta>
   <article-id pub-id-type="publisher-id">113867</article-id>
   <article-categories>
    <subj-group subj-group-type="toc-heading" xml:lang="ru">
     <subject>Труды молодых ученых</subject>
    </subj-group>
    <subj-group subj-group-type="toc-heading" xml:lang="en">
     <subject>Works of young scientists</subject>
    </subj-group>
    <subj-group>
     <subject>Труды молодых ученых</subject>
    </subj-group>
   </article-categories>
   <title-group>
    <article-title xml:lang="en">Discourse of Russian sociology in Discourse of Russian sociology in 2020-2025:  a case study of scientific text mining scientific text mining</article-title>
    <trans-title-group xml:lang="ru">
     <trans-title>Дискурс российской социологической науки 2020-2025 гг. на примере интеллектуального анализа научных текстов</trans-title>
    </trans-title-group>
   </title-group>
   <contrib-group content-type="authors">
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Медведев</surname>
       <given-names>М. М.</given-names>
      </name>
      <name xml:lang="en">
       <surname>Medvedev</surname>
       <given-names>Maksim Maksimovich</given-names>
      </name>
     </name-alternatives>
     <email>maxim.med.2002@gmail.com</email>
     <xref ref-type="aff" rid="aff-1"/>
    </contrib>
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Бойченко</surname>
       <given-names>С. А.</given-names>
      </name>
      <name xml:lang="en">
       <surname>Boychenko</surname>
       <given-names>Sofya Andreevna</given-names>
      </name>
     </name-alternatives>
     <xref ref-type="aff" rid="aff-1"/>
    </contrib>
   </contrib-group>
   <aff-alternatives id="aff-1">
    <aff>
     <institution xml:lang="ru">Кубанский государственный университет</institution>
    </aff>
    <aff>
     <institution xml:lang="en">Kuban State University</institution>
    </aff>
   </aff-alternatives>
   <pub-date publication-format="print" date-type="pub" iso-8601-date="2026-03-03T12:15:40+03:00">
    <day>03</day>
    <month>03</month>
    <year>2026</year>
   </pub-date>
   <pub-date publication-format="electronic" date-type="pub" iso-8601-date="2026-03-03T12:15:40+03:00">
    <day>03</day>
    <month>03</month>
    <year>2026</year>
   </pub-date>
   <volume>11</volume>
   <issue>1</issue>
   <fpage>30</fpage>
   <lpage>39</lpage>
   <self-uri xlink:href="https://zh-szf.ru/en/nauka/article/113867/view">https://zh-szf.ru/en/nauka/article/113867/view</self-uri>
   <abstract xml:lang="ru">
    <p>В статье представлены результаты комплексного дискурс-анализа корпуса из 595 научных публикаций по социологии за 2020–2025 гг., отобранных в электронной библиотеке CyberLeninka. Цель исследования – диагностика текущего состояния, структурных особенностей и динамики тематических трендов в российской социологической науке  с применением количественных методов компьютерной лингвистики. Методология включает автоматический сбор данных, лингвистическую предобработку (лемматизация UDPipe), тематическое моделирование методом латентного размещения Дирихле (LDA) и анализ семантических связей на основе векторных представлений GloVe с последующей визуализацией семантических сетей. Результаты выявили устойчивое ядро дисциплинарного дискурса, сформированное теоретико-методологическими, историческими и образовательными понятиями. Динамический анализ показал значительный рост релевантности тем, связанных с управлением, цифровизацией, данными и технологиями, начиная с 2023 г. Ключевым выводом является обнаружение выраженного семантического разрыва между этим традиционным гуманитарным ядром и формирующимся кластером «Цифровизация и ИИ». Это свидетельствует о слабой концептуальной интеграции цифровых методов и проблематики в основной дискурс российской социологии, которая сохраняет преимущественно теоретико-рефлексивный характер. Исследование вносит вклад  в наукометрию и социологию знания, предлагая инструментарий для объективного картирования и рефлексии траекторий развития социальных наук в условиях цифровой трансформации.</p>
   </abstract>
   <trans-abstract xml:lang="en">
    <p>The article presents the results of a comprehensive discourse analysis of a corpus of 595 scientific publications in sociology from 2020–2025, selected from the CyberLeninka online library. The aim of the study is to diagnose the current state, structural features, and dynamics of thematic trends in Russian sociological science using quantitative methods of computational linguistics. The methodology includes automatic data collection, linguistic preprocessing (lemmatization using UDPipe), topic modeling via Latent Dirichlet Allocation (LDA), and analysis of semantic relationships based on GloVe word embeddings with subsequent visualization of semantic networks. The results revealed a stable core of disciplinary discourse formed by theoretical-methodological, historical, and educational concepts. Dynamic analysis showed a significant increase in the relevance of topics related to management, digitalization, data, and technologies starting from 2023. The key finding is the identification of a pronounced semantic gap between this traditional humanities core and the emerging «Digitalization and AI» cluster. This indicates a weak conceptual integration of digital methods and topics into the mainstream discourse of Russian sociology, which retains a predominantly theoretical-reflective character. The study contributes to scientometrics and sociology of knowledge by offering a toolkit for objective mapping and reflection on the development trajectories of social sciences in the context of digital transformation.</p>
   </trans-abstract>
   <kwd-group xml:lang="ru">
    <kwd>интеллектуальный анализ текста</kwd>
    <kwd>социология науки</kwd>
    <kwd>научные тексты</kwd>
    <kwd>цифровизация</kwd>
    <kwd>тематическое моделирование</kwd>
   </kwd-group>
   <kwd-group xml:lang="en">
    <kwd>text mining</kwd>
    <kwd>sociology of science</kwd>
    <kwd>scientific texts</kwd>
    <kwd>digitalization</kwd>
    <kwd>topic modeling</kwd>
   </kwd-group>
  </article-meta>
 </front>
 <body>
  <p> </p>
 </body>
 <back>
  <ref-list>
   <ref id="B1">
    <label>1.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Медведев М.М. Казачьи колыбельные песни: опыт классификации и обобщения этнографического материала методами интеллектуального анализа текста / М.М. Медведев, А.А. Сергеев // Голос минувшего. – 2024. – № 3. – С. 30–40. – EDN PBTAVZ. – URL: https://www.elibrary.ru/item.asp?id=PBTAVZ (дата обращения: 26.01.2026).</mixed-citation>
     <mixed-citation xml:lang="en">Medvedev M.M. Kazach'i kolybel'nye pesni: opyt klassifikacii i obobscheniya etnograficheskogo materiala metodami intellektual'nogo analiza teksta / M.M. Medvedev, A.A. Sergeev // Golos minuvshego. – 2024. – № 3. – S. 30–40. – EDN PBTAVZ. – URL: https://www.elibrary.ru/item.asp?id=PBTAVZ (data obrascheniya: 26.01.2026).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B2">
    <label>2.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Николина Н.В. Дискурс-анализ как рефлексивная практика в социологии научного знания / Н.В. Николина // Философия науки. – 2022. – № 3. – С. 12-20. – URL: http://vital.lib.tsu.ru/vital/access/manager/Repository/koha:000999554 (дата обращения: 26.01.2026).</mixed-citation>
     <mixed-citation xml:lang="en">Nikolina N.V. Diskurs-analiz kak refleksivnaya praktika v sociologii nauchnogo znaniya / N.V. Nikolina // Filosofiya nauki. – 2022. – № 3. – S. 12-20. – URL: http://vital.lib.tsu.ru/vital/access/manager/Repository/koha:000999554 (data obrascheniya: 26.01.2026).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B3">
    <label>3.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Рунаев Т.А. Интеллектуальный анализ текста в социальных науках: учебное пособие / Т.А. Рунаев; Министерство науки и высшего образования Российской Федерации, Кубанский государственный университет. – Краснодар: Кубанский гос. ун-т, 2024. – 127 с.</mixed-citation>
     <mixed-citation xml:lang="en">Runaev T.A. Intellektual'nyy analiz teksta v social'nyh naukah: uchebnoe posobie / T.A. Runaev; Ministerstvo nauki i vysshego obrazovaniya Rossiyskoy Federacii, Kubanskiy gosudarstvennyy universitet. – Krasnodar: Kubanskiy gos. un-t, 2024. – 127 s.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B4">
    <label>4.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Blei D.M. Latent dirichlet allocation / D.M. Blei, A.Y. Ng, M.I. Jordan // Journal of Machine Learning Research. – 2003. – Vol. 3. – P. 993–1022. – URL: https://www.jmlr.org/papers/volume3/blei03a/blei03a.pdf (дата обращения: 26.01.2026).</mixed-citation>
     <mixed-citation xml:lang="en">Blei D.M. Latent dirichlet allocation / D.M. Blei, A.Y. Ng, M.I. Jordan // Journal of Machine Learning Research. – 2003. – Vol. 3. – P. 993–1022. – URL: https://www.jmlr.org/papers/volume3/blei03a/blei03a.pdf (data obrascheniya: 26.01.2026).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B5">
    <label>5.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Grimmer J. Text as Data: The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts / J. Grimmer, B.M. Stewart // Political Analysis. – 2013. – Vol. 21, № 3. – P. 267–297. – DOI: https://doi.org/10.1093/pan/mps028. – URL: https://web.stanford.edu/~jgrimmer/tad2.pdf (дата обращения: 26.01.2026).</mixed-citation>
     <mixed-citation xml:lang="en">Grimmer J. Text as Data: The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts / J. Grimmer, B.M. Stewart // Political Analysis. – 2013. – Vol. 21, № 3. – P. 267–297. – DOI: https://doi.org/10.1093/pan/mps028. – URL: https://web.stanford.edu/~jgrimmer/tad2.pdf (data obrascheniya: 26.01.2026).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B6">
    <label>6.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Pennington J. GloVe: Global Vectors for Word Representation / J. Pennington, R. Socher, C.D. Manning // Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP). – 2014. – P. 1532–1543. – URL: https://aclanthology.org/D14-1162/ (дата обращения: 26.01.2026).</mixed-citation>
     <mixed-citation xml:lang="en">Pennington J. GloVe: Global Vectors for Word Representation / J. Pennington, R. Socher, C.D. Manning // Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP). – 2014. – P. 1532–1543. – URL: https://aclanthology.org/D14-1162/ (data obrascheniya: 26.01.2026).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B7">
    <label>7.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Straka M. UDPipe: Trainable Pipeline for Processing CoNLL-U Files Performing Tokenization, Morphological Analysis, POS Tagging and Parsing / M. Straka, J. Hajic, J. Strakova // Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016). – Portoroz, Slovenia, 2016. – P. 4290–4297. – URL: https://ufal.mff.cuni.cz/biblio/attachments/2016-straka-p4247732638960608255.pdf (дата обращения: 26.01.2026).</mixed-citation>
     <mixed-citation xml:lang="en">Straka M. UDPipe: Trainable Pipeline for Processing CoNLL-U Files Performing Tokenization, Morphological Analysis, POS Tagging and Parsing / M. Straka, J. Hajic, J. Strakova // Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016). – Portoroz, Slovenia, 2016. – P. 4290–4297. – URL: https://ufal.mff.cuni.cz/biblio/attachments/2016-straka-p4247732638960608255.pdf (data obrascheniya: 26.01.2026).</mixed-citation>
    </citation-alternatives>
   </ref>
  </ref-list>
 </back>
</article>
