ABOUT THE USE OF INTERNET RESOURCES FOR THE ANALYSIS AND CREATION OF EDUCATIONAL TEXTS AND ASSIGNMENTS (ON EXAMPLE OF PHYSICS AND ASTRONOMY)
Abstract and keywords
Abstract:
Of great practical importance is the problem of analyzing existing and creating new educational materials: texts, drawings, mental maps, diagrams, presentations, animations, various tasks, etc. In general, any teaching materials on physics and astron-omy can be reduced to a text containing a certain number of relevant concepts, princi-ples, laws, educational tasks, questions, etc. The article discusses the problem of analyz-ing educational texts and identifying their key characteristics, which is important for creating high-quality teaching materials and improving teaching methods. The purpose of the work is to explore the possibilities of online resources for analyzing educational texts, determining their parameters and creating new educational materials. The article considers online platforms that allow to automatically solve various problems automati-cally: from identifying the main concepts and thoughts in educational texts, establishing inter- and intra-subject connections to building semantic networks that show the con-nections between key concepts. Practical aspects of the use of neural network technolo-gies are discussed. The possibilities of artificial intelligence in creating educational ma-terials are analyzed, including optimal structuring of educational information, descrip-tion of experimental evidence of theories, solving qualitative and quantitative problems, obtaining a list of scientific concepts associated with this concept. Examples of queries to a neural network are presented. The article considers Internet resources that help to find the average length of words and sentences, evaluate the Flash readability index and Fog index, and calculate the structural complexity of a text.

Keywords:
astronomy, didactics, Internet, concept, neural network, learning, semantics, complexity, text, physics
Text
Text (PDF): Read Download

Введение

Работа учителя-исследователя часто требует анализа учебных материалов: текстов, рисунков, диаграмм, презентаций, анимаций, видеозаписей, списков вопросов, задач и т.д. Любой учебный материал – это многомерный информационный объект, характеризующийся целым множеством различных показателей. В общем случае он может быть сведен к тексту с рисунками и формулами, в котором представлены научные понятия, принципы, законы, учебные задачи, вопросы и т.д. Эти элементы связаны между собой логическими, ассоциативными, парадигматическими связями, образуя единую систему. Часто такой текст отражает содержание учебной дисциплины, определяет методику обучения, программирует учебно-познавательную деятельность обучаемых.

Анализ учебных текстов, выявление их основных характеристик является одной из важнейших проблем дидактики. Она непосредственно связана с созданием новых учебно-методических материалов, написанием учебников и совершенствованием методики обучения. Развитие Интернета и искусственного интеллекта, в частности нейросетей, открывает новые возможности в плане анализа и создания новых учебных материалов для школы и вуза.

Цель статьи: изучить и продемонстрировать некоторые возможности онлайн-ресурсов Интернета для анализа и создания учебных материалов (текстов) по физике и астрономии, путем выявления ключевых понятий, построения ментальных карт, семантических сетей и т.д. Методологической основой являются работы следующих учёных: Л. Я. Аверьянов [1], M. D. White & E. E. Marsh [16] (контент-анализ), Н. К. Андриевская [2], С. Х. Бермудес [5] (семантическая близость), Л. А. Артюшина [3] (семантические сети), Т. В. Батура [4], С. В. Ракитина [14] (семантический анализ и концептосфера текста), А. С. Ванюшкин и Л. А. Гращенко [6] (ключевые слова), Т. Н. Гнитецкая [8] (внутрипредметные связи), Р. В. Майер [10; 11] (сложность понятий и текстов), М. М. Косова и М. А. Зильберглейт [9] (описательная статистика учебных текстов), Ю. Н. Марчук [12], С. И. Монахов, В. В. Турчаненко, Е. А. Федюкова и Д. Н. Чердаков [13], C. D. Manning, P. Raghavan & H. Schütze [15] (компьютерная лингвистика).

Результаты исследования. К учебным материалам относятся учебные тексты, графики диаграммы, презентации, компьютерные анимации, учебные видеофильмы и т.д. Их содержание в конечном счёте может быть сведено к текстам в широком смысле слова. Рисунки, графики и диаграммы можно заменить их словесным описанием, осуществив вербальное кодирование [10; 11]. То же самое относится к компьютерным анимациям и видеофильмам: их содержание может быть представлено в виде текста. Поэтому проблема сводится к анализу существующих учебных текстов и/или к порождению новых учебных текстов, на основе которых будут созданы те или иные учебные материалы.

Для анализа текстов часто применяют следующие методы цифровой гуманитаристики: 1) выявление ключевых концептов и их частотный анализ [6]; 2) количественный контент-анализ [1; 16]; 3) тематическое моделирование; 4) семантический анализ [4; 13]; 5) определение семантического расстояния между терминами путем нахождения косинусной меры близости [2; 5]; 6) изучение семантического пространства текста [3; 14] и т.д. Их использование позволяет изучить особенности учебных текстов и их связи с другими текстами.

            Перечислим возможности, открывающиеся при анализе и создании учебных материалов по физике и астрономии с помощью ресурсов Интернета:

1. Поиск информации: Поисковые системы (Google, Yandex, DuckDuckGo и т.д.) быстро находят определения, формулы, примеры задач и их решений, теоретические рассуждения, объяснения экспериментов по любой теме.

2. Визуализация и моделирование: Интерактивные симуляции, 3D-анимации, компьютерные модели позволяют визуализировать физические и астрономические явления при различных параметрах системы, выполнять виртуальные эксперименты и анализировать их результаты. Это помогает формировать в сознании ученика чувственно-наглядный образ изучаемого объекта или явления: атома, молекулы или кристалла, распространения волны, диффузии, резонанса и т.д. Например, задавая время, долготу и широту наблюдателя, можно вывести на экран вид звездного неба или рассчитать положение планет относительно Земли и Солнца.

3. Использование графических калькуляторов (Desmos, GeoGebra и т.д.) позволяет получать графики функций, соответствующие изучаемым физическим явлениям, и анализировать их свойства.

4. Анализ и решение задач: Онлайн-калькуляторы и решатели задач (Wolfram Alpha, Symbolab и т.д.) вычисляют интегралы, решают дифференциальные уравнения, рисуют графики. Банки задач и тестов помогают проверять знания учеников и их навыки решения задач по различным темам физики и астрономии.

5. Организация и структурирование информации: Инструменты для ведения заметок (Evernote, OneNote и т.д.) позволяют создавать структурированные заметки по учебному материалу, добавлять изображения, ссылки на другие ресурсы. Сервисы для создания ментальных карт (MindMeister, XMind и т.д.) помогают визуализировать связи между различными научными понятиями и создавать наглядные схемы для лучшего понимания и запоминания материала.

6. Использование нейросетей для решения разнообразных задач, связанных с обучением. Нейросети ChatGPT, DeepSeek или Qwen обучаются на огромных объемах текстовых данных. При формировании ответа они анализируют определенные части текстов, учитывая контекст, выбирая слова и фразы, которые вероятнее всего соответствуют поставленной задаче. Затем осуществляется фильтрация, исключающая неправильные или нежелательные ответы.

Последний пункт рассмотрим подробнее. Нейросети помогают решить следующие задачи:

1. Выявление главных мыслей (тезисов) текста. Для этого в нейросеть необходимо загрузить текст параграфа и сделать запрос: «Выяви главные мысли текста». На выходе получается перечень основных идей, представленных в тексте.

2. Перечисление научных понятий, связанных с изучаемым понятием П. В запросе необходимо указать понятие П и потребовать перечислить научные понятия, связанные с ним ассоциативными или парадигматическими связями. Например: «Какие научные понятия ассоциируются с понятием «атом»?» Нейросеть перечисляет: 1) основные физические и химические понятия: химический элемент, молекула, валентность, электронная оболочка, орбиталь, ионизация, радиус атома, изотопы, масса атома, атомная структура; 2) ядерные и субатомные понятия: протон, нейтрон, электрон, ядро атома, спектральные линии, энергетические уровни, фотон, альфа-, бета- и гамма-излучение, ядерный магнитный резонанс, колебательная и вращательная энергия; 3) химико-биологические ассоциации: химическая реакция, ковалентная связь, ионная связь, металлическая связь, водородная связь, катализ, аллотропия, реакционная способность, растворимость. Ответ нейросети содержит определения перечисленных понятий.

3. Построение ментальной карты понятия. Для этого необходимо сделать запрос: «Построй ментальную карту понятия “Солнце”». Нейросеть выдает текстовый ответ, в котором указано центральное понятие “Солнце”, связанные с ним второстепенные понятия 2-ого уровня и связанные с ними понятия 3-ого уровня. Это позволяет построить для данного понятия ментальную карту радиально-иерархического типа (в центре – понятие “Солнце”, от него отходят радиальные отрезки). При необходимости уточнения отдельных пунктов, нейросети задают уточняющие вопросы.

4. Установление и конкретизация межпредметных и внутрипредметных связей между различными темами, параграфами, отдельными вопросами, задачами [8]. Запросы имеют вид: «В чем проявляются межпредметные связи между астрономией и физикой при изучении Солнечной системы? Чем обусловлена эта связь?» или «Чем обусловлена внутрипредметная связь между механикой и молекулярной физикой?»

5. Описание экспериментов или наблюдений, доказывающих данную гипотезу или теорию. Запрос может выглядеть так: «Опиши эксперимент, доказывающий существование релятивистского замедления времени». В результате нейросеть описывает опыт с атомными часами, облетающими Землю, или эксперимент с мюонами. Или другой пример: «Перечисли эксперименты, доказывающие частную теорию относительности». Нейросеть выдает список опытов (опыт Майкельсона–Морли, эксперименты с мюонами, опыт Хафеле–Китинга с атомными часами, работа ускорителей частиц, ядерные реакции, аннигиляция частиц, эксперименты с движущимися источниками света, синхротронное излучение частиц), сопровождая его необходимыми пояснениями.

6. Решение качественных и количественных физических задач. Нейросеть может помочь решить практически любую школьную задачу, например: «Ядро лития-7, захватывая протон, распадается на две альфа-частицы. Определить сумму кинетических энергий этих частиц. Кинетической энергией протона пренебречь». В запросе следует написать: «Реши задачу» и сформулировать условие. Также она может отвечать на качественные вопросы, например: «Объясни, как работает транзистор?» или «Во сколько раз изменится частота собственных колебаний колебательного контура, если ёмкость конденсатора уменьшить в 4 раза?».

7. Подбор вопросов по заданной теме. Запрос может выглядеть так: «Подбери вопросы для школьного урока физики по теме “Фотоэффект”». На выходе нейросети – список вопросов, среди которых: 1) вопросы для актуализации знаний и введения в тему; 2) вопросы для изучения и понимания явления фотоэффекта; 3) вопросы для закрепления и применения знаний. Тут же нейросеть выдаёт рекомендации: 1) разным ученикам задавайте вопросы разной сложности; 2) стимулируйте активное участие учеников в обсуждении; 3) используйте демонстрации, анимации и интерактивные симуляции для наглядного представления изучаемого явления; 4) обратите внимание на практическое значение фотоэффекта; 5) задавайте вопросы для проверки понимания материала учащимися.

8. Формулировка тем рефератов или докладов. Запрос для нейросети может выглядеть так: «Сформулируй темы рефератов по теме “Электромагнитные колебания”».

9. Перечисление всех научных понятий, встречающихся в тексте. Для этого необходимо в окно запроса скопировать текст параграфа учебника (его объём не может превышать 5000 символов) и сформулировать задание: «Перечисли встречающиеся научные понятия». В ответе нейросети появится список используемых понятий.

10. Упорядочивание и классификация понятий по сложности. Пример соответствующего запроса к нейросети может выглядеть так: «Даны научные понятия: вода, Луна, …, Вселенная. Разбей эти понятия на 6 категорий в зависимости от дидактической сложности (первая категория – самые простые, шестая категория – самые сложные)». Нейросеть, учитывая повседневную встречаемость перечисленных объектов и необходимость дополнительных знаний, абстрактных представлений о невидимых структурах, свойствах, процессах и взаимодействиях, классифицирует понятия по сложности [10]. Получается так: 1) вода, корова, муха, рука, сердце, туча; 2) Земля, Луна, Солнце; 3) звезда, мозг, планета, Солнечная система; 4) атом, галактика, Вселенная, клетка, молекула, электрон, ядро атома; 5) белый карлик, ДНК, нейтрино, нейтрон, протон; 6) кварк, пульсар. Эти результаты можно использовать для оценки дидактической сложности учебных текстов [11].

11. Определение семантической близости между понятиями в небольшом тексте. Если в окно запроса загрузить текст и поставить задачу «Вычисли косинусную меру близости между ключевыми понятиями, входящими в текст», то нейросеть выдаст таблицу семантической близости между ключевыми понятиями. На её основе можно проанализировать семантическое пространство текста [3; 14].

Кроме перечисленных выше проблем, он-лайн ресурсы Интернета позволяют решить следующие задачи:

1. Выявление ключевых концептов параграфа (раздела, курса). Ключевыми называются концепты, усвоение которых имеет определяющее значение для понимания текста в целом. Они, как правило, чаще других упоминаются в учебном материале, активно используются при рассмотрении различных вопросов, имеют большое количество однокоренных слов и связей с другими понятиями. Например, часто встречающиеся в учебнике астрономии слова «звездный», «квазизвездный», «межзвездный», «протозвезда», «созвездие» относятся к одному концепту «звезда».

Чтобы выделить ключевые концепты, используют Интернет-ресурс advego.com. Текст загружают в специальную форму и запускают процесс. На выходе получается список всех входящих в текст слов с указанием частот употребления. С помощью Word его упорядочивают по алфавиту и выделяют часто используемые однокоренные понятия, выявляют ключевые концепты и вычисляют суммарное количество их употреблений. Ресурс обрабатывает тексты объемом не более 100000 символов, поэтому тексты учебников приходится анализировать по частям, а потом объединять в один файл.

2. Построение «облака слов» анализируемого текста. В качестве примера рассмотрим ключевые понятия школьного учебника «Астрономия» (авторы И. В. Галузо, В. А. Голубев, А. А. Шимбалёв) [7], электронную версию которого можно найти в Интернете. Описанным выше способом были выявлены 42 ключевых понятия Пi и установлены их количества ni: 1) Звезда (1038); 2) Солнце (740); 3) Земля (531); 4) Планета (392); 5) Галактика (286); 6) Небо (284); 7) Свет (255); 8) Тело (248); 9) Луч (240); 10) Масса (238) и т.д. Затем был создан текстовый файл, в котором ключевые концепты перечислены ni раз. С помощью он-лайн платформы Voyant-tools.org было получено облако слов, представленное на рис. 1; размер шрифта пропорционален частоте употребления термина.

Рис. 1. Облако научных понятий, входящих в учебник астрономии [7].

3. Построение семантической сети. Еще один метод заключается в определении семантического расстояния между ключевыми терминами дисциплины и построении семантической сети – графа, показывающего связи между ними. Допустим, нас интересует система формульных знаний школьного курса физики, объединяющая в себе 148 формул. Применяют следующий алгоритм: 1) из учебника выписывают все основные формулы, обведённые в рамку или выделенные жирным шрифтом; 2) формулы кодируют словесным кодом, заменяя буквы названиями соответствующих физических величин:  – «энергия магнитного поля равна индуктивность катушки умножить на силу тока в квадрате делить на число»; 3) создают текстовый файл, содержащий закодированные формулы; 4) удаляют слова, обозначающие математические операции: «равно», «сложить», «вычесть», «делить», «возвести в квадрат», «извлечь корень» (если это не сделать, то в семантической сети появятся вершины, соответствующие этим понятиям); 5) с помощью онлайн-ресурса https://nocodefunctions.com создают семантическую сеть из физических понятий, составляющих «формульные» знания.

Чтобы на последнем этапе программа лучше отличала понятия, входящие в одну формулу от понятий из другой, описания формул оформляют в виде отдельных предложений, а между ними вставляют последовательность из 10-12 стоп-слов (например, «однако»), на которые программа не реагирует и не включает их в семантическую сеть. В настройках следует выбрать опции: 1) учитывать слова из 3 и более букв (чтобы не потерять понятия «ток», «газ»); 2) исключить слова, встречающиеся 1 раз; 3) максимальная длина n-grams – одно слово.

Применение рассмотренного выше метода позволило получить семантическую сеть для понятий, составляющих систему формульных знаний (СФЗ) всего школьного курса физики (рис. 2). Граф состоит из 119 вершин (понятия, упоминаемые только один раз, не учитывались), между ними 457 связей. Получившиеся  15 кластеров показаны разными цветами. Размер кружков (вершин) пропорционален частоте упоминания понятий; ширина изогнутых линий, пропорциональна силе связей. Видно, что ядро семантической сети для СФЗ образовано следующими понятиями: частица, тело, масса, расстояние, скорость, сила, вектор, энергия, заряд, сила тока, колебания, поле.

Рис. 2. Семантическая сеть из понятий, входящих в СФЗ.

 

Визуализация семантического пространства «формульных» знаний позволяет по-новому взглянуть на их структуру, выявить скрытые взаимосвязи между различными концептами. Это способствует более глубокому пониманию структуры ментального пространства «идеального ученика» (то есть ученика, запоминающего всю сообщаемую информацию). В ментальном пространстве реального ученика некоторые вершины и связи представлены слабее или отсутствуют, что затрудняет усвоение новых знаний.

4. Определение структурной сложности текста и его читабельности, исходя из средних длин слов и предложений. Для вычисления индекса удобочитаемости Флеша и индекса туманности Фога в режиме онлайн можно использовать сайт https://sd1.su/online-service/text-index.php. При загрузке этой страницы появляется окно, в которое следует поместить текст и нажать на кнопку «Получить индексы». На экране появляются текстовые показатели: индексы Флеша и Фога, количество предложений, количество слов, количество слогов, количество символов, среднее количество слов в предложении , среднее количество слогов в словах . Последние два показателя позволяют вычислить структурную сложность текста:  [10; 11]. Аналогичным образом работает онлайн-платформа RuLingva (https://rulex.kpfu.ru/analysis).

Заключение. Современные технологии (Интернет + искусственный интеллект), предоставляют уникальные возможности для анализа существующих и создания новых учебных материалов. Они позволяют автоматически решать следующие задачи: 1) выявление ключевых концептов параграфа (раздела, курса); 2) построение семантических сетей текста; 3) выявление главных мыслей учебного материала; 4) получение списка научных понятий, ассоциативно или парадигматически связанных с данным понятием П; 5) оказание помощи в построении ментальной карты понятия; 6) установление и конкретизация межпредметных и внутрипредметных связей между различными темами, параграфами, вопросами и т.д.; 7) описание и объяснение экспериментов или наблюдений, доказывающих рассматриваемую теорию; 8) формирование ответов на качественные вопросы; 9) решение физических задач. Статья содержит конкретные примеры использования различных он-лайн платформ для анализа учебных текстов.

References

1. Aver'janov L. Ja. Kontent-analiz: monografija. M.: RGIU, 2007. 286 p.

2. Andrievskaja N. K. Gibridnaja intellektual'naja mera ocenki semantiche-skoj blizosti // Problemy iskusstvennogo intellekta. 2021. № 1. P. 4-17.

3. Artjushina L. A. Metody predstavlenija informacii v prostyh se-manticheskih setjah // Nauchno-tehnicheskij vestnik informacionnyh tehnologij, mehaniki i optiki. 2020. T. 20, № 3. P. 382-393.

4. Batura T. V. Semanticheskij analiz i sposoby predstavlenija smysla teksta v komp'juternoj lingvistike // Programmnye produkty i sistemy. 2016. № 4. P. 45-57.

5. Bermudes S. H. Metod izmerenija semanticheskogo shodstva tekstovyh dokumentov // Izvestija JuFU. Tehnicheskie nauki. 2017. № 3. P. 17-29.

6. Vanjushkin A. S., Grashhenko L. A. Metody i algoritmy izvlechenija klju-chevyh slov // Novye informacionnye tehnologii v avtomatizirovannyh siste-mah. 2016. № 19. P. 85-93.

7. Galuzo I. V. Astronomija: ucheb. dlja 11-go kl. uchrezhdenij obshh. sred. ob-razovanija s rus. jaz. obuchenija / I. V. Galuzo, V. A. Golubev, A. A. Shimbaljov. – Minsk: Adukacyja і vyhavanne, 2015. 224 p.

8. Gniteckaja T. N. Osnovy teorii vnutripredmetnyh svjazej // Fizicheskoe obra-zovanie v vuzah. 1999. № 2. P. 23-39.

9. Kosova M. M., Zil'berglejt M. A. Opisatel'naja statistika uchebnyh tekstov po fizike // Trudy Belorusskogo gosudarstvennogo tehnologicheskogo universiteta. Serija 6. Fiziko-matematicheskie nauki i informatika. 2006. № 14. P. 167-170.

10. Mayer R. V. Slozhnost' uchebnyh ponjatij i tekstov: monografija. Gla-zov: GIPU, 2024. 132 p.

11. Mayer R. V. Didakticheskaja slozhnost' uchebnyh tekstov i ejo ocenka: monografija. Glazov: GGPI, 2020. 149 p.

12. Marchuk Ju. N. Komp'juternaja lingvistika: ucheb. posobie. M.: AST; Vos-tok-Zapad, 2007. 317 p.

13. Monahov S. I. Analiz terminologii v sovremennyh shkol'nyh uchebni-kah metodami komp'juternoj lingvistiki // S. I. Monahov, V. V. Turchanenko, E. A. Fedju-kova, D. N. Cherdakov / Informatizacija obrazovanija i metodika jelek-tronnogo obuchenija. P. 209-215.

14. Rakitina S. V. Konceptosfera i semanticheskoe prostranstvo nauchnogo tek-sta // Al'manah sovremennoj nauki i obrazovanija. 2009. № 8-1. P. 125-126.

15. Manning C. D., Raghavan P., Schütze H. An Introduction to Information Re-trieval. Cambridge University Press. 2008. 520 p.

16. White M. D., Marsh E. E. Content analysis: A flexible methodology // Li-brary trends. 2006. Vol. 55, № 1. P. 22-45.

Login or Create
* Forgot password?