Россия
В статье проанализированы основные положения и идеи учебного пособия «Обработка экспериментальных данных на ЭВМ» авторского коллектива (О.С. Логунова, П.Ю. Романов, Е.А. Ильина, Ю.Б. Кухта, Л.Г. Егорова). Показано многообразие разработанного авторами учебного материала в области теории обработки данных и практики её применения: модели данных и классификация задач обработки, способы представления и модели порождения экспериментальных данных, основные методы и средства автоматизации вычислительных процессов, используемых при обработке данных. Отмечена важность комплексного индивидуального задания и особенности последовательной реализации алгоритмов обработки при помощи универсального статистического пакета Statistica.
эксперимент, наблюдение, экспериментальные данные, алгоритмы обработки, программное обеспечение, статистические методы, пакет Statistica, погрешности, кластерный анализ, корреляционный анализ, регрессионный анализ, планирование эксперимента.
Результаты исследования в любых областях науки и промышленности имеют ценность, если они базируются на выводах, вытекающих из конкретных фактов. Анализ различных процессов и явлений, как правило, связан с необходимостью сбора исходных данных и их обработки. Основы такой деятельности закладываются у бакалавров и магистров в ходе получения высшего образования. В области обработки экспериментальных данных предлагается множество учебников, учебных пособий и других изданий, излагающих материал с различных точек зрения. Проведя сравнительную характеристику классической теории, практики её применения, научных публикаций, публицистики и учитывая их достоинства и недостатки, авторы создали учебное пособие, в котором в той или иной мере представлены все существующие виды изданий.
Материал, изложенный в пособии «Обработка экспериментальных данных на ЭВМ» предполагает, что обучающиеся уже знакомы с математическими основами теории вероятности и статистики и, кроме того, владеют навыками работы с вычислительной техникой и прикладным программным обеспечением. Каждая глава имеет однотипную структуру – сначала представлена теория, затем практика её применения, задания для индивидуальной работы и контрольные вопросы к главе. Для индивидуальной работы, которую студенты выполняют в виде лабораторных или практических заданий, авторы предлагают экспериментальные данные, характеризующие функционирование предприятия металлургической промышленности ОАО «Магнитогорский металлургический комбинат». Комплексное индивидуальное задание является отличительной особенностью учебного пособия. Экспериментальные данные определяются единственный раз на весь период изучения курса, затем для них выполняется последовательная реализация алгоритмов обработки при помощи универсального статистического пакета Statistica. Применяя данное пособие в процессе обучения, можно использовать и другие экспериментальные данные, и другие средства реализации этапов обработки, в частности электронные таблицы или математические пакеты.
В первой главе учебного пособия «Обработка экспериментальных данных на ЭВМ» дается определение понятиям «эксперимент» и «наблюдение», приводится классификация видов наблюдения [20, с. 14]. Авторы делают вывод, что полное и точное описание какого-либо процесса возможно лишь в том случае, если известны все факторы, влияющие на этот процесс, т.е. такое описание вообще невозможно. Рассмотрев несколько примеров, авторы характеризуют основные виды ошибок в экспериментальных исследованиях: по происхождению (личные, инструментальные, внешние, методические, ошибки модели, ошибки классификации) и по своему характеру (систематические или случайные). Приводится схема образования суммарной ошибки эксперимента [20,с. 17]. Здесь же определяются цели и основные задачи обработки экспериментальных данных (предварительная обработка, кластерный анализ, корреляционный анализ, регрессионный анализ данных). Большое внимание уделено практике постановки задачи экспериментальных данных для исследования металлургического производства, приводятся конкретные примеры (исследование процесса выплавки стали) и результаты выполнения задания. Материал изложен наглядно, в формате электронной презентации. Именно в первой главе определяются исходные данные, которые используются в дальнейшем при реализации всех этапов обработки.
Вторая глава пособия посвящена программному обеспечению для обработки экспериментальных данных. Дается характеристика модулей приложений: многомерная статистическая группировка объектов, расчет статистических характеристик групп, анализ эффективности структурных изменений, программа прогнозирования структуры, программа гармонического анализа временного ряда, индексный анализ по мультипликативной схеме и др. Для каждого модуля описаны исходные данные и основные результаты, которые он позволяет рассчитать. Наглядно представлена схема классификации программных модулей для обработки экспериментальных данных [20, с. 30] и инструментальные средства реализации этих основных модулей в пакете Statistica [20, с. 31]. Целый параграф посвящен современному средству добычи и обработки данных –технологии Data Mining (интеллектуального анализа данных). Авторы считают, что «…применяемые для него методы многочисленны, а преимущества, открываемые в результате выявления новых знаний, огромны» [20, с. 37]. Современные программные средства, например, универсальный пакет Statistica также реализует большинство методов Data Mining. Также во второй главе делается обзор рынка программных средств для обработки результатов наблюдения, приводятся примеры программных статистических комплексов отечественного и зарубежного производства. Большое внимание уделено средствам графической визуализации экспериментальных данных. В частности, характеризуются разнообразные виды графиков: секторные диаграммы, полосовые диаграммы, диаграммы фигур-знаков, картограммы, картодиаграммы. Для облегчения задач исследователя в практическом применении графиков разработаны специальные пакеты прикладных программ, наиболее распространенными являются Harvard graphics, Statgraf, Supercalc, Excel. Технология построения диаграмм в каждой программе имеет свои особенности. Так, визуализации результатов в пакете Statistica представлена группой инструментов, которые позволяют построить одномерные, двумерные, трехмерные и многомерные диаграммы, а в электронных таблицах построенные диаграммы размещаются в рабочей книге и группируются по виду[20, с. 44]. Практика в данной главе представлена графическим анализом данных процесса выплавки стали (конкретный пример, его реализация, результаты в виде диаграмм).
В третьей главе учебного пособия раскрываются основы автоматизации обработки данных средствами Visual Basic for Statistica (SVB), которые позволяют решать проблемы различных областей с различными видами исходных данных, что значительно раздвигает возможности пакета Statistica. Характеризуются основные способы построения процедур в SVB: запись макросов– макросанализа, мастер-макрос (Журнал), клавиатурный макрос; разработка процедур в среде SVB; использование программ, созданных на Visual Basic из других приложений. В отдельном параграфе авторы раскрывают понятия объект, свойства объекта, методы, приводят описание основных программных объектов SVB и часто используемых свойств для объектов Statistica 6.1 [20, с. 57]. Представлены также организация ввода-вывода информации средствами Visual Basic for Statistica и логические структуры SVB. Практика в этой главе подразумевает построение средствами SVB следующих процедур: создание новой таблицы заданной размерности, изменение размеров таблицы, построение простых статистик, организация доступа к данным в таблице результатов, вставка массива в электронную таблицу.
Четвертая глава пособия посвящена статистическим основам обработки экспериментальных данных. Здесь дается понятие случайной величины и ее распределения, абсолютных и относительных величин, характеризуются обобщающие статистические показатели и вариации экспериментальных данных. В отдельном параграфе приводится теория гипотез и критериев. Здесь речь идет о различных видах гипотез (статистической, конкурирующей, простой, сложной), их проверке, возникающих ошибках, даются понятия статистического критерия, области принятия гипотезы, критической области, критических точек и мощности критерия. Статистические критерии наглядно представлены в табл. 4.3.[20, с. 91]. Характеризуя законы распределения случайной величины, авторы подробно останавливаются на их различных видах: нормальном распределении, экспоненциальном, биномиальном, распределении Пуассона, гипергеометрическом, полиномиальном. Представлены графические окна пакета Statistica 6.0 с функциями плотности и распределения величин. Набольшее внимание уделяется закону нормального распределения, поскольку именно для него разрабатывались почти все известные методы обработки экспериментальных данных. Завершает главу практика оценки вида распределения для данных, полученных при исследовании процесса выплавки стали.
Дальнейший материал учебного пособия раскрывает и позволяет реализовать основные задачи обработки экспериментальных данных (предварительная обработка, кластерный анализ, корреляционный анализ, регрессионный анализ данных). В пятой главе излагаются цели и задачи предварительной обработки данных; характеризуются алгоритмы отсева грубых погрешностей экспериментальных данных: отсев по максимальному относительному отклонению и отсев по критерию Стьюдента; с помощью критериев согласия проверяется гипотеза о виде распределения экспериментальных данных. Среди множества методик, позволяющих определить вид закона распределения случайной величины, выделяются те, которые опираются на среднее абсолютное отклонение, критерий Пирсона и критерий Колмогорова-Смирнова. Наличие критериев согласия и указаний по отсеву грубых погрешностей позволило авторам сформулировать ряд алгоритмов для предварительной обработки данных, которые могут детализироваться в зависимости от поставленной задачи. Все алгоритмы представлены в виде блок-схем [20, с.113–114]. Практика применения изложенной теории для предварительной обработки данных при исследовании процесса выплавки стали осуществляется средствами пакета Statistica 6.1. Решение поставленной задачи рассматривается на примере работы конкретных студентов.
В шестой главе пособия представлен один из важных этапов обработки экспериментальных данных – кластерный анализ, его цели, задачи, виды процедур, результаты реализации процедур кластеризации. Процедуры распределяются по двум направлениям: иерархические классификации и неиерархические (структурные). Характеризуются наиболее популярные методы кластерного анализа, среди которых агломеративная процедура кластеризации по расстояниям, метод дендритов (метод вроцлавской таксономии), метод корреляционных плеяд, рассматриваются достоинства и недостатки представленных методов. Для оценки сходства элементов при кластерном анализе используют три типа мер: коэффициенты подобия, коэффициенты связи и коэффициенты расстояния. Авторы подробно описывают меры сходства признаков в общем наборе данных, приводят фрагменты вычислений коэффициентов, полученные результаты. Отдельный параграф посвящен реализации кластерного анализа в пакете Statistica, где процедуры кластеризации осуществляются в диалоговом режиме. Наглядно приводится пример диалога для выполнения кластеризации при иерархической кластеризации и кластеризации методом k-средних. Практика кластеризации экспериментальных данных рассматривается при исследовании процесса выплавки стали: рассчитываются меры сходства исходных данных, определяются коэффициенты подобия, для расчетов используются стандартные встроенные средства. Демонстрируется пошаговое выполнение кластеризации с указанием методов, промежуточных и итоговых результатов.
Седьмая глава учебного пособия посвящена множественному анализу экспериментальных данных. Представив этапы обработки данных в множественном анализе и сформулировав его требования, авторы останавливаются на множественном корреляционном анализе, определяют параметры эмпирических уравнений, характеризуют статистические показатели для оценки применимости построенной эмпирической модели. Приводятся алгоритмы для проверки критерия по каждому виду показателя: статистика Фишера, статистика Стьюдента, средняя относительная ошибка аппроксимации. Методы построения множественных нелинейных регрессий представлены тремя разновидностями – метод всех регрессий, метод исключения переменных, метод включения переменных [20, с. 193]. Описывая модели со структурными изменениями, авторы рассматривают положительные и отрицательные стороны как кусочно-линейных, так и кусочно-нелинейных моделей регрессии, отмечают особенности применения статистического теста Чоу. Раскрывается значение остатков при изучении результатов множественного регрессионного анализа. В завершение главы представлена практика проведения множественного анализа экспериментальных данных средствами Statistica 6.1, приводится технология построения множественной линейной и мультипликативной моделей для всех признаков, определенных в исходной задаче.
Понятие о планировании эксперимента и критериях оптимальности дается в восьмой главе пособия. Здесь представлена логика понимания того, что есть «хороший» эксперимент, приводятся примеры. Критерии оптимальности в планировании эксперимента разбиваются на статические и динамические. Характеризуются статистические критерии оптимальности планов, которые связаны либо с точностью оценок параметров, либо с ошибкой в оценке модели, раскрывается связь между критериями, представлены общие методы построения оптимальных планов. На практике показывается, какие эффективные средства планирования эксперимента включает в себя пакет Statistica.
Отмечая важность организации метрологического обеспечения современного производства, авторы акцентируют внимание на том, что применение конкретных методов контроля требует необходимых знаний в соответствующих областях техники, умения пользоваться статистическими методами и вычислительными средствами. В девятой главе учебного пособия представлена модель качества, раскрыт ее смысл. Характеризуется эффективная система методов контроля и анализа качества продукции: расслоение (стратификация), средства для сбора данных, средства для представления данных, диаграммы рассеивания, контрольные карты, анализ Парето, причинно-следственная диаграмма (рыбья кость Исикавы) [20, с. 245]. Все виды диаграмм, карт и таблиц могут быть выполнены с помощью статистических программных комплексов. Наглядно показано построение контрольных карт средствами пакета Statistica.
В завершение авторы излагают методические рекомендации по изучению модуля «Обработка экспериментальных данных на ЭВМ» для направления подготовки 09.00.00 Информатика и вычислительная техника. В частности, приводится почасовое распределение тем для аудиторных занятий, варианты заданий к практическим занятиям, рекомендации по организации текущего контроля знаний студентов. Также в конце пособия представлены приложения с разнообразным материалом – результаты наблюдений, полученных при изучении выплавки стали в условиях электросталеплавильного цеха, задания для проверки теоретических знаний у обучающихся, темы реферативных работ по курсу «Обработка экспериментальных данных на ЭВМ» и др. [20, с. 259].
Изложенный в учебном пособии материал позволяет студентам получить знания о моделях данных и классификации задач обработки, об основных методах и средствах автоматизации вычислительных процессов, используемых при обработке данных, о способах представления и модели порождения экспериментальных данных. Обучающиеся приобретают практические навыки использования моделей, методов и инструментальных программных средств анализа и обработки экспериментальных данных на ЭВМ, распространенных приложений, реализующих элементы обработки экспериментальных данных.
1. Абдуразаков М.М., Азиев Р.А., Романов П.Ю., Садыкова А.Р. Структура и содержание ИТ-компетентности учителя в сфере облачных технологий: сб. науч. тр. междунар. научно-практ. конф-ции (EEIA-2017). - М., 2017. - С. 417-425.
2. Васева О.Х., Мельник М.А. Особенности создания модели управленческого содействия педагогу в реализации инновационной деятельности образовательного учреждения // Традиционные национально-культурные и духовные ценности как фундамент инноваци-онного развития России. - Магнитогорск, 2017. - Т. 1. - № 11. - С. 35-39.
3. Васева О.Х. Создание современной образовательной среды в процессе обучения Web-технологиям // Журнал исследований по управлению. - М., 2018. - Т. 4. - № 3. - С. 31-37.
4. Гладышева М.М., Романов П.Ю. Моделирование системы формирования исследовательских умений будущих инженеров-программистов // Вестник Челябинского государственного педагогического университета. - Челябинск, 2007. - № 6. - С. 150-161.
5. Злыднева Т.П. Организация исследовательской деятельности студентов университета в процессе профессиональной подготовки: автореф. дис… канд. пед. наук - Магнито-горск:МаГУ, 2006. - 24 с.
6. Злыднева Т.П. Методика формирования компетенций при реализации ФГОС ВПО третьего поколения // Наука и образование в современном обществе: вектор развития: сб. науч. трудов Международной научно-практической конференции, часть 5. - М.: «АР-Консалт», 2014. - С. 91-94.
7. Злыднева Т.П. Операционные системы. Проблемно-информационный курс: методические рекомендации по изучению курса «Системное и прикладное программное обеспечение» - Магнитогорск: МаГУ, 2007. - 48 с.
8. Злыднева Т.П. Опытно-экспериментальная работа по организации исследовательской деятельности студентов в процессе изучения дисциплин информатики // Психология и педагогика: пути и методы развития: сб. статей III Междунар. науч.-практ.конф-ии - Пенза, 2011. - С. 53-57.
9. Злыднева Т.П. Роль учебно-исследовательской деятельности студентов в реализации ФГОС нового поколения // Физико-математические науки и образование: сб. тр.Всерос. науч.-практ.конф-ии. - Магнитогорск, 2012. - С. 22-24.
10. Исследовательский подход в теории и практике педагогического образования: монография / Т.Е. Климова, В.А. Беликов, П.Ю. Романов [и др.]. - Магнитогорск: МаГУ, 2004. - 360 с.
11. Кухта Ю.Б., Ильина Е.А. Использование программного модуля для оценки знаний студентов в процессе обучения. //Talimtexnologiyalari. - Ташкент - 2014. - №1. - С.72-75.
12. Логунова О.С., Егорова Л.Г., Ильина Е.А., Гладышева М.М., Аркулис М.Б., Посохов И.А., Мацко И.И. Визуализация результатов научной деятельности. - Магнитогорск, 2015. - 85 с.
13. Логунова О.С., Ильина Е.А. Тестовые задания по дисциплине «Обработка экспериментальных данных на ЭВМ. - Магнитогорск: МГТУ им. Г.И. Носова, 2007. - 12 с.
14. Логунова О.С., Ильина Е.А., Кирпичева Н.Т. Программирование на языке VisualBasicforApplication: учеб.пособие - Магнитогорск, МГТУ им. Г.И. Носова,, 2000. - 75 с.
15. Логунова О.С., Ильина Е.А., Кухта Ю.Б., Егорова Л.Г., Чистяков Д.В. Теория и практика обработки экспериментальных данных на ЭВМ. - Магнитогорск, 2015. - 2-е изд-е. - 276 с.
16. Логунова О.С., Ильина Е.А., Павлов В.В. Теория и практики обработки экспериментальных данных на ЭВМ: учеб.пособие.- Магнитогорск: МГТУ им. Г.И. Носова,, 2011. - 300 с.
17. Логунова О.С., Леднов А.В., Королева В.В. Результаты анализа публикационной активности профессорско-преподавательского состава ФГБОУ ВПО «Магнитогорский государственный технический университет им. Г.И. Носова». // Вестник Магнитогорского государственного технического университета им. Г.И. Носова. - 2014. - № 3. - С. 78-87.
18. Логунова О.С., Мацко И.И., Посохов И.А. Система интеллектуальной поддержки процессов управления производством непрерывнолитой заготовки. - Магнитогорск, 2013. - 175 с.
19. Логунова О.С., Филиппов Е.Г., Павлов И.В., Павлов В.В. Стратегия постановки задачи многокритериальной оптимизации состава шихтовых материалов для электродуговой сталеплавильной печи. // Известия вузов. Черная металлургия, 2013. - № 1. - С. 66-70.
20. Обработка экспериментальных данных на ЭВМ: учебник/ О.С.Логунова, П.Ю. Романов, Е.А.Ильина, Ю.Б.Кухта, Л.Г. Егорова - М.: ИНФРА-М, 2018. - 326 с.
21. Организация исследовательской деятельности в процессе обучения естественнонаучным дисциплинам в школе и вузе: монография / П.Ю. Романов, Т.П. Злыднева, Т.Е. Романова [и др.]. - М.: ИНФРА-М, 2017. - 260 с.
22. Павлов В.В., Логунова О.С. Опыт стабилизации остаточного содержания элементов в стали при использовании альтернативных материалов в металлошихте дуговой сталеплавильной печи. // Металлург, 2014. - № 4. - С. 75-79.
23. Посохов И.А., Логунова О.С., Аркулис М.Б., Белявский А.Б., Торчинский В.Е. Алгоритмы обработки изображений серных отпечатков в системе оценки качества непрерывнолитой заготовки.- Магнитогорск, 2017.- 131 с.
24. Программные статистические комплексы: учеб.пособие. / О.С.Логунова, Е.Г.Филиппов, В.В.Павлов и др. - М.: Академия, 2011. - 240 с.
25. Романов Е.П. Портал как средство реализации образовательных услуг в системе открытого образования // Методология и методика формирования научных понятий у учащихся школ и студентов вузов: тезисы докл. Х всероссийской науч.-практ. конф-ции. - Челябинск: ЧГПУ, 2003. - С. 64-65.
26. Романов Е.П., Романова M.B. Технология проектного обучения в образовательном учреждении// /Южно-Уральский педагогический журнал. - Магнитогорск, 2010. - № 1. - С. 172-180.
27. Романов П.Ю. Принципы организации исследовательской деятельности учащихся в системе непрерывного образования // Объединенный научный журнал. - М., 2001. - № 7 (7). - С. 39-43.
28. Романов П.Ю. Теория и практика формирования исследовательских умений в процессе математической подготовки студентов: учеб.пособие. - Магнитогорск: МаГУ, 2003. - 86 с.
29. Романов П.Ю. Технология воспитания педагога-исследователя в системе непрерывного образования // Научные труды МПГУ. Серия: Естественные науки. - М., 2001. - С. 290-294.
30. Романов П.Ю. Управление формированием исследовательских умений обучающихся в системе непрерывного педагогического образования // Государственная служба. Научно-политический журнал. - М.:, 2002. - № 6 (20). - С. 99-105.
31. Романов П.Ю. Формирование исследовательских умений обучающихся в системе непрерывного педагогического образования: автореф. дисс…. д-ра пед. наук. - Магнитогорск, 2003. - 47 с.
32. Романов П.Ю., Банникова Д.Д. Особенности формирования исследовательских компетенций школьников на уроках математики // Южно-Уральский педагогический журнал. - Магнитогорск, 2015. - № 2. - С. 63-67.
33. Романов П.Ю., Романова М.В., Романов Е.П. Модель процесса развития информационной компетентности студентов с использованием АРИЗ-метода // 3i: intellect, idea, innovation - интеллект, идея, инновация. - Костанай, 2016. - № 1. - С. 154-164.
34. Романов П.Ю., Романова Т.Е. Уравнение касательной к графику функции// Математика. Первое сентября. - 2001. - №16. - С.17-20.
35. Романов П.Ю., Романова Т.Е. Роль графической интерпретации результатов решения задач с параметрами в организации исследовательской деятельности учащихся // Современные проблемы обучения математике в школе / под ред. Е.И. Жилина. - Магнитогорск, 2000. - С. 84-90.
36. Романов П.Ю., Сайгушев Н.Я., Романова Т.Е., Милов Ю.Е. Формирование исследовательских умений обучающихся в условиях перехода на Госстандарт нового поколения // Мир науки, культуры, образования. - Горно-Алтайск, 2015. - №6(55) - С. 65-68.
37. Романов П.Ю., Токмазов Г.В. Формирование исследовательских умений в процессе решения дифференциальных уравнений // Вестник Магнитогорского государственного университета. - Магнитогорск, 2000.- № 1.- С. 156-159.
38. Романов П.Ю., Усанова О.А. Теоретические аспекты развития творческих способностей студентов высших учебных заведений // Южно-Уральский педагогический журнал. - Магнитогорск, 2015.- № 1(2). - С. 77-82.
39. Сафонов Д.С., Логунова О.С. Система синтеза и анализа проектных решений конструкции секций вторичного охлаждения машины непрерывного литья заготовок. - Магнитогорск, 2015. - 109 с.
40. Хабибуллин Д.А., Романов П.Ю. Ценностное отношение: подходы к исследованию // Вестник Челябинского государственного педагогического университета. - Челябинск, 2011. - № 12-2. - С. 173-183.
41. Abdurazakov M.M., Aziyeva J.H., Romanov P.Yu., SadykovaA.R..Teachers IT competence structure and content in the field of cloud computing // The European Proceedings of Social &Behavioural Sciences EpSBS. - FutureAcademy, 2017. - Volume XXVIII. - Pp. 1-8.
42. Egorova L.G., KukhtaYu.B. Technology of roll production for cold rolling of strip using elec-troslagremelting method. //The International Journal of Advanced Manufacturing Technology. - 2016. - Т. 86. - № 1-4. - С. 547-556.