Saint-Petersburg, St. Petersburg, Russian Federation
Saint-Petersburg, St. Petersburg, Russian Federation
Saint-Petersburg, St. Petersburg, Russian Federation
UDK 159.9 Психология
A method for determining the parameters of a fuzzy discriminant function from a set of diagnostic test results is considered. These tests are the basis of the training sample for controlling the level of knowledge in nominal rating scales in automated learning systems. The fuzziness of measuring the results of solving control problems, as well as the classification of objects in the training sample, is taken into account. The method has a specific versatility and allows building similar diagnostic procedures for objects of different physical nature.
aggregation, discriminant function, training sample, distribution density, fuzzy sets, membership function
Введение
В основу одного из методов построения агрегированной (обобщенной) оценки знаний обучающихся [10] для случая, когда внешний критерий представлен в шкале наименований (оценки «сдал – не сдал», «Удовлетворительно – неудовлетворительно» и т. д.), может быть положен дискриминантный (числовой) анализ (ДА). Достоинством этого метода оценки знаний является то, что он позволяет сузить до минимума множество причинно-следственных связей в анализе результатов контроля знаний обучающихся, представляя их в номинальной шкале оценок, а также дает возможность достаточно просто оценить достоверность модели.
Исходные данные для процедур ДА включают в себя количественные значения результатов решения контрольных задач, необходимых для оценки уровня подготовки обучающихся. Работа педагогов-экспертов в этом случае заключается в формировании достаточного, для оценки знаний, множества результатов выполнения контрольных задач, представляемых как результаты сравнения образов. В работу экспертов входит, также, формирование и классификация обучающей выборки (ОВ) (внешнего критерия оценки знаний), на основе анализа которой осуществляется построение дискриминантной функции. Важным условием применения дискриминантного анализа в обработке результатов контроля знаний является условие (гипотеза) нормального распределения результатов решения контрольных задач в исследуемой группе обучающихся, а также допустимость перевода линейной свертки результатов оценки в интегральный показатель.
Метод расчета коэффициентов дискриминантной функции (ДФ) по обучающей выборке достаточно полно отражены в целом ряде исследований [1, 2, 3]. Однако в основе этих методик построения ДФ принято, что данные обучающей выборки не содержат элементов неопределенности. В действительности же нет более неопределенного объекта изучения, чем оценка знаний. Трудности в оценке знаний обучающихся указаны в работах [4, 5] и определяются следующими факторами:
а) сложность внутренней структуры знаний, характеризующейся большой размерностью, иерархичностью и многообразием неявно выраженных связей между элементами структуры личностных и профессиональных качеств обучающегося;
б) неоднозначность связей между свойствами личности обучающегося и способами их выражения в сфере конкретных знаний;
в) необходимость адекватного восприятия личности обучающегося преподавателем;
г) открытость системы измерения, которая подвержена воздействию комплекса физических, психологических и социологических факторов.
Перечисленные факторы приводят к неопределенности: как результатов самих измерений, так и делаемых по этим результатам выводов. Причем, неопределенность оценок знаний обучающегося в силу указанных выше факторов носит существенно нестатистический характер, т. е. проявляется в оценках экспертов и результатах принятия решений нечетко [6, 7].
В этом случае язык традиционной математики становится недостаточно гибким для моделирования подобных сложных систем, так как в нем нет средств достаточно адекватного описания понятий, которые имеют неопределенный и в общем случае нечеткий смысл [6 –11]. Отсутствие таких математических средств отражения нечеткости исходной информации в обучающей выборке (ОВ) определило необходимость разработки метода нечеткого дискриминантного анализа.
Предлагаемый ниже в статье материал содержит две части. В первой – схематично излагается содержание метода дискриминантного анализа знаний обучающихся в условиях наличия четкой исходной информации, а во второй – рассматриваются особенности учета нечеткости в составе ОВ при определении параметров ДФ.
1. Оценка знаний обучающихся методом дискриминантного анализа в условиях
наличия четкой исходной информации
Процесс формирования дискриминантной функции удобно рассматривать в виде отдельных этапов:
1) формирование ОВ;
2) нормирование значений индикаторов, измеряемых в процессе тестирования;
3) классификация ОВ;
4) определение коэффициентов значимости дискриминантной функции.
Рассмотрим их более подробно.
Этап I. Формирование обучающей выборки.
ОВ представляется в виде таблиц (таблица 1), количество столбцов
В этом случае варьирование может осуществляться на основе предположения о равномерной плотности распределения значений исследуемых индикаторов в пределах
от
Заметим, что указанная величина существенно меньше того, что необходимо для регрессионного анализа.
Этап 2. Нормирование значений индикаторов
В зависимости от типа измеряемого индикатора знаний и характера его влияния на интегральную (агрегированную) оценку используется либо линейное, либо квадратичное нормирование [1, 2].
При линейном нормировании
|
В случае противоположного влияния индикатора знания на оценку качества усвоения, его нормированное значение будет иметь вид:
|
Квадратичное нормирование осуществляется на основе расчета уравнения вида:
|
удовлетворяющего условиям [2]:
|
|
где
Совместное решение этих уравнений дает возможность получить коэффициенты нормирования:
|
где
Величина
|
Применение линейного нормирования значений
Этап 3. Классификация обучающей выборки.
Суть классификации ОВ заключается в отнесении каждого
Этап 4. Определение коэффициентов значимости дискриминантной функции.
Все методы вычисления весовых коэффициентов ДФ можно разбить на три
группы [1, 2]: рекуррентные, нерекуррентные и смешанные. Наиболее широкое распространение получили рекуррентные методы оценки. При их применении вектор оценок
В работах [1, 2] предложен простой способ определения коэффициентов ДФ, суть которого состоит в представлении вектора состояния
В этом случае дискриминантная функция будет определяться на основе следующего выражения:
где
|
Вспомогательные функции
f1 (y) = H0 (y1) · H (y2) = 1; f2 (y) = H1 (y1) · H0(y2) = 2 y1; f3 (y) = H0 (y1) · H1(y2) = 2 y2; f4 (y) = H1 (y1) · H1(y2) = 4y1 · y2 .
|
Обычно рассматривают нормированную дискриминантную функцию:
|
(3) |
где
Критерием соответствия найденной дискриминантной функции в обучающей выборке является выполнение неравенства:
|
(4) |
где
По мере изменений требований к знаниям обучающихся необходимо изменять состав и структуру обучающей выборки. Признаком, определяющим необходимость пересчета ДФ, может служить нарушение неравенства (4). В этом случае пересчет ДФ осуществляется на основе новой обучающей выборки.
Определенные таким образом значения ДФ представляют собой линейную модель свертки важных для данной области анализа параметров. Если в этом классе диагностических процедур произвести расчет ДФ для двух обучающихся (не обязательно из состава ОВ), то по величинам ДФ можно судить, например, о степени соответствия их знаний требованиям профессиональной деятельности.
Рассмотрим пример агрегирования оценок обучающихся с помощью дискриминантных функций на основе применения номинальной шкалы оценок. Допустим, что в качестве значимых параметров знаний обучающихся экспертами-педагогами выбраны три
параметра
Уровень знаний обучающихся будет тем выше, чем больше значения параметров
и
Следует обратить внимание, что такое число вариантов сочетаний отвечает неравенству (1).
В результате классификации ОВ первые пять реализаций параметров отнесены
к первому классу
Используя формулы (2) и (3), находим нормированные значения весовых коэффициентов дискриминантной функции:
Тогда значение дискриминантной функции для данной области (темы, курса, предмета) знаний будет:
Таблица 1.
Обучающая выборка
Table 1.
Training sample
Номер варианта ОВ |
Числовые значения измеряемых |
Нормированные значения индикаторов |
||||
х1 |
х2 |
х3 |
y1 |
y2 |
y3 |
|
|
0,87 |
0,2 |
0,6 |
0,8 |
0,75 |
0,56 |
0,84 |
0,1 |
1,0 |
0,6 |
1,0 |
1,0 |
|
0,81 |
0,2 |
0,9 |
0,4 |
0,75 |
0,89 |
|
0,9 |
0,3 |
0,7 |
1,0 |
0,5 |
0,67 |
|
0,87 |
0,1 |
0,8 |
0,8 |
1,0 |
0,78 |
|
|
0,81 |
0,3 |
0,1 |
0,4 |
0,5 |
0 |
0,75 |
0,4 |
0,2 |
0 |
0,25 |
0,11 |
|
0,78 |
0,3 |
0,5 |
0,2 |
0,5 |
0,44 |
|
0,84 |
0,4 |
0,3 |
0,5 |
0,25 |
0,22 |
|
0,75 |
0,5 |
0,4 |
0 |
0 |
0,33 |
В соответствии с (4) для десяти реализаций ОВ значения ДФ будут равны:
Так как
Найденная дискриминантная функция определяет параметры разделяющей плоскости номинальной шкалы оценок во множестве результатов выполнения контрольных заданий.
В ее структуре отражены результаты экспертизы знаний обучающихся экспертами-педагогами. Далее эта модель может быть использована педагогами, уровень квалификации которых в данной области знаний может быть ниже квалификации экспертов, что является достоинством подобного вида моделей.
С целью проверки значимости модели агрегирования оценок знаний обучающихся необходимо систематически обновлять состав ОВ в соответствии с изменениями требований к знаниям обучающихся в данном виде деятельности. Значимость модели агрегации в этом случае, аналогично, как и в примере, будет проверяться по результатам выполнения неравенства (4).
Допустим теперь, что необходимо по найденной модели оценить степень соответствия требованиям профессиональной деятельности уровня подготовки двух обучающихся, нормированные значения измеряемых результатов, выполнения заданий которых представлены в таблице 2. Здесь же в таблице приведены расчетные значения ДФ.
Таблица 2.
Результаты выполнения заданий обучающимися
Table 2.
Results of completing tasks by students
Обучаемыe |
Нормированные значения параметра |
Значения ДФ |
||
y1 |
y2 |
y3 |
||
1-й обучающийся
2-й обучающийся |
0,6
0,4 |
0,5
1,0 |
0,67
0,56 |
0,59
0,65 |
Как видно из таблицы 2, как первый, так и второй обучающиеся оцениваются положительно. Однако уровень знаний второго обучающегося выше, чем первого. В случае использования порядковой шкалы (например, l- балльной) оценки знаний обучающихся таких дискриминантных функций должно быть l. При этом каждая из ДФ рассчитывается по отдельной обучающей выборке, а оценка знаний будет определяться максимальным значением балла l*, при котором ДФ еще положительна. Таким образом, осуществляется переход от номинальной шкалы к порядковой шкале оценок.
Рассмотрим теперь, каким образом в ранках дискриминантного анализа осуществляется учет нечеткости исходной информации.
2. Применение нечеткого дискриминантного анализа в оценках знаний обучающихся
В процедурах формирования номинальных шкал нечеткость проявляется в итогах измерения результатов решения контрольных задач и в классификации различных их сочетаний в обучающей выборке. Например, первый вариант
Если теперь произвести расчет дискриминантных функций для каждого
где
Таким образом, последовательно выделяя варианты
где
Рассмотрим теперь, как определенное таким образом семейство дискриминантных функций используется для оценки знаний обучающихся. Причем измерение отдельных параметров осуществляется нечетко с функцией принадлежности, равной
где
Возможно два случая соотношений параметров:
а)
б)
B общем случае интервал изменений НДФ может принадлежать как положительной, так и отрицательной областям ее изменений, отражая, тем самым, неопределенность в оценке знаний обучающегося. Принятие решения в такой ситуации осуществляется на основе сравнения взвешенных числовых значений НДФ отрицательной и положительной области, т.е. производится проверка следующего неравенства:
где
Таким образом, уменьшение четкости оценок качества деятельности обучающегося приводит к появлению интервальных оценок коэффициентов нормированной дискриминантной функции. Причем, чем меньше четкость оценок, тем шире эти интервалы, тем более размыта оказывается ДФ, и тем более неопределенна и неоднозначна оценка знаний.
Рассмотрим теперь, каким образом можно определить функцию принадлежности
нечеткого множества, приведенное в работах [6, 8]. В соответствии с этим определением получим:
где
Математические основы дискриминантного анализа позволяют принять условие, что функция
Количество
где
Заметим, что в том случае, если все производимые измерения и принимаемые решения четки, то
Число вариантов может быть сокращено, если принять условие, что функция принадлежности каждого
Рассмотрим пример практической реализации метода. В качестве исходных данных примем данные предыдущего примера (таблица 1) дискриминантного анализа, но будем полагать, что классификация ОВ осуществляется экспертами нечетко. Результаты классификации ОВ представлены в таблице 3.
Таблица 3.
Результаты классификации ОВ
Table 3.
Results of classification of the training sample
Номера обучаемых |
Оцениваемые параметры |
||||
y1(Х1) |
y2 |
y3 |
|
|
|
1 2 3 4 5 6 7 8 9 10 |
0,87 0,84 0,81 0,9 0,87 0,81 0,75 0,78 0,84 0,75 |
0,2 0,1 0,2 0,3 0,1 0,3 0,4 0,3 0,4 0,5 |
0,6 1,0 0,9 0,7 0,8 0,1 0,2 0,5 0,3 0,4 |
0,8 1 1 1 1 - 0,3 0,4 - - |
0,2 - - - - 1 0,7 0,6 1 1 |
Верхние и нижние пределы допусков измеренных параметров равны:
Нормированные значения параметров обучающей выборки вычисляются по аналогии с предыдущим примером. Для выявления всех возможных вариантов формирования обучающих выборок примем условие, что
Результаты расчетов коэффициентов ДФ для каждого варианта и их функции принадлежности
Допустим, что с помощью построенной системы дискриминантного анализа необходимо оценить уровень знаний обучающегося. На основе предварительного анализа были определены нормированные значения результатов выполнения им контрольных заданий
В том случае, если представление о необходимом уровне знаний обучающихся изменяется вследствие изменения требований к ним, то дискриминантная функция должна быть определена на основе новой обучающей выборки. Признаком необходимости пересмотра состава обучающей выборки является нарушение неравенства (4). Так как подобные изменения в течение всего жизненного цикла обучающей системы возникают относительно редко, то рассчитанная дискриминантная функция может быть использована в течение продолжительного промежутка времени. При этом в рамках этого метода представляется возможным учесть широкий спектр разнообразных факторов, определяющих условия их реальной деятельности.
Таблица 4.
Результаты расчета вариантов ОВ
Table 4.
Results of calculation of training sample variants
Номер варианта |
Состав ОВ |
|
|
|
|
|
|
1 2 3 4 5 6 |
1,2,3,4,5 1, 2, 3, 4, 5, 7 1, 2, 3, 4, 5, 7, 8 2, 3, 4, 5, 7, 8 2, 3, 4, 5, 8 2, 3, 4, 5 |
6, 9, 10, 7, 8 6, 9, 10, 8 6, 9, 10 1, 6, 9, 10 1, 6, 9, 10, 7 1, 6, 9, 10, 7, 8 |
0,6 0,2 0,3 0,2 0,2 0,2 |
Таблица 5.
Функции принадлежности вариантов ДФ
Table 5.
Membership functions of discriminant function variants
Номер обучающей выборки |
Функция принадлежности |
Коэффициенты ДФ |
||
|
|
|
||
1 2 3 4 5 6 |
0,6 0,2 0,3 0,2 0,2 0,2 |
0,31 0,15 0,28 0,25 0,16 0,45 |
0,33 0,2 0,25 0,35 0,14 0,13 |
0,36 0,16 0,35 -0,2 -0,23 -0,28 |
Вместе с тем, дискриминантный анализ может найти широкое применение в процедурах анализа состояния объектов различной физической природы, в том числе и сложных технических систем, для которых наиболее важным его результатом является принятие решения о возможности или невозможности его дальнейшей эксплуатации.
В этом случае наличие рассчитанных параметров дискриминантной функции позволяет принять решение исходя из простых расчетов, не требующих глубоких знаний эксплуатационных характеристик объекта.
1. Anderson T. Introduction to a Multivariate Statistical Analysis. Moscow: Fizmatgiz; 1963. 500 p.
2. Malinovsky L.G. Classification of Objects by Means of Discriminant Analysis. Moscow: Nauka; 1979. 260 p.
3. Aven P.O. Construction of an Integral Exponent in Criterion Space. Automation and Remote Control. 1985;4:87-91.
4. Bespalko V.P., Tatur Yu.G. Systematic and Methodological Support of the Educational Process of Training Specialists. Moscow: Vysshaya Shkola; 1989. 141 p.
5. Mikoni S.V., Sokolov B.V., Yusupov R.M. Qualimetry of Models and Polymodal Complexes. Moscow: RAN; 2018. 314 p.
6. Zaichenko Yu.P. Fuzzy Models and Methods in Intelligent Systems. Kaliningrad: Slovo; 2008. 344 p.
7. Kozlov V.N. System Analysis, Optimization and Decision Making. Moscow: Prospekt; 2014. 176 p.
8. Orlovsky S.A. Problems of Decision-Making with Fuzzy Information. Moscow: Nauka; 1981. 208 p.
9. Zadeh L.A. Roles of Soft Computing and Fuzzy Logic in the Conception, Design and Deployment of Information. Intelligent Systems. Computational Intelligence. 2001;2(3):7-11.
10. Federal Law No. 273-FZ of 2012 Dec 29 (as Amended on 2021 Jul 2) on Education in the Russian Federation;2(15).
11. Spasennikov V, Androsov K, Golubeva G. Ergonomic Factors in Patenting Computer Systems for Personnel’s Selection and Training. In: Proceedings of the 30th International Conference on Computer Graphics and Machine Vision: CEUR Workshop Proceedings: 30; 2020 Sep 22-25; Saint Petersburg: 2020. p. 1.