Аннотация и ключевые слова
Аннотация (русский):
Выборки, получаемые в различных исследованиях, часто принадлежат к нормальному распределению. При этом иногда в них встречаются значения, существенно отличающиеся от основной группы значений. Рассмотрены наиболее популярные статистические критерии для проверки на выброс единственного такого значения. Показано, что в этом случае статистически обоснованы критерии Граббса, Диксона и Ирвина. Не рекомендуются критерии Шовене и Шарлье ввиду слишком низких или слишком высоких уровней значимости табличных значений. Показано также, что критерий Романовского эквивалентен одностороннему критерию Граббса, и поэтому не имеет самостоятельного значения. Процентные точки критерия Романовского, приводимые в информационных источниках, ошибочны. Рассчитаны действительные значения его процентных точек.

Ключевые слова:
выброс, критерий Граббса, критерий Романовского, критерий Шовене, критерий Шарлье, критерий Диксона, критерий Ирвина
Текст
Текст (PDF): Читать Скачать

1. Введение

Числовые данные, получаемые в различных процессах, иногда содержат значения, заметно отличающиеся по величине от основной группы значений. Их появление может иметь случайный характер, например, из-за резкого изменения условий измерений, сбоев средств измерений, ошибок при передаче данных, ошибок оператора и др. В этом случае они являются выбросами, поэтому необходимо их выявление и отбраковка. В данной статье рассмотрены статистические критерии для проверки на единственный выброс, применимые к выборкам, принадлежащим к нормальному распределению, и наиболее часто встречающиеся в научных публикациях и учебных материалах.

По количеству значений, проверяемых на выбросы, бывают критерии для проверки одного значения (на одиночный выброс) – Граббса, Романовского, Шовене, Шарлье, и для проверки до двух или нескольких значений (множественное тестирование) – Диксона, Ирвина, Титьена-Мура, Роснера. Для проверки на одиночный выброс применимы критерии обеих групп. При этом критерии Титьена-Мура и Роснера при тестировании на одиночный выброс равнозначны соответственно одностороннему и двустороннему критерию Граббса, и в этом случае самостоятельного значения не имеют.

При проверке на выбросы нулевая гипотеза состоит в том, что проверяемые значения принадлежат тому же распределению, что и вся выборка, т.е. не являются выбросами. Альтернативная гипотеза состоит в том, что проверяемые значения принадлежат другому распределению, и потому являются выбросами.

Критерии Граббса, Романовского, Диксона, Ирвина основаны на сравнении расчётного значения статистики критерия с процентной точкой (табличным значением), соответствующей некоторому уровню значимости α. В то же время критерии Шарлье и Шовене основаны на других статистических закономерностях, в них не используются уровни значимости и процентные точки. Уровень значимости – это вероятность отклонения верной нулевой гипотезы.

Обычно проверку на выбросы проводят при уровне значимости 0,01 или 0,05. В ГОСТ Р ИСО 5725-2-2002 «Точность (правильность и прецизионность) методов и результатов испытаний», часть 2, рекомендуется значения выборки, определяемые как выбросы при уровне значимости 0,05, идентифицировать как квазивыбросы, при уровне 0,01 – как статистические выбросы. Если они не могут быть объяснены техническими ошибками и заменены правильными значениями, рекомендуется квазивыбросы сохранять в наборе данных, а статистические выбросы исключать. Уровень значимости в сочетании с соответствующей процентной точкой критерия представляется наиболее объективной мерой при проверке на выбросы.

 

2. Критерии Граббса

Рассмотрим вариационный ряд выборки из нормального распределения: x1, x2, …, xi, …,  xn. По одностороннему критерию Граббса [1-5] (встречаются также названия «критерий Н.В. Смиронова» и «критерий Смирнова-Граббса») для проверки на выброс значения выборки рассчитывают статистику

                                                ,                                                       (1)

где x  – среднее арифметическое выборки, хс – проверяемое (сомнительное) значение, т.е. x1 или  xn, – выборочное среднеквадратическое отклонение (СКО).

Если G1 больше табличного значения одностороннего критерия Граббса,  хс идентифицируют как выброс.

По двустороннему критерию Граббса [6] (встречается также название «критерий наибольшего абсолютного отклонения») проверяют на выброс крайнее значение выборки, максимально удалённое от x . Статистика критерия:

Если G2 больше табличного значения двустороннего критерия Граббса, хс идентифицируют как выброс.

Критерии Граббса рассмотрены во множестве публикаций, широко применяются на практике, их процентные точки получены как аналитически, так и методом Монте-Карло. Можно рассматривать эти критерии как статистически обоснованные.

 

3. Критерий Романовского

Критерий Романовского [7] основан на методе проверке гипотезы о равенстве средних двух выборок. Если при проверке на выброс сомнительное значение выборки хс выделить в отдельную выборку, то по этому методу получим статистику критерия:

,

где x * среднее арифметическое выборки без учёта хс, s* − выборочное среднеквадратическое отклонение без учёта хс. Если B больше табличного значения критерия Романовского, хс идентифицируют как выброс.

Табличные значения критерия Романовского Bтабл в соответствии с [7] рассчитывают по выражению

,

где tn-1,α – квантиль распределения Стьюдента при числе степеней свободы n-1 и уровне значимости α. Иногда для упрощения принимают Bтабл = tn-1,α.

Некоторые процентные точки критерия Романовского по [7] приведены в табл. 1.

Таблица 1

Процентные точки критерия Романовского по [7]

α

n = 3

n = 10

n = 20

n = 40

n = 70

n = 100

0,01

11,460

3,408

2,932

2,742

2,668

2,640

0,05

4,968

2,273

2,145

2,048

2,009

1,994

 

Расчёт процентных точек с использованием метода проверки равенства средних двух выборок выглядит, однако, сомнительно, поскольку при выделении в отдельную выборку проверяемого значения, минимального или максимального, она не будет случайной и независимой.

В [8] приведена статистика одностороннего критерия Граббса для максимального значения выборки в виде

Преобразуя это выражение, получим

                                                                       (2)

Из (2) видно, что критерий Романовского эквивалентен одностороннему критерию Граббса и, таким образом, не имеет самостоятельного значения. Подставляя в (2) значения процентных точек для G1, можно получить соответствующие действительные значения процентных точек критерия Романовского. Некоторые из них приведены в табл. 2.

Таблица 2

Действительные процентные точки критерия Романовского

α

n = 3

n = 10

n = 20

n = 40

n = 70

n = 100

0,01

117,093

4,746

4,024

3,855

3,854

3,884

0,05

23,391

3,537

3,280

3,277

3,346

3,407

 

Расчёт Bтабл методом Монте-Карло даёт те же значения (отличающиеся в пределах погрешности метода), что и в табл. 2. Приведённые в табл. 2 действительные значения процентных точек критерия Романовского значительно отличаются от имеющихся в литературных источниках (табл. 1), что указывает на ошибочность литературных данных.

 

4. Критерий Шовене

По критерию Шовене [9] сомнительное значение является выбросом, если

,

где К – квантиль функции стандартного нормального распределения F(К), равной 1-1/(4n), т.е. К = F-1[1-1/(4n)].

Статистика критерия Шовене соответствует статистике (1) одностороннего критерия Граббса, но при неизвестных уровнях значимости. Найденные методом Монте-Карло при моделировании 1 млн выборок для каждого n, уровни значимости приведены в табл. 3.

Таблица 3

Уровни значимости для критерия Шовене

n

3

4

5

6

10

30

50

100

500

1000

5000

α

0

0

0,068

0,095

0,138

0,187

0,190

0,201

0,214

0,216

0,218

 

Из табл. 3 видно, что при n = 3 и n = 4 уровни значимости для критерия Шовене слишком малы, практически равны нулю.  При n = 5 и более уровни значимости слишком велики. В пределе

Таким образом, критерий Шовене не может быть рекомендован для практического применения.

 

5. Критерий Шарлье

Критерий Шарлье подобен критерию Шовене. По критерию Шарлье [10] сомнительное значение является выбросом, если

,

где Кшквантиль функции стандартного нормального распределения находится из соотношения F(Кш) = 1-1/(2n).

Статистика критерия Шарлье также соответствует статистике (1) одностороннего критерия Граббса при иных значениях процентных точек и неизвестных уровнях значимости. Уровни значимости, полученные методом Монте-Карло, при моделировании 1 млн выборок при каждом n, приведены в табл. 4.

Таблица 4

Уровни значимости для критерия Шарлье

n

3

4

5

6

10

30

50

100

500

1000

5000

α

0,552

0,467

0,434

0,417

0,398

0,384

0,384

0,385

0,390

0,390

0,391

Как видно из табл. 4, уровни значимости для табличных значений критерия Шарлье недопустимо велики. В пределе

Таким образом, критерий Шарлье также не может быть рекомендован для практического применения.

 

6. Критерии для множественного тестирования

По критерию Диксона [9,11] xn является выбросом, если

Выбросом является x1, если

Здесь r10 – процентная точка.

Критерий Диксона широко применяется на практике, его процентные точки получены как аналитически, так и методом Монте-Карло. Можно рассматривать этот критерий как статистически обоснованный.

По критерию Ирвина xn является выбросом, если

Выбросом является x1, если

Процентные точки λα,n для критерия Ирвина изначально были рассчитаны для случая известного генерального среднеквадратического отклонения [12], однако обычно применялись при замене его выборочным среднеквадратическим отклонением s, что приводит к некоторой неточности, особенно при небольших объёмах выборки. В [13] приведены процентные точки критерия Ирвина для случая выборочного среднеквадратического отклонения. Критерий Ирвина применим для оценки на одиночный выброс при использовании процентных точек по [13].

 

7. Заключение

Из рассмотренных критериев проверки на единственный выброс при нормальном распределении приемлемы критерии Граббса, Диксона, Ирвина. Критерии Шовене и Шарлье не рекомендуются для практического применения. Критерий Романовского эквивалентен одностороннему критерию Граббса, и поэтому самостоятельного значения не имеет.

Список литературы

1. Pearson E.S., Chandra Sekar C. The efficiency of statistical tools and a criterion for the rejection of outlying observations // Biometrika. - 1936. - Vol. 28. - P. 308-320.

2. Смирнов Н.В. Оценка максимального члена в ряду наблюдений // Доклады АН СССР. - 1941. - Т. 33. - № 5. - С. 346-349.

3. Grubbs F. E. Sample criteria for testing outlying observations// Annals of Mathematical Statistics. - 1950. - Vol. 21, № 1. - P. 27-58.

4. Grubbs F. E. Procedures for Detecting Outlying Observations in Samples // Tech-nometrics. - 1969. - ¬ Vol. 11, ¬№ 1. - P.1-21.

5. Grubbs F. E., Beck G. Extension of sample sizes and percent¬age points for significance tests of outlying observations // Technomet¬rics. - 1972. - Vol. 14, №. 4. - P. 847-854.

6. Quesenberry, C.P., David, H.A. Some tests for outliers // Biometrika. - 1961. - Vol. 48, P. 379-390.

7. Взаимозаменяемость и технические измерения в машиностроении : монография / Б. С. Балакшин, С.С. Волосов, А.Н. Журавлёв. - Москва: Машиностроение, 1972. - 615 с.

8. Ширяева Л.К. О нулевом и альтернативном распределении статистики критерия наибольшего по абсолютной величине нормированного отклонения // Изв. вузов. Математика. - 2014. - № 10. - С. 62-78.

9. Кобзарь А.И. Прикладная математическая статистика. - 2е изд., испр. и доп. - Москва: Физматлит, 2012. - 816 с.

10. Схиртладзе А.Г., Радкевич Я.М. Метрология, стандартизация и технические измерения: учебник. - Старый Оскол: ТНТ, 2010. - 420 с.

11. Dixon, W.J. Ratios involving extreme values // Annals of Mathematical Statistics. - Vol. 22, № 1. - P. 68-78.

12. Irvin J.O. On a criterion for the rejection of outlying observation // Biometrika. - 1925. - V. 17. - P. 238-250.

13. Заляжных В.В. Расширение области применения критерия Ирвина при обнаружении аномальных измерений // Вестник СибГУТИ. - 2020. - № 2 - . С. 95-104.

Войти или Создать
* Забыли пароль?