<?xml version="1.0"?>
<!DOCTYPE article
PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.4 20190208//EN"
       "JATS-journalpublishing1.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" article-type="research-article" dtd-version="1.4" xml:lang="en">
 <front>
  <journal-meta>
   <journal-id journal-id-type="publisher-id">Journal of Natural Sciences Research</journal-id>
   <journal-title-group>
    <journal-title xml:lang="en">Journal of Natural Sciences Research</journal-title>
    <trans-title-group xml:lang="ru">
     <trans-title>Журнал естественнонаучных исследований</trans-title>
    </trans-title-group>
   </journal-title-group>
   <issn publication-format="print">2500-0489</issn>
   <issn publication-format="online">2500-0489</issn>
  </journal-meta>
  <article-meta>
   <article-id pub-id-type="publisher-id">49402</article-id>
   <article-categories>
    <subj-group subj-group-type="toc-heading" xml:lang="ru">
     <subject>Математика и механика</subject>
    </subj-group>
    <subj-group subj-group-type="toc-heading" xml:lang="en">
     <subject>Mathematics and mechanics</subject>
    </subj-group>
    <subj-group>
     <subject>Математика и механика</subject>
    </subj-group>
   </article-categories>
   <title-group>
    <article-title xml:lang="en">About single outliers tests</article-title>
    <trans-title-group xml:lang="ru">
     <trans-title>О критериях одиночных выбросов</trans-title>
    </trans-title-group>
   </title-group>
   <contrib-group content-type="authors">
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Заляжных</surname>
       <given-names>В. В.</given-names>
      </name>
      <name xml:lang="en">
       <surname>Zalyazhnyh</surname>
       <given-names>V. V.</given-names>
      </name>
     </name-alternatives>
     <bio xml:lang="ru">
      <p>кандидат технических наук;</p>
     </bio>
     <bio xml:lang="en">
      <p>candidate of technical sciences;</p>
     </bio>
     <xref ref-type="aff" rid="aff-1"/>
    </contrib>
   </contrib-group>
   <aff-alternatives id="aff-1">
    <aff>
     <institution xml:lang="ru">Северный (Арктический) федеральный университет имени М.В. Ломоносова</institution>
     <country>Россия</country>
    </aff>
    <aff>
     <institution xml:lang="en">Northern (Arctic) Federal University named after M.V. Lomonosov</institution>
     <country>Russian Federation</country>
    </aff>
   </aff-alternatives>
   <pub-date publication-format="print" date-type="pub" iso-8601-date="2022-03-23T14:38:13+03:00">
    <day>23</day>
    <month>03</month>
    <year>2022</year>
   </pub-date>
   <pub-date publication-format="electronic" date-type="pub" iso-8601-date="2022-03-23T14:38:13+03:00">
    <day>23</day>
    <month>03</month>
    <year>2022</year>
   </pub-date>
   <volume>7</volume>
   <issue>1</issue>
   <fpage>16</fpage>
   <lpage>21</lpage>
   <history>
    <date date-type="received" iso-8601-date="2022-03-23T00:00:00+03:00">
     <day>23</day>
     <month>03</month>
     <year>2022</year>
    </date>
   </history>
   <self-uri xlink:href="https://zh-szf.ru/en/nauka/article/49402/view">https://zh-szf.ru/en/nauka/article/49402/view</self-uri>
   <abstract xml:lang="ru">
    <p>Выборки, получаемые в различных исследованиях, часто принадлежат к нормальному распределению. При этом иногда в них встречаются значения, существенно отличающиеся от основной группы значений. Рассмотрены наиболее популярные статистические критерии для проверки на выброс единственного такого значения. Показано, что в этом случае статистически обоснованы критерии Граббса, Диксона и Ирвина. Не  рекомендуются критерии Шовене и Шарлье ввиду слишком низких или слишком высоких уровней значимости табличных значений. Показано также, что критерий Романовского эквивалентен одностороннему критерию Граббса, и поэтому не имеет самостоятельного значения. Процентные точки критерия Романовского, приводимые в информационных источниках, ошибочны. Рассчитаны действительные значения его процентных точек.</p>
   </abstract>
   <trans-abstract xml:lang="en">
    <p>The samples obtained in various studies often belong to a normal distribution. At the same time, sometimes they contain values that differ significantly from the main group of values. The most popular statistical tests for checking for an outlier of a single such value is considered. It do shown that in this case the tests of Grubbs, Dixon and Irwin are statistically justified. The Chauvenet and Charlie tests do not recommended due to too low or too high levels of significance of tabular values. It do also shown that the Romanovsky's  test  is equivalent to the one-sides Grubbs test, and so do not independent. The percentage points of the Romanovsky's test given in information sources are erroneous. The actual values of its percentage points are calculated.</p>
   </trans-abstract>
   <kwd-group xml:lang="ru">
    <kwd>выброс</kwd>
    <kwd>критерий Граббса</kwd>
    <kwd>критерий Романовского</kwd>
    <kwd>критерий Шовене</kwd>
    <kwd>критерий Шарлье</kwd>
    <kwd>критерий Диксона</kwd>
    <kwd>критерий Ирвина</kwd>
   </kwd-group>
   <kwd-group xml:lang="en">
    <kwd>outlier</kwd>
    <kwd>Grubbs`s test</kwd>
    <kwd>Romanovsky's test</kwd>
    <kwd>Chauvenet`s test</kwd>
    <kwd>Charlie's test</kwd>
    <kwd>Dixon’s test</kwd>
    <kwd>Irvin’s test</kwd>
   </kwd-group>
  </article-meta>
 </front>
 <body>
  <p>1. ВведениеЧисловые данные, получаемые в различных процессах, иногда содержат значения, заметно отличающиеся по величине от основной группы значений. Их появление может иметь случайный характер, например, из-за резкого изменения условий измерений, сбоев средств измерений, ошибок при передаче данных, ошибок оператора и др. В этом случае они являются выбросами, поэтому необходимо их выявление и отбраковка. В данной статье рассмотрены статистические критерии для проверки на единственный выброс, применимые к выборкам, принадлежащим к нормальному распределению, и наиболее часто встречающиеся в научных публикациях и учебных материалах.По количеству значений, проверяемых на выбросы, бывают критерии для проверки одного значения (на одиночный выброс) – Граббса, Романовского, Шовене, Шарлье, и для проверки до двух или нескольких значений (множественное тестирование) – Диксона, Ирвина, Титьена-Мура, Роснера. Для проверки на одиночный выброс применимы критерии обеих групп. При этом критерии Титьена-Мура и Роснера при тестировании на одиночный выброс равнозначны соответственно одностороннему и двустороннему критерию Граббса, и в этом случае самостоятельного значения не имеют.При проверке на выбросы нулевая гипотеза состоит в том, что проверяемые значения принадлежат тому же распределению, что и вся выборка, т.е. не являются выбросами. Альтернативная гипотеза состоит в том, что проверяемые значения принадлежат другому распределению, и потому являются выбросами. Критерии Граббса, Романовского, Диксона, Ирвина основаны на сравнении расчётного значения статистики критерия с процентной точкой (табличным значением), соответствующей некоторому уровню значимости α. В то же время критерии Шарлье и Шовене основаны на других статистических закономерностях, в них не используются уровни значимости и процентные точки. Уровень значимости – это вероятность отклонения верной нулевой гипотезы.Обычно проверку на выбросы проводят при уровне значимости 0,01 или 0,05. В ГОСТ Р ИСО 5725-2-2002 «Точность (правильность и прецизионность) методов и результатов испытаний», часть 2, рекомендуется значения выборки, определяемые как выбросы при уровне значимости 0,05, идентифицировать как квазивыбросы, при уровне 0,01 – как статистические выбросы. Если они не могут быть объяснены техническими ошибками и заменены правильными значениями, рекомендуется квазивыбросы сохранять в наборе данных, а статистические выбросы исключать. Уровень значимости в сочетании с соответствующей процентной точкой критерия представляется наиболее объективной мерой при проверке на выбросы. 2. Критерии ГраббсаРассмотрим вариационный ряд выборки из нормального распределения: x1, x2, …, xi, …,  xn. По одностороннему критерию Граббса [1-5] (встречаются также названия «критерий Н.В. Смиронова» и «критерий Смирнова-Граббса») для проверки на выброс значения выборки рассчитывают статистику                                                  ,                                                       (1)где x  – среднее арифметическое выборки, хс – проверяемое (сомнительное) значение, т.е. x1 или  xn,  – выборочное среднеквадратическое отклонение (СКО).Если G1 больше табличного значения одностороннего критерия Граббса,  хс идентифицируют как выброс.По двустороннему критерию Граббса [6] (встречается также название «критерий наибольшего абсолютного отклонения») проверяют на выброс крайнее значение выборки, максимально удалённое от x . Статистика критерия: Если G2 больше табличного значения двустороннего критерия Граббса, хс идентифицируют как выброс.Критерии Граббса рассмотрены во множестве публикаций, широко применяются на практике, их процентные точки получены как аналитически, так и методом Монте-Карло. Можно рассматривать эти критерии как статистически обоснованные. 3. Критерий РомановскогоКритерий Романовского [7] основан на методе проверке гипотезы о равенстве средних двух выборок. Если при проверке на выброс сомнительное значение выборки хс выделить в отдельную выборку, то по этому методу получим статистику критерия: ,где x *– среднее арифметическое выборки без учёта хс, s* − выборочное среднеквадратическое отклонение без учёта хс. Если B больше табличного значения критерия Романовского, хс идентифицируют как выброс.Табличные значения критерия Романовского Bтабл в соответствии с [7] рассчитывают по выражению  ,где tn-1,α – квантиль распределения Стьюдента при числе степеней свободы n-1 и уровне значимости α. Иногда для упрощения принимают Bтабл = tn-1,α.Некоторые процентные точки критерия Романовского по [7] приведены в табл. 1.Таблица 1Процентные точки критерия Романовского по [7]αn = 3n = 10n = 20n = 40n = 70n = 1000,0111,4603,4082,9322,7422,6682,6400,054,9682,2732,1452,0482,0091,994 Расчёт процентных точек с использованием метода проверки равенства средних двух выборок выглядит, однако, сомнительно, поскольку при выделении в отдельную выборку проверяемого значения, минимального или максимального, она не будет случайной и независимой. В [8] приведена статистика одностороннего критерия Граббса для максимального значения выборки в виде Преобразуя это выражение, получим                                                                         (2)Из (2) видно, что критерий Романовского эквивалентен одностороннему критерию Граббса и, таким образом, не имеет самостоятельного значения. Подставляя в (2) значения процентных точек для G1, можно получить соответствующие действительные значения процентных точек критерия Романовского. Некоторые из них приведены в табл. 2.Таблица 2 Действительные процентные точки критерия Романовскогоαn = 3n = 10n = 20n = 40n = 70n = 1000,01117,0934,7464,0243,8553,8543,8840,0523,3913,5373,2803,2773,3463,407 Расчёт Bтабл методом Монте-Карло даёт те же значения (отличающиеся в пределах погрешности метода), что и в табл. 2. Приведённые в табл. 2 действительные значения процентных точек критерия Романовского значительно отличаются от имеющихся в литературных источниках (табл. 1), что указывает на ошибочность литературных данных. 4. Критерий ШовенеПо критерию Шовене [9] сомнительное значение является выбросом, если ,где К – квантиль функции стандартного нормального распределения F(К), равной 1-1/(4n), т.е. К = F-1[1-1/(4n)].Статистика критерия Шовене соответствует статистике (1) одностороннего критерия Граббса, но при неизвестных уровнях значимости. Найденные методом Монте-Карло при моделировании 1 млн выборок для каждого n, уровни значимости приведены в табл. 3.Таблица 3 Уровни значимости для критерия Шовенеn345610305010050010005000α000,0680,0950,1380,1870,1900,2010,2140,2160,218 Из табл. 3 видно, что при n = 3 и n = 4 уровни значимости для критерия Шовене слишком малы, практически равны нулю.  При n = 5 и более уровни значимости слишком велики. В пределе Таким образом, критерий Шовене не может быть рекомендован для практического применения. 5. Критерий ШарльеКритерий Шарлье подобен критерию Шовене. По критерию Шарлье [10] сомнительное значение является выбросом, если ,где Кш − квантиль функции стандартного нормального распределения находится из соотношения F(Кш) = 1-1/(2n).Статистика критерия Шарлье также соответствует статистике (1) одностороннего критерия Граббса при иных значениях процентных точек и неизвестных уровнях значимости. Уровни значимости, полученные методом Монте-Карло, при моделировании 1 млн выборок при каждом n, приведены в табл. 4.Таблица 4Уровни значимости для критерия Шарльеn345610305010050010005000α0,5520,4670,4340,4170,3980,3840,3840,3850,3900,3900,391Как видно из табл. 4, уровни значимости для табличных значений критерия Шарлье недопустимо велики. В пределе Таким образом, критерий Шарлье также не может быть рекомендован для практического применения. 6. Критерии для множественного тестированияПо критерию Диксона [9,11] xn является выбросом, если Выбросом является x1, если Здесь r10 – процентная точка.Критерий Диксона широко применяется на практике, его процентные точки получены как аналитически, так и методом Монте-Карло. Можно рассматривать этот критерий как статистически обоснованный.По критерию Ирвина xn является выбросом, если Выбросом является x1, если Процентные точки λα,n для критерия Ирвина изначально были рассчитаны для случая известного генерального среднеквадратического отклонения [12], однако обычно применялись при замене его выборочным среднеквадратическим отклонением s, что приводит к некоторой неточности, особенно при небольших объёмах выборки. В [13] приведены процентные точки критерия Ирвина для случая выборочного среднеквадратического отклонения. Критерий Ирвина применим для оценки на одиночный выброс при использовании процентных точек по [13]. 7. ЗаключениеИз рассмотренных критериев проверки на единственный выброс при нормальном распределении приемлемы критерии Граббса, Диксона, Ирвина. Критерии Шовене и Шарлье не рекомендуются для практического применения. Критерий Романовского эквивалентен одностороннему критерию Граббса, и поэтому самостоятельного значения не имеет.</p>
 </body>
 <back>
  <ref-list>
   <ref id="B1">
    <label>1.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Pearson E.S., Chandra Sekar C. The efficiency of statistical tools and a criterion for the rejection of outlying observations // Biometrika. - 1936. - Vol. 28. - P. 308-320.</mixed-citation>
     <mixed-citation xml:lang="en">Pearson E.S., Chandra Sekar C. The efficiency of statistical tools and a criterion for the rejection of outlying observations // Biometrika. - 1936. - Vol. 28. - P. 308-320.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B2">
    <label>2.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Смирнов Н.В. Оценка максимального члена в ряду наблюдений // Доклады АН СССР. - 1941. - Т. 33. - № 5. - С. 346-349.</mixed-citation>
     <mixed-citation xml:lang="en">Smirnov N.V. Ocenka maksimal'nogo chlena v ryadu nablyudeniy // Doklady AN SSSR. - 1941. - T. 33. - № 5. - S. 346-349.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B3">
    <label>3.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Grubbs F. E. Sample criteria for testing outlying observations// Annals of Mathematical Statistics. - 1950. - Vol. 21, № 1. - P. 27-58.</mixed-citation>
     <mixed-citation xml:lang="en">Grubbs F. E. Sample criteria for testing outlying observations// Annals of Mathematical Statistics. - 1950. - Vol. 21, № 1. - P. 27-58.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B4">
    <label>4.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Grubbs F. E. Procedures for Detecting Outlying Observations in Samples // Tech-nometrics. - 1969. - ¬ Vol. 11, ¬№ 1. - P.1-21.</mixed-citation>
     <mixed-citation xml:lang="en">Grubbs F. E. Procedures for Detecting Outlying Observations in Samples // Tech-nometrics. - 1969. - ¬ Vol. 11, ¬№ 1. - P.1-21.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B5">
    <label>5.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Grubbs F. E., Beck G. Extension of sample sizes and percent¬age points for significance tests of outlying observations // Technomet¬rics. - 1972. - Vol. 14, №. 4. - P. 847-854.</mixed-citation>
     <mixed-citation xml:lang="en">Grubbs F. E., Beck G. Extension of sample sizes and percent¬age points for significance tests of outlying observations // Technomet¬rics. - 1972. - Vol. 14, №. 4. - P. 847-854.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B6">
    <label>6.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Quesenberry, C.P., David, H.A. Some tests for outliers // Biometrika. - 1961. - Vol. 48, P. 379-390.</mixed-citation>
     <mixed-citation xml:lang="en">Quesenberry, C.P., David, H.A. Some tests for outliers // Biometrika. - 1961. - Vol. 48, P. 379-390.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B7">
    <label>7.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Взаимозаменяемость и технические измерения в машиностроении : монография / Б. С. Балакшин, С.С. Волосов, А.Н. Журавлёв. - Москва: Машиностроение, 1972. - 615 с.</mixed-citation>
     <mixed-citation xml:lang="en">Vzaimozamenyaemost' i tehnicheskie izmereniya v mashinostroenii : monografiya / B. S. Balakshin, S.S. Volosov, A.N. Zhuravlev. - Moskva: Mashinostroenie, 1972. - 615 s.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B8">
    <label>8.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Ширяева Л.К. О нулевом и альтернативном распределении статистики критерия наибольшего по абсолютной величине нормированного отклонения // Изв. вузов. Математика. - 2014. - № 10. - С. 62-78.</mixed-citation>
     <mixed-citation xml:lang="en">Shiryaeva L.K. O nulevom i al'ternativnom raspredelenii statistiki kriteriya naibol'shego po absolyutnoy velichine normirovannogo otkloneniya // Izv. vuzov. Matematika. - 2014. - № 10. - S. 62-78.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B9">
    <label>9.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Кобзарь А.И. Прикладная математическая статистика. - 2е изд., испр. и доп. - Москва: Физматлит, 2012. - 816 с.</mixed-citation>
     <mixed-citation xml:lang="en">Kobzar' A.I. Prikladnaya matematicheskaya statistika. - 2e izd., ispr. i dop. - Moskva: Fizmatlit, 2012. - 816 s.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B10">
    <label>10.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Схиртладзе А.Г., Радкевич Я.М. Метрология, стандартизация и технические измерения: учебник. - Старый Оскол: ТНТ, 2010. - 420 с.</mixed-citation>
     <mixed-citation xml:lang="en">Shirtladze A.G., Radkevich Ya.M. Metrologiya, standartizaciya i tehnicheskie izmereniya: uchebnik. - Staryy Oskol: TNT, 2010. - 420 s.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B11">
    <label>11.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Dixon, W.J. Ratios involving extreme values // Annals of Mathematical Statistics. - Vol. 22, № 1. - P. 68-78.</mixed-citation>
     <mixed-citation xml:lang="en">Dixon, W.J. Ratios involving extreme values // Annals of Mathematical Statistics. - Vol. 22, № 1. - P. 68-78.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B12">
    <label>12.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Irvin J.O. On a criterion for the rejection of outlying observation // Biometrika. - 1925. - V. 17. - P. 238-250.</mixed-citation>
     <mixed-citation xml:lang="en">Irvin J.O. On a criterion for the rejection of outlying observation // Biometrika. - 1925. - V. 17. - P. 238-250.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B13">
    <label>13.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Заляжных В.В. Расширение области применения критерия Ирвина при обнаружении аномальных измерений // Вестник СибГУТИ. - 2020. - № 2 - . С. 95-104.</mixed-citation>
     <mixed-citation xml:lang="en">Zalyazhnyh V.V. Rasshirenie oblasti primeneniya kriteriya Irvina pri obnaruzhenii anomal'nyh izmereniy // Vestnik SibGUTI. - 2020. - № 2 - . S. 95-104.</mixed-citation>
    </citation-alternatives>
   </ref>
  </ref-list>
 </back>
</article>
