аспирант
Россия
УДК 696.117 Краны. Запорные задвижки. Вентили. Прочая арматура
Введение. Технологии анализа «Больших данных» являются основой развития информационного общества. Хранение и обработка «Больших данных» требует значительных затрат вычислительной мощности, дорогостоящих систем хранения данных. В сфере строительства основным источником «Больших данных» являются технологии «Умного дома» и «Умного города». Разработка методики анализа больших данных, направлена на снижение затрат по эксплуатации элементов инженерного оборудования, своевременное обслуживание, с целью безаварийной эксплуатации. Представленную методику анализа можно распространить на любые элементы оборудования, собирающего данные о своей работе и состоянии. Материалы и методы. Использованы данные из открытых источников. Данные для анализа получены от управляющей компании ООО «Южный». Предметом исследования является шаровый кран с электроприводом. Подготовка и визуализация информации выполнялась при помощи Microsoft Office Excel. Результаты. Разработанная методики анализа больших данных с целью предсказания изменения фаз жизненного цикла элементов инженерного оборудования зданий и сооружений, по результатам предварительного анализа показала свою работоспособность. Высокую результативность в задаче выявления бракованных изделий продемонстрировал метод с использованием «Контрольных карт Шухарта». Применение методов кластерного и квалиметрического анализа в несвойственных для них сценариях, позволило предсказать изменение фаз жизненного цикла с приемлемой для задач исследования точностью. Выводы. Методика анализа основана на использовании современных алгоритмов. Сами алгоритмы часто используются в целях обработки больших данных. Научная новизна состоит в подходе к анализу, в котором в отличие от классических схем, где кластерный и квалиметрический методы анализа используются для поиска наилучшего управленческого решения, в данной работе целью анализа, является поиск элементов оборудования близких к изменению фазы жизненного цикла.
большие данные, жизненный цикл, инженерное оборудование, интеллектуальный анализ данных, кластерный анализ, квалиметрия, фазы жизненного цикла, системы прогнозирования, контрольные карты Шухарта
Введение
В современной науке достаточно широкое распространение получили подходы, связанные с обработкой, хранением и анализом больших массивов данных. Такое направление, связанное с изменением технологии обработки и анализа данных, с развитием распределенных систем хранения и обработки информации, с уходом от традиционных баз и банков, получил общее наименование «Big Data» (большие данные) [1-3]. Термин «Data Mining», который часто переводится как "Интеллектуальный анализ данных" или "Раскопка данных", описывает систему поиска закономерностей и, возможно, прогнозирования тенденций проявления данных.
Научный интерес к этой области знаний возрастает год от года. В качестве примера можно привести несколько наиболее значимых статей за последние годы: Lu W., «Big data analytics to identify illegal construction waste dumping: A Hong Kong study. »; Zhang, Z. and Xie, X «Towards testing big data analytics software: the essential role of metamorphic testing»; Youssra Riahi, Sara Riahi «Big Data and Big Data Analytics: Concepts, Types and Technologies»; Blazquez, D. and Domenech, J., «Big Data sources and methods for social and economic analyses»; Breed, D.G. and Verster, T., «An empirical investigation of alternative semi-supervised segmentation methodologies.»; Lekhwar, S., Yadav, S. and Singh, A., 2019. Lekhwar, S., Yadav, S. and Singh, A., «Big Data Analytics in Retail» [4-9].
Всё чаще такой подход применяется и в строительстве в связи с дальнейшим развитием цифровых технологий в отрасли «Умного дома» [10-16].
В качестве примера такого подхода рассмотрим методику анализа больших данных с целью предсказания изменения фаз жизненного цикла элементов инженерного оборудования зданий и сооружений, которая, в итоге, направлена на снижение издержек при проектировании и реализации систем инженерного оборудования зданий за счёт отказа от многоуровневого дублирования, упрощение работы обслуживающего персонала снижения аварийности в процессе эксплуатации зданий и сооружений. Данное исследование является развитием идей, представленных автором в статье «Predicting the Elements Operation of Buildings’ Engineering Equipment Using the Big Data Analysis Technologies» [17].
Материалы и методы
Данные для анализа получены от управляющей компании ООО «Южный», путём оцифровки сведений, содержащихся в рабочих и аварийных журналах. В качестве предмета исследования использовались данные о установленных в жилых домах шаровых кранах с электроприводом, регистрирующих своё текущее состояние и ежедневно отправляющие данные по своему состоянию в управляющую компанию.
Структура приложения включает шесть основных блоков.
1.База данных, - в блоке хранятся данные необходимые для анализа;
2.Блок «Предварительной оценки», — где с использованием «контрольных карт Шухарта» отделяются данные по бракованным и наиболее удачным устройствам, вышедшим из эксплуатации;
3.Блок «Эталонная модель стандартная», — где с использованием метода кластерного анализа моделируется динамическая эталонная модель на основе данных, собранных с устройств, вышедших из строя в процессе эксплуатации;
4.Блок «Эталонная модель брак», — где с использованием метода кластерного анализа моделируется динамическая эталонная модель на основе данных, собранных с устройств, вышедших из строя в результате допущенного брака;
5.«Блок предсказания стандартный» — в блоке на основании эталонной модели и исходных данных из первого блока, с использованием квалиметрического и экспертного анализа, прогнозируются сроки выхода изделий из строя и формируются рекомендации сервисным службам для их проверки или замены;
6.«Блок предсказания брак», — в блоке на основании эталонной модели и исходных данных из первого блока, с использованием квалиметрического и экспертного анализа, прогнозируются сроки выхода изделий из строя и формируются рекомендации сервисным службам для их первоочередной проверки или замены. (Рис.1).
Рис.1. Структура приложения
Алгоритм работы приложения (Рис. 2):
Внешние данные поступают в логический блок, где проверяется, является ли изделие работающим? Если оно работает, передаём данные в блок прогнозирования. Если устройство не работает, снимаем дампы данных и передаём в следующий логический блок, где с использованием метода «Контрольных карт Шухарта» определяется является ли вышедшее изделие браком [18]. Если устройство вышло из строя штатно, данные передаются в модуль перерасчёта «Эталонной модели стандартной» с использованием метода «Кластерного анализа» [19]. Данные, полученные от работающего изделия, обрабатываются методом «Квалиметрического анализа» с эталоном, полученным в блоке «Эталонная модель стандартная» [20]. Если полученные данные приближаются к эталонной модели, выдаётся рекомендация на проверку состояния устройства, в противном случае никаких действий не предпринимается. Если устройство вышло из строя с показателями, находящимися в области «Брака», данные передаются в модуль перерасчёта «Эталонной модели брак» с использованием метода «Кластерного анализа». Данные, полученные от работающего изделия, обрабатываются методом «Квалиметрического анализа» с эталоном, полученным в блоке «Эталонная модель брак». Если полученные данные приближаются к эталонной модели выдаётся первоочередная рекомендация на проверку состояния устройства, в противном случае никаких действий не предпринимается (Рис.2).
Рис.2. Алгоритм работы приложения
Результаты исследования
Расчёты производились на массиве данных, сгенерированном для проверки работоспособности математической модели в приложении Microsoft Excel. Каждый объект описывается набором своих характеристик, называемых параметрами. Параметры могут быть числовыми или нечисловыми. Исходные данные на первоначальном этапе фильтруются с использованием экспертного метода и контрольных карт Шухарта (Рис.3.) Для построения карт были выбраны следующие параметры: наработка часов фактическая, количество включений, количество пропущенной воды. Для построения CL — центральной линии использовали среднее геометрическое значение параметров:
где — среднее геометрическое, n — число показателей, а t1×t2×….tn – набор показателей.
Рис.3. Контрольные карты Шухарта
С целью приведения параметров к сопоставимым величинам перед началом анализа используется метод нормализации данных:
где tj — нормализованный параметр,
ti — ненормализованный параметр,
— сумма исходных значений параметра t, нуждающегося в нормализации
Для поиска расстояний между объектами в матрице несходства использовалась формула нахождения евклидова расстояния:
где d (x, y) — евклидово расстояние,
m — количество параметров у сравниваемых объектов,
xi, yi — значения параметров [21].
На первом этапе квалиметрического анализа рассчитывается процент ошибки на основании данных из эталонной модели кластерного анализа и показателей:
где q% — величина ошибки в процентах,
tЭ — эталонное значение параметра,
i=1…n — диапазон текущих параметров,
– среднее геометрическое параметров, рассчитывается по формуле
где t — значение параметра для соответствующего устройства.
Параллельно указывается величина ошибки, полученная экспертным методом и все вычисления идут параллельно.
На втором этапе квалиметрического анализа нормализуем данные для анализа, используя следующие формулы:
1. Отклонение от эталонного значения параметра (∆ti):
где ti — исходный параметр,
tэ — эталонное значение параметра.
2. Интегральный показатель качества (Qинт):
где ∆ti — отклонение от эталонного значения параметра,
q% — величина ошибки в процентах.
На завершающем этапе квалиметрического анализа находим среднее значение по объектам, сортируем их по возрастанию, вычисляем интервалы в полученной последовательности и находим среднее геометрическое интервалов. На основании вычисленной среднегеометрической делим получившуюся последовательность на кластеры. Объединив результаты вычислений, полученных с использованием математического и экспертного методов, получаем итоговую диаграмму с прогнозом (Рис.4) [22].
Рис.4. Итоговая диаграмма прогноза
Заключение и обсуждение
Методика анализа больших данных с целью предсказания изменения фаз жизненного цикла элементов инженерного оборудования зданий и сооружений основана на использовании современных алгоритмов. Сами алгоритмы часто используются в целях обработки больших данных.
В качестве примера можно привести алгоритмы машинного обучения RFR (Random Forest Regressor), GBC (Gradient Busting Classifier) и GBR (Gradient Busting Regressor) описанные М.Р. Салиховым и Р.А. Юрьевой в статье «Алгоритм прогнозирования состояния оборудования на основе машинного обучения» [23].
Научная новизна состоит в подходе к анализу, в котором в отличие от классических схем, где кластерный и квалиметрический методы анализа используются для поиска наилучшего управленческого решения, в данной работе целью анализа, является поиск элементов оборудования близких к изменению фазы жизненного цикла.
На сегодняшний день исследование находится в активной фазе тестирования методики расчётов. Конечным результатом проведённого исследования будет являться полнофункциональный, гибкий программный комплекс, пригодный как для предприятия, от которого получены исходные данные, так и для любого предприятия строительной сферы, с целью увеличения эффективности обслуживания элементов инженерного оборудования.
1. Форман Д. Много чисел: анализ больших данных с помощью Excel. Альпина Паблишер, Москва, 2016, стр. 464.
2. Прокопец А. Конкурентное программирование на Scala ДМК-Пресс, Москва, 2018 стр.342.
3. Kagan P. Big data sets in construction. E3S Web Conf., International Science Conference SPbWOSCE-2018 “Business Technologies for Sustainable Urban Development”. 2019, Volume 110, Number 3, pages: 80-84, doihttps://doi.org/10.1088/1757-899X/869/2/022004
4. Lu W., Big data analytics to identify illegal construction waste dumping: A Hong Kong study. Resources, Conservation and Recycling, 2019. Vol., 141, pp.264-272. https://doi.org/10.1016/j.resconrec.2018.10.039
5. Zhang Z. and Xie X., Towards testing big data analytics software: the essential role of metamorphic testing. Biophysical reviews, 2019, Vol. 11(1), pp.123-125 https://doi.org/10.1007/s12551-019-00500-x
6. Youssra Riahi, Sara Riahi, 2018, Big Data and Big Data Analytics: Concepts, Types and Technologies, International Journal of Research and Engineering. | September-October 2018 |, Vol. 5 No. 9, PP. 524-528 DOI:https://doi.org/10.21276/ijre.2018.5.9.5
7. Blazquez D. and Domenech, J., 2018. Big Data sources and methods for social and economic analyses. Technological Forecasting and Social Change journal, Volume 130, pp. 99--113. https://doi.org/10.1016/j.techfore.2017.07.027
8. Breed D.G. and Verster T., 2019. An empirical investigation of alternative semi-supervised segmentation methodologies. South African Journal of Science, Volume 115, pp. pp.92-98. http://dx.doi.org/10.17159/sajs.2019/5359.
9. Lekhwar S., Yadav S. and Singh, A., Big Data Analytics in Retail. Singapore, Springer, 2019, pp. 469-477. DOIhttps://doi.org/10.1007/978-981-13-1747-7_45.
10. Асаул В.В., Лушников А.С. РЕАЛИЗАЦИЯ ЭЛЕМЕНТОВ ЦИФРОВОЙ ЭКОНОМИКИ В СТРОИТЕЛЬСТВЕ: ОТЕЧЕСТВЕННЫЙ И ЗАРУБЕЖНЫЙ ОПЫТ / Сборник «Экономические проблемы в архитектуре, градостроительстве и инвестиционно-строительной деятельности. Современное состояние и проблемы» - материалы Всероссийской научно-практической конференции членов РААСН, ППС, молодых ученых СПбГАСУ и специалистов инвестиционно-строительной отрасли. Санкт-Петербург, 2019, стр. 89-93. DOIhttps://doi.org/10.17513/vaael.1729.
11. Травуш В.И. Цифровые технологии в строительстве Академия. Архитектура и строительство. 2018, том 3 стр. 107-117. DOIhttps://doi.org/10.22337/2077-9038-2018-3-107-117.
12. Травуш В.И. Белостоцкий А.М., Акимов П.А. ЦИФРОВЫЕ ТЕХНОЛОГИИ В СТРОИТЕЛЬСТВЕ: ДЕКЛАРАЦИИ И РЕАЛЬНОСТЬ. ЧАСТЬ 2. ЭКСПЕРИМЕНТАЛЬНЫЕ И ЛОКАЛЬНЫЕ ИССЛЕДОВАНИЯ, ПРОИЗВОДСТВО МАТЕРИАЛОВ, ИЗДЕЛИЙ И КОНСТРУКЦИЙ, МАТЕРИАЛОВЕДЕНИЕ, ЭКОНОМИКА СТРОИТЕЛЬСТВА, ИНФОРМАЦИОННОЕ МОДЕЛИРОВАНИЕ / Сборник «Устойчивое развитие региона: архитектура, строительство, транспорт». Материалы 5-й Международной научно-практической конференции Института архитектуры, строительства и транспорта. 2018, С. 25-38.
13. Добрынин А.П., Черных К.Ю., Куприяновский В.П., Куприяновский П.В., Синягов С.А. Цифровая экономика - различные пути эффективного применения технологий (BIM, PLM, CAD, IOT, Smart City, BIG DATA и др.) International Журнал открытых информационных технологий, 2016, том 4, выпуск 1, стр. 4-11. DOI:https://doi.org/10.23968/1999-5571-2020-17-2-4-11.
14. Корабельникова С.С., Корабельникова С.К. ЦИФРОВЫЕ ТЕХНОЛОГИИ КАК ЭЛЕМЕНТ СНИЖЕНИЯ РИСКОВ В СТРОИТЕЛЬСТВЕ. Дискуссия. 2019, том 2 (93) С. 18-27. DOI: 24411/2077-7639-2019-10002.
15. Лескова Ю.Г. ПРИМЕНЕНИЕ ИНФОРМАЦИОННЫХ (ЦИФРОВЫХ) ТЕХНОЛОГИЙ В САМОРЕГУЛИРОВАНИИ КАК УСЛОВИЕ РАЗВИТИЯ СТРОИТЕЛЬНОЙ ОТРАСЛИ И ПРАВОВОЕ РЕГУЛИРОВАНИЕ Издательская группа "Юрист". Гражданское право. 2018, том 5 стр. 9-11 DOI:https://doi.org/10.18572/2070-2140-2018-5-9-11.
16. Kagan P. The use of digital technologies in building organizational and technological design. E3S Web Conf. 2021, Vol. 263, XXIV International Scientific Conference “Construction the Formation of Living Environment” (FORM-2021), Article Number 04040, https://doi.org/10.1051/e3sconf/202126304040
17. Kagan P., Sigitov A. Predicting the Elements Operation of Buildings’ Engineering Equipment Using the Big Data Analysis Technologies. Lecture Notes in Civil Engineering, 2022, 231, стр. 87-93. DOI:https://doi.org/10.1007/978-3-030-96206-7_9.
18. Дорофеев М. Практикум использования контрольных карт Шухарта. Электронный ресурс. Электронный журнал Хабр. Публ. от 07.03.2012. - URL: https://habr.com/ru/post/139596/ (дата обращения: апрель 2022). - Текст: электронный.
19. Университет ИТМО. Кластерный анализ - каждому. Электронный ресурс. Электронный журнал Хабр. Публ. от 19.01.2021. - URL: https://habr.com/ru/company/spbifmo/blog/534410/ (дата обращения: апрель 2021). - Текст: электронный
20. Азгальдов Г.Г., Азгальдова Л.А., Количественная оценка качества (Квалиметрия). - М.: Издательство стандартов, 1971, 176 с. - УДК 658.562.003.12 (048) - 5000 экз. - Текст: непосредственный.
21. Дюран Б., Одель П.: Кластерный анализ, «Статистика», Москва (1977).
22. Азгальдов Г.Г., Костин А.В., Садов В.В.: Квалиметрия для всех. «ИнформЗнание», Москва (2012).
23. Салихов М.Р., Юрьева Р.А., Алгоритм прогнозирования состояния оборудования на основе машинного обучения // Изв. Вузов. Приборостроение. 2022. Т. 65, №9. С. 648-655. DOI:https://doi.org/10.17586/0021-3454-2022-65-9-648-655