Bryansk, Bryansk, Russian Federation
Assessing and predicting the dynamic flight performance of an unmanned aerial vehicle is associated with the complexity of constructing and applying strict mathematical models that take into account many heterogeneous parameters. The paper examines the problem of estimating the battery consumption of an unmanned aerial vehicle when flying along a given route, considering weather conditions and geospatial characteristics. An approach to its solution is proposed, based on clarifying the estimate obtained using an approximate dependence by finding the interval with the highest probability containing the actual flow value. To find the specified interval, it is proposed to use the binary classification method applying logistic regression models based on the training data set. A pipeline is built that combines the mechanisms of constructing, training, and applying the assessment model. Implementing this pipeline using the Loginom analytical platform, which is included in the Russian software register, is described. The features of preparing training data, as well as the results of teaching the model and checking it on the test data set are considered.
unmanned aerial vehicle, battery consumption, data mining, logistic regression, binning
Введение
Оценка и прогнозирование расхода энергии (заряда) аккумуляторной батареи при перемещении беспилотного летательного аппарата (БПЛА) в воздухе по заданному маршруту относится к классу задач расчета динамических характеристик БПЛА, наряду с такими задачами, как расчет необходимой емкости аккумуляторной батареи по времени полета, оценка продолжительности полета БПЛА по емкости батареи [1, 2], расчет времени полета по заданному маршруту [2, 3] и др. Разработка математического и программного обеспечения для моделирования подобных задач представляет собой направление, актуальное для целого ряда приложений – от планирования маршрутов и оптимизации загрузки БПЛА при решении задач транспортировки грузов [4, 5] до выбора оптимального сценария динамической реконфигурации роя [6] или гетерогенной группы БПЛА [7] при выходе из строя отдельных аппаратов или потере связи с ними. Во всех указанных случаях расход заряда аккумуляторной батареи выступает в качестве одного из целевых показателей при решении соответствующих оптимизационных задач.
Основная проблема, возникающая при оценке динамических характеристик БПЛА, состоит в сложности построения строгих математических моделей, позволяющих осуществлять подобную оценку. Так расход заряда зависит не только от параметров маршрута и летно-технических характеристик БПЛА, но и от множества других разнородных параметров, характеризующих погодные условия (температуру и влажность воздуха, скорость и направление ветра и т.д.), особенности рельефа местности вдоль маршрута и др. [8, 9]. Кроме того, на расход заряда оказывают влияние различные динамические возмущения, связанные с конкретными условиями полета, а также трудно предсказуемые. В этой связи применение известных из литературы аналитических зависимостей и формул для оценки расхода заряда аккумулятора при перемещении БПЛА хоть и позволяет получить некоторое прогнозное значение этой величины, но отклонение полученного значения от реального, которое будет иметь место в конкретных условиях полета, может оказаться весьма значительным.
В качестве примера можно привести формулу, которая предлагается в работе [7], со ссылкой на работу [10], для оценки расхода заряда при перемещении БПЛА по кратчайшему прямолинейному маршруту между заданными начальной и конечной точками:
|
(1) |
где C – величина расхода заряда; q – расстояние между начальной и конечной точками; v – скорость перемещения БПЛА; k1, k2 – поправочные коэффициенты, зависящие от массы БПЛА и силы ветра. Первое слагаемое в скобках определяет расход энергии, вызванный трением воздуха во время полета, который пропорционален кубу скорости, второе слагаемое – расход энергии, необходимый для преодоления подъемной силы. При этом отмечается, что данная формула носит эвристический характер, в ее основу положен ряд упрощающих предположений (например, о постоянной скорости полета), и в ней не учитывается влияние многих параметров, перечисленных выше.
При наличии достаточного объема исторических данных о фактических значениях величины расхода заряда аккумулятора при перемещении БПЛА определенного типа в различных условиях (физико-географических, погодных и др.) для построения модели оценки расхода заряда можно воспользоваться подходом, основанным на интеллектуальном анализе данных (ИАД). В этом случае набор имеющихся данных выступает в роли обучающего множества, и модель может строиться на его основе, в виде, например, нейронной сети. Данный подход в общем случае позволяет учесть большее количество показателей, влияющих на величину расхода заряда, чем использование аналитических зависимостей, а кроме того, получаемые модели в большей степени адаптированы к разнородности, неточности и неполноте данных.
Вместе с тем, получение набора данных для полноценного обучения модели не всегда возможно и часто связано со значительными временными и другими затратами. В этом случае можно применять комбинированный подход, в рамках которого с помощью аналитической зависимости, подобной (1), вычисляется приближенное значение величины расхода, а затем, с использованием доступного обучающего множества, выбирается доверительный интервал, который с наибольшей вероятностью будет включать фактическое значение данного показателя. При определенном снижении точности оценивания, по сравнению с применением машинного обучения «в чистом виде», данный подход позволяет получить модель, обладающую большей интерпретируемостью, и результаты ее построения можно использовать для выделения дополнительных факторов, оказывающих влияние на величину расхода заряда.
В настоящей работе предлагается способ построения и настройки параметров модели оценки расхода заряда на основе комбинированного подхода, использующего формулу (1), для которой доверительные интервалы определяются с помощью бинарной классификации на основе моделей логистической регрессии.
Структура и формальное представление модели оценки расхода заряда
Общий набор обучающих данных модели включает в себя несколько наборов данных и формально представляется в виде:
где R – данные о полетных заданиях; W – данные о погодных условиях; G – геопространственные данные; S – данные о летно-технических характеристиках БПЛА.
Набор данных R содержит данные о маршрутах полетов в виде набора опорных точек (включая начальную и конечную точки), имеющих геоконтекстную привязку. Кроме того, в этот набор входят временные метки, связанные с прохождением опорных точек маршрута, сведения об используемой на маршруте модели БПЛА, а также о динамических параметрах БПЛА, изменяющихся в процессе выполнения полетного задания, включая массу БПЛА и заряд аккумулятора с привязкой к опорным точкам.
Набор W описывает погодные условия, которые могут оказывать влияние на ход выполнения полетного задания. К ним могут относиться температура и влажность воздуха, скорость и направление ветра и т.д. [8, 9]. Эти данные также имеют геоконтекстную привязку и привязку ко времени, что позволяет устанавливать связь между полетными заданиями и конкретными погодными условиями, имевшими место при его выполнении.
К геопространственным данным, входящим в набор G, относятся данные о рельефе местности вдоль маршрута следования БПЛА в рамках полетного задания, карты высот и другие факторы, которые могут оказывать влияние на сложность прохождения летательным аппаратом конкретных участков маршрута.
Отметим, что в случае неполноты или отсутствия данных из наборов W или G для отдельных участков маршрута, неизвестные значения могут заменяться на усредненные или задаваться экспертным путем.
Набор данных S включает в себя статические сведения о летно-технических характеристиках различных моделей БПЛА: максимальная и крейсерская скорость, дальность полета, диапазон использования высот, взлетно-посадочные характеристики и др.
Входными данными модели оценки являются данные о конкретном полетном задании, для которого необходимо оценить величину расхода заряда аккумулятора. Такие данные будем называть рабочими и соответствующий набор данных будем обозначать R ¢.
Целью построения и применения модели, как уже неоднократно отмечалось, является оценка расхода заряда аккумулятора БПЛА при выполнении полетного задания, описываемого набором рабочих данных R ¢. В качестве приближенной оценки будем использовать величину C ¢, вычисленную по формуле (1) на основе набора рабочих данных R ¢. При этом будем предполагать, что значение q в формуле (1) может быть получено суммированием длин прямолинейных участков между всеми опорными точками маршрута. Для рассчитанного таким образом значения C ¢ будем рассматривать интервал D = (d1, d2) и через E обозначим искомую вероятность попадания в данный интервал фактического значения величины расхода заряда С, т.е.
Заметим, что интервал D строится на основе оцененного значения C ¢, но в общем случае может как содержать, так и не содержать его (при значительной ошибке оценивания).
С учетом сказанного выше, набор выходных данных модели формально представляется в виде:
и таким образом, модель оценки расхода заряда аккумулятора БПЛА на основе данных полетного задания допускает следующее формальное представление:
Для применения модели M необходимо предварительно выполнить шаги по ее созданию и настройке на основе обучающего набора данных X. Структурированное представление процесса построения, обучения и применения указанной модели будет далее называть конвейером оценки. Рассмотрим его более подробно.
Описание конвейера оценки
Предлагаемая структура конвейера оценки представлена на рис. 1 в виде диаграммы, построенной с применением нотации BPMN 2.0 [11]. Диаграмма описывает два процесса – создание модели M и ее последующее применение. Создание модели представляет собой итерационный процесс, который повторяется до тех пор, пока не будет достигнута приемлемая точность модели. Каждая итерация связана с корректировкой и оптимизацией параметров, используемых для обучения.
Рис. 1. Структура конвейера оценки
Fig. 1. Structure of estimation pipeline
Ключевым этапом построения модели на каждой итерации является процесс, показанный на рис. 1 в виде блока 5 (Выполнить моделирование). Детальная структура данного процесса, с учетом его реализации на основе применения подхода ИАД, представлена в виде BPMN-диаграммы на рис. 2.
Рис. 2. Реализация модели оценки с применением подхода ИАД
Fig. 2. Implementation of the estimation model using the Intelligent Data Analysis approach
Как видно из рис. 2, процесс реализации модели также является итерационным. Под валидацией в блоке 5.2.2 подразумевается качественная проверка параметров обучения модели – соответствие типов данных, наличие нормализации и предобработки. При выявлении недочетов выполняется корректировка параметров модели или обучающих данных.
Отметим также, что обучающие данные о полетном задании R и погодных условиях W перед их объединением и использованием для обучения модели целесообразно предварительно обработать – выполнить нормализацию и вычислить интегральные показатели [12]. В частности, для некоторых погодных данных в этой ситуации целесообразным будет применение методов конечных классов или биннинга [13].
Процесс обучения модели M на рис. 2 показан в виде блока 5.2.1. Прежде чем перейти к его детальному рассмотрению, рассмотрим предлагаемый способ реализации самой модели. Для этого вернемся к исходной постановке задачи и формальной структуре модели M. Пусть для значения величины расхода заряда C ¢, рассчитанного на основе рабочих данных полетного задания R ¢ с помощью формулы (1), задан некоторый набор интервалов D1, D2, …, DN, и необходимо выбрать тот из них, в который с наибольшей вероятностью попадает фактическое значение расхода заряда C. Задача оценки вероятности попадания данной величины в конкретный интервал Di (i = 1, …, N), по своей сути, является задачей бинарной классификации [12], поэтому для ее решения предлагается использовать логистическую регрессию.
Таким образом, механизм преобразования входных данных в выходные в рамках модели M реализуется в виде набора моделей логистической регрессии, каждая из которых связана с определенным интервалом Di и вычисляет вероятность Ei попадания в данный интервал фактического значения величины расхода заряда. Обучение указанного набора моделей сводится к вычислению набора коэффициентов соответствующего набора функций логистической регрессии, для чего используется метод максимального правдоподобия.
На рис. 3 представлена BPMN-диаграмма, которая описывает структуру процесса обучения модели на примере ситуации, когда для оценки отклонения рассчитанного значения C ¢ величины расхода заряда от фактического значения C используется 5 интервалов:
1)
2)
3)
4)
5)
Рис. 3. Процесс обучения модели для некоторого заданного набора интервалов
Fig. 3. The training process for the model, applied to a specific set of intervals
В блоке 5.2.1.3 осуществляется расчет значения C ¢ с использованием формулы (1), для которой все необходимые значения определяются на основе рабочих данных R ¢ о полетном задании, с учетом погодных условий и характеристик БПЛА. Вычисленное значение C ¢ добавляется к набору обучающих данных X, содержащему, среди прочего, информацию о фактических значениях C для различных ситуаций. Полученный набор используется для обучения пяти раздельных моделей логистической регрессии, представленных на рис. 3 блоками 5.2.1.4.1 – 5.2.1.4.5. Результатом обучения являются величины E1, …, E5, определяющие вероятности попадания фактического значения расхода соответственно в интервалы D1, …, D5. Далее выбирается интервал, характеризующийся наибольшим значением вероятности Ei.
Через K и K ¢ на рис. 3 обозначены наборы коэффициентов логистической регрессии соответственно до и после обучения, через P – внутренние параметры метода максимального правдоподобия.
Отметим, что представленная на рис. 3 структура процесса обучения является масштабируемой и легко обобщается на любую структуру и число используемых интервалов Di.
Программная реализация и экспериментальная проверка конвейера оценки
Программная реализация разработанного конвейера была выполнена с использованием аналитической платформы Loginom [14], входящей в Российский реестр программного обеспечения [15]. На рис. 4 показан пример реализации конвейера в среде Loginom, а также фрагменты наборов входных и выходных данных для модели логистической регрессии, соответствующей интервалу
Рис. 4. Реализация фрагмента конвейера анализа данных на платформе Loginom
Fig. 4. Implementation of a fragment of data analysis pipeline оn the Loginom platform
Для экспериментальной проверки был сформирован набор обучающих данных, который содержал 380 записей, включающих геопространственные данные и данные о погоде, полученные из открытых источников и дополненные синтетическими данными о маршрутах полетных заданий и характеристиках БПЛА. В качестве данных о погоде в обучающий набор были включены данные о скорости и направлении ветра, а из доступной геопространственной информации была использована разность высот. Аналогичным образом был подготовлен тестовый набор данных, содержащий 200 записей, таким образом, общий объем данных составил 580 записей.
В процессе построении модели была выполнена оценка значимости полей набора данных с применением метода биннинга [13], для включения в итоговую версию модели были отобраны поля, имеющие наибольшую значимость. Их описание приведено в табл. 1.
Таблица 1
Данные, используемые для построения модели
Table 1
Data used for model building
Название поля |
Тип данных |
Описание |
Скорость полета, м/с |
Вещественное число |
Средняя скорость БПЛА в рамках полетного задания |
Направление полета |
Пара вещественных чисел |
Синус и косинус угла, задающего направление полета БПЛА |
Расстояние, м |
Вещественное число |
Протяженность маршрута |
Сухая масса БПЛА, кг |
Вещественное число |
Сухая масса БПЛА в соответствии с его техническими характеристиками |
Скорость ветра, м/с |
Вещественное число |
Скорость ветра вдоль маршрута полета |
Направление ветра |
Пара вещественных чисел |
Синус и косинус угла, задающего направление ветра вдоль маршрута полета |
Перепад высот, м |
Вещественное число |
Разница высот над уровнем моря между точкой начала полета и точкой его окончания |
Расход заряда, мА×ч |
Вещественное число |
Прогнозируемая величина, равная разности между уровнем заряда в начальной и конечной точках полета |
Перед началом обучения моделей логистической регрессии была выполнена нормализация полей данных с целью приведения значений к интервалу [0, 1]. При обучении модели использовался метод кросс-валидации K-fold со случайным сэмплингом и количеством колод кросс-валидации равным 5. Для отбора факторов и защиты от переобучения использовался метод гребневой регрессии. Для найденных коэффициентов модели выполнялась денормализация, при этом поправка на долю событий делалась на основе обучающего множества.
Для предобработки значений непрерывных величин, таких как расстояние и скорость, использовался модуль платформы Loginom «Конечные классы», который реализует процедуру биннинга [13] (рис. 5). Использование набора меток множеств вместо непрерывного ряда положительно сказывается на точности модели. Кроме того, процедура формирования конечных классов связана с определением статистических характеристик WoE и IV, которые позволяют судить о «вкладе» отдельных полей в формирование выходного значения. Эта информация может быть в дальнейшем использована для уточнения зависимости (1), за счет выделения дополнительных факторов, оказывающих влияние на величину расхода заряда.
Рис. 5. Пример работы модуля «Конечные классы»
Fig. 5. An example of operation of “Finite classes” module
На рис. 6 представлены количественные результаты обучения модели в среде Loginom: ROC-кривая, оценки классификации и матрицы ошибок [12]. Для каждой модели логистической регрессии в роли события выступало попадание фактического значения расхода заряда C в соответствующий интервал Di. В результате применения обученной модели к тестовым данным ее предсказательная сила составила порядка 65 %, что является приемлемым результатом.
Рис. 6. Результаты обучения модели
Fig. 6. Model training results
Заключение
В статье предложен подход к построению модели оценки расхода заряда аккумулятора БПЛА при его полете по заданному маршруту, с учетом погодных условий и геопространственных характеристик. В рамках данного подхода оценочное значение вычисляется с использованием приближенной зависимости, и далее для этого значения находится доверительный интервал, с наибольшей вероятностью содержащий фактическое значение расхода. Для нахождения указанного интервала используются обучающие данные и метод бинарной классификации с применением моделей логистической регрессии. Построен конвейер, объединяющий механизмы построения, обучения и применения модели оценки. Рассмотрена реализация данного конвейера средствами аналитической платформы Loginom.
В качестве направлений совершенствования предложенного подхода можно отметить поиск путей повышения точности модели оценки и ее предсказательной силы, за счет расширения состава обучающих данных, включения дополнительных полей, характеризующих погодные условия и геопространственные характеристики маршрута. Также интерес представляет апробация построенной модели оценки на реальных данных летных экспериментов.
1. Arzamastsev A.A., Kryuchkov A.A. Mathematical Models for Engineering Calculations of Aircrafts of Multi-Rotor Type (Part 1). Tambov University Review. Series: Natural and Technical Sciences. 2014;19(6):1821-1828.
2. Arzamastsev A.A. Mathematical Models for Engineer Calculations of Aircraft of Multi-Rotor Type (Part 2). The Aims of Routing. Tambov University Review. Series: Natural and Technical Sciences. 2015;20(2):465-468.
3. Kurbanov R.K. Algorithm for Calculating the Flight Time of an Unmanned Aerial Vehicle for Aerial Photography. Agricultural Machinery and Technologies. 2023;17(1):35-40. doi:https://doi.org/10.22314/2073-7599-2023-17-1-35-40.
4. Matyukha S.V. Unmanned Aerial Systems in Cargo Transportation. Transport Business of Russia. 2022;1:141-143.
5. Zakharova A.A., Kutakhov V.P., Meshcheryakov R.V., Podvesovskiy A.G., Smolin A.L. Modeling Cargo Transportation Tasks in an Unmanned Air Transportation System. Aerospace Instrument-Making. 2023;3:3-15.
6. Mubashir Iqbal M, Anwar Ali Z, Khan R, Shafiq M. Motion Planning of UAV Swarm: Recent Challenges and Approaches. In: Ali ZA, Cvetković D, editors. Aeronautics – New Advances. IntechOpen [Internet]. 2022. Available from: https://www.intechopen.com/chapters/82985
7. Liu D, Du Z, Liu X, et. al. Task-Based Network Reconfiguration in Distributed UAV Swarms: A Bilateral Matching Approach. IEEE/ACM Trans. Netw. 2022;30(6):2688-2700.
8. Gorbunov A.A., Galimov A.F. The Influence of Meteorological Factors on the Use and Flight Safety of Unmanned Aerial Vehicle with Side Repeater Radio. Vestnik Saint-Petersburg University of State Fire Service of Emercom of Russia. 2016;2:7-15.
9. Aleshin I.M., Dorozhkov V.V., Dyakov V.V., Perederin F.V., Kholodkov K.I. UAV Surveys in Cold Weather. Dynamic Processes in Geospheres. 2023;15(2):89-98.
10. Zeng Y., Zhang R. Energy-Efficient UAV Communication with Trajectory Optimization. IEEE Trans. Wireless Communication. 2017;16(6): 3747-3760.
11. Fedorov I.G. Business Process Model and Notation (BPMN) 2.0. Standard ISO/IEC 19510:2013 for Creating Executable Business Process Models. Moscow: Plekhanov Russian University of Economics; 2018.
12. Paklin N.B., Oreshkov V.I. Business-Analytics: From Data to Knowledge. St. Petersburg: Peter; 2013.
13. Guoping Z. A Necessary Condition for a Good Binning Algorithm in Credit Scoring. App. Math. Sci., 2014;8(65):3229-3242.
14. Analytical Platform Loginom [Internet] [cited 2024 Apr 15]. Available from: https://loginom.ru/platform
15. Russian Software Register [Internet] [cited 2024 Apr 15]. Available from: https://reestr.digital.gov.ru/