ОСНОВЫ РЕЛЯЦИОННОЙ ТЕОРИИ В РЕШЕНИИ ЗАДАЧ СТРУКТУРИЗАЦИИ И КЛАССОВОГО РАСПРЕДЕЛЕНИЯ ДАННЫХ ПРОИЗВОДСТВЕННО-ЭКОНОМИЧЕСКОГО СЕКТОРА ПЕНИТЕНЦИАРНОЙ СИСТЕМЫ
Аннотация и ключевые слова
Аннотация (русский):
В представленном исследовании рассмотрено применение основ реляционной теории и теории множеств как части онтологии проектирования баз данных информационных систем. В качестве примера был рассмотрен производственно-экономический сектор пенитенциарной системы. В работе были рассмотрены архитектуры статистических отчетных данных: возможности индексации, структуризации и классового распределения. Рассмотрено построение иерархических структур для каждого из классов. С позиции реляционной теории рассмотрено: взаимодействие между множествами, возможности организовать срезы данных по отраслям производства и учреждениями, где организованы производственные процессы; разработан ряд правил для организации работы с данными. Исходя из проведенного теоретико-множественного анализа, были разработаны ключевые параметры эффективности (Key Performance Indicators (KPI)), использование которых в практической деятельности производственных подразделений поможет более качественно проводить мониторинг организованной работы. Исходя из полученных результатов, представлены практические примеры взаимных распределений и проведение OLAP-анализа с использованием разработанного ранее программного комплекса. Целью исследования явилось: исследовать возможность применения реляционной теории в решении задач структуризации и классового распределения данных на примере производственно-экономического сектора пенитенциарной системы. Новизна работы заключается в: разработанных взаимосвязях между множествами и правилах работы с данными, построенных на их основе; разработанной классификации данных; результатах исследования иерархических структур классов; разработанных KPI для применения в практической деятельности. В качестве методов исследования были рассмотрены методы реляционной теории; теории множеств и логики в рамках онтологии проектирования баз данных информационных систем. Практическая значимость исследования заключается: в применении разработанных методов и подходов, а также правил работы с данными при построении архитектур баз данных информационных систем производственно-экономического сектора пенитенциарной системы, а также в их применении при построении отчетно-аналитической работы предприятий пенитенциарной системы. Теоретическая значимость заключается: в разработанных подходах, правилах и нормах при работе с отчетными данными пенитенциарной системы; в разработанной классовой структуризации данных; в исследованных возможностях организовать срезы данных; в представленных KPI для проведения дальнейших исследований.

Ключевые слова:
ключевые параметры эффективности, трудовой сектор, пенитенциарная система, теория множеств
Текст
Текст (PDF): Читать Скачать

Введение

Обоснование выбранного объекта исследования. Согласно официальным данным, которые представлены в открытых источниках [1], в 2023 году объем производственного сектора пенитенциарной системы составил 44,3 млрд. руб, а доля осужденных, которые привлечены к труду, составила 86,6%. На 01.01.2024 в структуру производственного сектора УИС входит 596 исправительных учреждений [1]. Производственные подразделения УИС являются надежными партнерами и поставщиками продукции для нужд органов государственной и муниципальной власти [1]. Кроме того, проведение трудовой адаптации является неотъемлемой частью процесса исправления и социализации осужденных. Поэтому, проведение исследований в данной области является актуальным не только для пенитенциарной системы, но и для Российской Федерации в целом.

Важной составляющей любого крупного производства является ведение отчетной статистической документации [2]. Предприятия пенитенциарной системы в данном вопросе не являются исключением. Согласно Приказу ФСИН России №754 от 30.08.2019 «Об утверждении формы статистической отчетности ОТАО «Отчет о трудовой адаптации осужденных» и инструкции по ее заполнению и представлению» (далее Приказ ФСИН России №754 от 30.08.2019) в пенитенциарной системе ведется учет данных производственной, трудовой и экономической деятельности. Помимо данных статистических отчетных форм, существуют и другие:

Приказ ФСИН России №1033 от 12.11.2019 «Об утверждении формы ведомственной статистической отчетности ФСИН-6 «Сведения о социально значимых заболеваниях у лиц, содержащихся в учреждениях уголовно-исполнительной системы Российской Федерации, и отдельных показателях деятельности медицинской службы» и инструкции по ее заполнению и представлению» (далее Приказ ФСИН России №1033 от 12.11.2019);

Приказ ФСИН России №661 от 15.09.2020 О внесении изменения в приказ ФСИН России от 12 ноября 2019 г. № 1033 (далее Приказ ФСИН России №661 от 15.09.2020);

Приказ ФСИН России от 01.08.2014 № 398 «Об утверждении формы статистической отчетности ФСИН-1 «Итоги деятельности учреждений, органов и предприятий уголовно-исполнительной системы» и инструкции по её заполнению и представлению» (далее Приказ ФСИН России №398 от 01.08.2014).

Научная проблема. За последние пять лет наблюдается рост объемов производства, а также рост доли спецконтингента привлеченного к труду. Однако, существует ряд вопросов, которые могут стать актуальными не только при проведении научных исследований, но и с позиций практического применения. На сегодняшний день отсутствуют какие-либо утвержденные методы и подходы, которые позволяли бы проводить прикладные статистические исследования и применять методы системного анализа в целом по приведенным отчетным формам [3].  Это приводит к тому, что на сегодняшний день отсутствует возможность разработки информационных систем, которые бы позволили проводить аналитику отчетных данных, проводить разработку прогнозов и возможных рисков для предприятий, разрабатывать планы по повышению эффективности производственных процессов, корректировать централизованное управление предприятиями с позиций корректной научно-исследовательской работы со статистической информацией.

Рассмотренные методы для решения проблемы. В качестве одной из первых ступеней для решения обозначенных проблем наиболее перспективным может явиться применение основ реляционной теории [4], теории множеств и логики [5], объектно-ориентированного подхода (ООП) [6] с последующей реализацией при помощи технологии ORM (Object-Relational Mapping) [7]. Все это следует рассматривать как часть проектирования достаточно глобальной информационной системы, ориентированной на производства, которые распределены по территориям всей Российской Федерации. Поэтому, данные методы в представленном исследовании рассматривались как часть архитектур баз данных и разрабатываемых информационных систем для проведения научных исследований [8]. В приведенном исследовании рассмотрено: возможность применения основ реляционной теории для структуризации данных, их классификации; создание правил для исследования взаимных распределений многомерных данных, а также проведения OLAP-анализа [9]. В качестве программной реализации для дальнейших разработок представляется актуальным использование систем управления базами данных (СУБД) (например, таких как MySQL [10], PostgreSQL [11] или SQLite [12] (если нужна интеграция напрямую в программное обеспечение)), использование которых будет направлено непосредственно для решения проблем прогноза, поддержки принятия решений и автоматизации производственной деятельности. Применение основ реляционной теории может явиться здесь хорошим инструментом. Немаловажным аспектом реляционной теории, ООП и онтологии проектирования является структуризация данных с распределением на классы [7]. Представленные далее в работе результаты исследования можно принять в качестве основы при разработке архитектур баз данных информационных систем, позволяющих проводить научные исследования. Рассмотрим более подробно разбиение данных на классы – данный шаг позволит лучше структурировать существующую информацию и выделить наиболее важные KPI (Key Performance Indicators) [13].

 

1. Анализ производственного сектора пенитенциарной системы и разработка классового распределения данных

Исходя из представленной ранее системы индексации данных [14] все исследуемые параметры для производственного сектора можно представить в виде множеств:

Xm=2,  p∈{1,2},  o∈{…}                                       (1)

где: m=2 – отчеты о производственной деятельности пенитенциарных учреждений (оставшиеся mm=1 – отчет о трудовой адаптации осужденных, m=3 – отчет о производственной и экономической деятельности, связанной с привлечением осужденных к труду, m=4 – сведения о социально-значимых заболеваниях, m=5 – отчет о среднем профессиональном образовании и профессиональном обучении – рассматривались отдельно), p – номер раздела в представленных формах учета (p=1: производственная и экономическая деятельность учреждений уголовно-исполнительной системы; p=2: производственная и экономическая деятельность в отраслевом разрезе), o – номер исследуемого параметра. Будут справедливы ограничения:

p=1 ⇒ o∈ {1,2, ...,61} ,                     (2)

p=2 ⇒ o∈ {1,2, ...,37} ,                     (3)

Индексация для срезов по учреждениям и отраслям производства также проводилась согласно разработанной ранее системы [15]. Было принято обозначение для срезов – Yu,v, где u=1 – срез по учреждениям в рамках производственной и экономическая деятельности пенитенциарной системы (v –в этом случае являются отдельно взятым видом учреждений); u=2 – разрез по отраслям производства (v – отдельная отрасль промышленности).

Здесь также можно ввести условия:

u=1 v∈{1,2,…, 14}  ,                    (4)

u=2 v∈{1,2,…, 13}  ,                    (5)

Исходя из имеющейся информации, производственно-экономический сектор можно разделить на 6 классов, для каждого класса при этом можно сделать срезы по отраслям производства, временной шкале и учреждениям.

Таким образом, для Xm=2,  p∈{1,2},  o∈{…} определены следующие классы.

1. Класс «Объем производства» (включает в себя: Xm=2,p=1,o∈{1,2,…,25};Xm=2,p=2,o∈{1,2,…,13} ). Здесь, для создания срезов массивов данных в рамках представленных множеств по учреждениям, будет справедливо (1):

Yu=1,v∈{1,2,…,14}⇒Xm=2,  p=1,  o∈1,2, …, 25 ,    (1)

для отраслевого среза производств (2):

Yu=2,v∈{1,2,…,13}Xm=2,  p=2,  o1,2, …, 13 ,    (2)

если не рассматривать срезы по учреждениям и отраслям производства, то (3):

Yu=1,v=1Yu=2,v=1    Xm=2,  p=1,  o1,2, …, 25Xm=2,  p=2,  o1,2, …, 13 . (3)

2. Класс «Расходы» (Xm=2,  p=1,  o26,27, …, 37;Xm=2,  p=2,  o14,15, …, 26 ). Аналогично предыдущему классу, будет справедливо (4):

 Yu=1,v∈{1,2,…,14}Xm=2,  p=1,  o26,27, …, 37,  (4)

для отраслевого среза (5):

Yu=2,v1,2,…,13Xm=2,  p=2,  o14,15, …, 26, (5)

если не рассматриваем срезы (6):

 

Yu=1,v=1Yu=2,v=1 Xm=2,  p=1,  o26,27, …, 37Xm=2,  p=2,  o14,15, …, 26 .(6)

 

3. Класс «Доходы» (Xm=2,  p=1,  o38,39, 42, 43,44, 45;Xm=2,  p=2,  o33,  34 ). Для создания срезов по учреждениям будет справедливо (7):

 

Yu=1,v∈{1,2,…,14}Xm=2,  p=1,  o38,39, 42, 43,44, 45,                (7)

 

для отраслей (8):

 

Yu=2,v∈{1,2,…,13}Xm=2,  p=2,  o33,  34 ,                                                      (8)

 

 как видно, здесь для отраслевого среза присутствует всего лишь два множества, поэтому (9):

 

 

Yu=1,v=1Yu=2,v=1    Xm=2,  p=1,  o38,39, 42, 43 …, 45Xm=2,  p=2,  o33,34 . (9)

 

4. Класс «Задолженность» (Xm=2,  p=1,  o46,47,…, 55 ). Здесь присутствует срез только для учреждений (10):

Yu=1,v∈{1,2,…,14}Xm=2,  p=1,  o46,47,…, 55 .                                    (10)

5. Класс «Остатки и брак продукции» (Xm=2,  p=1,  o40,41,60;Xm=2,  p=2,  o28,...,32,  36 ). Для учреждений (11):

 Yu=1,v∈{1,2,…,14}Xm=2,  p=1,  o40,41,60 , (11)

отраслевой срез (12):

 Yu=2,v∈{1,2,…,13}Xm=2,  p=2,  o28,...,32,  36 ,(12)

если не рассматривать срезы (13):

 

Yu=1,v=1Yu=2,v=1   Xm=2,  p=1,  o40,41,60Xm=2,  p=2,  o28,...,32,  36 . (13)

 

6. Класс «Объем заказов». Подробное исследование непосредственно самих видов заказов не входило в задачи исследования, однако, если смотреть обобщенно, то объемы заказов оказывают существенное влияние на производственно-экономический сектор. Поэтому был рассмотрен один параметр («объем заказов для всех видов продукции») и возможные срезы по нему (14-16):

Yu=1,v∈{1,2,…,14}Xm=2,  p=1,  o=56 ,             (14)

Yu=2,v∈{1,2,…,13}Xm=2,  p=2,  o=35 ,             (15)

 

Yu=1,v=1Yu=2,v=1 Xm=2,  p=1,  o=56 =Xm=2,  p=2,  o=35 .                     (16)

 

Обобщенная схема связи между срезом по учреждениям и срезом по отраслям производства, которая существует на сегодняшний день (для всех рассмотренных классов) будет выглядеть следующим образом (рисунок 1).

Взаимодействие между множествами [15], с учетом всех представленных срезов и возможных вариантов взаимодействия – представлена на рисунке 2 далее.

Перспективным продолжением приведенного классового распределения производственно-экономического сектора будет проведение многомерного анализа данных. Изучение взаимных распределений параметров разных классов относительно друг друга – является важной составляющей для последующего построения моделей описания и прогноза. Также немаловажной составляющей является и исследование возможных срезов для изучаемых данных т.е. в нашем случае можно построить срезы по отраслям производства (Yu=2,v∈{1,2,…,13} ), временной шкале (t) и учреждениям (Yu=1,v∈{1,2,…,14} ).

2. Структуры классов и их взаимодействие между собой

Рассмотрим более подробно структуру каждого из представленных классов. Структура класса «Объем производства» (Xm=2,p=1,o∈{1,2,…,25};Xm=2,p=2,o∈{1,2,…,13} ). Учет ведется с разделением на три группы потребителей: первое – для нужд непосредственно самой УИС, второе – для государственных и муниципальных служб, третье – при заключении договора между УИС и коммерческих структур. На примере Xm=2,p=1,o∈{1,2,…,25}  рассмотрим структуру данного класса (здесь стоит отметить, что для Xm=2,p=2,o∈{1,2,…,13}  будет схожая структура) (18):

Как видно из рисунка 2, класс «Заказы» влияет на класс «Объем производства», в свою очередь класс «Объем производства» влияет на остальные классы. Также можно отметить, что для срезов Yu=1,v∈{1,2,…,13}  отсутствует класс «Задолженности».

 

Рис. 1. Обобщенная схема связи между срезом по учреждениям и срезом по отраслям производства, которая существует на сегодняшний день (для всех рассмотренных классов)

Fig. 1. Generalized diagram of the relationship between the cross-section by institutions and the cross-section by industry, which exists today (for all the classes considered)

 

Рис. 2. Взаимодействие между множествами производственно-экономического сектора с учетом срезов

Fig. 2. The interaction between the sets of the production and economic sector, taking into account the cross-sections

 

 

Сопоставить значения при разных срезах (Yu=1,v∈{1,2,…,14};  Yu=2,v∈{1,2,…,13} ) для выбранного класса относительно остальных можно лишь при использовании общего суммирующего значения как для учреждений, так и для отраслей производства, то есть (17):

Yu=1,v=1=Yu=2,v=1.                                  (17)

 

Xm=2,p=1,o=1 = {<x>|xXm=2,p=1,o=5xXm=2,p=1,o=8xXm=2,p=1,o=12} , (18)

 

Вся производственная деятельность на предприятиях УИС при этом (для всех трех групп потребителей) разделена на две глобальные категории: производство товаров (которое также в отчетных документах содержит стоимость переработанных сырья и материалов) и выполнение работ и оказание услуг (19):

 

Xm=2,p=1,o=1  = {<x>|rXm=2,p=1,o=2   ∨xXm=2,p=1,o=4  },  (19)

 

будет справедливо также:

 

Xm=2,p=1,o=2 = {<x>|xXm=2,p=1,o=5xXm=2,p=1,o=8xXm=2,p=1,o=12xXm=2,p=1,o=4},  (20)

 

или:

 

Xm=2,p=1,o=4  = {<x>|xXm=2,p=1,o=5xXm=2,p=1,o=8xXm=2,p=1,o=12xXm=2,p=1,o=2},  (21)

 

учет объема производства товаров, выполненных работ и оказанных услуг, связанный с привлечением осужденных к труду, для нужд УИС, в фактических ценах:

Xm=2,p=1,o=5  ={<x>|xXm=2,p=1,o=6= ∨xXm=2,p=1,o=7} , (22)

Учет объемов производства товаров, выполненных работ и оказанных услуг, связанный с привлечением осужденных к труду, для государственных и муниципальных нужд (без учета объемов для нужд УИС) :

Xm=2,p=1,o=8  = {<x>|xXm=2,p=1,o=9xXm=2,p=1,o=11} , (23)

Для коммерческих структур:

Xm=2,p=1,o=12 = {<x>|xXm=2,p=1,o=13xXm=2,p=1,o=14} . (24)

Для Xm=2,p=2,o∈{1,2,…,13}  может быть построена схожая иерархическая структура. Обобщенные иерархические структуры на примере Xm=2,p=1,o∈{1,2,…,25}  представлены далее (25).

 

Xm=2,p=1,o=1 Xm=2,p=1,o=2 Xm=2,p=1,o=4 Xm=2,p=1,o=5 Xm=2,p=1,o=6 Xm=2,p=1,o=7 Xm=2,p=1,o=8 Xm=2,p=1,o=9 Xm=2,p=1,o=10 Xm=2,p=1,o=9 -Xm=2,p=1,o=10 Xm=2,p=1,o=11 Xm=2,p=1,o=12 Xm=2,p=1,o=13 Xm=2,p=1,o=14 , (25)

 

KPI здесь могут быть определены следующими соотношениями. Доля производства товаров, исходя из общего объема производства (manufacturing products (MP)):

MPYu=1,v∈{1,2,…,14}=Xm=2,p=1,o=2Xm=2,p=1,o=1 ,(26)

MPYu=2,v∈{1,2,…,13}=Xm=2,p=2,o=2Xm=2,p=2,o=1 ,                (27)

если рассматриваем без учета стоимости сырья и материалов (manufacturing products (work only) (MP(WO))):

MPWOYu=1,v∈{1,2,…,14}=Xm=2,p=1,o=2-Xm=2,p=1,o=3Xm=2,p=1,o=1 ,                     (28)

MPWOYu=2,v∈{1,2,…,13}=Xm=2,p=2,o=2-Xm=2,p=2,o=3Xm=2,p=2,o=1 ,                     (29)

доля выполнения работ и оказания услуг (production of services (POS)):

POSYu=1,v∈{1,2,…,14}=Xm=2,p=1,o=4Xm=2,p=1,o=1 ,              (30)

POSYu=2,v∈{1,2,…,13}=Xm=2,p=2,o=4Xm=2,p=2,o=1 ,              (31)

Далее рассмотрим структуру для остальных классов производственно-экономического сектора.

Аналогичным образом можно построить структуры данных для класса «Расходы» (Xm=2,  p=1,  o26,27, …, 37;Xm=2,  p=2,  o14,15, …, 26 ). Здесь будет справедливо:

Xm=2,p=1,o=26={<x>|xXm=2,p=1,o=29xXm=2,p=1,o=32xXm=2,p=1,o=33} , (32)

 

Xm=2,p=1,o=26 =  {<x>|xXm=2,p=1,o=27xXm=2,p=1,o=28}, (33)

 

Xm=2,p=1,o=27= {<x>|xXm=2,p=1,o=29xXm=2,p=1,o=32xXm=2,p=1,o=33xXm=2,p=1,o=28},  (34)

 

Xm=2,p=1,o=28 ={<x>|xXm=2,p=1,o=29xXm=2,p=1,o=32xXm=2,p=1,o=33xXm=2,p=1,o=27},  (35)

 

как можно заметить, Xm=2,p=1,o=36  и Xm=2,p=1,o=37  не укладываются в данную иерархию и могут рассматриваться отдельно; Xm=2,p=1,o=32  не имеет разделений на «производство товаров» и «выполнение работ и оказание услуг».

Структура класса «Расходы» достаточно хорошо накладывается на класс «Объем производства». Это можно представить в виде условий (на примере Yu=1,v∈{1,2,…,14} ):

 

Xm=2,p=1,o=26Xm=2,p=1,o=1Xm=2,p=1,o=27Xm=2,p=1,o=2Xm=2,p=1,o=28Xm=2,p=1,o=4Xm=2,p=1,o=29Xm=2,p=1,o=5Xm=2,p=1,o=30Xm=2,p=1,o=6Xm=2,p=1,o=31Xm=2,p=1,o=7Xm=2,p=1,o=32Xm=2,p=1,o=8Xm=2,p=1,o=33Xm=2,p=1,o=12Xm=2,p=1,o=34Xm=2,p=1,o=13Xm=2,p=1,o=35Xm=2,p=1,o=14,                           (36)

для Yu=2,v1,2,…,13  будет несколько выглядеть иначе (37):

Xm=2,p=1,o=14Xm=2,p=1,o=1Xm=2,p=1,o=15Xm=2,p=2,o=2Xm=2,p=2,o=16Xm=2,p=2,o=4Xm=2,p=2,o=17Xm=2,p=2,o=5Xm=2,p=2,o=18Xm=2,p=2,o=6Xm=2,p=2,o=19Xm=2,p=2,o=7Xm=2,p=2,o=20Xm=2,p=2,o=8Xm=2,p=2,o=21Xm=2,p=2,o=9Xm=2,p=2,o=22Xm=2,p=2,o=10Xm=2,p=2,o=23Xm=2,p=2,o=11Xm=2,p=2,o=23Xm=2,p=2,o=12Xm=2,p=2,o=24Xm=2,p=2,o=13 .                           (37)

 

Расходы производства предпочтительнее рассматривать в долевом соотношении от объемов. KPI в этом случае могут быть определены как (expenses depending on income (EDOI)):

при Yu=1,v∈{1,2,…,14} :

EDOIYu=1,v∈{1,2,…,14} = Xm=2,  p=1,  o26,27, …, 37 Xm=2,  p=1,  o∈1,2, …, 25 ,(38)

при Yu=2,v∈{1,2,…,13} :

EDOIYu=2,v∈{1,2,…,13} =Xm=2,  p=2,  o14,15, …, 26Xm=2,  p=2,  o1,2, …, 13 ,(39)

Далее рассмотрим структуру класса «Доходы». Для класса «Доходы» (Xm=2,  p=1,  o38,39, 42, 43,44, 45;Xm=2,  p=2,  o33,  34 ) иерархические структуры отсутствуют, а некоторые KPI будут соответствовать уже имеющимся параметрам и показателям.

Так, например, чистая прибыль (net profit(NP)) характеризуется: NPYu=1,v∈{1,2,…,14}=Xm=2,p=1,o=43  и NPYu=2,v∈{1,2,…,13}=Xm=2,p=2,o=34 .

Превышение доходов над расходами (excess of income over expenses (EOIOE)): EOIOEYu=1,v∈{1,2,…,14}=Xm=2,p=1,o=42  и EOIOEYu=2,v∈{1,2,…,13}=Xm=2,p=2,o=34 . При Yu=1,v∈{1,2,…,14}  связь с классом «Расходы» будет следующая:

EOIOEYu=1,v∈{1,2,…,14}=Xm=2,p=1,o=42=Xm=2,p=1,o=38-Xm=2,p=1,o=36 ,      (40)

По аналогии с расходами следует ввести значение доли чистой прибыли относительно объемов производства (volume of production (WOP)):

при Yu=1,v∈{1,2,…,14} :

NPWOPYu=1,v∈{1,2,…,14}= Xm=2,p=1,o=43Xm=2,p=1,o=1 , (41)

при Yu=2,v∈{1,2,…,13} :

NPWOPYu=2,v∈{1,2,…,13}= Xm=2,p=2,o=34Xm=2,p=2,o=1 , (42)

а также превышение доходов над расходами в зависимости от объемов производства (WOP)

EOIOE(WOP)Yu=1,v∈{1,2,…,14}=Xm=2,p=1,o=42Xm=2,p=1,o=1  (43)

 EOIOE(WOP)Yu=2,v∈{1,2,…,13}=Xm=2,p=2,o=34Xm=2,p=2,o=1 . (44)

Отношение доходов к расходам (income-expenses(IE))  можно выразить как:

IEYu=1,v∈{1,2,…,14}=Xm=2,p=1,o=38Xm=2,p=1,o=26 .                (45)

KPI для классов «Задолженность» (Xm=2,  p=1,  o46,47,…, 55 ), «Остатки и брак продукции» (Xm=2,  p=1,  o40,41,60;Xm=2,  p=2,  o28,...,32,  36 ), «Объем заказов» (Xm=2,  p=1,  o=56, Xm=2,  p=2,  o=35 ) некоторые параметры возможно приравнять непосредственно к KPI, для этого следует провести анализ взаимных распределений на основе собранных статистических данных с другими классами.

Доля бракованной продукции (defective products (DP)) относительно объемов производства:

DP=X'm=2,p=2,o=38=Xm=2,p=1,o=1Xm=2,p=1,o=38 ,      (46)

Таким образом, были рассмотрены структуризация данных и разделение их на классы. Определены структуры каждого класса. Было установлено, что некоторые классы зависимы от других, что и было отражено при помощи UML-диаграмм. Также можно отметить наличие иерархических структур в некоторых классах (например, «Объем производства»; «Расходы»). Все это позволило разработать и выделить KPI, для которых представляется актуальным проведение OLAP-анализа. Рассмотрим далее несколько примеров OLAP-анализа с учетом срезов данных, которые характерны для представленных классов.

3. Примеры взаимных распределений, OLAP-кубы

Рассмотрим примеры многомерного анализа распределений некоторых основополагающих параметров из одного класса относительно другого класса. Для реализации воспользуемся применением OLAP-кубов, благодаря которым можно в графическом виде рассмотреть взаимные распределения и организовать срезы многомерных данных. Для этого был использован разработанный ранее программный комплекс «Программа для графического анализа взаимных распределений числовых параметров из статистических отчетных форм ФСИН России» [16].

Рассмотрим случай взаимного распределения параметра «Объем производства товаров, выполненных работ и оказанных услуг, связанный с привлечением осужденных к труду, в фактических ценах», тыс. руб. (Xm=2,p=1,o=1 ) и «Расходы при производстве товаров (работ, услуг), связанные с привлечением осужденных к труду», тыс. руб. (Xm=2,p=1,o=26 ), в срезе для общего количества учреждений (Yu=1,v=1 ) (рисунок 3).

 

Рис. 3. Пример трехмерного взаимного распределения для Xm=2,p=1,o=1  и Xm=2,p=1,o=26  в срезе Yu=1,v=1  

Fig. 3. Example of a three-dimensional mutual distribution for Xm=2,p=1,o=1  and Xm=2,p=1,o=26  in the slice Yu=1,v=1

 

 

Как видно из рисунка 4, взаимное распределение Xm=2,p=1,o=1  и Xm=2,p=1,o=26  является линейным и может быть охарактеризовано функцией вида (47):

fx=ax+b .                                         (47)

В первую очередь это обусловлено грамотно организованными работой и контролем в производственно-экономическом секторе пенитенциарной системы. Вторым аспектом (и более влияющим на данное распределение) будет непосредственно метод учета данных: исследуемые параметры представляют собой циклические (сезонные) временные ряды, учет которых ведется накопительным итогом (т.е. на каждый 12-й месяц года значение данных параметров будет максимальным, а на 1-й месяц года - минимальным), что и можно увидеть на рисунке 4.

Рассмотрим другой пример: взаимное распределение Xm=2,p=1,o=1  и Xm=2,p=1,o=56  (рисунок 4).

 

Рис. 4. Пример трехмерного взаимного распределения для параметров Xm=2,p=1,o=1  и Xm=2,p=1,o=56  в срезе Yu=1,v=1

Fig. 4. An example of a three-dimensional mutual distribution for parameters Xm=2,p=1,o=1   and Xm=2,p=1,o=56   in the slice Yu=1,v=1

 

Как видно из рисунка 4, для Xm=2,p=1,o=56  временной ряд всегда заканчивается на отметке «0», это в первую очередь обусловлено тем, что к концу года все заказы должны быть исполнены. Также можно отметить нелинейную структуру распределения данных в рамках одного цикла для данного параметра, что требует дополнительных исследований.

Аналогичным образом были исследованы и другие классы. было отмечено, что в каждом классе присутствуют свои особенности: учет данных, которые относятся к классам «Объем производства» (Xm=2,p=1,o∈{1,2,…,25};Xm=2,p=2,o∈{1,2,…,13} ), «Расходы» (Xm=2,  p=1,  o26,27, …, 37;Xm=2,  p=2,  o14,15, …, 26 ), и «Доходы» (Xm=2,  p=1,  o38,39, 42, 43,44, 45;Xm=2,  p=2,  o33,  34 )  ведется накопительным итогом в течении года; для параметров, которые относятся к классам «Задолженность» (Xm=2,  p=1,  o46,47,…, 55 ) и «Остатки и брак продукции» (Xm=2,  p=1,  o40,41,60;Xm=2,  p=2,  o28,...,32,  36 ) – характерен учет данных по фактическим значениям за каждый месяц; для класса «Объем заказов» (Xm=2,  p=1,  o=56;Xm=2,  p=2,  o=35 ) характерны максимальные значения в начале цикла (года), но при этом в завершении цикла значения должны быть сведены к нулю.

Заключение

Применение принципов реляционной теории в поставленных задачах исследования позволило проиндексировать и структурировать собранные данные, распределить их на классы, определить условия для каждого класса и возможные срезы для более детального изучения параметров.

Продолжением исследования является проведение анализа и изучение временных рядов для параметров из представленных классов. Можно отметить, что исследуемые данные производственно-экономического сектора в большинстве случаев представляют собой циклические временные ряды (цикл – один год).

Также представляется актуальным исследование возможностей сопоставления данных производственно-экономического и трудового секторов. Основной проблемой здесь может стать разность методов учета данных: производственно-экономические показатели представляют собой в большей части циклические временные ряды, а данные, которые отражают состояние трудовых ресурсов - являются трендовыми временными рядами. Актуальным инструментом для дальнейшей реализации представленного классового распределения данных будет являться применение языков программирования, которые ориентированы на работу с базами данных, статистическую обработку информации, применение объектно-ориентированного подхода.

Список литературы

1. Сайт ФСИН России. URL: https://fsin.gov.ru/structure/adaptation/index.php?sphrase_id=190571 (дата обращения: 04.03.2024).

2. Картамышев А.С., Черныш Б.А. Подход к формированию данных для аналитической отчетности в системе управления предприятием // Информационные технологии. 2023. Т. 29, № 10. С. 540-548. DOIhttps://doi.org/10.17587/it.29.540-548. EDN WBODBJ.

3. Пономарев Д.С. Применение теории множеств для разработки ключевых параметров эффективности трудового сектора пенитенциарной системы // Эргодизайн. 2024. № 3(25). С. 297-306. DOIhttps://doi.org/10.30987/2658-4026-2024-3-297-306. EDN BGHYDS.

4. Date C.J. SQL and Relational Theory. O’Reilly. 2010. 474 p. ISBN 9781449319724.

5. Robert R. S. Set Theory and Logic. Dover Publications, Revised ed. edition. 1979. 512 p.

6. Dusty Ph. Python 3 Object Oriented Programming. Packt Publishing. 2010. 404 p. ISBN‎ 978-1849511261.

7. Halpin T. Object-Role Modeling Fundamentals: A Practical Guide to Data Modeling with ORM. Wiley, First Edition. 2015. 192 p. ISBN‎ 978-1634620741.

8. Благодатский, Г. А. Гибридные методы и алгоритмы поддержки принятия решений для управления иерархическими производственно-техническими системами : диссертация на соискание ученой степени доктора технических наук / Благодатский Григорий Александрович. – Ижевск, 2023. – 409 с. – EDN FVLGPT.

9. Барсегян А.А., Куприянов М.С., Степаненко В.В. и др. Методы и модели анализа данных: OLAP и Data Mining. СПб.: БХВ-Петербург, 2004. 336 с. ISBN 5-94157-522-X.

10. Nichter D. Efficient MySQL Performance: Best Practices and Techniques. O'Reilly Media; 1st edition. 2022. 335p. ISBN‎ 978-1098105099.

11. Obe R., Hsu L. PostgreSQL: Up and Running: A Practical Guide to the Advanced Open Source Database. O'Reilly Media; 3rd edition. 2017. 312 p. ISBN‎ 978-1491963418.

12. Kreibich J. Using SQLite: Small. Fast. Reliable. Choose Any Three. O'Reilly Media; 1st edition. 2010. 526 p. ISBN‎ 978-0596521189.

13. Eric T.P. The Big Book of Key Performance Indicators / Wiley. 2006. 109 p.

14. Пономарев Д.С. Разработка систем индексации данных для производственно-экономического и трудового секторов пенитенциарной системы // Инженерный вестник Дона. 2024. № 3(111). С. 100-108. EDN CAZJLC.

15. Booch G., Rumbaugh J., Jacobson I. Unified Modeling Language User Guide. Publisher: Addison Wesley. First Edition October 20, 1998. 512 p. ISBN‎ 978-0321267979.

16. Свидетельство о государственной регистрации программы для ЭВМ № 2023685776 Российская Федерация. Программа для графического анализа взаимных распределений числовых параметров из статистических отчетных форм ФСИН России : № 2023680076 : заявл. 29.09.2023 : опубл. 29.11.2023 / Д. С. Пономарев, М. М. Горохов, С. Б. Пономарев ; заявитель Федеральное казенное учреждение «Научно-исследовательский институт Федеральной службы исполнения наказаний». – EDN BJIPAT.

Войти или Создать
* Забыли пароль?