<?xml version="1.0"?>
<!DOCTYPE article
PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.4 20190208//EN"
       "JATS-journalpublishing1.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" article-type="research-article" dtd-version="1.4" xml:lang="en">
 <front>
  <journal-meta>
   <journal-id journal-id-type="publisher-id">Profession-Oriented School</journal-id>
   <journal-title-group>
    <journal-title xml:lang="en">Profession-Oriented School</journal-title>
    <trans-title-group xml:lang="ru">
     <trans-title>Профильная школа</trans-title>
    </trans-title-group>
   </journal-title-group>
   <issn publication-format="print">1998-0744</issn>
  </journal-meta>
  <article-meta>
   <article-id pub-id-type="publisher-id">95359</article-id>
   <article-id pub-id-type="doi">10.12737/1998-0744-2025-13-2-40-45</article-id>
   <article-categories>
    <subj-group subj-group-type="toc-heading" xml:lang="ru">
     <subject>Цифровая образовательная среда</subject>
    </subj-group>
    <subj-group subj-group-type="toc-heading" xml:lang="en">
     <subject>The digital learning environment</subject>
    </subj-group>
    <subj-group>
     <subject>Цифровая образовательная среда</subject>
    </subj-group>
   </article-categories>
   <title-group>
    <article-title xml:lang="en">AUTOMATION OF EXTRACTION AND ANALYSIS OF TABULAR DATA WITH CHARACTERISTICS OF ELECTRONIC COMPONENTS</article-title>
    <trans-title-group xml:lang="ru">
     <trans-title>АВТОМАТИЗАЦИЯ ИЗВЛЕЧЕНИЯ И АНАЛИЗА ТАБЛИЧНЫХ ДАННЫХ С ХАРАКТЕРИСТИКАМИ ЭЛЕКТРОННЫХ КОМПОНЕНТОВ</trans-title>
    </trans-title-group>
   </title-group>
   <contrib-group content-type="authors">
    <contrib contrib-type="author">
     <contrib-id contrib-id-type="orcid">https://orcid.org/0000-0001-9625-7713</contrib-id>
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Гуриков</surname>
       <given-names>С. Р.</given-names>
      </name>
      <name xml:lang="en">
       <surname>Gurikov</surname>
       <given-names>Sergey Rostislavovich</given-names>
      </name>
     </name-alternatives>
     <email>sgurikov@mail.ru</email>
     <bio xml:lang="ru">
      <p>кандидат педагогических наук;</p>
     </bio>
     <bio xml:lang="en">
      <p>candidate of pedagogical sciences;</p>
     </bio>
     <xref ref-type="aff" rid="aff-1"/>
    </contrib>
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Андреева</surname>
       <given-names>Е. В.</given-names>
      </name>
      <name xml:lang="en">
       <surname>Andreeva</surname>
       <given-names>Ekaterina V.</given-names>
      </name>
     </name-alternatives>
     <xref ref-type="aff" rid="aff-2"/>
    </contrib>
   </contrib-group>
   <aff-alternatives id="aff-1">
    <aff>
     <institution xml:lang="ru">Московский государственный технологический университет «Станкин»</institution>
    </aff>
    <aff>
     <institution xml:lang="en">Moscow State University of Technology «STANKIN»</institution>
    </aff>
   </aff-alternatives>
   <aff-alternatives id="aff-2">
    <aff>
     <institution xml:lang="ru">Московский технический университет связи и информатики</institution>
    </aff>
    <aff>
     <institution xml:lang="en">Moscow technical university of communication and information</institution>
    </aff>
   </aff-alternatives>
   <pub-date publication-format="print" date-type="pub" iso-8601-date="2025-05-19T23:05:31+03:00">
    <day>19</day>
    <month>05</month>
    <year>2025</year>
   </pub-date>
   <pub-date publication-format="electronic" date-type="pub" iso-8601-date="2025-05-19T23:05:31+03:00">
    <day>19</day>
    <month>05</month>
    <year>2025</year>
   </pub-date>
   <volume>13</volume>
   <issue>2</issue>
   <fpage>40</fpage>
   <lpage>45</lpage>
   <history>
    <date date-type="received" iso-8601-date="2025-02-23T00:00:00+03:00">
     <day>23</day>
     <month>02</month>
     <year>2025</year>
    </date>
    <date date-type="accepted" iso-8601-date="2025-04-02T00:00:00+03:00">
     <day>02</day>
     <month>04</month>
     <year>2025</year>
    </date>
   </history>
   <self-uri xlink:href="https://zh-szf.ru/en/nauka/article/95359/view">https://zh-szf.ru/en/nauka/article/95359/view</self-uri>
   <abstract xml:lang="ru">
    <p>В статье рассматривается процесс автоматизации извлечения и анализа табличных данных, которые содержат характеристики электронных компонентов. Подчеркивается проблема извлечения данных из PDF-документов вручную.&#13;
&#13;
Актуальность данной работы обусловлена необходимостью использования данных, представленных в формате PDF, конструкторами современного предприятия, использующими лазерные технологии для измерения расстояний с высокой точностью. Однако процесс извлечения и анализа данных из PDF-документов затруднен из-за особенностей хранения технических данных о характеристиках электронных компонентов и отсутствия эффективных инструментов считывания и преобразования информации.&#13;
&#13;
В работе предложено решение, основанное на разработке Python-скриптов для автоматизации процесса извлечения и анализа табличных данных из PDF-документов. Это позволяет извлекать данные из распознанных таблиц и преобразовать их в формат, удобный для дальнейшей обработки.</p>
   </abstract>
   <trans-abstract xml:lang="en">
    <p>The article discusses the process of automating the extraction and analysis of tabular data that contain the characteristics of electronic components. The problem of extracting data from PDF documents manually is emphasized.&#13;
The relevance of this work is due to the need to use the data presented in PDF format by the designers of a modern enterprise using laser technologies to measure distances with high accuracy. However, the process of extracting and analyzing data from PDF documents is difficult due to the peculiarities of storing technical data on the characteristics of electronic components and the lack of effective tools for reading and converting information.&#13;
The paper proposes a solution based on the development of Python scripts to automate the process of extracting and analyzing tabular data from PDF documents. This allows you to extract data from recognized tables and convert them into a format that is convenient for further processing.</p>
   </trans-abstract>
   <kwd-group xml:lang="ru">
    <kwd>PDF</kwd>
    <kwd>документы</kwd>
    <kwd>распознавание таблиц</kwd>
    <kwd>скрипт</kwd>
    <kwd>Python</kwd>
   </kwd-group>
   <kwd-group xml:lang="en">
    <kwd>PDF</kwd>
    <kwd>documents</kwd>
    <kwd>table recognition</kwd>
    <kwd>script</kwd>
    <kwd>Python</kwd>
   </kwd-group>
  </article-meta>
 </front>
 <body>
  <p></p>
 </body>
 <back>
  <ref-list>
   <ref id="B1">
    <label>1.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Загородников М. В. Восстановление текстового слоя PDF документов со сложным фоном / М. В. Загородников, А. А. Михайлов // Труды Института системного программирования РАН. – 2024. – Т. 36, № 3. – С. 189-202.</mixed-citation>
     <mixed-citation xml:lang="en">Zagorodnikov M. V. Restoration of the text layer of PDF documents with a complex background / M. V. Zagorodnikov, A. A. Mikhailov // Proceedings of the Institute of System Programming of the Russian Academy of Sciences. – 2024. – Vol. 36, No. 3. – pp. 189-202.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B2">
    <label>2.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Калачинский А. В. Генерация описания работы автоматных программ в документ формата PDF / А. В. Калачинский, И. Н. Ященко // Системы управления и обработки информации. – 2019. – № 1(44). – С. 93-98.</mixed-citation>
     <mixed-citation xml:lang="en">Kalachinsky A.V. Generation of descriptions of automatic programs in a PDF document / A.V. Kalachinsky, I. N. Yashchenko // Information management and processing systems. – 2019. – № 1(44). – pp. 93-98.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B3">
    <label>3.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Огальцов А. В. Автоматическое извлечение метаданных из научных PDF-документов / А. В. Огальцов, О. Ю. Бахтеев // Информатика и ее применения. – 2018. – Т. 12, № 2. – С. 75-82.</mixed-citation>
     <mixed-citation xml:lang="en">Ogaltsov A.V. Automatic extraction of metadata from scientific PDF documents / A.V. Ogaltsov, O. Y. Bakhteev // Informatics and its applications. – 2018. – Vol. 12, No. 2. – pp. 75-82. DOI 10.14357/19922264180211.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B4">
    <label>4.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Тронин В. Г. Автоматизация процесса извлечения страниц из pdf-документа / В. Г. Тронин, А. О. Куранов // Вестник Ульяновского государственного технического университета. – 2018. – № 3(83). – С. 31-38.</mixed-citation>
     <mixed-citation xml:lang="en">Tronin V. G. Automation of the process of extracting pages from a pdf document / V. G. Tronin, A. O. Kuranov // Bulletin of the Ulyanovsk State Technical University. – 2018. – № 3(83). – pp. 31-38.</mixed-citation>
    </citation-alternatives>
   </ref>
  </ref-list>
 </back>
</article>
