<!DOCTYPE article
PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.4 20190208//EN"
       "JATS-journalpublishing1.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" article-type="research-article" dtd-version="1.4" xml:lang="en">
 <front>
  <journal-meta>
   <journal-id journal-id-type="publisher-id">Modeling of systems and processes</journal-id>
   <journal-title-group>
    <journal-title xml:lang="en">Modeling of systems and processes</journal-title>
    <trans-title-group xml:lang="ru">
     <trans-title>Моделирование систем и процессов</trans-title>
    </trans-title-group>
   </journal-title-group>
   <issn publication-format="print">2219-0767</issn>
  </journal-meta>
  <article-meta>
   <article-id pub-id-type="publisher-id">26715</article-id>
   <article-id pub-id-type="doi">10.12737/article_5c4f196e58e605.96494978</article-id>
   <article-categories>
    <subj-group subj-group-type="toc-heading" xml:lang="ru">
     <subject>Технические науки</subject>
    </subj-group>
    <subj-group subj-group-type="toc-heading" xml:lang="en">
     <subject></subject>
    </subj-group>
    <subj-group>
     <subject>Технические науки</subject>
    </subj-group>
   </article-categories>
   <title-group>
    <article-title xml:lang="en">INFORMATION SYSTEMS FOR EXTRACTING DATA FROM UNSTRUCTURED TEXT USING ONTOLOGIES</article-title>
    <trans-title-group xml:lang="ru">
     <trans-title>Информационные системы для извлечения данных из неструктурированного текста с использованием онтологий</trans-title>
    </trans-title-group>
   </title-group>
   <contrib-group content-type="authors">
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Лавлинский</surname>
       <given-names>Валерий Викторович</given-names>
      </name>
      <name xml:lang="en">
       <surname>Lavlinskiy</surname>
       <given-names>V. Viktorovich</given-names>
      </name>
     </name-alternatives>
     <xref ref-type="aff" rid="aff-1"/>
    </contrib>
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Зольникова</surname>
       <given-names>Юлия Олеговна</given-names>
      </name>
      <name xml:lang="en">
       <surname>Zol'nikova</surname>
       <given-names>Yuliya Olegovna</given-names>
      </name>
     </name-alternatives>
     <xref ref-type="aff" rid="aff-2"/>
    </contrib>
   </contrib-group>
   <aff-alternatives id="aff-1">
    <aff>
     <institution xml:lang="ru">Воронежский государственный лесотехнический университет имени Г.Ф. Морозова</institution>
    </aff>
    <aff>
     <institution xml:lang="en">Voronezh State University of Forestry and Technologies named after G.F. Morozov</institution>
    </aff>
   </aff-alternatives>
   <aff-alternatives id="aff-2">
    <aff>
     <institution xml:lang="ru">Воронежский государственный лесотехнический университет имени Г.Ф. Морозова</institution>
     <country>RU</country>
    </aff>
    <aff>
     <institution xml:lang="en">FSBE Institution of Higher Education Voronezh State University of Forestry and Technologies named after G.F. Morozov</institution>
     <country>RU</country>
    </aff>
   </aff-alternatives>
   <volume>11</volume>
   <issue>3</issue>
   <fpage>30</fpage>
   <lpage>34</lpage>
   <self-uri xlink:href="https://zh-szf.ru/en/nauka/article/26715/view">https://zh-szf.ru/en/nauka/article/26715/view</self-uri>
   <abstract xml:lang="ru">
    <p>Основной задачей при извлечении информации из текста является промежуточное представление данных. Для этой цели используется грамматический разбор и осуществляется синтаксический анализ текста, чтоб определить соответствие грамматической структуры правилам формальной грамматики для данного языка. Процесс грамматического разбора приводит к генерации дерева грамматического разбора, а также графов зависимостей. Графы зависимостей представляют собой структуры данных, которые являются производными от обрабатываемого текста и определяют неявную структуру реализации в заданном тексте.</p>
   </abstract>
   <trans-abstract xml:lang="en">
    <p>Основной задачей при извлечении информации из текста является промежуточное представление данных. Для этой цели используется грамматический разбор и осуществляется синтаксический анализ текста, чтоб определить соответствие грамматической структуры правилам формальной грамматики для данного языка. Процесс грамматического разбора приводит к генерации дерева грамматического разбора, а также графов зависимостей. Графы зависимостей представляют собой структуры данных, которые являются производными от обрабатываемого текста и определяют неявную структуру реализации в заданном тексте.</p>
   </trans-abstract>
   <kwd-group xml:lang="ru">
    <kwd>Грамматический разбор</kwd>
    <kwd>извлечение смысловой информации</kwd>
    <kwd>онтологии</kwd>
    <kwd>неструктурированный текст</kwd>
    <kwd>граф зависимостей.</kwd>
   </kwd-group>
  </article-meta>
 </front>
 <body>
  <p>Дерево грамматического разбораДерево грамматического разбора является упорядоченным деревом с корнем, который отображает синтактическую структуру предложения. В этом разделе описывается метод Обозначения Пенна корпусов с синтаксической разметкой (Penn Treebank Notation), который используется многими приложениями грамматического разбора, для тегирования (разметки) предложения до того, как будет сгенерировано дерево грамматического разбора. Эти теги в основном используются в системах извлечения смысловой информации, для формулирования правил, согласно которым должно производится извлечение.Ниже приведена упрощенная форма определений из Обозначений Пенна Корпусов с Синтаксической Разметкой (для полного списка обозначений см. [1]):S: Простые декларативные предложения (Simple declarative clause)NP: Именная группа (Noun Phrase). Категория фраз, которая включает в себе все составляющие, зависящие от главного существительного.VP: Глагольная группа (Verb Phrase). Категория выражений, возглавляемая глаголом.</p>
 </body>
 <back>
  <ref-list>
   <ref id="B1">
    <label>1.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Software - The Stanford Natural Language Processing Group. -Режим доступа: http://nlp.stanford.edu/software/. - Загл. с экрана.</mixed-citation>
     <mixed-citation xml:lang="en">Software - The Stanford Natural Language Processing Group. -Rezhim dostupa: http://nlp.stanford.edu/software/. - Zagl. s ekrana.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B2">
    <label>2.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Ciravegna, F. (LP), an adaptive algorithm for information extraction from Web-related texts.  In Proceedings of the IJCAI-2001 Workshop on Adaptive Text Extraction and Mining held in conjunction with 17th International Joint Conference on Artificial Intelligence (IJCAI)/, F. Ciravegna, J. Tang, J. Li, H. Lu, B. Liang, X. Huang, K. Wang.- Seattle, USA. - 2001.</mixed-citation>
     <mixed-citation xml:lang="en">Ciravegna, F. (LP), an adaptive algorithm for information extraction from Web-related texts.  In Proceedings of the IJCAI-2001 Workshop on Adaptive Text Extraction and Mining held in conjunction with 17th International Joint Conference on Artificial Intelligence (IJCAI)/, F. Ciravegna, J. Tang, J. Li, H. Lu, B. Liang, X. Huang, K. Wang.- Seattle, USA. - 2001.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B3">
    <label>3.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">iASA: Learning to Annotate the Semantic Web. JOURNAL ON DATA SEMANTICS IV Lecture // Notes in Computer Science. - 2005. - Volume 3730/2005. - P. 110-145</mixed-citation>
     <mixed-citation xml:lang="en">iASA: Learning to Annotate the Semantic Web. JOURNAL ON DATA SEMANTICS IV Lecture // Notes in Computer Science. - 2005. - Volume 3730/2005. - P. 110-145</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B4">
    <label>4.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Soderland, S., Learning information extraction rules for semi-structured and free text / S. Soderland // Machine Learning. -1999. - №34. - P. 233-272/</mixed-citation>
     <mixed-citation xml:lang="en">Soderland, S., Learning information extraction rules for semi-structured and free text / S. Soderland // Machine Learning. -1999. - №34. - P. 233-272/</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B5">
    <label>5.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Califf, M. E. Bottom-up relational learning of pattern matching rules for information extraction / M. E. Califf, , R. J. Mooney // Journal of Machine Learning Research. -2003. - Vol. 4. - Pp.177-210.</mixed-citation>
     <mixed-citation xml:lang="en">Califf, M. E. Bottom-up relational learning of pattern matching rules for information extraction / M. E. Califf, , R. J. Mooney // Journal of Machine Learning Research. -2003. - Vol. 4. - Pp.177-210.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B6">
    <label>6.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Соколов, Е. Г. Применение LSA/LSI методов для извлечения данных из неструктурированного текста / Е. Г. Соколов, М. М. Шарнин // Труды Международной научной конференции по физико-технической информатике CPT2018. - Царьград, 2018. - С. 59-63.</mixed-citation>
     <mixed-citation xml:lang="en">Sokolov, E. G. Primenenie LSA/LSI metodov dlya izvlecheniya dannyh iz nestrukturirovannogo teksta / E. G. Sokolov, M. M. Sharnin // Trudy Mezhdunarodnoy nauchnoy konferencii po fiziko-tehnicheskoy informatike CPT2018. - Car'grad, 2018. - S. 59-63.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B7">
    <label>7.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Методы автоматической классификации текстов по функциональным стилям / Л.М. Ермакова, М.А. Абашев, Р.В. Никитин, Р.И. Ушаков // Вестник Пермского университета. Серия: Математика. Механика. Информатика. - 2014. - № 4 (27). - С. 78-83.</mixed-citation>
     <mixed-citation xml:lang="en">Metody avtomaticheskoy klassifikacii tekstov po funkcional'nym stilyam / L.M. Ermakova, M.A. Abashev, R.V. Nikitin, R.I. Ushakov // Vestnik Permskogo universiteta. Seriya: Matematika. Mehanika. Informatika. - 2014. - № 4 (27). - S. 78-83.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B8">
    <label>8.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Богатырев, М. Ю. Извлечение фактов из текстов естественного языка с применением концептуальных графовых моделей / М.Ю. Богатырев // Известия Тульского государственного университета. Технические науки. -  2016. - № 7-1. - С. 198-208.</mixed-citation>
     <mixed-citation xml:lang="en">Bogatyrev, M. Yu. Izvlechenie faktov iz tekstov estestvennogo yazyka s primeneniem konceptual'nyh grafovyh modeley / M.Yu. Bogatyrev // Izvestiya Tul'skogo gosudarstvennogo universiteta. Tehnicheskie nauki. -  2016. - № 7-1. - S. 198-208.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B9">
    <label>9.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Stulov, N. Patent landscapes &amp; new technology trends in iot: extracting and visualizing data patterns / N. Stulov // Открытые семантические технологии проектирования интеллектуальных систем. - 2018. - Т. 2, № 8. - С. 293-297.</mixed-citation>
     <mixed-citation xml:lang="en">Stulov, N. Patent landscapes &amp; new technology trends in iot: extracting and visualizing data patterns / N. Stulov // Otkrytye semanticheskie tehnologii proektirovaniya intellektual'nyh sistem. - 2018. - T. 2, № 8. - S. 293-297.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B10">
    <label>10.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Метод автоматизированного извлечения адресов из неструктурированных текстов / А. В. Комарова, А. А. Менщиков, А. В. Полев, Ю. А. Гатчин // International Journal of Open Information Technologies. - 2017. - Т. 5, № 11. - С. 21-27.</mixed-citation>
     <mixed-citation xml:lang="en">Metod avtomatizirovannogo izvlecheniya adresov iz nestrukturirovannyh tekstov / A. V. Komarova, A. A. Menschikov, A. V. Polev, Yu. A. Gatchin // International Journal of Open Information Technologies. - 2017. - T. 5, № 11. - S. 21-27.</mixed-citation>
    </citation-alternatives>
   </ref>
  </ref-list>
 </back>
</article>
