Обоснована актуальность автоматизации создания лингвистических онтологий и выбор для этой цели Википедии в качестве источника информации. Предложена математическая модель Википедии и лингвистической онтологии, использующая парадигму нечетких семантических отношений между понятиями. Сделан краткий обзор мер семантической близости понятий с учетом их вычислительной сложности, обоснован выбор взвешенной меры Дайса.
лингвистическая онтология, лексическая онтология, автоматическое построение онтологий, ontology learning, Википедия, нечеткие семантические отношения, семантическая близость
1. Janik, M. Trainingless ontologybased text categorization : PhD diss. / Maciej Janik. - University of Georgia, 2008. - 150 p.
2. Syed, Z. S. Wikipedia as an Ontology for Describing Documents / Z. S. Syed, T. Finin, A. Joshi // Proceedings of the Second International Conference on Weblogs and Social Media. - 2008. - P. 136-144.
3. Добров, Б. В. Лингвистическая онтология по естественным наукам и технологиям для приложений в сфере информационного поиска / Б. В. Добров, Н. В. Лукашевич //10-я Нац. конф. по искусств. интеллекту с междунар. участием. - 2006. - С. 489-497.
4. Лукашевич, Н. В. Модели и методы автоматической обработки неструктурированной информации на основе базы знаний онтологического типа : дис…. д-ра техн. наук / Н. В. Лукашевич. - М., 2014. - 312 c.
5. Cimiano, P. Ontology Learning and Population from Text: Algorithms, Evaluation and Applications / Philipp Cimiano. - Springer US, 2006.
6. Турдаков, Д. Ю. Texterra: инфраструктура для анализа текстов / Д. Ю. Турдаков [и др.] // Труды Института системного программирования РАН. - 2014. - Т. 26. - № 1. - С. 421-440.
7. Turdakov, D. Semantic relatedness metric for Wikipedia concepts based on link analysis and its application to word sense disambiguation / D. Turdakov, P. Velikhov // In proceedings of the SYRCoDIS´2008. - 2008.
8. Варламов, М. И. Расчет семантической близости концептов на основе кратчайших путей в графе ссылок Википедии / М. И. Варламов, А. В. Коршунов // Труды конференции ИОИ-2014: Интеллектуализация обработки информации (5-10 окт. 2014 г., Греция). - 2014. - С. 1107-1125.
9. Нечеткие множества в моделях управления и искусственного интеллекта / под ред. Д. А. Поспелова. - М.: Наука, Гл. ред. физ.-мат. лит., 1986. - 312 с.
10. Велихов, П. Е. Меры семантической близости статей Википедии и их применение к обработке текстов / П. Е. Велихов // Информационные технологии и вычислительные системы. - 2009. - №. 1. - С. 23-37.