2023, випуск 1, c. 23-34

Одержано 27.11.2022; Виправлено 15.01.2023; Прийнято 25.04.2023

Надруковано 28.04.2023; Вперше Online 23.05.2023

https://doi.org/10.34229/2707-451X.23.1.3

Попередня  |  ПОВНИЙ ТЕКСТ  |  Наступна

 

УДК 519.8

Нечіткий кластерний аналіз: псевдометрики та нечіткі кластери

І. Рясна ORCID ID favicon Big

Інститут кібернетики імені В.М. Глушкова НАН України, Київ

Листування: Ця електронна адреса захищена від спам-ботів. Вам потрібно увімкнути JavaScript, щоб побачити її.

 

Вступ. Задачі кластеризації виникають у різних сферах людської діяльності. У випадках, коли відсутні вихідні дані, достатні для статистичного аналізу або використовується інформація, отримана від експертів, пропонуються нечіткі моделі задач, що ураховують різні види невизначеності та більш аргументовано відображають реальні ситуації, які моделюють системи різного призначення. Особливу увагу привертають проблеми інваріантності у задачах з різнотипними даними, виміряними за різними шкалами за класифікацією С. Стівенса. Відомо, що при розв’язанні задач кластерного аналізу з використанням операції транзитивного замикання у відношенні еквівалентності, яке отримується, змінюються такі зв'язки між об'єктами, як схожість та несхожість. Тому, необхідно ураховувати проблему адекватності при розробці моделей та алгоритмів для розв’язання задач нечіткого кластерного аналізу.

Мета роботи. Провести аналіз проблеми адекватності результатів нечіткого кластерного аналізу щодо введення метрик і псевдометрик на нечітких множинах за наявності кількох якісних та кількісних характеристик об’єктів. Запропонувати підхід, що забезпечує адекватність псевдометрики, тобто забезпечує інваріантність відносно допустимих перетворень значень нечітких ознак, а також забезпечує розбиття об’єктів на класи еквівалентності без спотворення відстані між ними.

Результати. Запропоновано аксіоматичні визначення нечіткого кластера та нечіткого кластера рівня α, які введено як нечіткі множини елементів, схожих з певними елементами заданої множини, при виконанні умови: відношення несхожості повинно бути інваріантною псевдометрикою. Ця умова забезпечується використанням коефіцієнта лінгвістичної кореляції при обчисленні нечітких відношень схожості та несхожості. На основі визначення нечіткого кластера рівня α та порогової конорми визначено відстань між нечіткими кластерами рівня α.

Висновки. Запропонований підхід може бути основою для розробки алгоритмів розв’язання задач кластерного аналізу. При цьому забезпечується змістовна інтерпретація отриманих кластерів та можливість уточнення результатів при подальших дослідженнях їхньої структури.

 

Ключові слова: нечітка множина, конорма, метрика, псевдометрика, нечітке відношення схожості, нечіткий кластер.

 

Цитувати так: Рясна І. Нечіткий кластерний аналіз: псевдометрики та нечіткі кластери. Cybernetics and Computer Technologies. 2023. 1. С. 23–34. https://doi.org/10.34229/2707-451X.23.1.3

 

Список літератури

           1.     Balopoulos V., Hatzimichailidis A.G., Papadoupoulos B.K. Difference and similarity measures for fuzzy operators. Information Sciences. 2007. 177. P. 2336–2348. https://doi.org/10.1016/j.ins.2007.01.005

           2.     Chaudur B.B., Rosenfeld A. On a metric distance between fuzzy sets. Pattern Recognition Letters. 1996. 17. 11. P. 1157–1160. https://doi.org/10.1016/0167-8655(96)00077-3

           3.     Gardner Andrew, et al. Measuring distance between unordered sets of different sizes. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2014. P. 137–143. https://doi.org/10.1109/CVPR.2014.25

           4.     Kosub S. A note on the triangle inequality for the jaccard distance. CoRR, abs/1612.02696, 2016.

           5.     Williams J.S, Steele N. Difference, distance and similarity as a basis for fuzzy decision support based on prototypical decision classes. Fuzzy Sets and Systems. 2002. 131. P. 35–46. http://dx.doi.org/10.1016/S0165-0114(01)00253-6

           6.     Wu D. and Mendel J.M. A comparative study of ranking methods, similarity measures and uncertainty measures for interval type-2 fuzzy sets. Information Sciences. 2009. 179 (8). P. 1169–1192. https://doi.org/10.1016/j.ins.2008.12.010

           7.     Wu D. and Mendel J.M. A vector similarity measure for linguistic approximation: Interval type-2 and type-1 fuzzy sets. Information Sciences. 2008. 178 (2). P. 381–402. https://doi.org/10.1016/j.ins.2008.12.010

           8.     Szmidt E., Kacprzyk J. Distances between intuitionistic fuzzy sets. Fuzzy Sets and Systems. 2000. 114. P. 505–518. https://doi.org/10.1016/S0165-0114(98)00244-9

           9.     D’Urso P., Gil M.Á. Fuzzy data analysis and classification. Adv. Data Anal. Classif. 2017. 11. P. 645–657. https://doi.org/10.1007/s11634-017-0304-z

       10.     Zgurovsky M.Z., Zaychenko Y.P. The Fundamentals of Computational Intelligencе: System Approach. Springer: Switzerland, 2016. 375 p.

       11.     Яснопольська В. Розвідка, перехоплення цілей і керування вогнем: які безпілотники задіяно у війні в Україні. https://fakty.com.ua/ua/svit/20220428-osnovne-pryznachennya-rozvidka-najpopulyarnishi-modeli-bezpilotnykiv-v-ukrayini-ta-rosiyi/

       12.     Mumtaz Karatas, Ertan Yakıcı, Nasuh Razi Military Facility Location Problems: A Brief Survey. 2018. https://doi.org/10.4018/978-1-5225-5513-1.ch001

       13.     Sevdik G., Esnaf S., Baytürk E. Facility Location for Unmanned Aerial Vehicle Base Stations to Provide Uninterrupted Mobile Communication After Earthquakes. In: Durakbasa, N.M., Gençyılmaz, M.G. (eds) Digital Conversion on the Way to Industry 4.0. ISPR 2020. Lecture Notes in Mechanical Engineering. Springer, Cham. https://doi.org/10.1007/978-3-030-62784-3_5

       14.     Salama M., Srinivas S. Joint optimization of customer location clustering and drone-based routing for last-mile deliveries. Transportation Research Part C: Emerging Technologies. 2020. Vol. 114. P. 620–642. https://doi.org/10.1016/j.trc.2020.01.019

       15.     Ernest N., Sathyan A., Cohen K. Genetic Fuzzy Single and Collaborative Tasking for UAV Operations. In: Multi-Rotor Platform-based UAV Systems. P. 217–242. https://doi.org/10.1016/B978-1-78548-251-9.50011-X

       16.     Руспини Э.Г. Последние достижения в нечетком кластер-анализе. В кн. Нечеткие множества и теория возможностей. Последние достижения. М.: Радио и связь, 1986. С. 114–132.

       17.     Zadeh L.A. Similarity relations and fuzzy ordering. Information Sciences. 1971. Vol. 3. P. 177–200. https://doi.org/10.1016/S0020-0255(71)80005-1

       18.     Tamura S., Higuchi S., Tanaka K. Pattern classification based on fuzzy relations. IEEE Trans. Systems, Man and Cybernetics. 1971. v. SMC-1. P. 61–66. https://doi.org/10.1109/TSMC.1971.5408605

       19.     Yang M.-S., Shih H.-M. Cluster analysis based on fuzzy relations. Fuzzy Sets and Systems. 2001. Vol. 120. P. 197–212. https://doi.org/10.1016/S0165-0114(99)00146-3

       20.     Барсегян А.А. и др. Методы и модели анализа данных: OLAP и Data Mining. СПб: БХВ-Петербург, 2004. 336 с.

       21.     Нечеткие множества в моделях управления и искусственного интеллекта. М.: Наука, 1986. 312 с.

       22.     Кривий С.Л. Дискретна математика. Вибрані питання. Київ: Видавничий дім „Києво-Могилянська академія”, 2007. 572 с.

       23.     Hulianytskyi L., Riasna I. On Fuzzy Similarity Relations for Heterogeneous Fuzzy Sets. II International Scientific Symposium «Intelligent Solutions» IntSol-2021, September 28–30, 2021, Kyiv-Uzhhorod, Ukraine IntSol. P. 48–59. https://ceur-ws.org/Vol-3018/Paper_5.pdf

 

 

ISSN 2707-451X (Online)

ISSN 2707-4501 (Print)

Попередня  |  ПОВНИЙ ТЕКСТ  |  Наступна

 

 

            Випуски

 

© Вебсайт та оформлення. 2019-2024,

Інститут кібернетики імені В.М. Глушкова НАН України,

Національна академія наук України.