2025, випуск 4, c. 47-54
Одержано 17.09.2025; Виправлено 12.11.2025; Прийнято 18.11.2025
Надруковано 08.12.2025; Вперше Online 15.12.2025
https://doi.org/10.34229/2707-451X.25.4.5
Попередня | ПОВНИЙ ТЕКСТ | Наступна
Семіотичний підхід у створенні фонемної моделі мовного сигналу
І.A. Безвербний *
, К.П. Сосненко ![]()
Інститут кібернетики імені В.М. Глушкова НАН України, Київ
* Листування: Ця електронна адреса захищена від спам-ботів. Вам потрібно увімкнути JavaScript, щоб побачити її.
Вступ. Мовний сигнал характеризується високою варіативністю фізичних параметрів, проте фонеми зберігають стабільність ідентифікації навіть за умов істотних коливань частоти й амплітуди. Це створює підґрунтя для побудови моделей, які абстрагуються від точних акустичних значень і ґрунтуються на функціонально-знаковій природі мовлення. Такий підхід відкриває можливість семіотичного представлення сигналу, де ключову роль відіграють відносні зміни параметрів. Його методологічна основа пов’язана з ідеєю нормалізації мовного сигналу за частотами дванадцятитонового хроматичного звукоряду, що, у свою чергу, знаходить підтвердження у психоакустичних властивостях слуху та анатомічній будові слухового апарату людини.
Мета дослідження – формування семіотичного словника мовного сигналу на основі розрахунку частот, необхідних для передачі мовлення, нормалізованого за частотами дванадцятитонового хроматичного звукоряду, та подальша розробка семіотичної моделі, яка забезпечує можливість побудови інтерпретованих систем розпізнавання мовлення.
Результати. У роботі обґрунтовано використання концепції кореляції частот мовного сигналу з дванадцятитоновим хроматичним звукорядом як ідейної основи нормалізації. Запропоновано кодувати сигнал через пари нормалізованих зшачень різниці частоти та різниці амплітуди. Таке подання створює знакову структуру з чіткою внутрішньою формою та функцією, що дозволяє не лише аналізувати, а й інтерпретувати мовлення. На основі такого підходу побудовано семіотичну репрезентацію мовлення, яка забезпечує не лише ефективне розпізнавання, а й високу інтерпретованість мовного сигналу. Також розроблення рекурентної нейронної моделі створює можливість точного відтворення фонем на основі шаблонів із семіотичних одиниць, що відкриває перспективи для подальшої інтеграції семіотичного підходу з методами глибинного навчання.
Висновки. Семіотичне представлення мовного сигналу у вигляді дискретних знакових одиниць відкриває перспективи для створення інтерпретованих систем автоматичного розпізнавання. Розроблена модель поєднує теоретичну новизну з прикладною значущістю, роблячи внесок у розвиток комп’ютерної лінгвістики та технологій штучного інтелекту.
Ключові слова: мовний сигнал, лінгвістична структура, фонемна модель, інтерпретованість, семіотична репрезентація, рекурентна нейронна модель.
Цитувати так: Безвербний І.A., Сосненко К.П. Семіотичний підхід у створенні фонемної моделі мовного сигналу. Cybernetics and Computer Technologies. 2025. 4. С. 47–54. https://doi.org/10.34229/2707-451X.25.4.5
Список літератури
1. Rabiner L.R., Juang B.H. Fundamentals of Speech Recognition. Englewood Cliffs, NJ : Prentice-Hall, 1993. 507 p.
2. Graves A., Mohamed A., Hinton G. Speech recognition with deep recurrent neural networks. Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2013. P. 6645–6649. https://doi/org/10.1109/ICASSP.2013.6638947
3. Graves A., Fernández S., Gomez F., Schmidhuber J. Connectionist temporal classification: Labelling unsegmented sequence data with recurrent neural networks. Proceedings of the 23rd International Conference on Machine Learning (ICML), 2006. P. 369–376. https://doi/org/10.1145/1143844.1143891
4. Baevski A., Zhou Y., Mohamed A., Auli M. Wav2vec 2.0: A Framework for Self-Supervised Learning of Speech Representations. Advances in Neural Information Processing Systems. 2020. Vol. 33. P. 12449–12460.
5. Horndasch A., Noeth E., Batliner A., Warnke V. Phoneme-to-grapheme mapping for spoken inquiries to the semantic. Isca-archive INTERSPEECH, 2006. ICSLP. https://www.isca-archive.org/interspeech_2006/ horndasch06_interspeech.pdf (звернення: 17.09.2025)
6. Sazhok M.M., Robeiko V.V., Smoliakov Ye.A., Zabolotko T.O., Seliukh R.A., Fedoryn D.Ya, Yukhymenko O.A. Modeling domain openness in speech information technologies. Control systems and computersю 2023. No. 4. P. 19–26.
7. Semotiuk M.V., Palagin A.V. Technocratic model of the human auditory system. arXiv preprint arXiv:2310.05639, 2023. https://arxiv.org/abs/2310.05639 (звернення: 17.09.2025)
8. Семотюк М.В., Безвербний І.А. Адаптивний алгоритм виділення фонем у мовному сигналі. Комп'ютерні засоби, мережі та системи. 2017. № 16. C. 14–19. http://jnas.nbuv.gov.ua/article/UJRN-0000848988
9. Безвербний І.А. До питання виділення фонем у мовному сигналі за допомогою ефекту стоячої хвилі. Комп’ютерні засоби, мережі та системи. 2019. № 18. С. 32–35. http://jnas.nbuv.gov.ua/article/UJRN-0001084065
10. Безвербний І.А. Чірплет-аналіз мовних сигналів на основі перетворення Гільберта – Хуанга. Кібернетика та комп'ютерні технології. 2025. № 1. С. 74–80. https://doi.org/10.34229/2707-451X.25.1.7
11. Груша В.М. Інтелектуальна обробка даних від хлорофіл-флуорометричних сенсорів. Кібернетика та комп'ютерні технології. 2022. № 1. C. 42–48. https://doi.org/10.34229/2707-451X.22.1.5
12. Свідоцтво про реєстацію авторського права на твір №110368.
ISSN 2707-451X (Online)
ISSN 2707-4501 (Print)
Попередня | ПОВНИЙ ТЕКСТ | Наступна