2021, випуск 1, c. 54-60
Одержано 10.02.2021; Виправлено 17.02.2021; Прийнято 25.03.2021
Надруковано 30.03.2021; Вперше Online 03.04.2021
https://doi.org/10.34229/2707-451X.21.1.5
Попередня | Повний текст | Наступна
Досягнення у визначенні просторової структури білків на основі методів машинного навчання
Б.О. Білецький
Інститут кібернетики імені В.М. Глушкова НАН України, Київ
Листування: Ця електронна адреса захищена від спам-ботів. Вам потрібно увімкнути JavaScript, щоб побачити її.
Вступ. Задача визначення просторової структури білків – одна з найважливіших нерозв’язаних задач людства. Життя на планеті Земля називають білковим, оскільки білкові молекули – рушії процесів життєдіяльності в живих організмах. Білки становлять близько 80 % сухої маси клітини та координують процеси життєдіяльності. Функція білка залежить від його просторової структури.
Результати останніх змагань методів визначення білкових структур продемонстрували значні успіхи у цьому важливому напрямку. Одна з дослідницьких груп представила метод AlphaFold 2, точність якого сягнула точності експериментальних методів.
Мета роботи. Розглянути та проаналізувати основні принципі дії програмного комплекса AlphaFold з визначення просторової структури білків.
Результати. Наведено основні складові методи та етапи в процесі розпізнавання структури білка. До складових етапів та відповідних методів належать такі як: пошук гомологічних білків на основі методів множинного вирівнювання, побудова білок-специфічного диференційованого потенціалу за допомогою штучних нейронних мереж та оптимізація енергії за допомогою градієнтного спуску та обмеженого семплювання.
Висновки. Поєднання цілої низки методів та використання інформації з банків білкових та генетичних даних дозволяють значно просунутися у розв’язанні надзвичайно важливої задачі визначення структури білка.
Ключові слова: просторова структура білка, машинне навчання, AlphaFold.
Цитувати так: Білецький Б.О. Досягнення у визначенні просторової структури білків на основі методів машинного навчання. Cybernetics and Computer Technologies. 2021. 1. С. 54–60. https://doi.org/10.34229/2707-451X.21.1.5
Список літератури
1. https://www.rcsb.org/stats/growth/growth-released-structures (звернення 10.02.2021)
2. https://www.uniprot.org/statistics/Swiss-Prot, https://www.ebi.ac.uk/uniprot/TrEMBLstats (звернення 10.02.2021)
3. Zemla A. LGA: A method for finding 3D similarities in protein structures. 2003. Nucleic Acids Research. 31 (13). P. 3370–3374. https://doi.org/10.1093/nar/gkg571
4. EVA: EValuation of Automatic protein structure prediction. http://pdg.cnb.uam.es/eva/doc/concept.html (звернення 10.02.2021)
5. Protein Structure Prediction Center. https://predictioncenter.org/index.cgi (звернення 10.02.2021)
6. Heaven D. Why deep-learning AIs are so easy to fool. Nature. 2019. 574. P. 163–166. https://doi.org/10.1038/d41586-019-03013-5
7. Pinkus A. Approximation theory of the MLP model in neural networks. Acta Numerica. 1999. 8. P. 143–195. https://doi.org/10.1017/S0962492900002919
8. Cybenko G.V. Approximation by Superpositions of a Sigmoidal function. Mathematics of Control Signals and Systems. 1989. 2 (4). P. 303–314. https://doi.org/10.1007/BF02551274
9. Senior A.W., Evans R., Jumper, J. et al. Improved protein structure prediction using potentials from deep learning. Nature. 2020. 577. P. 706–710. https://doi.org/10.1038/s41586-019-1923-7
10. https://www.rosettacommons.org/software (звернення 10.02.2021)
11. https://toolkit.tuebingen.mpg.de/tools/hhblits (звернення 10.02.2021)
12. https://blast.ncbi.nlm.nih.gov (звернення 10.02.2021)
13. Malouf R. A comparison of algorithms for maximum entropy parameter estimation. Proceedings of the Sixth Conference on Natural Language Learning (CoNLL-2002). 2002. P. 49–55. https://doi.org/10.3115/1118853.1118871
14. https://www.cathdb.info/ (звернення 10.02.2021)
ISSN 2707-451X (Online)
ISSN 2707-4501 (Print)
Попередня | Повний текст | Наступна