top of page
kandinsky-download-1701776296233 копия.jpg

Исследование запаха, обонятельных рецепторов и молекул запаха с использованием искусственного интеллекта

22.11.23 Британское общество флэйвористов проводило вебинар "Exploring Smell, Olfactory Receptors & Smell Molecules Utilizing AI", посвященный использованию искусственного интеллекта для исследования запаха, работы олфакторецепторов и связи структуры вкусоароматических веществ с их запахом.

Докладчиком выступал профессор Olivier Taboureau из Université Paris Cité, специалист по био- и хемоинформатике.  Биохимик по первоначальному образованию, г-н Taboureau в 2001 году получил ученую степень по биоинформатике и data mining (одна из областей data science). С 2014 года он стал сотрудничать с Center for Taste and Feeding Behavior (CSGA,  France) по вопросам восприятия запаха.  В докладе изложены результаты применения методов искусственного интеллекта к человеческому восприятию с целью  расшифровки связи между структурой ароматических молекул, их запахом  и взаимодействием с олфакторецепторами.

Работа с малыми ароматическими молекулами — это не основное направление работы автора доклада, а просто  является частью общего направления изучения взаимодействий различных лигандов с рецепторами а также взаимодействий более высокого уровня. 

После открытия механизма распознавания запахов почти сразу стало понятно, что будет очень трудно охватить всю картину восприятия запаха потому,  что одна молекула вкусоароматического вещества может взаимодействовать в разной степени со множеством олфакторецепторов  и  один олфакторецептор может возбуждаться  множеством разных молекул. Учитывая количество олфакторецепторов и вкусоароматических молекул, это дает практически неисчеслимое число комбинаций. Докладчик и его коллеги решили, что  разобраться с этим могут помочь методы Data science. Задача состояла в том, что бы связать запах веществ с их структурой и далее через  структуру веществ  связать запах с откликом олфакторецепторов.

Для исследования отношения молекулярной структуры и свойств хорошо подходят методы Network science — области, применяющей теорию графов,  статистическую механику, компьютерную визуализацию  и кучу других дисциплин  к сложным сетевым структурам  любого происхождения, представленным в классическом виде узлов и ребер.  Построение сети проводили с помощью метода P-PAN (Protein-Protein Associated Network method), который позволяет установить связи и оценить веса взаимодействий между отдельными узлами сети используя информацию о взаимодействии каждого из узлов с некими посредниками. В упрощенной модели в качестве узлов выступали 24 олфакторецептора, а  в качестве посредников - 2927 ароматических молекул.

Модель показала, что использованный подход позволяет  соотнести  запахи некоторых продуктов с конкретными группами олфакторецепторов.  Исследователи предположили, что масштабирование модели, т.е.  включение в нее всех имеющихся данных и настойка весов позволят в дальнейшем делать достаточно точные предсказания запаха на основе химической структуры вещества.

Главные задачи, которые предстояло решить исследователям, составляли:

  • визуализация пространства запахов в координатах  запаха и олфакторецепторов

  • определение связей между структурой ароматических веществ, их запахом и взаимодействием с олфакторецепторами

  • разработка модели искусственного интеллекта, способного предсказывать на основании структуры одоранта его запах и характер взаимодействия с олфакторецепторами

В качестве исходных данных выступали описания запахов 6955 душистых веществ, сделанные с использованием 160 дескрипторов и данные о характере взаимодействия 445 ароматических веществ  в отношении 106 олфакторецепторов.  Для работы с этими данными исследователи рассматривали несколько вариантов архитектур нейросетей, обычно используемых для подобных задач.  Наиболее эффективной для решения поставленной задачи оказалась GCN модель (Graph Convolutional Network). 

 

Один из этапов работы этой модели - преобразовании химической структуры вещества в фрагмент  нейронной сети, удобный для дальнейшего использовании при предсказании.

Модель  GCN очень хорошо справлялась с предсказанием запаха на основе структуры молекулы и еще лучше – с предсказанием взаимодействия молекулы с рецепторами. Точность предсказаний составляла 0,96 и 0,99 соответственно. При этом одни  структурно-запаховые ассоциации тяжело поддавались предсказанию, а других хорошо. Например связи запахов солода, кленового сиропа, сандала и мускуса со структурами молекул отлично предсказывались моделью. А связи запахов чая, шоколада, металла - очень плохо.  Не исключено, что причина этого кроется в исходных данных  для обучения, а именно в соотнесении этих запахов с дескрипторами.

Для 397 вкусо-ароматических веществ, про которые имелась информация и о запахе, и о взаимодействии с олфакторецепторами связь между запахом и рецептором определена с высокой достоверностью. Можно сказать, что отдельные рецепторы реагируют сразу на  группу запахов. Например OR8D1 - на карамельную группу, OR2AT4 - на древесную. Интересно, что на наиболее неприятные запахи реагируют сразу несколько рецепторов.

Результаты проделанной исследователями  работы воплотились в компьютерную программу Pred-O3, запущенную на сервере https://odor.rpbs.univ-paris-diderot.fr/ и работающую в свободном доступе.

Программу можно использовать для описанных выше целей - предсказывать запах вещества по структуре, определять характер взаимодействия ДВ с теми или иными рецепторами. Причем это именно предсказание, а не поиск в базе, потому что пользователь  может вводить в программу  формулу любого вещества, и структуру любого рецептора из любого  стороннего  источника.

bottom of page