Учёные нашли необычный способ применения машинного обучения для разделения химических компонентов в сложных смесях. Исследование было опубликовано на сайте PNAS.

В воде и почве во всем мире обычно содержатся химические загрязнители, такие как полициклические ароматические углеводороды, вызывающие неблагоприятные последствия для здоровья при воздействии на человека. В многокомпонентных смесях эти вещества можно обнаружить при помощи рамановской спектроскопии. Рамановский спектр состоит из множества пиков, каждый из которых соответствует определённой функциональной группе в структуре соединения, по аналогии с отпечатками пальцев у человека.

Стратегии машинного обучения же были разработаны для идентификации отдельных источников в сложной смеси сигналов, известной как «эффект коктейльной вечеринки», когда несколько человек говорят одновременно, но слушатель пытается уловить в этом обсуждении важную для него информацию, например, своё имя.

Объединив возможности спектроскопии с возможностями машинного обучения, учёные начали изучать, можно ли идентифицировать отдельные химические соединения с помощью анализа спектров многокомпонентных смесей. Они разработали метод машинного обучения, который называем «Извлечением характеристических пиков». Путем анализа спектров смесей, в которых различаются соотношения концентраций различных компонентов, этот алгоритм может извлекать спектры каждого неизвестного компонента в смеси неизвестных веществ, которые затем идентифицируются с помощью библиотеки спектров.

Сочетая возможности спектроскопии по «молекулярному отпечатку пальцев» с возможностями машинного обучения по распознаванию и разделению сигналов, эта попытка исследователей является шагом вперёд на пути к компьютерному разделению неизвестных химических компонентов, встречающихся в сложных многокомпонентных смесях.