Machine learning predicts electron densities with DFT accuracy — ABC Chemicals


Необходимость использования расчетов волновой функции или теории функционала плотности (DFT) для определения электронных плотностей была обойдена моделью машинного обучения. Это позволит химикам быстро определить свойства, которые зависят от электронной плотности крупных систем, такие как силы Ван-дер-Ваальса, галогеновая связь и взаимодействия CH – π. Эти нековалентные взаимодействия могут дать представление о связывании систем хозяин-гость или предпочтительных энантиомеров в путях реакции, где промежуточные звенья и переходные состояния могут быть стабилизированы тонким притяжением.

Распределение электронной плотности является одним из самых мощных инструментов в распоряжении вычислительного химика. Из электронной плотности могут быть определены такие свойства, как заряды, диполи и энергии электростатического взаимодействия. Точный учет их важен для предсказательной силы многих методов квантовой химии, таких как вычисление интенсивности инфракрасного излучения или определение нековалентных взаимодействий.

Machine learning predicts electron densities with DFT accuracy - ABC Chemicals

Вычисление электронной плотности может быть сложной и длительной для больших систем, использующих традиционные волновые функции или методы DFT. Чтобы преодолеть эту проблему, Clémence Corminboeuf, Michele Ceriotti и коллеги из Швейцарского федерального технологического института (EPFL) разработали модель машинного обучения, которая может предсказать плотность электронов только по атомным координатам. «Прорыв в том, чтобы иметь возможность точно предсказать, самое большее за несколько минут, электронную плотность сложных молекул без каких-либо квантово-химических расчетов», — объясняет член команды Альберто Фабрицио.

«Я думаю, что это действительно интересный подход, как с точки зрения ошибок предсказания, так и переносимости на малые и большие системы», — комментирует Натали Фей, которая занимается исследованием вычислительной неорганической химии в Университете Бристоля, Великобритания.

Квантовые трюки для лучшего машинного обучения

Модель машинного обучения опирается на обширный тренировочный набор димеров с малыми молекулами. Эти димеры имеют свою электронную плотность, представленную базисными наборами, подобными тем, которые используются в вычислениях обычной вычислительной химии. Хитрость в повышении точности прогнозируемой плотности электронов заключалась в использовании вспомогательных базисных наборов, разработанных для метода разрешения идентичности — приближения, которое помогает ускорить расчет двух электронных интегралов. «Ключевой прогресс в этой работе по сравнению с их предыдущей работой заключается в том, что исследователи в настоящее время внедрили вспомогательные функции для эффективной параметризации прогнозируемых плотностей», — отмечает Маркус Рейхер, теоретический химик из Швейцарского федерального технологического института в Цюрихе.

«Стандартные базисные наборы сконструированы так, чтобы как можно ближе аппроксимировать волновую функцию, в то время как вспомогательные базисные наборы в рамках аппроксимации с разрешением идентичности предназначены для имитации плотностей в один электрон», — объясняет Корминбоф. Используя эти вспомогательные базисные наборы, ошибки в прогнозируемых плотностях уменьшаются до уровня ниже 0,5%, что намного точнее, чем ошибка> 10% в более часто используемых базисных наборах, таких как cc-pVDZ.

Machine learning predicts electron densities with DFT accuracy - ABC Chemicals

После того, как код машинного обучения был обучен вычисленным функциям плотности электронов малых димеров, была проверена способность точно предсказывать плотности электронов в химически различных и гораздо более крупных системах. Электронная плотность 77-атомного полипептидного энкефалина была успешно предсказана с точностью до 1,4% в сравнении с расчетами DFT, а в серии из восьми больших полипептидов средняя ошибка составила всего 1,5%. Эта электронная плотность была достигнута намного быстрее, чем стандартные методы DFT, обеспечивая более быстрый доступ ко всем важным электронным плотностям и дальнейшее понимание нековалентных взаимодействий в этих больших полипептидах.

Тем не менее, Фей отмечает, что «близорукость» текущей модели остается проблемой. Это относится к модели машинного обучения, представляющей молекулы как атомно-центрированную среду шириной 4 Å. Из-за этого дальнодействующие взаимодействия не полностью улавливаются.

Корминбоф предлагает возможное решение, отметив, что «эту проблему можно решить, изменив то, как мы представляем нашу местную химическую среду. Чтобы закодировать нелокальную информацию, можно сформулировать структуру для представления сред в форме потенциала, интегрированного во все пространство ». На данный момент, недавно разработанная модель машинного обучения предоставит множество возможностей быстрого прогнозирования, при условии наличия атомных координат, будь то рентгеновская кристаллография или классическое моделирование молекулярной динамики.







Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *