Diet approach to DFT benchmarking — ABC Chemicals

Признанный сварливый физик призывает разработчиков перестать фокусироваться на молекулах и начать думать о твердых телах

Предварительный сравнительный анализ методов теории функционала плотности (DFT) больше не требует много времени. Так говорит Тим Гоулд из Университета Гриффит в Австралии, который разработал три подмножества диеты из известной молекулярной базы данных.1 Эти системы могут точно ранжировать методы DFT с меньшим количеством вычислительных ресурсов, чем всесторонний сравнительный анализ. Гулд надеется, что они помогут усилиям по сравнительному анализу твердотельных методов, используя наборы данных, которые более сопоставимы с твердотельными системами.

Существуют сотни различных DFT-приближений, более известных как функционалы, и разработчики методов полагаются на сравнительный анализ для тестирования новых. Они часто ранжируются в соответствии с их точностью: более точный функционал способен воспроизводить ключевые химические свойства, которые можно рассчитать на более высоком уровне теории для сравнения. Одной из современных систем бенчмаркинга является база данных «Общая основная группа по термохимии, кинетике и нековалентным взаимодействиям», обычно сокращенно GMTKN55. Он предназначен для газофазных молекулярных функционалов, содержащих 1500 разностей энергий, и способен анализировать ДПФ-функционалы, чтобы найти общий показатель качества. «База данных GMTKN55 быстро стала новым стандартом для анализа огромного количества методов DFT», — объясняет создатель базы данных Ларс Геригк из университета Мельбурна, Австралия. Его работа в этой области дала представление о сотнях приближений DFT.24

Развиваться и оптимизировать

«Я немного раздражен тем, что химики всегда смотрят на молекулы и игнорируют материалы в твердом состоянии», — говорит Гулд. «Нам нужен был способ тестирования на обоих типах систем одновременно. Проблема в том, что делать тесты на твердые вещества намного сложнее, чем на молекулы, поэтому даже если бы у нас был комплексный тест на твердые вещества, он был бы намного меньше, чем для молекул. Чтобы преодолеть этот разрыв, нам нужно нечто меньшее, чем современное состояние молекул, что в идеале было бы точно так же ». Гулд связался с Геригком, чтобы спросить, есть ли у них планы относительно мини-версии их работы GMTKN55, но это не было направление, в котором направлялось исследование Геригка. «Если бы я хотел меньший набор, я бы сделал это сам», — говорит Гулд.

Diet approach to DFT benchmarking - ABC Chemicals

К счастью, вся работа для GMTKN55 была доступна онлайн, поэтому Гулд мог легко собрать необходимую ему информацию. Он сжал данные до репрезентативного подмножества, используя две фазы оптимизации, которые были слабо основаны на эволюции: оптимизация могла развиваться, чтобы дать наиболее подходящую систему. Это заняло всего несколько минут на ноутбуке, и полученные подмножества диеты из 100 и 150 систем смогли воспроизвести среднее абсолютное отклонение каждого функционала с хорошей точностью по сравнению с полной базой данных GMTKN55. Для сравнения с подмножеством 150 систем требуется менее 400 одноточечных вычислений по сравнению с комплексным сравнительным анализом, который может потребовать почти 2500 вычислений. Дополнительное подмножество голодания, состоящее только из 30 систем, было не таким точным, но оно все же могло воспроизводить ключевые тенденции.

«Меньший набор данных — это благо для функциональных разработчиков», — говорит Торбьерн Бьоркман из финского университета Або Академи, который работает над системами бенчмаркинга в твердом состоянии. Он считает, что этот набор диет поможет разработчикам, которым «часто нужно проводить быстрые тесты, чтобы увидеть, действительно ли идеи ведут в правильном направлении». Он добавляет, что работа Гулда «также поднимает некоторые интересные вопросы, касающиеся самих тестов». Бьоркман предполагает, что можно найти подмножество, которое вместо воспроизведения средних значений, как это делает работа Гулда, возможно, максимизирует различия между методами. Затем разработчики могут выяснить, какие методы наиболее похожи, и глубже погрузиться в сами методы бенчмаркинга.

Я немного раздражен, когда химики игнорируют материалы в твердом состоянии.

Тем не менее, Гулд отмечает, что «вы никогда не сможете получить такую же статистическую глубину из набора рационов, поскольку он просто не охватывает столько химии, сколько его полные родители». Геригк соглашается с добавлением: «Хотя он не заменяет GMTKN55, он является очень полезным дополнением и может использоваться для предварительного тестирования новых методов».

«Эта работа никогда бы не состоялась, если бы команда Геригка не сделала свою работу доступной, что позволило бы мне заняться новой наукой о существующих данных», — говорит Гулд.

В будущем Гулд планирует попытаться сделать для твердых частиц то, что GMTKN55 и другие сделали для молекул, и создать самый большой и лучший тест из возможных. «Я буду умолять людей, которых я знаю — и, возможно, не знаю — кто сделал шаги в этом направлении. Это, наконец, помогло бы мне стать менее раздражительным из-за сосредоточенности на молекулах. Но я действительно надеюсь, что другие могут взять мои данные или метод, который я представил, и сделать что-то новое с ним, как я ».

Ссылки

1. Т Гулд, Phys. Химреагент Химреагент Phys., 2018, DOI: 10.1039 / c8cp05554h (Эта статья бесплатна до 19 декабря 2018 года.)

2. L Goerigk и другие, Phys. Химреагент Химреагент Phys., 2017, 1932184 (DOI: 10.1039 / c7cp04913g)

3. Н. Мехта, М. Казанова-Паес и Ларс Геригк, Phys. Химреагент Химреагент Phys., 2018, 2023175 (DOI: 10.1039 / c8cp03852j)

4. Наджиби и Л. Геригк, J. Chem. Теория вычислений., 2018, DOI: 10.1021 / acs.jctc.8b00842

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *