Машинное обучение значительно ускоряет поиск стабильных структур в периодической таблице

Создан алгоритм, который может быстро сканировать гипотетические кристаллические структуры, содержащие любой природный элемент, и находить те, которые, скорее всего, будут стабильными. Программа, которая была обучена методом машинного обучения на наборе данных из 140 000 материалов, делает предсказания почти так же точно, как симуляции квантовой химии, и гораздо эффективнее. Исследователи просмотрели 31 миллион потенциальных структур и нашли 1,8 миллиона стабильных. Подобные поиски потенциально могут найти превосходные материалы для множества применений.

Уравнение Шрама Дингера неразрешимо для химических систем сложнее атома водорода. Поэтому химики часто полагаются на ab initio моделирование электронной плотности, такое как DFT, для расчета свойств многоэлектронных систем. Они могут быть удивительно точными, но в больших многоатомных системах, таких как кристаллы, они требуют больших вычислительных затрат. ‘Как правило, DFT можно проводить для любого материала с менее чем 1000 атомов в элементарной ячейке,’ говорит Shyue Ping Ong из Калифорнийского университета в Сан-Диего, ‘но он плохо масштабируется, и вы не сможете легко провести DFT для миллионов материалов, даже если это простые материалы’

Межатомные потенциалы упрощают эту задачу, просто рассматривая форму поверхности потенциальной энергии атомов в различных средах. Чтобы узнать форму этой поверхности потенциальной энергии, исследователи полагаются на алгоритмы машинного обучения. ‘Допустим, вас интересует углерод, — говорит Онг. ‘Итак, вы проводите DFT-расчеты различных структур углерода, чтобы получить энергии и силы. Затем вы используете эти данные для обучения потенциала машинного обучения только для углерода… Но этот потенциал не будет работать для кремния или карбида кремния. Приходится повторять весь процесс обучения для каждого химического соединения, с которым вы работаете.’

Мысль над материей

Чтобы преодолеть это ограничение, Онг и его научный сотрудник Чи Чен использовали графовые нейронные сети — подход машинного обучения, который сочетает в себе представление графов с алгоритмами, слабо смоделированными на основе мозга. Они начали с DFT-расчетов энергий и межатомных сил в 140 000 известных и гипотетических неорганических структурах в Проекте материалов – базе данных с открытым исходным кодом, созданной в 2011 году. Они послужили обучающими данными для алгоритма графовой нейронной сети M3GNet, который обучился делать выводы о том, как данный атом определенного элемента может вести себя в различных конфигурациях. В результате M3GNet получил ‘универсальный межатомный потенциал’, управляющий взаимодействием между 89 различными элементами.

Исследователи взяли произвольные структуры для 5283 кристаллов. Сначала они использовали M3GNet для нахождения приблизительных основных состояний. M3GNet ‘основные состояния’ были впоследствии релаксированы с помощью DFT, чтобы найти более точные основные состояния. Релаксация произвольных структур с помощью M3GNet уменьшила энергию кристаллов по крайней мере в 10 раз по сравнению с последующей релаксацией DFT. Это показало, что M3GNet нашел основное состояние системы почти так же хорошо, как DFT, но с гораздо меньшими вычислительными затратами – структура K57Se34,, например, которая первоначально требовала 15 часов на 32-ядерном процессоре при расчете DFT, могла быть рассчитана M3GNet за 22 с на одноядерном ноутбуке. ‘Сейчас можно работать с тысячами или десятками тысяч атомов,’ говорит Онг. ‘Мы вносим улучшения в код, использующий GPU, которые сделают системы с более чем 100 000 атомов более выполнимыми.  

Кроме того, Чи Чен, работающий сейчас в Microsoft Quantum, говорит, что двухэтапная релаксация имеет преимущество. ‘Для многих структур расчет DFT застревает в локальных минимумах. Релаксация M3GNet с последующей релаксацией DFT позволяет получить более низкие энергии по сравнению с одной только релаксацией DFT,’ объясняет он.

Картирование материального пространства

В рамках проекта M3GNet был проведен поиск 31 миллиона гипотетических кристаллических структур с 50 или менее атомами в элементарной ячейке, и было обнаружено, что около 1,8 миллиона потенциально стабильны. Исследователи проанализировали 2000 из них с помощью метода DFT, который согласился с предсказанием стабильности в 1578 случаях. Исследователи также использовали M3GNet для прогнозирования упругости материалов и кривых дисперсии фононов, которые важны для определения таких свойств, как динамическая стабильность и теплопроводность, и в обоих случаях они обнаружили хорошее согласие с DFT.

Исследователи теперь надеются, что алгоритм сможет найти новые полезные материалы. ‘В этой работе нет синтеза, ’ говорит Онг. ‘DFT является эталоном. Но я надеюсь, что некоторые из этих предсказаний в конечном итоге будут подтверждены экспериментально. Например, я работаю над литий-ионными батареями. Одно из свойств, которое вас обычно интересует, — это проводимость литий-иона. Наш универсальный потенциал может работать с любой комбинацией элементов в периодической таблице и поэтому может быть использован для моделирования любого потенциального материала литий-ионной батареи.’

‘Это очень впечатляющая работа,’ говорит Пабло Пьяджи из Принстонского университета в Нью-Джерси. ‘Обычно глубокое обучение в молекулярном моделировании используется для изучения конкретного вещества и очень небольшого числа химических элементов. В этой работе они действуют совершенно в противоположном направлении… Мое впечатление в целом таково: работа имеет огромный потенциал для предсказания новых соединений, которые, возможно, могут превзойти известные материалы для различных применений’