Суперкомпьютер исследует самый большой барьер биотоплива: система исследователей из 23,7 миллиона атомов демонстрирует, почему лигнин является такой проблемой

Целлюлозный этанол — топливо, полученное из древесных растений и отходов биомассы — потенциально может стать доступным возобновляемым транспортным топливом, которое может конкурировать с бензином, но лигнин, один из наиболее распространенных компонентов клеточной стенки растений, мешает.В природе эластичный полимер лигнина помогает обеспечить леса для растений, укрепляя тонкие целлюлозные волокна — основной сырьевой ингредиент целлюлозного этанола — и служит защитным барьером от болезней и хищников. Защитные свойства лигнина сохраняются во время обработки биотоплива, где это является большим препятствием, поскольку он выдерживает дорогостоящую предварительную обработку, предназначенную для его удаления, и блокирует ферменты от расщепления целлюлозы до простых сахаров для ферментации в биоэтанол.Чтобы лучше понять, как именно сохраняется лигнин, исследователи из Окриджской национальной лаборатории (ORNL) Министерства энергетики США (DOE) создали одно из крупнейших биомолекулярных симуляций на сегодняшний день — систему с 23,7 миллионами атомов, представляющую предварительно обработанную биомассу (целлюлозу и лигнин). в присутствии ферментов.

Размер моделирования требовал, чтобы Titan, флагманский суперкомпьютер в Oak Ridge Leadership Computing Facility (OLCF), пользовательском центре Министерства энергетики США, отслеживал и анализировал взаимодействие миллионов атомов.Исследование, проведенное под руководством Джереми Смита, заведующего кафедрой Университета Теннесси (Юта) и директора Центра молекулярной биофизики UT-ORNL, детально раскрыло, почему лигнин представляет собой такую ​​проблему: он не только связывается с целлюлозой в предпочтительные местоположения, к которым стремятся ферменты, но лигнин также привлекает и занимает связывающий целлюлозу домен самих ферментов.

«Это препятствует механизму, который фермент должен прикрепить к целлюлозе. Таким образом, лигнин связывается именно там, где это наименее желательно для промышленных целей», — сказал научный сотрудник ORNL Лукас Петридис. «Это детальное знание поведения лигнина может помочь в генной инженерии ферментов, которые меньше связываются с лигнином и, следовательно, производят биоэтанол более эффективно».Помимо научных знаний, полученных в результате моделирования, система биомассы, созданная командой, способствует переходу вычислительной биофизики к сложным, многокомпонентным системам, что стало возможным благодаря суперкомпьютерам ведущего класса.

Построение модели биомассыВо время предварительной обработки кислота, вода и тепло работают над удалением нецеллюлозной биомассы из растительного материала. Лигнин, однако, остается, собираясь в агрегаты вокруг целлюлозы и препятствуя достижению ферментами целлюлозы.

Чтобы точно смоделировать эту многолюдную среду, команда Смита использовала экспериментальные данные для создания репрезентативного образца предварительно обработанной биомассы и ферментов. Модель учитывала такие детали, как отношение целлюлозы к лигнину, тип лигнина и относительное количество ферментов. В общей сложности моделирование отслеживало девять целлюлозных волокон, 468 молекул лигнина и 54 молекулы фермента в прямоугольной водяной камере.

Команда построила модель с использованием кода молекулярной динамики под названием GROMACS в рамках программы инновационных и новых вычислений, влияющих на теорию и эксперимент, или INCITE. Создав полную модель, команда обратилась к Cray XK7 Titan, самому быстрому суперкомпьютеру Америки, чтобы обеспечить необходимую вычислительную мощность для наблюдения за системой в действии.Во время своих самых больших прогонов моделирование биомассы увеличивалось до почти 4000 из 18 666 узлов Titan, производя примерно 45 наносекунд времени моделирования за один день. В течение года команда накопила 1,3 микросекунды времени моделирования, что является значительным периодом времени в мире вычислительной биофизики.

«Нигде в мире мы не могли бы запустить это моделирование», — сказал Петридис.В дополнение к пониманию проблем, связанных с биотопливом следующего поколения, моделирование команды указывало на потенциальные пути, которые могут помочь смягчить воздействие лигнина. В частности, моделирование продемонстрировало, что лигнин не так сильно связывается с менее упорядоченными или аморфными целлюлозными волокнами, что означает, что он меньше конкурирует с находящимися там ферментами.

«Промышленники знали, что аморфная целлюлоза легче расщепляется ферментами, но мы показали, что не только свойства, присущие аморфной целлюлозе, облегчают работу ферментов, но также и то, что лигнин менее вреден», — сказал Петридис.Параллельный анализЧтобы максимально использовать время на флагманском суперкомпьютере OLCF, команда Смита настроила GROMACS, чтобы оптимизировать обмен данными между тысячами ядер ЦП Titan. Кроме того, команда удвоила временной интервал, используемый GROMACS для расчета движения системы биомассы.

Реализовав более эффективный с вычислительной точки зрения метод отслеживания дальнодействующих взаимодействий между атомами, команда смогла увеличить временной шаг с 2 фемтосекунд до 4 фемтосекунд, или 4000 триллионных долей секунды, без потери точности.Полученные данные передавались в высокопроизводительную систему хранения OLCF до тех пор, пока их не удалось проанализировать. Как правило, анализ выполняется последовательно или по одному событию за раз, но рост вычислительной мощности и размера моделирования создает узкое место для анализа — это просто занимает слишком много времени.Чтобы обойти это ограничение, команда Смита работала над тем, чтобы оснастить GROMACS возможностью проводить анализ параллельно, что означает, что тысячи процессоров Titan могут работать в тандеме для выполнения задач анализа.

Например, запустив параллельный анализ на 2000 ядер ЦП, исследователи могли получить результаты в 2000 раз быстрее, чем традиционные методы. В сотрудничестве с командой ORNL Джош Вермаас, аспирант Иллинойского университета в Урбана-Шампейн, внес значительный вклад в эти усилия в качестве аспиранта DOE по вычислительным наукам в ORNL.Новая возможность не только помогла команде сократить время на решение, но и проложила путь для анализа аналогичных крупномасштабных симуляций в будущем. «Анализ был одним из камней преткновения для моделирования в таком масштабе», — сказал член команды Роланд Шульц, научный сотрудник UT. «Благодаря параллельному анализу он стал более осуществимым и упростит моделирование для руководителей».Поскольку суперкомпьютеры позволяют создавать более крупные и более реалистичные системы, амбиции исследователей и реализм их биологических систем продолжают расти.

Summit, следующий суперкомпьютер ведущего класса OLCF, будет предлагать по крайней мере в пять раз большую вычислительную мощность, чем Titan. Для команды Смита это означает, что ее модели биомассы могут усложняться для дальнейшего изучения проблем, связанных с биотопливом.«Мы пытаемся достичь сложности, присущей природе и промышленным условиям», — сказал Петридис. «В конце концов, мы хотели бы построить простую модель клеточной стенки растений, которую мы могли бы обработать in silico или с помощью компьютерного моделирования, и посмотреть, как она изменится во время предварительной обработки».

Исследование было поддержано Управлением науки Министерства энергетики США.