Вычислительные инструменты помогут идентифицировать микробы в сложных образцах окружающей среды

Новый проект, поддерживаемый Национальным научным фондом, предоставит вычислительные инструменты, призванные помочь идентифицировать и охарактеризовать генетическое разнообразие жителей этих микробных сообществ. Этот проект, осуществляемый исследователями из Технологического института Джорджии и Университета штата Мичиган, позволит клиницистам и ученым сравнивать геномную информацию организмов, с которыми они сталкиваются, с растущими объемами данных, предоставляемых мировым научным сообществом.

Инструменты будут размещены на веб-сервере, предназначенном для использования исследователями, которые могут не иметь обучения новейшим методам биоинформатики. Прототип системы, содержащий ограниченное количество вычислительных инструментов, уже доступен на http://enve-omics.ce.gatech.edu и привлекает более 500 пользователей каждый месяц.

«Во многих областях науки мы имеем дело с сообществами микроорганизмов, и одна из проблем, с которыми мы столкнулись, — это идентифицировать их, потому что у нас не было хороших инструментов, чтобы отличить отдельные микробы от смесей», — сказал Костас Константинидис, научный сотрудник. профессор Школы гражданской и экологической инженерии Технологического института Джорджии и главный исследователь проекта. «Наши инструменты будут разработаны для работы с геномами целых сообществ организмов».Современные методы идентифицируют отдельные микробы, исследуя их гены малых субъединиц рибосомной РНК (SSU рРНК), но новые инструменты позволят ученым анализировать целые геномы и мета-геномы.«С наступлением эры генома мы теперь можем получить весь геном этих организмов, чтобы увидеть не только рибосомную РНК, но и все гены в геноме, чтобы лучше понять, каким может быть потенциал каждого организма», — сказал Константинидис. «Будет много преимуществ, если посмотреть на все гены вместо одного, рРНК SSU, например, чтобы определить, какие организмы кодируют токсины или ферменты, расщепляющие загрязнители».

В трехлетнем проекте участвуют ученые, работающие над проектом базы данных рибосом в Университете штата Мичиган: Джим Тидже, директор Центра микробной экологии Университета штата Мичиган, и Джеймс Коул, доцент-исследователь из Университета штата Мичиган и директор проекта базы данных рибосом. .Возможность идентифицировать и подсчитывать организмы в сложных сообществах с использованием не зависящих от культуры, геномных технологий и связанных с ними алгоритмов биоинформатики становится все более важной, поскольку ученые изучают организмы, которые нельзя выращивать в лаборатории.

Большинство организмов в мире сопротивляются традиционной лабораторной культуре, а это означает, что их необходимо изучать в полевых условиях и идентифицировать с помощью генетической информации.Константинидис и его исследовательская группа изучают такие сообщества в воде озер в системе реки Чаттахучи в Джорджии и других местах. Они изучают, как эти сообщества реагируют на возмущения, такие как разливы нефти или пестицидов, и роль, которую разные члены сообщества играют в разложении загрязнителей.

«Эти инструменты на самом деле взяты из нашей исследовательской практики», — сказал Константинидис. «Мы подошли к тому моменту, когда мы не смогли обработать данные, чтобы ответить на вопросы, которые хотели задать. Это привело нас к этому новому проекту по разработке инструментов, которые нам и другим нужны, чтобы исследовать данные и получать информацию, которую мы ищем. . "В одном литре озерной воды может содержаться до 500 различных видов, а вместе их геномная информация может составлять десятки миллиардов букв, кодирующих ген. Только из озера Ланье команда сгенерировала 200 гигабайт геномных данных.«Мы хотим выяснить, какие организмы существуют и какие гены они кодируют», — пояснил Константинидис. «Инструменты, которые мы разрабатываем, позволят нам это сделать».

Инструменты, разработанные в рамках проекта, будут полезны как клиническим микробиологам, так и исследователям окружающей среды. «Это не будет относиться к какой-либо одной дисциплине», — сказал он. «Пока люди работают с микробами, это будет им полезно, потому что некоторые вопросы универсальны».Система также будет создана для оказания удобной помощи ученым, которые могут не иметь подготовки в области новейших геномных и биоинформатических методов. «Существует большая потребность в анализе больших данных, а обученных людей сейчас не так много», — сказал Константинидис. «Эти инструменты сделают жизнь исследователей проще».

Среди предстоящих задач — создание инфраструктуры, способной обрабатывать растущие объемы геномной информации, производимой во всем мире.«Нам нужно будет разработать некоторые вычислительные решения для проблем, связанных со всеми новыми доступными данными», — сказал Константинидис. «Нам нужно создавать инструменты с высокой пропускной способностью, чтобы справляться с объемами данных, которые растут геометрически».

Первоначально система будет работать на серверах Технологического института Джорджии и Университета штата Мичиган, но если спрос и объем данных будут расти, могут потребоваться дополнительные ресурсы, такие как суперкомпьютер XSEDE Национального научного фонда.