Программное обеспечение моделирует более детальные эволюционные сети на основе генетических данных

Исследователь риса Луай Наклех и его группа разработали PhyloNet, программный пакет с открытым исходным кодом, который учитывает как горизонтальное, так и вертикальное наследование генетического материала между геномами. Его метод «максимального правдоподобия», подробно описанный в этом месяце в Proceedings of the National Academy of Sciences, позволяет PhyloNet выводить сетевые модели, которые лучше описывают эволюцию определенных групп видов, чем модели деревьев.«Вывод» в данном случае означает анализ генов для определения их эволюционной истории с наивысшей вероятностью — максимальной вероятностью — связей между видами. Коллега Наклеха и Райса Кристофер Джермейн недавно выиграл грант Национального научного фонда на сумму 1,1 миллиона долларов на анализ эволюционных закономерностей с использованием байесовского вывода, метода статистической оценки вероятностей на основе набора данных.

Чтобы построить сети, которые учитывают все генетические связи между видами, программа определяет вероятность вариаций, которые филогенетические деревья не могут проиллюстрировать, например, горизонтальный перенос генов. Эти передачи обходят простую эволюцию от родителей к потомкам и позволяют генетическим вариациям переходить от одного вида к другому другими способами, кроме воспроизводства.Биологи хотят знать, когда и как произошли эти передачи, но древовидные структуры скрывают такую ​​информацию. «Когда происходит горизонтальный перенос, как при гибридизации двух видов, древовидная модель становится неадекватной для описания эволюционной истории, и сети, которые включают горизонтальный перенос генов, становятся более подходящей моделью», — сказал Наклех.

Программное обеспечение Nakhleh на основе Java учитывает неполную сортировку по происхождению, при которой ключи к эволюции генов, не совпадающие с установленной линией видов, появляются в генетической записи.«Мы первая группа, которая разработала общую модель, которая позволит биологам оценивать гибридизацию с учетом всех этих сложностей эволюции», — сказал Наклех.Большинство существующих программ филогенетики (изучение эволюционных отношений) игнорируют такие сложности. «В конечном итоге они переоценивают степень гибридизации», — сказал Наклех. «Они начинают видеть много сложностей в данных и говорят:« О, здесь все сложно; это, должно быть, гибридизация », и в конечном итоге делают слишком много выводов.

Наш метод признает, что часть сложности не имеет ничего общего с гибридизацией; делать с другими случайными процессами, которые произошли в ходе эволюции ".Исследователи Райса использовали два набора данных для тестирования новой программы.

Один из них, созданный компьютером набор данных, имитирующий реалистичную модель эволюции, позволил им оценить точность программы. Во втором были задействованы множественные геномы мышей, найденные в Европе и Азии. «Были истории о гибридизации мышей, — сказал Наклех. «Теперь, когда у нас есть первый метод, позволяющий проводить систематический анализ, мы проверили его на очень большом количестве данных из пяти образцов мышей и обнаружили гибридизацию», особенно в присутствии генетического сигнала от мыши в Казахстане, которая он нашел свой путь к мышам во Франции и Германии, сказал он.

Наклех надеется, что биологи-эволюционисты воспользуются PhyloNet, чтобы по-новому взглянуть на огромное количество геномных данных, собранных за последние несколько десятилетий. «Для меня захватывающим является то, что биологи теперь могут систематически просматривать множество данных, которые они сгенерировали, и проверять, не произошла ли гибридизация».