Публичная база данных макромолекулярных дифракционных экспериментов

Макромолекулярная рентгеновская кристаллография привела к требованию публичного распространения координат атомов и большого количества экспериментальных данных через банк данных белков (PDB) и аналогичные проекты, что сделало эту область одной из наиболее воспроизводимых в биологических науках.В 2011 году IUCr поручил Рабочей группе по нанесению дифракционных данных (DDDWG) изучить преимущества и возможность архивирования необработанных дифракционных изображений в кристаллографии.

В трехлетнем отчете DDDWG за 2011–2014 гг. Содержится несколько ключевых рекомендаций относительно сохранения исходных дифракционных данных.

Однако до сих пор нет мандата на публичное раскрытие исходных дифракционных данных.Интегрированный ресурс воспроизводимости в макромолекулярной кристаллографии (IRRMC) является частью программы «От больших данных к знаниям» Национального института здравоохранения и был разработан для архивирования необработанных данных дифракционных экспериментов и, что не менее важно, для предоставления соответствующих метаданных.

База данных содержит на момент написания 3070 экспериментов по дифракции макромолекул (5983 набора данных) и соответствующие им частично обработанные метаданные, что составляет около 3% всех отложений в банке данных по белкам. Ресурс доступен по адресу http://www.proteindiffraction.org, и его можно искать по различным критериям с помощью простого и оптимизированного интерфейса.

Все данные доступны для неограниченного доступа и скачивания. Ресурс служит подтверждением концепции и демонстрирует возможность архивирования необработанных дифракционных данных и связанных с ними метаданных рентгеноструктурных исследований биологических макромолекул.Разговаривая с репортером о проекте, руководитель группы Владек Минор сказал: «Сейчас проводится так много исследований, что их невозможно опубликовать полностью, и часто результаты неудачных исследований не появляются в литературе.

Я думаю, что ключ к разгадке. успех — это знать о неудачных экспериментах, мы хотим знать, почему они терпят неудачу ».Цель проекта — расширить IRRMC и включить в него наборы данных, по которым не удалось получить рентгеновские структуры.

Это могло бы облегчить совместные усилия по совершенствованию методов определения структуры белка, а также обеспечить доступность «бесхозных» данных, оставленных отдельными исследователями и / или вымершими проектами структурной геномики.

Новости со всего мира