Новые технологии мониторинга активности мозга генерируют беспрецедентные объемы информации. Эти данные могут дать новое понимание того, как работает мозг, но только если исследователи смогут их интерпретировать. Чтобы помочь разобраться в данных, нейробиологи теперь могут использовать возможности распределенных вычислений с помощью Thunder, библиотеки инструментов, разработанной в исследовательском кампусе Janelia при Медицинском институте Говарда Хьюза.Thunder ускоряет анализ наборов данных, которые настолько велики и сложны, что на их анализ на одной рабочей станции уйдут дни или недели — если бы одна рабочая станция вообще могла это сделать.
Руководители группы Janelia Джереми Фриман, Миша Аренс и другие коллеги из Janelia и Калифорнийского университета в Беркли сообщают в выпуске журнала Nature Methods от 27 июля 2014 г., что они использовали Thunder для быстрого поиска закономерностей на изображениях с высоким разрешением. собраны из мозга активных рыбок данио и мышей с помощью нескольких методов визуализации.Важно отметить, что они использовали Thunder для анализа данных изображений с нового микроскопа, который Аренс и его коллеги разработали для мониторинга активности почти каждой отдельной клетки в мозгу рыбок данио, когда они реагируют на зрительные стимулы. Эта технология описана в сопроводительном документе, опубликованном в том же выпуске Nature Methods.Thunder может работать в частном кластере или в сервисах облачных вычислений Amazon.
Исследователи могут найти все, что им нужно, чтобы начать использовать библиотеку инструментов с открытым исходным кодом на http://freeman-lab.github.io/thunder.Новые микроскопы делают изображения мозга быстрее, с лучшим пространственным разрешением и в более широких областях мозга, чем когда-либо прежде. Тем не менее, все эти детали зашифрованы в гигабайтах или даже терабайтах данных. На одной рабочей станции простые вычисления могут занять часы. «Для большинства этих наборов данных одна машина просто не сможет их обработать», — говорит Фриман.
Фриман и Аренс говорят, что не только объем данных превышает возможности одного компьютера, но и их сложность. «Когда вы записываете информацию из мозга, вы не знаете, как лучше всего получить из нее нужную информацию.
Каждый набор данных индивидуален. У вас есть идеи, но генерируют ли они понимание — вопрос открытый до тех пор, пока вы действительно применяете их », — говорит Аренс.
Он объясняет, что нейробиологи редко приходят к новым представлениям о мозге при первом рассмотрении своих данных. Вместо этого первоначальный анализ может намекнуть на более многообещающий подход, и после некоторых корректировок и нового вычислительного анализа данные могут начать выглядеть более значимыми. «Возможность быстро применять эти анализы — один за другим — важна. Скорость дает исследователю больше гибкости для изучения и получения новых идей».Вот почему попытки анализировать данные нейробиологии с помощью медленных вычислительных инструментов могут быть такими неприятными. «Для некоторых анализов вы можете загрузить данные, запустить их и вернуться на следующий день», — говорит Фриман. «Но если вам нужно настроить анализ и запустить его снова, вам придется подождать еще одну ночь».
Для больших наборов данных время задержки может составлять недели или месяцы.Распределенные вычисления были очевидным решением для ускорения анализа при изучении всего богатства набора данных, но существует множество альтернатив.
Фриман решил использовать новую платформу под названием Spark. По словам Фримена, Spark, разработанный в Калифорнийском университете в AMPLab Беркли, быстро становится популярным инструментом для крупномасштабных вычислений в промышленности. Возможности Spark для кэширования данных устраняют узкое место загрузки полного набора данных для всех, кроме начального шага, что делает его хорошо подходящим для интерактивного исследовательского анализа и для сложных алгоритмов, требующих повторяющихся операций с одними и теми же данными. А элегантные и универсальные интерфейсы прикладного программирования (API) Spark помогают упростить разработку.
Thunder использует Python API, который, как надеется Фриман, упростит освоение другими, учитывая все более широкое использование Python в нейробиологии и науке о данных.Чтобы сделать Spark пригодным для анализа широкого спектра данных нейробиологии — информации о связях и активности, собранной от разных организмов и с помощью различных методов, — Фриман впервые разработал стандартизированные представления данных, которые можно было использовать для распределенных вычислений. Затем он попытался выразить типичные рабочие процессы нейробиологии на вычислительном языке Spark.
Отсюда, по его словам, биологические вопросы, которые интересовали его и его коллег, привели к развитию. «Мы начали с вопросов о биологии, затем приступили к анализу и разработали инструменты», — говорит он.В результате получился модульный набор инструментов, который будет расширяться по мере того, как команда Janelia и сообщество нейробиологов будут добавлять новые компоненты. «Разработанный нами анализ — это строительные блоки», — говорит Аренс. «Разработка новых методов анализа для интерпретации крупномасштабных записей — активная область и идет рука об руку с развитием ресурсов для крупномасштабных вычислений и визуализации. Алгоритмы в нашей статье являются отправной точкой».
Используя Thunder, Фриман, Аренс и их коллеги проанализировали изображения мозга за считанные минуты, взаимодействуя с результатами анализа и пересматривая его без длительных задержек, связанных с предыдущими методами. Например, на изображениях мозга мыши, сделанных с помощью двухфотонного микроскопа, команда обнаружила в мозге клетки, активность которых варьировалась в зависимости от скорости бега.
По словам ученых, для анализа гораздо больших наборов данных такие инструменты, как Thunder, не только полезны, но и необходимы. Это верно для информации, собираемой новым микроскопом, который Аренс и его коллеги разработали для мониторинга активности всего мозга в ответ на визуальные стимулы.В прошлом году руководитель группы Аренс и Джанелия Филип Келлер использовал высокоскоростную визуализацию светового листа для создания микроскопа, который фиксирует нейронную активность клетка за клеткой почти во всем мозге незрелой рыбки данио.
Этот микроскоп давал потрясающие изображения нейронов в мозгу рыбок данио, которые активировались, пока рыба была неактивна. Но Аренс хотел использовать эту технологию для изучения активности мозга в более сложных ситуациях.
Теперь команда объединила свою оригинальную технологию с симулятором плавания в виртуальной реальности, который ранее разработал Аренс, чтобы обеспечить рыбам визуальную обратную связь, имитирующую движение.В световом микроскопе лист лазерного света сканирует образец, освещая тонкие срезы за раз. Чтобы рыба в микроскопе могла видеть окружающую среду виртуальной реальности и реагировать на нее, команде Аренса нужно было защитить ее глаза.
Поэтому они запрограммировали лазер так, чтобы он быстро отключался, когда его световой лист приближался к глазу, и перезапускался, когда область была очищена. Затем они представили второй лазер, который сканирует образец под другим углом, чтобы обеспечить отображение области мозга за глазами. Вместе два лазера визуализируют мозг почти полностью, не мешая зрению животного.
Сочетание этих двух технологий позволяет Аренсу отслеживать активность всего мозга, поскольку рыба регулирует свое поведение на основе полученной сенсорной информации. Этот метод генерирует около терабайта данных за час, что представляет собой сложную задачу анализа данных, которая помогла мотивировать разработку Thunder. Когда Фриман и Аренс применили свои новые инструменты к данным, быстро возникли закономерности.
В качестве примеров они идентифицировали клетки, активность которых была связана с движением в определенных направлениях, и клетки, которые активировались именно тогда, когда рыба была в состоянии покоя, и смогли охарактеризовать динамику активности этих клеток. Примеры подобных анализов и примеры наборов данных доступны на веб-сайте http://research.janelia.org/zebrafish/.
Теперь Аренс планирует исследовать более сложные вопросы, используя новую технологию, и он, и Фриман предвидят расширение Thunder. «На любом уровне это действительно только начало», — говорит Фриман.
