[МУЗЫКА] А теперь давайте повнимательнее посмотрим на то, что из себя представляет секвенсный проект. Любой секвенсный проект начинается с выделения биологического материала, первичную структуру которого вы хотите определить. Далее вы создаёте библиотеки, то есть трансформируете молекулы таким образом, чтобы их можно было нанести на секвенирующий инструмент. После того как ваш секвенирующий инструмент отработал, вы получаете информацию о первичной структуре в формате, которая в дальнейшем может быть использована компьютерными программами. После этого наступает этап анализа данных, а также их интерпретации, о сложности которого мы с вами уже говорили. Идеальным результатом любого секвенсного проекта является простое изложение полученных результатов, воспользоваться которыми могут учёные и медики разного опыта обращения с данными. Так кто же такой биоинформатик? Биолог — это человек, который работает с молекулами в лаборатории, он собирает молекулярные данные о ДНК, РНК, белковом секвенсе, экспрессии генов и так далее. Программист, математик, статистик — это человек, который создаёт программы, алгоритмы для хранения и анализа данных. А кто ж такой биоинформатик? Это человек, который должен владеть и теми, и другими данными и быть в состоянии ответить на биологические вопросы с помощью анализа молекулярных данных. Ниже приведён перечень лишь некоторых вопросов, которые стоят перед микробной геномикой. И начнём мы со сборки генома. Сборка генома представляет собой очень сложную компьютерную задачу, и объясняется это тем, что необходимо собрать воедино огромное количество маленьких фрагментов. Идеальным выходом, результатом работы программы, собирающей геном, должно явиться восстановление всех хромосом просеквенированного организма. Однако это почти никогда не происходит в силу того, что геномы сложны, и в результате мы получаем неполностью восстановленный геном. De Novo сборку генома можно сравнить с пазлом, состоящим из огромного количества маленьких фрагментов, но без рисунка. Первым этапом этой сборки является оптимальный выбор библиотек, то есть это лабораторный метод, а также подбор правильной секвенсной технологии, наилучшим образом подходящей к данному конкретному проекту. Следующим этапом является очистка полученных секвенсных данных от информации, не имеющей отношения к просеквенированному нами геному. Следующий этап — это непосредственно сборка. Для этого необходимо выбрать правильный сборщик, так называемый «ассемблер», а, кроме того, параметр и настройки сборки, чтобы получить максимально хороший результат. Однако практически никогда не удаётся получить полностью восстановленный геном на этапе автоматической сборки. Поэтому следующим этапом является этап финиширования. То есть задача этого этапа — исправить все ошибки и по возможности восстановить полностью геном, то есть каждую хромосому, каждый ампликон. А пока попробуйте восстановить картинку, спрятавшуюся за кучкой этих разноцветных фрагментов. [МУЗЫКА] [МУЗЫКА] [МУЗЫКА]