Екатерина «Катя» Шульгина была студенткой первого курса Высшей школы искусств и наук и искала небольшой проект по вычислительной биологии, чтобы она могла проверить требования к своей программе по системной биологии. Она задавалась вопросом, как генетический код, который когда-то считался универсальным, может развиваться и меняться.
Это был 2016 год, и сегодня Шульгина вышла на другую сторону этого краткосрочного проекта, предложив способ разгадать эту генетическую загадку. Она описывает это в новой статье в журнале eLife с гарвардским биологом Шоном Эдди.
В отчете подробно рассказывается о новой компьютерной программе, которая может считывать последовательность генома любого организма, а затем определять его генетический код. Программа под названием Codetta может помочь ученым расширить свое понимание того, как развивается генетический код, и правильно интерпретировать генетический код недавно секвенированных организмов.
«Это само по себе является очень фундаментальным вопросом биологии», - сказала Шульгина, которая проводит свои исследования в Eddy’s Lab.
Генетический код - это набор правил, которые говорят клеткам, как интерпретировать трехбуквенные комбинации нуклеотидов в белки, которые часто называют строительными блоками жизни. Почти каждый организм, от кишечной палочки до человека, использует один и тот же генетический код. Вот почему когда-то считалось, что код высечен на камне. Но ученые обнаружили несколько отклонений - организмов, которые используют альтернативные генетические коды - существуют, где набор инструкций отличается.
Вот где может проявить себя Codetta. Программа может помочь идентифицировать больше организмов, которые используют эти альтернативные генетические коды, помогая пролить новый свет на то, как генетические коды могут вообще измениться.
«Понимание того, как это произошло, поможет нам понять, почему мы изначально думали, что это невозможно… и как на самом деле работают эти действительно фундаментальные процессы», - сказала Шульгина.
Codetta уже проанализировала последовательности генома более чем 250 000 бактерий и других одноклеточных организмов, называемых археями, на предмет альтернативных генетических кодов и определила пять, которые никогда не были обнаружены. Во всех пяти случаев код аминокислота кислоты аргинина был переведен на другую аминокислоту. Считается, что это первый раз, когда ученые увидели этот обмен у бактерий, и может намекнуть на эволюционные силы, которые влияют на генетический код.
Исследователи говорят, что это исследование является крупнейшим скринингом альтернативных генетических кодов. Codetta, по сути, проанализировала каждый геном, доступный для бактерий и архей.
Название программы представляет собой нечто среднее между кодонами, последовательностью из трех нуклеотидов, образующих фрагменты генетического кода, и Розеттским камнем, каменной плитой с надписью на трех языках.
Эта работа знаменует собой кульминационный момент для Шульгиной, которая последние пять лет провела разработку статистической теории, лежащей в основе Codetta, написав программу, протестировав ее, а затем проанализировав геномы. Он работает путем считывания генома организма, а затем доступа к базе данных известных белков для создания вероятного генетического кода. Он отличается от других подобных методов масштабом, в котором он может анализировать геномы.
Шульгина пришла в лабораторию Эдди, которая специализируется на сравнении геномов, в 2016 году после того, как обратилась к нему за советом по алгоритму, который она разрабатывала для интерпретации генетических кодов.
До сих пор никто не проводил столь обширного исследования альтернативных генетических кодов.
Исследователи говорят, что следующим шагом будет использование Codetta для поиска альтернативных кодов в вирусах, эукариотах и органеллярных геномах, таких как митохондрии и хлоропласты.
«Есть еще много разнообразия в жизни, где мы еще не проводили систематического обследования», - сказала Шульгина.
Метки: Генетика