Главная / Новости / Как расшифровывается последовательность генома

Как расшифровывается последовательность генома

20.11.2021г.

Концепция генетического анализа ДНК

Екатерина «Катя» Шульгина была студенткой первого курса Высшей школы искусств и наук и искала небольшой проект по вычислительной биологии, чтобы она могла проверить требования к своей программе по системной биологии. Она задавалась вопросом, как генетический код, который когда-то считался универсальным, может развиваться и меняться.

Это был 2016 год, и сегодня Шульгина вышла на другую сторону этого краткосрочного проекта, предложив способ разгадать эту генетическую загадку. Она описывает это в новой статье в журнале eLife с гарвардским биологом Шоном Эдди.

В отчете подробно рассказывается о новой компьютерной программе, которая может считывать последовательность генома любого организма, а затем определять его генетический код. Программа под названием Codetta может помочь ученым расширить свое понимание того, как развивается генетический код, и правильно интерпретировать генетический код недавно секвенированных организмов.

Как расшифровывается последовательность генома

«Это само по себе является очень фундаментальным вопросом биологии», - сказала Шульгина, которая проводит свои исследования в Eddy’s Lab.

Что такое генетический код

Генетический код - это набор правил, которые говорят клеткам, как интерпретировать трехбуквенные комбинации нуклеотидов в белки, которые часто называют строительными блоками жизни. Почти каждый организм, от кишечной палочки до человека, использует один и тот же генетический код. Вот почему когда-то считалось, что код высечен на камне. Но ученые обнаружили несколько отклонений - организмов, которые используют альтернативные генетические коды - существуют, где набор инструкций отличается.

Вот где может проявить себя Codetta. Программа может помочь идентифицировать больше организмов, которые используют эти альтернативные генетические коды, помогая пролить новый свет на то, как генетические коды могут вообще измениться.

«Понимание того, как это произошло, поможет нам понять, почему мы изначально думали, что это невозможно… и как на самом деле работают эти действительно фундаментальные процессы», - сказала Шульгина.

Codetta уже проанализировала последовательности генома более чем 250 000 бактерий и других одноклеточных организмов, называемых археями, на предмет альтернативных генетических кодов и определила пять, которые никогда не были обнаружены. Во всех пяти случаев код аминокислота кислоты аргинина был переведен на другую аминокислоту. Считается, что это первый раз, когда ученые увидели этот обмен у бактерий, и может намекнуть на эволюционные силы, которые влияют на генетический код.

Исследователи говорят, что это исследование является крупнейшим скринингом альтернативных генетических кодов. Codetta, по сути, проанализировала каждый геном, доступный для бактерий и архей.

Название программы представляет собой нечто среднее между кодонами, последовательностью из трех нуклеотидов, образующих фрагменты генетического кода, и Розеттским камнем, каменной плитой с надписью на трех языках.

Эта работа знаменует собой кульминационный момент для Шульгиной, которая последние пять лет провела разработку статистической теории, лежащей в основе Codetta, написав программу, протестировав ее, а затем проанализировав геномы. Он работает путем считывания генома организма, а затем доступа к базе данных известных белков для создания вероятного генетического кода. Он отличается от других подобных методов масштабом, в котором он может анализировать геномы.

Как расшифровывается последовательность генома

Шульгина пришла в лабораторию Эдди, которая специализируется на сравнении геномов, в 2016 году после того, как обратилась к нему за советом по алгоритму, который она разрабатывала для интерпретации генетических кодов.

До сих пор никто не проводил столь обширного исследования альтернативных генетических кодов.

  • «Было здорово увидеть новые коды, потому что, насколько мы знали, Кейт проделала бы всю эту работу, и новых кодов не нашлось бы», - сказал Эдди, который также является медицинским следователем Говарда Хьюза. Он также отметил возможность использования системы для обеспечения точности многих баз данных, содержащих последовательности белков.
  • «Многие белковые последовательности в базах данных в наши дни представляют собой лишь концептуальные переводы последовательностей геномной ДНК» , - сказал Эдди. «Люди ищут в этих белковых последовательностях всевозможные полезные вещи, такие как новые ферменты, новые инструменты для редактирования генов и тому подобное. Вы хотите, чтобы эти белковые последовательности были точными, но если организм использует нестандартный код, они будут ошибочно переведены».

Исследователи говорят, что следующим шагом будет использование Codetta для поиска альтернативных кодов в вирусах, эукариотах и органеллярных геномах, таких как митохондрии и хлоропласты.

«Есть еще много разнообразия в жизни, где мы еще не проводили систематического обследования», - сказала Шульгина.

Источник

Метки:





Читайте далее: