Институт общей генетики им. Н.И. Вавилова РАН, Россия, 119991, Москва, ул. Губкина, 3,
e-mail: This e-mail address is being protected from spambots. You need JavaScript enabled to view it.

Введение
В настоящее время предсказание физиологической роли генов является актуальной задачей современной генетики. Биоинформационные методологии, созданные для решения такой задачи, можно разделить на две основные категории:

  • поиск гомологии между последовательностями исследуемых генов и генов с известной функциональной активностью;
  • выявление фундаментальных закономерностей, влияющих на профиль экспрессии гена, на основе данных анализа их последовательности с последовательностями генов, имеющих сходные функции.

 

 

Для выявления таких закономерностей среди последовательностей генов целесообразно использовать выборки генов из разных организмов, сгруппированных по определенным свойствам: в этом случае вероятность выявления тех характеристик, которые имеют первостепенное значение для физиологической роли гена(ов) в пределах выделенной выборки генов, значительно увеличится. Сейчас практически все базы данных о последовательностях геномов разных видов растений размещены на разных сайтах, что затрудняет сравнительный анализ последовательностей генов из разных видов растений.

 

Результаты и обсуждение
Нами разработано программное обеспечение, включающее в себя базу данных о секвенированных геномах растений и позволяющее формировать произвольные выборки нуклеотидных последовательностей генов с целью их дальнейшего анализа по различным параметрам. В базу данных включены не только последовательности всех генов растений, геномы которых к настоящему времени определены, но и сведения об известных и предполагаемых функциях большинства растительных генов. При этом, в созданной базе данных последовательности генов растений могут быть сгруппированы по категориям согласно их функциям в соответствии с классификацией GO (Gene Ontology). Используя эту категоризацию, база данных позволяет сформировать произвольную выборку генов как в пределах одного вида растений, так и нескольких видов, а также выборку генов, характеризующуюся сходными одной или несколькими функциями. Помимо этого в автоматическом режиме может быть проведен не только поиск выделенных последовательностей, но и их сравнительный анализ, который включает анализ GC-содержания и кодонового состава последовательности каждого гена и в среднем по всей выборке генов. При этом, результаты анализа могут быть сгруппированы как по функциям генов, так и по выбранным видам растений. Результаты анализа могут быть сохранены и использованы на следующих этапах, в частности, для сравнительного анализа с результатами, полученными на других выборках генах.

 

Разработанное программное обеспечение позволяет оценить, в частности, эффективность экспрессии гена одного вида растений при его переносе и экспрессии в другой вид растений.

Работа выполнена при финансовой поддержке гранта РФФИ №09-04-01518_а.