Я б в биоинформатики пошёл, пусть меня научат!


Плюсы и минусы профессииГде учитьсяЗарплата на 16.07.2021

Биоинформатик – человек, занимающийся анализом медико-биологических данных. Он разрабатывает, а также применяет алгоритмические, вычислительные и иные методы, позволяющие узнать больше об информации, заключенной в наших клетках, иных биологических данных. Кстати, в 2021 году центр профориентации ПрофГид разработал точный тест на профориентацию. Он сам расскажет вам, какие профессии вам подходят, даст заключение о вашем типе личности и интеллекте.

Краткое описание

Современные методы диагностики и исследований приводят к росту количества научных данных, которые вручную обрабатывать очень сложно. В этом случае на помощь приходит биоинформатика, которая как междисциплинарная область науки сформировалась во второй половине XX века. Биоинформатики пользуются элементами прикладной математики, статистики, а также информатики. Во время работы они оперируют следующими знаниями:

  • языки программирования, преимущественно Java, С, С++, С#, R;
  • язык разметки HTML;
  • программы: ACT, BLAST, Clustal и иные;
  • SQL, CUDA.

Рассмотрим основные области исследования:

  • анализ генетических последовательностей, эволюционная вычислительная биология;
  • проведение оценки биологического разнообразия, аннотация геномов.

Профессия молодая, в дальнейшем она будет развиваться еще более стремительно, ведь применение вычислительных методов гарантирует высокую точность, скорость и исключает человеческий фактор. Технологии биоинформатики необходимы в биохимии, биофизике, экологии, фармакологии, сельском хозяйстве, генетике и других сферах.

Кто-то это уже сделал. Так найдите их и спросите!

Какая бы хитрая не была проблема и как бы не был нов метод, всегда есть вероятность, что люди уже занимались тем, с чем пришлось столкнуться вам. Есть два сайта, на которых обсуждают возникшие в исследованиях проблемы — BioStars и SeqAnswers (а чисто программистские вопросы — Stack Overflow). Иногда можно получить дельный совет даже в твиттере. Поищите в интернете, кто в этой стране и в мире занимается похожими вопросами и свяжитесь с ними (см. таблицу 3).
Таблица 3. Русские «сухие» лаборатории.

ЛабораторияГородЧем занимаются
Группа молекулярного моделирования на биологическом факультете МГУМоскваМолекулярная динамика белков и пептидов
Группа вычислительной структурной биологии, биоинформатическая группа и лаборатория эволюционной геномики на факультете биоинженерии и биоинформатики МГУМосква
  • Молекулярное моделирование нуклеиновых кислот и нуклеопротеидов и биомембран. Дизайн ферментов.
  • Системная биология, биостатистика, изучение вторичной структуры РНК.
  • Изучения естественного отбора на геномном уровне, работа с данными секвенирования нового поколения (NGS).
Лаборатория химической кибернетики и группа компьютерного молекулярного дизайна на химическом факультете МГУМосква
  • Квантовая и фотохимия
  • Молекулярное моделирование оболочек вирусов и их ингибиторов, а также мембранных рецепторов
Лаборатория биокатализа и биотрансформаций и Отдел математических методов в биологии НИИ физико-химической биологии МГУМосква
  • Молекулярное моделирование и биоинженерия ферментов
  • Анализ пространственной структуры белков и комплексов белок-ДНК. Анализ геномных данных.
Лаборатория моделирования биомолекулярных систем в Институте биоорганической химии РАНМоскваМолекулярное моделирование биомембран и мембранных белков, а также биологически активных веществ
Лаборатории структурной биоинформатики и структурно-функционального конструирования лекарств в Институте биомедицинской химии РАМНМоскваКомпьютерное моделирование комплексов белков с белками и лекарствами, драг-дизайн, фармакология, изучение связей «структура—активность»
Учебно-Научный и еще несколько биоинформатических групп в Институте Проблем Передачи Информации РАНМоскваСистемная биология, анализ пространственных структур биомолекул, сравнительная геномика.Организуют Московский биоинформатический семинар, Московскую школу биоинформатики и конференцию «Moscow Conference for Molecular Computational Biology».
Лаборатория системной биологии и вычислительной генетики и группа биоинформатики в Институте общей генетики РАНМоскваПоиск функциональных мотивов (сайтов связывания транскрипционных факторов и т.д.) в последовательностях ДНК
Лаборатория биоинформатики и системной биологии в Институте молекулярной биологии РАНМоскваМетоды биоинформатики и поиска функциональных мотивов, предсказание предрасположенности к заболеваниям
Лаборатория биоинформатики в НИИ Физико-химической медициныМоскваПроблемы метагеномики и протеомики
Лаборатория алгоритмической биологии Академического университета РАНСанкт-ПетербургПроблемы «сборки» и анализа геномов
Лаборатория «Алгоритмы сборки геномных последовательностей» национального исследовательского университета информационных технологий, механики и оптикиСанкт-ПетербургПроблемы «сборки» и анализа геномов
Группа биоинформатики и функциональной геномики Института Цитологии РАНСанкт-ПетербургИзучение функционального значения общей структуры генома
Лаборатории функциональной геномики и клеточного стресса и механизмов функционирования клеточного генома Института биофизики клетки РАНПущино
  • Моделирование структурной организации и поиск промоторов в ДНК бактерий
  • Анализ распределения физических свойств вдоль последовательности ДНК, нелинейная динамика ДНК
Лаборатория прикладной математики в Институте математических проблем биологии РАНПущиноВторичная структура РНК, альтернативный сплайсинг
Лаборатория физики белка Института белка РАНПущиноТеоретическое и экспериментальное изучение процессов сворачивания белковых молекул
Отдел системной биологии Института цитологии и генетики СО РАННовосибирскПостгеномная биоинформатика. Компьютерный анализ и моделирование молекулярно-генетических систем. Генные сети. Модели эволюции микроорганизмов.
Группа лаборатории экологической биохимии Института биологии КарНЦ РАНПетрозаводскМолекулярное моделирование биомембран
Мы отдаем себе отчет, что в одной таблице нельзя перечислить все стóящие научные группы. Если мы забыли кого-то, то с удовольствием добавим. Таблица подготовлена Еленой Чуклиной (Московский физико-технический институт / Учебно-научный Института проблем передачи информации РАН).

В довершение можно сказать, что в интернете есть масса форумов и юзергрупп, где можно задать интересующие вопросы. Установите себе линукс и начните изучать в онлайне что-нибудь биоинформатическое. При должном упорстве вы удивитесь, как многого можно достичь, имея просто компьютер и выход в интернет!

Статья написана по мотивам эссе в журнале Nature Biotechnology [10] при участии Артура Залевского и Елены Чуклиной.


Автор этой заметки делает вид, что моделирует на компьютере взаимодействие лиганд-связывающего домена никотинового ацетилхолинового рецептора типа α7 с одним из природных нейромодуляторов.

Особенности профессии

Биоинформатика находится на стыке медицины, биологии, прикладной математики, информатики. В обязанности людей, выбравших это направления, входит решение глобальных задач:

  • поиск методов лечения онкологических, хронических, аутоиммунных заболеваний;
  • продление срока жизни населения, улучшение экологической ситуации, поиск генома долголетия;
  • разработка, планирование, внедрение математических методов, алгоритмов, программ, используемых для анализа медицинской и биологической информации;
  • применение полученных результатов на практике.

Области исследования обширные, а биоинформатика обладает огромным потенциалом. Международный рынок труда уже испытывает дефицит биоинформатиков, ведь в них заинтересованы и фармакологические, и IT-компании.

Безусловно, биоинформатик должен обладать безупречными знаниями в сфере медицины и биологии, разбираться в сложных профессиональных терминах, огромным плюсом станет знание английского языка. Большую часть рабочего времени эксперты в этой области проводят за компьютером, работа малоподвижная, но имеет огромное социальное значение.

Плюсы и минусы профессии

Плюсы

  1. Очень перспективная сфера деятельности. Рост массивов данных приведет к еще большей востребованности биоинформатиков.
  2. Из года в год в этом сегменте наблюдается стабильный рост заработных плат.
  3. Перед биоинформатиками открыты все двери – от отечественных исследовательских центров до респектабельных мировых IT-компаний.
  4. Для работы используются математические методы, компьютерные программы, поэтому биоинформатики не взаимодействуют с пациентами или биологическими материалами.
  5. Знание языков программирования и основ прикладной математики позволяют биоинформатику выбрать другой сегмент деятельности. Например, классическое программирование, разработка и тестирование программ.
  6. Постоянное саморазвитие и совершенствование профессиональных навыков.
  7. Возможность заниматься анализом массивов данных, зная, что результаты работы в перспективе спасут жизни тысяч людей.
  8. Области исследования биоинформатики получают активную поддержку государства.

Минусы

  1. Работая сидячая, сопряжена с усиленной мозговой активностью.
  2. Профессия больше подходит для людей, имеющих технический склад ума.
  3. У молодых биоинформатиков, не имеющих опыта работы, могут возникнуть проблемы при трудоустройстве.
  4. Некоторые врачи с недоверием относятся к этому междисциплинарному направлению.

Обучение на биоинформатика

Вузы

Московский государственный университет имени М.В. Ломоносова

Биоинженерия и биоинформатика (Факультет биоинженерии и биоинформатики МГУ им. М.В. Ломоносова)

Первый Московский государственный медицинский университет им. И.М.Сеченова

Биоинженерия и биоинформатика (Первый Московский государственный медицинский университет им. И.М.Сеченова)

Биоинформатика только набирает популярность, но профильные факультеты уже успешно функционируют в российских вузах. Если вы желаете стать экспертом в этой области, то обратите внимание на направление подготовки «Биоинженерия и биоинформатика» (код: 06.05.01).

Для поступления на эту специальность необходимо сдать ЕГЭ по профильной математике, а также обязательному русскому языку. Остальные экзамены зависят от вуза, но чаще всего это биология, химия, физика или информатика (1-2 из перечисленных).Подготовкой кадров по этому направлению занимаются немногие российские вузы, а проходной балл по предмету составляет 64-92, бюджетных мест – не более 30. Форма обучения — очная, срок — 5 лет (специалитет).

Используйте систему контроля версий

Использование контроля версий позволит более гибко управлять развитием кода, позволит легко возвращаться к предыдущим редакциям программы или переключаться между разными ветвями разработки, а также откроет возможность совместной разработки программы. Распространенные системы — такие как Git или Subversion — дадут возможность легкой публикации проекта в сети. Вы сделаете лучше прежде всего для себя, если не поленитесь написать несколько внятных README-файлов и положите их в нужные места проекта; это чрезвычайно вам поможет, если спустя месяцы или даже годы вам придется вернуться к старой программе. Документируйте программы и скрипты, чтобы было понятно, что они делают. Когда публикуете научную статью, хорошим тоном будет опубликовать также оригинальные программы, которые использовались для обсчета данных: это позволит другим использовать тот же метод и воспроизвести ваши результаты. Неплохо бы также вести электронный дневник, в котором был бы записан весь ход работы. Онлайн-репозитории, такие как Github, позволяют делать это, а также позволят вам хранить рабочие версии программы, что станет дополнительным уровнем бэкапа ваших наработок (см. таблицу 1).
Таблица 1. Важные инструменты компьютерного биолога.

ЗадачаИнструменты
Совместная разработка программСделайте ваш код (и, возможно, данные) доступными в сети с такими онлайн-хранилищами как Github, Sourceforge или Bitbucket. В интернете много руководств по использованию этих систем. Существуют также системы управления научными проектами, о которых рассказано в отдельной врезке.
Для сложных задач пишите скрипты и конвейерыДля этого можно использовать как современные разработки, вроде Ruffus, так и проверенные временем классические UNIX-утилиты типа Make. Выбор конкретного инструментария зависит от личных предпочтений и любимого языка программирования
Сделайте ваши «конвейеры» доступнымиНе исключено, что в командной строке вы себя чувствуете, как рыба в воде, но большинство ваших коллег, наверняка, нет. Созданные вами конвейеры можно оснащать графическими интерфейсами с помощью систем Galaxy или Taverna.
Инструменты разработчика (IDE)Конечно, программы можно писать в любом текстовом редакторе, начиная с , но будет лучше, если вы освоите более продвинутые инструменты — такие как текстовый редактор Emacs или полнофункциональную среду разработки типа Eclipse. И, опять же, конкретный выбор будет основан на ваших предпочтениях и любимом языке программирования.

Системы управления проектами

Еще одним полезным инструментом, помимо систем контроля версий, который можно позаимствовать из программисткой практики, являются системы управления проектами. Проще всего воспринимать их как продвинутый электронный журнал, который предоставляет вам следующие дополнительные возможности:

  • Создание и назначение задач. Например, «посчитать то-то». Внутри задачи можно вести обсуждения, которые будут удобно структурированы и не превратят вашу почту в склад ужасающей переписки вроде «Re: Project X (100)» При этом, однако, можно настроить почтовые уведомления, поэтому никто не пропустит важный комментарий.
  • Прикладывать и организовывать файлы с подробными описаниями и поддержкой версий а-ля Dropbox. Вам приходилось подолгу искать в нескольких ветках переписки по проекту какие-нибудь файлы с маловразумительными названиями, вроде «report_ACC_clean.xxx»?
  • Во встроенную Wiki можно заносить описания процедур запуска программ, методики экспериментов, встраивать видеозаписи и даже рендерить LaTeX формулы.
  • Текстовый поиск по всему содержимому, в том числе по приложенным файлам.
  • Интеграция с системами контроля версий для разработки ПО позволяет удобно соотносить задачи с изменениями в репозиториях.
  • Есть даже такие экзотические возможности, как организация своего аналога Google Docs для одновременного редактирования текста. Не всю информацию можно доверить сторонним ресурсам.

В нашей лаборатории мы используем Redmine — это отличная СПО-система управления проектами, под которую есть множество плагинов. Ее можно развернуть как самостоятельно, так и взять в аренду виртуальную машины с уже установленной системой. Наиболее известным проприетарным аналогом является Basecamp.

Залевский Артур, факультет биоинженерии и биоинформатики МГУ (группа вычислительной структурной биологии).

Рейтинг
( 1 оценка, среднее 5 из 5 )
Понравилась статья? Поделиться с друзьями: