Плюсы и минусы профессииГде учитьсяЗарплата на 16.07.2021
Биоинформатик – человек, занимающийся анализом медико-биологических данных. Он разрабатывает, а также применяет алгоритмические, вычислительные и иные методы, позволяющие узнать больше об информации, заключенной в наших клетках, иных биологических данных. Кстати, в 2021 году центр профориентации ПрофГид разработал точный тест на профориентацию. Он сам расскажет вам, какие профессии вам подходят, даст заключение о вашем типе личности и интеллекте.
Краткое описание
Современные методы диагностики и исследований приводят к росту количества научных данных, которые вручную обрабатывать очень сложно. В этом случае на помощь приходит биоинформатика, которая как междисциплинарная область науки сформировалась во второй половине XX века. Биоинформатики пользуются элементами прикладной математики, статистики, а также информатики. Во время работы они оперируют следующими знаниями:
- языки программирования, преимущественно Java, С, С++, С#, R;
- язык разметки HTML;
- программы: ACT, BLAST, Clustal и иные;
- SQL, CUDA.
Рассмотрим основные области исследования:
- анализ генетических последовательностей, эволюционная вычислительная биология;
- проведение оценки биологического разнообразия, аннотация геномов.
Профессия молодая, в дальнейшем она будет развиваться еще более стремительно, ведь применение вычислительных методов гарантирует высокую точность, скорость и исключает человеческий фактор. Технологии биоинформатики необходимы в биохимии, биофизике, экологии, фармакологии, сельском хозяйстве, генетике и других сферах.
Кто-то это уже сделал. Так найдите их и спросите!
Какая бы хитрая не была проблема и как бы не был нов метод, всегда есть вероятность, что люди уже занимались тем, с чем пришлось столкнуться вам. Есть два сайта, на которых обсуждают возникшие в исследованиях проблемы — BioStars и SeqAnswers (а чисто программистские вопросы — Stack Overflow). Иногда можно получить дельный совет даже в твиттере. Поищите в интернете, кто в этой стране и в мире занимается похожими вопросами и свяжитесь с ними (см. таблицу 3).
Таблица 3. Русские «сухие» лаборатории.
Лаборатория | Город | Чем занимаются |
Группа молекулярного моделирования на биологическом факультете МГУ | Москва | Молекулярная динамика белков и пептидов |
Группа вычислительной структурной биологии, биоинформатическая группа и лаборатория эволюционной геномики на факультете биоинженерии и биоинформатики МГУ | Москва |
|
Лаборатория химической кибернетики и группа компьютерного молекулярного дизайна на химическом факультете МГУ | Москва |
|
Лаборатория биокатализа и биотрансформаций и Отдел математических методов в биологии НИИ физико-химической биологии МГУ | Москва |
|
Лаборатория моделирования биомолекулярных систем в Институте биоорганической химии РАН | Москва | Молекулярное моделирование биомембран и мембранных белков, а также биологически активных веществ |
Лаборатории структурной биоинформатики и структурно-функционального конструирования лекарств в Институте биомедицинской химии РАМН | Москва | Компьютерное моделирование комплексов белков с белками и лекарствами, драг-дизайн, фармакология, изучение связей «структура—активность» |
Учебно-Научный и еще несколько биоинформатических групп в Институте Проблем Передачи Информации РАН | Москва | Системная биология, анализ пространственных структур биомолекул, сравнительная геномика.Организуют Московский биоинформатический семинар, Московскую школу биоинформатики и конференцию «Moscow Conference for Molecular Computational Biology». |
Лаборатория системной биологии и вычислительной генетики и группа биоинформатики в Институте общей генетики РАН | Москва | Поиск функциональных мотивов (сайтов связывания транскрипционных факторов и т.д.) в последовательностях ДНК |
Лаборатория биоинформатики и системной биологии в Институте молекулярной биологии РАН | Москва | Методы биоинформатики и поиска функциональных мотивов, предсказание предрасположенности к заболеваниям |
Лаборатория биоинформатики в НИИ Физико-химической медицины | Москва | Проблемы метагеномики и протеомики |
Лаборатория алгоритмической биологии Академического университета РАН | Санкт-Петербург | Проблемы «сборки» и анализа геномов |
Лаборатория «Алгоритмы сборки геномных последовательностей» национального исследовательского университета информационных технологий, механики и оптики | Санкт-Петербург | Проблемы «сборки» и анализа геномов |
Группа биоинформатики и функциональной геномики Института Цитологии РАН | Санкт-Петербург | Изучение функционального значения общей структуры генома |
Лаборатории функциональной геномики и клеточного стресса и механизмов функционирования клеточного генома Института биофизики клетки РАН | Пущино |
|
Лаборатория прикладной математики в Институте математических проблем биологии РАН | Пущино | Вторичная структура РНК, альтернативный сплайсинг |
Лаборатория физики белка Института белка РАН | Пущино | Теоретическое и экспериментальное изучение процессов сворачивания белковых молекул |
Отдел системной биологии Института цитологии и генетики СО РАН | Новосибирск | Постгеномная биоинформатика. Компьютерный анализ и моделирование молекулярно-генетических систем. Генные сети. Модели эволюции микроорганизмов. |
Группа лаборатории экологической биохимии Института биологии КарНЦ РАН | Петрозаводск | Молекулярное моделирование биомембран |
Мы отдаем себе отчет, что в одной таблице нельзя перечислить все стóящие научные группы. Если мы забыли кого-то, то с удовольствием добавим. Таблица подготовлена Еленой Чуклиной (Московский физико-технический институт / Учебно-научный Института проблем передачи информации РАН). |
В довершение можно сказать, что в интернете есть масса форумов и юзергрупп, где можно задать интересующие вопросы. Установите себе линукс и начните изучать в онлайне что-нибудь биоинформатическое. При должном упорстве вы удивитесь, как многого можно достичь, имея просто компьютер и выход в интернет!
Статья написана по мотивам эссе в журнале Nature Biotechnology [10] при участии Артура Залевского и Елены Чуклиной.
Автор этой заметки делает вид, что моделирует на компьютере взаимодействие лиганд-связывающего домена никотинового ацетилхолинового рецептора типа α7 с одним из природных нейромодуляторов.
Особенности профессии
Биоинформатика находится на стыке медицины, биологии, прикладной математики, информатики. В обязанности людей, выбравших это направления, входит решение глобальных задач:
- поиск методов лечения онкологических, хронических, аутоиммунных заболеваний;
- продление срока жизни населения, улучшение экологической ситуации, поиск генома долголетия;
- разработка, планирование, внедрение математических методов, алгоритмов, программ, используемых для анализа медицинской и биологической информации;
- применение полученных результатов на практике.
Области исследования обширные, а биоинформатика обладает огромным потенциалом. Международный рынок труда уже испытывает дефицит биоинформатиков, ведь в них заинтересованы и фармакологические, и IT-компании.
Безусловно, биоинформатик должен обладать безупречными знаниями в сфере медицины и биологии, разбираться в сложных профессиональных терминах, огромным плюсом станет знание английского языка. Большую часть рабочего времени эксперты в этой области проводят за компьютером, работа малоподвижная, но имеет огромное социальное значение.
Плюсы и минусы профессии
Плюсы
- Очень перспективная сфера деятельности. Рост массивов данных приведет к еще большей востребованности биоинформатиков.
- Из года в год в этом сегменте наблюдается стабильный рост заработных плат.
- Перед биоинформатиками открыты все двери – от отечественных исследовательских центров до респектабельных мировых IT-компаний.
- Для работы используются математические методы, компьютерные программы, поэтому биоинформатики не взаимодействуют с пациентами или биологическими материалами.
- Знание языков программирования и основ прикладной математики позволяют биоинформатику выбрать другой сегмент деятельности. Например, классическое программирование, разработка и тестирование программ.
- Постоянное саморазвитие и совершенствование профессиональных навыков.
- Возможность заниматься анализом массивов данных, зная, что результаты работы в перспективе спасут жизни тысяч людей.
- Области исследования биоинформатики получают активную поддержку государства.
Минусы
- Работая сидячая, сопряжена с усиленной мозговой активностью.
- Профессия больше подходит для людей, имеющих технический склад ума.
- У молодых биоинформатиков, не имеющих опыта работы, могут возникнуть проблемы при трудоустройстве.
- Некоторые врачи с недоверием относятся к этому междисциплинарному направлению.
Обучение на биоинформатика
Вузы
Московский государственный университет имени М.В. Ломоносова
Биоинженерия и биоинформатика (Факультет биоинженерии и биоинформатики МГУ им. М.В. Ломоносова)
Первый Московский государственный медицинский университет им. И.М.Сеченова
Биоинженерия и биоинформатика (Первый Московский государственный медицинский университет им. И.М.Сеченова)
Биоинформатика только набирает популярность, но профильные факультеты уже успешно функционируют в российских вузах. Если вы желаете стать экспертом в этой области, то обратите внимание на направление подготовки «Биоинженерия и биоинформатика» (код: 06.05.01).
Для поступления на эту специальность необходимо сдать ЕГЭ по профильной математике, а также обязательному русскому языку. Остальные экзамены зависят от вуза, но чаще всего это биология, химия, физика или информатика (1-2 из перечисленных).Подготовкой кадров по этому направлению занимаются немногие российские вузы, а проходной балл по предмету составляет 64-92, бюджетных мест – не более 30. Форма обучения — очная, срок — 5 лет (специалитет).
Используйте систему контроля версий
Использование контроля версий позволит более гибко управлять развитием кода, позволит легко возвращаться к предыдущим редакциям программы или переключаться между разными ветвями разработки, а также откроет возможность совместной разработки программы. Распространенные системы — такие как Git или Subversion — дадут возможность легкой публикации проекта в сети. Вы сделаете лучше прежде всего для себя, если не поленитесь написать несколько внятных README-файлов и положите их в нужные места проекта; это чрезвычайно вам поможет, если спустя месяцы или даже годы вам придется вернуться к старой программе. Документируйте программы и скрипты, чтобы было понятно, что они делают. Когда публикуете научную статью, хорошим тоном будет опубликовать также оригинальные программы, которые использовались для обсчета данных: это позволит другим использовать тот же метод и воспроизвести ваши результаты. Неплохо бы также вести электронный дневник, в котором был бы записан весь ход работы. Онлайн-репозитории, такие как Github, позволяют делать это, а также позволят вам хранить рабочие версии программы, что станет дополнительным уровнем бэкапа ваших наработок (см. таблицу 1).
Таблица 1. Важные инструменты компьютерного биолога.
Задача | Инструменты |
Совместная разработка программ | Сделайте ваш код (и, возможно, данные) доступными в сети с такими онлайн-хранилищами как Github, Sourceforge или Bitbucket. В интернете много руководств по использованию этих систем. Существуют также системы управления научными проектами, о которых рассказано в отдельной врезке. |
Для сложных задач пишите скрипты и конвейеры | Для этого можно использовать как современные разработки, вроде Ruffus, так и проверенные временем классические UNIX-утилиты типа Make. Выбор конкретного инструментария зависит от личных предпочтений и любимого языка программирования |
Сделайте ваши «конвейеры» доступными | Не исключено, что в командной строке вы себя чувствуете, как рыба в воде, но большинство ваших коллег, наверняка, нет. Созданные вами конвейеры можно оснащать графическими интерфейсами с помощью систем Galaxy или Taverna. |
Инструменты разработчика (IDE) | Конечно, программы можно писать в любом текстовом редакторе, начиная с , но будет лучше, если вы освоите более продвинутые инструменты — такие как текстовый редактор Emacs или полнофункциональную среду разработки типа Eclipse. И, опять же, конкретный выбор будет основан на ваших предпочтениях и любимом языке программирования. |
Системы управления проектами
Еще одним полезным инструментом, помимо систем контроля версий, который можно позаимствовать из программисткой практики, являются системы управления проектами. Проще всего воспринимать их как продвинутый электронный журнал, который предоставляет вам следующие дополнительные возможности:
- Создание и назначение задач. Например, «посчитать то-то». Внутри задачи можно вести обсуждения, которые будут удобно структурированы и не превратят вашу почту в склад ужасающей переписки вроде «Re: Project X (100)» При этом, однако, можно настроить почтовые уведомления, поэтому никто не пропустит важный комментарий.
- Прикладывать и организовывать файлы с подробными описаниями и поддержкой версий а-ля Dropbox. Вам приходилось подолгу искать в нескольких ветках переписки по проекту какие-нибудь файлы с маловразумительными названиями, вроде «report_ACC_clean.xxx»?
- Во встроенную Wiki можно заносить описания процедур запуска программ, методики экспериментов, встраивать видеозаписи и даже рендерить LaTeX формулы.
- Текстовый поиск по всему содержимому, в том числе по приложенным файлам.
- Интеграция с системами контроля версий для разработки ПО позволяет удобно соотносить задачи с изменениями в репозиториях.
- Есть даже такие экзотические возможности, как организация своего аналога Google Docs для одновременного редактирования текста. Не всю информацию можно доверить сторонним ресурсам.
В нашей лаборатории мы используем Redmine — это отличная СПО-система управления проектами, под которую есть множество плагинов. Ее можно развернуть как самостоятельно, так и взять в аренду виртуальную машины с уже установленной системой. Наиболее известным проприетарным аналогом является Basecamp.
Залевский Артур, факультет биоинженерии и биоинформатики МГУ (группа вычислительной структурной биологии).