А.А. ЗАМЯТНИН, доктор биологических наук, Институтбиохимии им. А.Н.Баха РАН
Нашрассказ будет посвящен одной из самых молодых фундаментальных наук (если несамой молодой), которая родилась всего лишь несколько лет назад вместе с теми, ктоеще сейчас учится в начальной школе. В отличие от многих других наук опротеомике можно точно сказать, при каких обстоятельствах она возникла, указатьгод, когда появилось ее название и кто его придумал.
Начнемс обстоятельств. Во второй половине XX в. бурно развивались аналитическиеметоды биохимии, молекулярной биологии и вычислительной техники. Выдающиесяуспехи, достигнутые в этих областях, привели к возможности расшифровки огромныхпоследовательностей оснований нуклеиновых кислот и к записи полного геномаживого организма. Впервые полный геном был расшифрован в 1980 г. [1] у бактериофага phi Х-174 (около 5·103 оснований), затем у первой бактерии – Haemophilusinfluenzae (1, 8·106 оснований) [2]. А c завершением XX в. была законченаграндиозная работа по расшифровке полного генома человека – выявлениюпоследовательности примерно 3 млрд оснований нуклеиновых кислот [3]. На этуработу было затрачено несколько миллиардов долларов (примерно по одному долларуна одно основание). Всего же уже расшифрованы геномы нескольких десятков видовживых организмов. Именно в этот период возникли две новые биологические науки:в 1987 г. впервые в научной печати было использовано слово «геномика» [4], а в 1993 г. – «биоинформатика» [5].
Укаждого биологического вида часть генома представлена участками, кодирующимиаминокислотные последовательности белков. Например, таких участков у человеканасчитывается порядка 100 000 (по некоторым оценкам, это число может достигать300 000, а с учетом химически модифицированных структур – несколькихмиллионов). Казалось бы, зная полный геном и генетический код, можно путемтрансляции получить все сведения о структуре белков. Однако все не так просто.Постепенно становилось очевидным, что в данной рассматриваемой клеточнойсистеме организма нет корреляции между наборами мРНК и белков. Кроме того, многиебелки, синтезированные на рибосомах в соответствии с нуклеотиднойпоследовательностью, после синтеза подвергаются химическим модификациям и могутсуществовать в организме в модифицированной и немодифицированной формах. И ещенемаловажно то, что белки обладают разнообразными пространственными структурами,которые на сегодняшний день нельзя определить по линейным последовательностямнуклеотидов и даже аминокислот. Поэтому прямое выделение и определение структурвсех функционирующих белков остается по-прежнему актуальной задачей (прямоеопределение структуры на сегодняшний день осуществлено примерно лишь для 10%белков человека). Так, в дополнение к геномике появился термин «протеомика», объектомисследования которой является протеом (от англ. PROTEins – белки и genOMe –геном). А в научной печати упоминание о протеоме впервые появилось в 1995 г. [6].
Следуетдобавить, что большую роль в жизнедеятельности организмов играют многочисленныекороткие фрагменты белковых предшественников, которые называются олигопептидами,или просто пептидами. Именно из-за них наблюдается такой разнобой в оценкеколичества белково-пептидных компонентов у представителей одного биологическоговида. Поэтому наряду с терминами «протеом» и «протеомика» в настоящее время ужеупотребляются такие термины, как «пептидом» и «пептидомика», представляющиесобой часть протеома и протеомики. О многообразии структуры и функций белков ипептидов на страницах газеты «Биология» нами было рассказано ранее [7].
Итак,сформулируем определения новых наук, которые появились при жизни нынешнегомолодого поколения и которые тесно взаимосвязаны друг с другом (рис. 1).
/>
Рис.1. Схема, иллюстрирующая полную взаимосвязь трех новых биологических наук
Геномика– наука, занимающаяся изучением структуры и функций генов (геном – совокупностьвсех генов организма).
Биоинформатика– наука, занимающаяся изучением биологической информации с помощьюматематических, статистических и компьютерных методов.
Протеомика– наука, занимающаяся изучением совокупности белков и их взаимодействий в живыхорганизмах (протеом – совокупность всех белков организма).
Отметимтакже, что протеомика в общих чертах включает в себя структурную протеомику, функциональнуюпротеомику и прикладную протеомику, которые мы рассмотрим в отдельности.
Структурная протеомика
Наиболееяркой особенностью биологии является разнообразие. Оно просматривается на всехуровнях биологической организации (биологические виды, морфология, химическаяструктура молекул, сеть регуляторных процессов и т.д.). В полной мере этоотносится и к белкам. Масштаб их структурного разнообразия до сих пор до концане выявлен. Достаточно сказать, что число аминокислотных остатков в одном белкеможет составлять от двух (минимальная структура, имеющая пептидную связь) додесятков тысяч, а белок титин человека содержит 34 350 аминокислотных остаткови на сегодняшний день является рекордсменом – самой крупной из всех известныхбелковых молекул.
Чтобыполучить сведения о протеоме, необходимо сначала его выделить и очистить отдругих молекул. Поскольку число белков во всем протеоме (т.е. во всеморганизме) весьма велико, обычно берут только часть организма (его орган илиткань) и различными методами выделяют белковую компоненту. За почти 200-летнююисторию изучения белков разработано множество методов выделения белков – отпростого солевого осаждения до современных сложных методов, учитывающихразличные физические и химические свойства этих веществ. После получения чистойфракции индивидуального белка определяется его химическая структура.
Вструктурной протеомике проводится определение структуры не одного, а сразумножества белков, и к настоящему времени для этого разработан специальный циклпроцедур и создан арсенал соответствующих высокоточных приборов. (Полный набороборудования для протеомных исследований стоит более одного миллиона долларов.)
/>
Рис.2. Инструменты протеомики
Нарис. 2 приведена схема лабораторного цикла от приготовления образца доопределения его структуры. После выделения и очистки (на рисунке представленуже выделенный и очищенный препарат) с помощью двумерного электрофорезапроводится разделение белков. Это разделение идет по двум направлениям: в одномразделяются молекулы белка, имеющие разную массу, в другом – различныйсуммарный электрический заряд. В результате этой тончайшей процедуры наспециальном носителе одинаковые молекулы группируются, образуя макроскопическиепятна, причем в каждом пятне содержатся только одинаковые молекулы. Число пятен,т.е. число разных белков или пептидов, может составлять многие тысячи (рис. 3, 4),и для их исследования используются автоматические устройства для обработки ианализа. Затем проводится отбор пятен и введение содержащихся в них веществ всложнейший физический прибор – масс-спектрометр, с помощью которого иопределяется химическая (первичная) структура каждого белка.
/>
Рис.3. Пример двумерной электрофореграммы белков из экстракта печени мыши [8]
/>
Рис.4. Пример двумерной электрофореграммы пептидов из цереброспинальной жидкостичеловека [9]
/>
Рис.5. Нуклеотидная последовательность гена, кодирующего сывороточный альбуминчеловека
Первичнуюструктуру белка можно также определить, пользуясь результатами геномики ибиоинформатики. На рис. 5 дана полная структура гена сывороточного альбуминачеловека. Она содержит 1830 азотистых оснований, кодирующих 610 аминокислотныхостатков. Этот ген, как и абсолютное большинство других, начинается с кодонаatg, кодирующего остаток метионина, и заканчивается одним из стоп-кодонов, вданном случае taa. Таким образом кодируется структура, состоящая из 609аминокислотных остатков (рис. 6). Однако эта структура – молекула еще несывороточного альбумина, а лишь его предшественника. Первые 24 аминокислотныхостатка представляют собой так называемый сигнальный пептид, который припереходе молекулы из ядра в цитоплазму отщепляется, и только после этогообразуется структура сывороточного альбумина, получаемая при выделении этогобелка. В итоге данная молекула содержит 385 аминокислотных остатков.
/>
Рис.6. Аминокислотная последовательность предшественника сывороточного альбуминачеловека, транслированная с нуклеотидной последовательности с помощьюгенетического кода
/>
Рис.7. Пространственная (третичная) структура молекулы сывороточного альбуминачеловека
Однакоаминокислотная последовательность не раскрывает пространственную структурубелка. С точки зрения термодинамики, вытянутая линейная структура энергетическиневыгодна, и поэтому она специфическим для каждой последовательности образомсворачивается в уникальную пространственную структуру, которая может бытьопределена с помощью двух мощных физических методов – рентгеноструктурногоанализа и метода ядерного магнитного резонанса (ЯМР-спектроскопии). С помощьюпервого из них определены пространственные структуры уже нескольких тысячбелков, в том числе и сывороточного альбумина человека, изображение которогопредставлено на рис. 7. Эта структура, в отличие от первичной (аминокислотнойпоследовательности), называется третичной и в ней хорошо видны спирализованныеучастки, являющиеся элементами вторичной структуры.
Такимобразом, задача структурной протеомики сводится к выделению, очистке, определениюпервичной, вторичной и третичной структур всех белков живого организма, а ееосновными средствами являются двумерный электрофорез, масс-спектрометрия ибиоинформатика.
Биоинформатика белков
Существованиеогромного количества разнообразных белков привело к необходимости созданияинформационных массивов – баз (или банков) данных, в которые заносились бы всеизвестные о них сведения. В настоящее время существует множество общих испециализированных баз данных, которые доступны в Интернете каждому желающему.В общих базах содержатся сведения о всех известных белках живых организмов, т.е.о глобальном протеоме всего живого. Примером такой базы являетсяSwissProt-TrEMBL (Швейцария–Германия), в которой на сегодняшний день содержатсяструктуры почти 200 000 белков, установленные аналитическими методами, и ещепочти 2 млн структур, которые определены в результате трансляции с нуклеотидныхпоследовательностей [10]. На рис. 8 и 9 показано количество существующих белков,которые известны для каждого заданного числа аминокислотных остатков. Осиабсцисс на этих графиках ограничены 2000 остатков, но, как уже сказано выше, хотяи не часто, но встречаются и существенно более крупные молекулы. Из данных, представленныхна рисунках, следует, что наибольшее число белков содержит по несколько сотенаминокислотных остатков. К ним относятся ферменты и другие достаточно мобильныемолекулы. Среди более крупных белков много таких, которые выполняют опорную илизащитную функции, скрепляя биологические структуры и придавая им прочность.
/>
Рис.8. Распределение известных (выделенных) белков по числу аминокислотных остатков
/>
Рис.9. Распределение транслированных аминокислотных последовательностей по числуминокислотных остатков
/>
Рис.10. Распределение известных природных олигопептидов по числу аминокислотныхостатков
Вглобальном протеоме особое место занимают небольшие очень подвижные молекулы, содержащиене более 50 аминокислотных остатков и обладающие специфическим спектромфункциональной активности. Они называются олигопептидами, или просто пептидами.Для них, т.е. для глобального пептидома, создан особый банк данных, которыйназывается EROP-Moscow. Это название представляет собой аббревиатуру от терминаEndogenous Regulatory OligoPeptides (эндогенные регуляторные олигопептиды), иуказывает на то, что банк создан и базируется в столице нашей страны [11]. Насегодняшний день расшифрована структура почти 6000 олигопептидов, выделенных изпредставителей всех царств живого. Так же как и крупные белки, количествоолигопептидов с заданным числом аминокислотных остатков можно изобразить графически(рис. 10). Судя по графику, чаще всего встречаются олигопептиды, содержащиепримерно 8–10 аминокислотных остатков. Среди них в основном содержатся молекулы,которые участвуют в регуляции нервной системы, и поэтому называютсянейропептидами. Очевидно, что самые быстрые процессы в живом организмеосуществляются с участием нервной системы, поэтому пептидные регуляторы должныбыть мобильными и следовательно небольшими. Однако, следует отметить, что, ввидуогромного структурного и функционального разнообразия как белков, так ипептидов, для них до сих пор не создано строгой классификации.
Такимобразом, в данном случае задачами биоинформатики являются накопление информациио физико-химических и биологических свойствах белков, анализ этой информации, каталогизацияи подготовка информационной базы и вычислительных средств для выявлениямеханизмов их функционирования.
Функциональная протеомика
Наличиев организме того или иного белка дает основание предполагать, что он обладает(или обладал) определенной функцией, а весь протеом служит для того, чтобыосуществлялась полноценная жизнедеятельность всего организма. Функциональнаяпротеомика занимается определением функциональных свойств протеома, и решаемыеею задачи существенно сложнее, чем, например, определение белково-пептидныхструктур.
Очевидно,что функционирование протеома осуществляется в многокомпонентной среде, вкоторой присутствует множество молекул других химических классов – сахаров, липидов,простагландинов, различных ионов и многих других, включая молекулы воды. Неисключено, что через некоторое время появятся такие термины, как «сахаром», «липидом»и им подобные. Белковые молекулы взаимодействуют с окружающими их другими илитакими же, как и они, структурами, что в конечном итоге приводит к возникновениюфункциональных реакций сначала на молекулярном уровне, а затем и намакроскопическом. Уже известно множество таких процессов, в том числе сучастием белков. Среди них взаимодействие фермента с субстратом, антигена сантителом, пептидов с рецепторами, токсинов с ионными каналами и т.д.(рецепторы и ионные каналы также являются белковыми образованиями). Длявыявления механизмов этих процессов проводятся как экспериментальныеисследования индивидуальных участников взаимодействия, так и системные исследованиясредствами биоинформатики. Рассмотрим несколько примеров таких системныхподходов.
Нарис. 11 показаны представители протеома (в данном случае пептидома) человека –различные гастрины и холецистокинины, которые локализованы в желудочно-кишечномтракте (при написании аминокислотных последовательностей использованстандартный однобуквенный код, расшифровка которого была дана нами ранее [7]).Функциональными частями молекул этих пептидов являются очень схожие правыеобласти. Однако пептиды обладают прямо противоположными поведенческимисвойствами: гастрины вызывают у человека ощущение голода, а холецистокинины –сытости. По-видимому, данное различие обусловлено тем, что в первичнойпоследовательности холецистокининов положение остатка тирозина Y сдвинуто наодин шаг по сравнению с гастринами. На том же рисунке приведена первичнаяструктура пептида ционина, полученного из представителя простейших хордовыхCiona intestinalis (рис. 12). Его структура гомологична и гастринам, ихолецистокининам и характеризуется двумя остатками тирозина, находящимися в техже положениях, что и у обоих указанных пептидов. К сожалению, функциональныесвойства его не изучены. А при должном экспериментальном исследовании можнобыло бы ответить на вопрос, какова роль химической структуры в целом и остатковтирозина в частности при проявлении противоположных физиологических эффектов.
/>
Рис.11. Первичные структуры представителей пептидома человека в сравнении соструктурой одного из пептидов оболочечника
/>
Рис.12. Оболочечник Ciona intestinalis, обитающий в Северном море
Другойпример: на рис. 13 приведены аминокислотные последовательности очень похожихмолекул, которые также объединены в структурно-гомологичное семейство. Этимолекулы обнаружены у весьма эволюционно далеких живых организмов – отнасекомых до млекопитающих. В первой строке дана первичная структурабрадикинина, содержащего 9 аминокислотных остатков и встречающегося у многихвысших организмов, в том числе и у человека. В течение многих лет химикисинтезировали различные неприродные аналоги этой молекулы, чтобы ответить навопрос, какой ее участок ответственен за взаимодействие с рецептором. Около 30 летназад были даже синтезированы все возможные фрагменты брадикинина – 8дипептидов, 7 трипептидов и т.д. (всего возможны 36 фрагментов), величинуактивности которых затем испытывали в одном и том же биологическом тесте.Результат оказался тривиальным: выяснилось, что максимальную активностьпроявляет лишь вся молекула целиком, а каждый фрагмент по отдельности обладаетлибо следовой активностью, либо нулевой. Эту трудоемкую работу не пришлось быделать, если бы в то время были известны другие брадикинины, приведенные нарис. 13, и средствами биоинформатики они были бы выделены из глобальногопротеома. Представленное структурно-гомологичное семейство наглядно демонстрирует,что у всех молекул есть область, которая в результате биологической эволюциипрактически не изменялась (квазиконсервативная область), и она представляетсобой молекулу брадикинина высших живых организмов, отобранную как наиболеесовершенную в результате эволюционного процесса. Данный пример демонстрирует, чтопротеомика вместе с биоинформатикой позволяет быстро (и дешево) решатьпринципиальные научные проблемы.
/>
Рис.13. Первичные структуры природных пептидов брадикининов, полученных из разныхживых организмов. Жирным шрифтом указаны квазиконсервативные области
/>
Рис.14. Первичные структуры структурно-гомологичного семейства эндотелинов /токсинов
И,наконец, третий пример – структурно-гомологичное семейство эндотелинов млекопитающихи токсинов змей (рис. 14). Несмотря на поразительное сходство структур, ихфункциональные свойства разительно отличаются друг от друга: одни являютсяочень полезными регуляторами сосудистого сокращения, а другие – смертельноопасны для жизни. В данном случае мы сталкиваемся с ситуацией, когда первичнаяструктура не несет достаточной информации, способной объяснить причину различияфункций, и необходимо более детальное рассмотрение пространственной (третичной)структуры. На рис. 15 и 16 показаны пространственные структуры двухпредставителей этого семейства – эндотелина-1 и сарафотоксина 6b, полученные спомощью ЯМР-спектроскопии. На рисунках они повернуты так, чтобы достичьмаксимальной пространственной гомологии. Но полной гомологии не удается получитьни при каком повороте. Следовательно, несмотря на большое сходство первичныхструктур, взаимодействие их осуществляется с разными рецепторными структурами, апотому и приводит к разным физиологическим эффектам.
/>
Рис.15. Пространственная структура сосудосокращающего пептида эндотелина-1 человека
/>
Рис.16. Пространственная структура сарафотоксина 6b израильской змеи Atractaspisengaddesis
Конечностоль частными примерами невозможно полностью охарактеризовать многообразиефункциональной протеомики. Создание представлений об огромной сети взаимодействийбелковых и других молекул в организме требует огромного труда и применения всехсредств современной биоинформатики. По существу, создание таких представленийеще только начинается. Однако есть основание полагать, что с каждым годом нашипознания в этой области будут быстро расти.
/>
Рис.17. Общие контуры карты метаболизма карбоновых кислот [12]
Однимиз первых успехов на этом пути является создание карты метаболизма карбоновыхкислот в Институте биохимии им. А.Н. Баха Российской академии наук (рис. 17).Эта карта представляет собой сеть реакций с регулярным периодическим строением.Такой подход оказался успешным ввиду того, что функционально аналогичныеметаболиты претерпевают сходные биохимические превращения, образуяфункционально аналогичные производные. В карте по вертикали расположены области,содержащие соединения с одинаковым числом атомов углерода (от 1 до 10), агоризонтальные ряды представляют собой ряды функционально аналогичныхметаболитов. Химические структуры на карте соединены многочисленными стрелкамис указанием, какие ферменты (белки) участвуют в соответствующих химическихпревращениях. Не правда ли, такой подход напоминает периодическую системухимических элементов Д.И. Менделеева? И так же, как и менделеевская система, даннаякарта обладает прогностической силой. С ее помощью был предсказан целый рядновых ферментов, которые впоследствии были обнаружены экспериментально.
Подобныесхемы могут быть распространены и на другие метаболические процессы (например, углеводов,аминокислот и т.д.), а также использованы для поиска новых метаболитовбиохимических реакций.
Такимобразом, функциональная протеомика занимается изучением сложных взаимосвязейструктуры и функций протеома.
Практическая протеомика
Итак,главной задачей протеомики является выявление механизма взаимодействияогромного числа белков и пептидов в одном организме. Какова же практическаязначимость этой грандиозной и дорогостоящей работы? Очевидно, что в первуюочередь в результатах такой работы заинтересованы фармакологи и медики, посколькуочень часто прослеживается тесная связь между изменениями в белковом составе иболезненным состоянием человека. Поэтому новые данные в протеомике будутиспользоваться (и уже используются) для быстрой разработки новых лекарственныхсредств и новейших методов лечения болезней, с которыми медицина бороласьвеками. На сегодняшний день 95% всех фармакологических средств воздействуют набелки. Протеомика со своим системным подходом может помочь идентифицировать иоценить важность появления новых белков гораздо эффективнее, что, в своюочередь, ускорит разработку новых диагностических тестов и терапевтическихсредств.
Первоепрактическое применение протеомных исследований состоялось задолго до появлениятермина «протеомика», еще в начале XX в., когда была обнаружена роль инсулина вразвитии такого тяжелого заболевания, как диабет. Создание инсулиновыхпрепаратов спасло жизнь миллионам людей.
Внастоящее же время протеомика, вместе с геномикой и биоинформатикой, ориентированана создание новых лекарственных препаратов (рис. 18), в которых молекулярными мишенямибудут служить те или иные белки [13]. Процесс нахождения новых мишеней длядействия лекарств решается с помощью биоинформатики, причем объектом анализаявляется геном. Однако после анализа генома необходимо получить доказательстватого, что данный белок интенсивно экспрессируется и находится в клетке врабочем состоянии. Эту задачу решает протеомика. Таким образом выявляетсямолекулярная генетическая мишень для лекарства.
/>
Рис.18. Взаимосвязь геномики, протеомики и биоинформатики при решении проблемыконструирования новых лекарственных средств
Следуетотметить, что протеомика может и сама по себе решать проблему нахождениямишени. Если получить протеомные карты (подобные тем, что представлены на рис. 3или 4) нормальных и патологических тканей, то по различиям в них можноустановить, какие белки важны для развития того или иного патологическогосостояния, и выбрать их в качестве мишеней или использовать эти знания длядиагностики. Можно предположить, что в будущем к обычному анализу кровидобавится создание протеомных карт крови. Для этого в поликлиниках необходимобудет использовать специальное оборудование, с помощью которого у пациентовпериодически будут брать кровь. При возникновении болезненного состоянияпротеомную карту больного человека нужно будет всего лишь сравнить с его жепротеомной картой, но составленной в то время, когда он был здоров, и можнобудет выявить произошедшие изменения в белковом составе крови и определитьпричину заболевания. Подобное сравнение протеомов опухолевых и нормальныхклеток, клеток до и после воздействия определенных факторов (например, физическихили химических), использование биологических жидкостей в диагностических целях– все это представляет огромный интерес и открывает совершенно новые перспективыдля медицины, ветеринарии, фармакологии, пищевой промышленности и другихприкладных областей. Впереди предстоит огромная и интересная работа.
Списоклитературы
1. Sanger F., Air G.M., Barrell B.G., Brown N.L. et al. Nucliotidesequence of bacteriophage phi X-174 DNA.//Nature. 1977. V. 265, № 5596. P.687–695.
2. Fleischmann R.D., Adams M.D., White O. et al. Whole-genome randomsequencing and assembly of Haemophilus influenzae Rd.//Science. 1995. V.269, № 5223. P. 496–512.
3.Nature. 2001. 409, № 6822 (большая часть выпуска журнала посвящена расшифровкегенома человека).
4. Ferguson-Smith A.C., Ruddle F.H. The genomics of humanhomeobox-containing loci.//Pathol. Immunopathol. Res. 1988. V. 7, № 1–2. P.119–126.
5. Franklin J. Bioinformatics changing the face ofinformation.//Ann. NY Acad. Sci. 1993. V. 700. P. 145–152.
6. Wasinger V.C., Cordwell S.J., Cerpa-Poljak A. et al. Progresswith gene-product mapping of the Mollicutes: Mycoplasmagenitalium.//Electrophoresis. 1995. V. 16, № 7. P. 1090–1094.
7.Замятнин А.А. Блистающий мир белков и пептидов.//Биология. 2002.№ 25–26. P. 8–13.
8. Gorg A., Weiss W., Dunn M.J. Current two-dimensionalelectrophoresis technology for proteomics.//Proteomics. 2004. V. 4, № 12. P. 3665–3685.
9. Ramstrom M., Bergquist J. Miniaturized proteomics and peptidomicsusing capillary liquid separation and high resolution mass spectrometry.//FEBSLett. 2004. V. 567, № 1. P. 92–95.
10. au.expasy.org/sprot/
11. erop.inbi.ras.ru/
12.Малыгин А.Г. Метаболизм карбоновых кислот (периодическая схема). – М.:«Международная программа образования», 1999.
13.Арчаков А.И. Что за геномикой? – Протеомика.//Вопр. мед. химии. 2000. Т. 46, №4. С. 335–343.
Дляподготовки данной работы были использованы материалы с сайта bio.1september.ru