Ръководство за методите и софтуера за прогнозиране на протеиновата структура

За да упражняват своите биологични функции, протеините се сгъват в една или повече специфични форми, продиктувани от сложни и обратими нековалентни взаимодействия. Определянето на структурата на протеин може да се постигне чрез отнемаща време и сравнително скъпа техника като кристалография, ядрено-магнитен резонанс и двойна поляризационна интерферометрия. Софтуерът за биоинформатика е разработен за изчисляване и прогнозиране на протеиновите структури въз основа на техните аминокиселинни последователности.

Преглед на структурата на протеина

Като алтернатива на експерименталната техника, анализът на структурата и инструментите за прогнозиране помагат да се предвиди протеиновата структура според техните аминокиселинни последователности. Решаването на структурата на даден протеин е изключително важно в медицината (например в дизайна на лекарства) и биотехнологиите (например при проектирането на нови ензими). Полето на изчислителното прогнозиране на протеини се развива непрекъснато, следвайки увеличаването на изчислителната мощ на машините и разработването на интелигентни алгоритми.

Има четири нива на протеинова структура (фигура 1). При прогнозиране на протеиновата структура първичната структура се използва за прогнозиране на вторични и третични структури.

Вторичните структури на протеините се локализират сгъване в полипептидната верига, която се стабилизира от водородни връзки. Най-често срещаните вторични протеинови структури са алфа спирали и бета листове.

Третичната структура е крайната форма на протеина, след като различните вторични структури са сгънати в 3D структура. Тази финална форма се формира и се задържа заедно чрез йонно взаимодействие, дисулфидни мостове и сили на ван де Ваал.

Четири нива на протеинова структура. Изображение от Khanacademy.org.

Методи и софтуер за прогнозиране на протеиновата структура

Разработен е голям брой софтуери за прогнозиране на структурата за специални белтъчни характеристики и особености, като прогнозиране на разстройства, прогнозиране на динамиката, прогнозиране на запазването на структурата и др. Подходите включват хомологично моделиране, протеин нарязване, методи ab initio, прогнозиране на вторичната структура и трансмембранна спирала и прогнозиране на сигнален пептид.

Изборът на правилния метод винаги започва с използване на първичната последователност на неизвестния протеин и търсене на протеиновата база данни за хомолози (фигура 2).

Диаграма за вземане на решения за метод за прогнозиране на протеиновата структура.

Ето някои подробни методи за прогнозиране на протеиновата структура:

  • Средства за прогнозиране на вторичната структура

Тези инструменти предсказват локални вторични структури, базирани само на аминокиселинната последователност на протеина. След това прогнозираните структури се сравняват с резултата DSSP, който се изчислява въз основа на кристалографската структура на протеина (повече за DSSP резултата тук).

Методите за прогнозиране на вторичната структура главно разчитат на бази данни от известни протеинови структури и съвременни методи за машинно обучение като невронни мрежи и поддържащи векторни машини.

Ето някои страхотни инструменти за прогнозиране на вторичната структура.

  • Третична структура

Средствата за предсказване на третичната (или 3-D) структура попадат в два основни метода: Ab initio и сравнително моделиране на протеини.

Методите за прогнозиране на белтъчната структура Ab initio (или de novo) се опитват да предскажат третичните структури от последователности, базирани на общи принципи, които управляват енергията на сгъване на протеини и / или статистически тенденции на конформационните характеристики, които родните структури придобиват, без използването на изрични шаблони.

Цялата информация за третичната структура на протеина е кодирана в неговата основна структура (тоест нейната аминокиселинна последователност). Въпреки това може да се предвиди огромен брой от тях, сред които само един има минималната свободна енергия и стабилност, необходими за правилното сгъване. Така че прогнозирането на протеиновата структура Ab initio изисква огромно количество изчислителна сила и време за решаване на естествената конформация на протеин и остава едно от основните предизвикателства за съвременната наука.

Най-популярните сървъри включват Robetta (използвайки софтуерен пакет Rosetta), SWISS-MODEL, PEPstr, QUARK. Разгледайте изчерпателен списък тук.

Ако протеин с известна третична структура споделя поне 30% от неговата последователност с потенциален хомолог с неопределена структура, сравнителните методи, които наслагват предполагаемата неизвестна структура с известната, могат да бъдат използвани за прогнозиране на вероятната структура на неизвестното. Хомологичното моделиране и протеиновото нарязване са две основни стратегии, които използват предварителна информация за друг подобен протеин, за да предложат прогнозиране на неизвестен протеин, въз основа на неговата последователност.

Софтуерът за хомологично моделиране и протеинови резби включва RaptorX, FoldX, HHpred, I-TASSER и други.

Препратки

De novo прогнозиране на протеиновата структура. Wikipedia.

Прогнозиране на протеиновата структура. Wikipedia