Joancreus/rosetta
Rosetta@home

Rosetta@home és un projecte de computació distribuïda per a la predicció de l'estructura de les proteïnes que utilitza la plataforma Berkeley Open Infrastructure for Network Computing (BOINC). És dirigit pel Laboratori Baker, de la Universitat de Washington. L'objectiu de Rosetta@home és predir acoblaments proteïna-proteïna i dissenyar noves proteïnes mitjançant l'ús d'uns 60.000 ordinadors actius cedits per voluntaris, amb un rendiment mitjà de més de 62 teraFLOPS a data del 18 d'octubre del 2011.[2] Foldit, un videojoc basat en Rosetta@Home, intenta assolir el mateix objectiu per mitjà del proveïment participatiu. Tot i que el projecte es concentra principalment en la investigació bàsica per millorar la precisió i robustesa dels mètodes proteòmics, Rosetta@home també duu a terme investigacions aplicades en l'àmbit de la malària, la malaltia d'Alzheimer i altres patologies.[3]

Igual que la resta de projectes BOINC, Rosetta@home utilitza la capacitat de processament d'ordinadors en repòs cedits per voluntaris per executar càlculs sobre unitats de treball. Els resultats són enviats al servidor central del projecte, on se'ls valida i assimila a les bases de dades del projecte. Es tracta d'un projecte multiplataforma que es pot fer servir en una gran varietat de configuracions de maquinari. Els usuaris poden seguir el progrés de la seva pròpia predicció de l'estructura de les proteïnes gràcies a l'estalvi de pantalla de Rosetta@home.

A més d'investigar sobre malalties, la xarxa Rosetta@home serveix per provar nous mètodes de bioinformàtica estructural. Una vegada han estat desenvolupats i considerats estables després de funcionar a la gran varietat d'ordinadors voluntaris de Rosetta@home, aquests nous mètodes són utilitzat en altres aplicacions basades en Rosetta, com ara RosettaDock i el Human Proteome Folding Project. Dues de les proves més importants pels nous mètodes desenvolupats gràcies a Rosetta@home són els experiments Critical Assessment of Techniques for Protein Structure Prediction (CASP) i Critical Assessment of Prediction of Interactions (CAPRI), experiments que avaluen els mètodes més avançats de predicció de l'estructura de les proteïnes i predicció d'acoblaments proteïna-proteïna, respectivament. Rosetta@home sovint és un dels millors predictors en aquests experiments. El projecte és un dels millors predictors d'estructura terciària que existeixen.[4]

Plataforma de computació

modifica

Tant l'aplicació Rosetta@home com la plataforma de computació distribuïda BOINC estan disponibles per les plataformes Microsoft Windows, Linux i Macintosh (BOINC també funciona en altres plataformes, com ara FreeBSD).[5] Per participar a Rosetta@home, cal tenir un processador (CPU) amb una velocitat de rellotge d'almenys 500 MHz, 200 megabytes d'espai de disc lliure, 512 megabytes de memòria física i connexió a Internet.[6] A data del 4 de maig del 2010, la versió actual de l'aplicació Rosetta era la 5.98, mentre que la versió actual de l'aplicació Rosetta Mini era la 2.14.[7] La versió actual recomanada del programa BOINC és la 6.2.19.[5] Es fa servir HTTP estàndard (port 80) per la comunicació entre el client BOINC de l'usuari i els servidors de Rosetta@home, situats a la Universitat de Washington. Per l'intercanvi de contrasenyes es fa servir HTTPS (port 443). El control remot i local del client BOINC utilitza els ports 31416 i 1043, que poden haver de ser desbloquejats si es troben darrere un tallafocs.[8] Els servidors del Laboratori Baker, situats a la Universitat de Washington, envien unitats de treball amb dades sobre proteïnes individuals als ordinadors dels voluntaris, que calculen una predicció d'estructura per la proteïna assignada. Per tal d'evitar la duplicació de prediccions d'estructura per una mateixa proteïna, cada unitat de treball s'inicialitza amb una llavor numèrica aleatòria. Això fa que cada predicció tingui una trajectòria de descens exclusiva del paisatge energètic de la proteïna.[9] Les prediccions de l'estructura de les proteïnes generades per Rosetta@home són aproximacions d'un mínim global al paisatge energètic d'una determinada proteïna. Aquest mínim global representa la conformació més energèticament favorable de la proteïna, és a dir, el seu estat natiu.

 
L'estalvi de pantalla de Rosetta@home mostrant el progrés d'una predicció de l'estructura d'una ubiqüitina sintètica (PDB ID: 1ogw)

Una de les característiques principals de la interfície gràfica d'usuari (GUI) de Rosetta@home és un estalvi de pantalla que mostra el progrés d'una de les unitats de treball actuals durant la simulació del procés de plegament proteic. A la part superior esquerra de l'estalvi de pantalla actual es pot veure com la proteïna diana va adoptant diferents formes (conformacions) en la seva cerca de l'estructura més energèticament favorable. Just a la dreta es veu l'estructura de la conformació acceptada més recent. A la part superior dreta es veu la conformació més energèticament favorable del cimbell actual. A sota es veu l'estructura autèntica (o nativa) de la proteïna, si ja ha estat determinada. L'estalvi de pantalla inclou tres gràfics. A prop del centre es mostra un gràfic de l'energia lliure del model acceptat, que va fluctuant a mesura que canvia aquest últim. A l'extrem dret hi ha un gràfic de la desviació típica (DT) del model acceptat, que mesura el grau de semblança estructural entre el model acceptat i el model natiu. A la dreta del gràfic de l'energia acceptada i a sota del gràfic de la desviació típica, s'utilitzen els resultats de les dues funcions per generar un gràfic energia/DT a mesura que es va polint el model.[10]

Igual que els altres projectes BOINC, Rosetta@home s'executa al rerefons de l'ordinador de l'usuari, aprofitant la potència de càlcul no utilitzada. S'inicia abans o en el moment d'entrar al sistema operatiu. Rosetta@home allibera capacitat de processador quan la necessiten altres aplicacions, de manera que no afecta l'ús normal de l'ordinador. Per tal d'evitar el consum d'electricitat i la generació de calor per part d'un ordinador funcionant a un ritme sostingut, a les preferències d'usuari es pot especificar el percentatge màxim d'ús del processador permès a Rosetta@home. També es poden configurar les hores del dia a les quals es permet treballar a Rosetta@home i moltes altres preferències.

Rosetta, el programari que s'executa a la xarxa Rosetta@home, fou reescrit en C++ per tal que fos més fàcil de desenvolupar que la versió original, escrita en Fortran. Aquesta nova versió és orientada a objectes i fou llançada el 8 de febrer del 2008.[7][11] Rosetta Commons és l'organització encarregada de desenvolupar el codi de Rosetta.[12] El programari està disponible per la comunitat acadèmica sota una llicència lliure, mentre que les companyies farmacèutiques han de pagar per utilitzar-lo.[12]

Importància del projecte

modifica

Gràcies a la proliferació de projectes de seqüenciació de genomes, els científics poden inferir la seqüència aminoacídica (o estructura primària) de moltes de les proteïnes actives a l'interior de les cèl·lules. Tanmateix, per comprendre millor la funció de cada proteïna i dissenyar fàrmacs de manera racional, els científics necessiten conèixer l'estructura tridimensional (o estructura terciària) de les proteïnes.

 
La diana T0281 del CASP6, la primera predicció de l'estructura d'una proteïna ab initio en proporcionar una resolució a nivell quasi-atòmic. Rosetta generà un model de T0281 (superposada en magenta) amb 1,5 Å DT de l'estructura cristal·lina (en blau).

Actualment es determina l'estructura tridimensional de les proteïnes de manera experimental, utilitzant la cristal·lografia de rajos X o l'espectroscòpia de ressonància magnètica nuclear (RMN). Es tracta d'un procés lent (poden caldre setmanes o fins i tot mesos per descobrir com es cristal·litza una proteïna) i car (costa uns 100.000 USD per proteïna).[13] Malauradament, el ritme al qual es descobreixen noves seqüències és molt superior al ritme al qual se'n determina l'estructura. Hi ha més de 7.400.000 de seqüències proteiques disponibles a la base de dades de proteïnes no redundant de l'NCBI, però menys de 52.000 proteïnes han vist la seva estructura tridimensional resolta i depositada al Protein Data Bank, el principal dipòsit d'informació estructural sobre les proteïnes.[14] Un dels objectius principals de Rosetta@home és predir l'estructura de les proteïnes amb la mateixa precisió que els mètodes actuals, però de manera molt més ràpida i barata. Rosetta@home també desenvolupa mètodes per determinar l'estructura i l'acoblament de les proteïnes de membrana (com ara les GPCR),[15] que són extremament difícils d'analitzar amb tècniques tradicionals com la cristal·lografia de rajos X i l'espectroscòpia de ressonància magnètica nuclear però que també representen la majoria de dianes pels fàrmacs nous.

El progrés en la predicció de l'estructura de les proteïnes s'avalua cada dos anys amb l'experiment Critical Assessment of Techniques for Protein Structure Prediction (CASP), en el qual investigadors d'arreu del món intenten derivar l'estructura d'una proteïna a partir de la seva seqüència aminoacídica. Els grups que aconsegueixen els millors resultats en aquest experiment, que a vegades es converteix en una competició, són considerats com a exemples de les tecnologies més avançades en la predicció de l'estructura de les proteïnes. Rosetta, el programa en el qual es basa Rosetta@home, hi ha participat des de l'experiment CASP5 (2002). A l'experiment CASP6 (2004), Rosetta assolí una fita històrica en esdevenir el primer mètode en proporcionar una resolució ab initio a nivell quasi-atòmic en la predicció de l'estructura de la proteïna corresponent, la diana CASP T0281.[16] El modelatge ab initio és considerat un tipus especialment difícil de predicció de l'estructura de les proteïnes, car no fa servir informació d'homologia estructural i s'ha de basar en informació d'homologia de seqüències i el modelatge d'interaccions físiques al si de la proteïna. Rosetta@home ha participat al CASP des del 2006, quan fou un dels millors predictors en totes les categories de predicció d'estructura al CASP7.[17][18][19] Aquestes prediccions d'alta qualitat foren fetes possibles per la capacitat de processament cedida pels voluntaris de Rosetta@home.[20] A mesura que va adquirint més capacitat de processament, Rosetta@home és capaç d'estudiar més regions de l'espai de conformació (les diferents formes que pot assumir una proteïna), que, segons la paradoxa de Levinthal, s'espera que augmenti de manera exponencial amb la llargada de les proteïnes.

També es fa servir Rosetta@home per la predicció de l'acoblament de proteïnes, que determina l'estructura de diverses proteïnes que formen un complex (o estructura quaternària). Aquest tipus d'interacció proteica afecta moltes funcions cel·lulars, incloent-hi la unió antigen-anticòs, la unió enzim-inhibidor i la importació i exportació cel·lulars. Determinar aquestes interaccions és de capital importància pel disseny de fàrmacs. També s'utilitza Rosetta a l'experiment Critical Assessment of Prediction of Interactions (CAPRI), que avalua el progrés en l'àmbit de l'acoblament de proteïnes de manera similar a com el CASP avalua el progrés en el camp de la predicció de l'estructura de les proteïnes. S'ha citat la capacitat de processament cedida pels voluntaris de Rosetta@home com un dels factors més importants en el rendiment de Rosetta a CAPRI, en el qual proporcionà unes de les prediccions d'acoblament més precises i completes.[21]

A principis del 2008 es féu servir Rosetta per dissenyar computacionalment una proteïna amb una funció que mai no s'havia observat a la natura.[22] Aquesta fita s'inspirava en part en la retractació d'un article destacat del 2004 que havia descrit el disseny computacional d'una proteïna amb una activitat enzimàtica superior a la de la seva forma natural.[23] L'article d'investigació publicat pel grup de David Baker l'any 2008 descrivia el procés de creació de la proteïna i citava el paper de Rosetta@home i els recursos computacionals que proporcionava, a més de ser una important prova de concepte per aquest mètode de disseny de proteïnes.[22] Aquest tipus de disseny de proteïnes podria tenir aplicacions futures en el descobriment de fàrmacs, la química verda i la bioremediació.[22]

Investigacions sobre malalties

modifica

A més de dur a terme recerca bàsica sobre el disseny, l'acoblament i la predicció de l'estructura de les proteïnes, també es fa servir Rosetta@home per investigacions relacionades directament amb malalties.[24] El diari de Rosetta@home, escrit per David Baker, descriu molts projectes d'investigació menors.[25]

Malaltia d'Alzheimer

modifica

RosettaDesign, un dels components del paquet de programari Rosetta, fou utilitzat per fer una predicció precisa de quines regions de proteïnes amiloidògenes tenien més probabilitats de generar fibril·les semblants a amiloides.[26] RosettaDesign agafava hexapèptids (fragments amb una llargada de sis aminoàcids) de les proteïnes estudiades i n'escollia la forma d'energia més baixa corresponent una estructura semblant a la d'un hexapèptid que se sabia que formava fibril·les. Això conduí a la identificació de pèptids que tenien dues vegades les probabilitats de formar fibril·les que podria tenir una proteïna agafada a l'atzar.[27] En el mateix estudi es féu servir Rosetta@home per predir estructures per la beta amiloide, una proteïna formadora de fibril·les que s'ha suggerit que podria provocar la malaltia d'Alzheimer.[28] S'han assolit resultats preliminars (que encara no han estat publicats) sobre proteïnes dissenyades per Rosetta que podrien evitar la formació de fibril·les, tot i que no se sap si això previndria la malaltia.[29]

Àntrax

modifica

Un altre component de Rosetta, RosettaDock,[30][31][32] fou utilitzat juntament amb mètodes experimentals per modelar les interaccions entre les tres proteïnes que conformen la toxina de l'àntrax: el factor letal (FL), el factor edema (FE) i l'antigen protector (AP). El model computacional féu una previsió precisa de l'acoblament entre l'FL i l'AP, cosa que contribuí a determinar quins dominis de cada proteïna són els que estan implicats en el complex FL-AP. Aquesta informació fou utilitzada més endavant per investigadors que descobriren millors vacunes contra l'àntrax.[33][34]

Virus de l'herpes simple 1

modifica

RosettaDock fou utilitzat per modelar l'acoblament entre un anticòs (la immunoglobulina G) i una proteïna de superfície expressada pel virus de l'herpes simple 1 (VHS-1), que serveix per degradar l'anticòs antivíric. El complex proteic predit per RosettaDock era molt similar als models experimentals, especialment difícils d'obtenir. Això conduí els investigadors a concloure que el mètode d'acoblament té potencial per estudiar alguns dels problemes de la cristal·lografia de rajos X a l'hora de modelar interfícies proteïna-proteïna.[35]

S'ha fet servir Rosetta@home per dissenyar possibles vacunes contra el virus de la immunodeficiència humana (VIH)[36][37] en el marc d'un programa de recerca finançat per una beca de 19,4 milions de dòlars atorgada per la Fundació Bill i Melinda Gates,[38]

Malària

modifica

S'ha utilitzat Rosetta en investigacions en el marc de la iniciativa Grand Challenges In Global Health[39] per tal de dissenyar noves endonucleases homing que serveixin per eradicar Anopheles gambiae o fer que sigui incapaç de transmetre la malària.[40] La capacitat de modelar i alterar les interaccions proteïna-ADN de manera específica, com per exemple les de les endonucleases homing, fa que els mètodes informàtics de disseny de proteïnes com ara Rosetta tinguin un paper important a la teràpia gènica (que inclou possibles tractaments pel càncer).[24][41]

Desenvolupament i derivacions

modifica

Rosetta fou inicialment desenvolupat pel Laboratori Baker el 1998 com a enfocament ab initio a la predicció d'estructures,[42] però des d'aleshores s'ha diversificat en diverses vies de desenvolupament i diferents serveis. El nom de la plataforma ve de la pedra de Rosetta i és degut al fet que intenta desxifrar el «significat» estructural de les seqüències aminoacídiques de les proteïnes.[43] El projecte Rosetta@home fou llançat (és a dir, s'anuncià que ja no estava en fase beta) més de set anys després de la seva creació, el dia 6 d'octubre del 2005.[7] Molts dels estudiants de postgrau i altres investigadors que participaren al desenvolupament inicial de Rosetta treballen actualment a altres universitats i organitzacions de recerca, des d'on han contribuït a millorar diferents parts del projecte.

RosettaDesign

modifica
 
Superposició del model de la Top7 determinat per Rosetta (en vermell) sobre l'estructura determinada per cristal·lografia de rajos X (en blau, PDB ID: 1QYS)

RosettaDesign és un mètode informàtic de disseny de proteïnes basat en Rosetta que s'inicià el 2000 amb un estudi per redissenyar la ruta de plegament de la proteïna G.[44] El 2002 es féu servir RosettaDesign per dissenyar la Top7, una proteïna Α/β de 93 aminoàcids de llargada que tenia un plegament que mai no s'havia observat a la natura. Rosetta predigué aquesta nova conformació amb 1,2 Å DT de l'estructura determinada per cristal·lografia de rajos X, una predicció de l'estructura particularment precisa.[45] Rosetta i RosettaDesign obtingueren un ampli reconeixement per ser els primers en dissenyar i predir amb precisió l'estructura d'una nova proteïna de tal llargada. L'article del 2002 que descrivia l'enfocament doble fou lloat per dues cartes a la revista Science[46][47] i ha estat citat per més de 240 articles científics.[48] El producte tangible d'aquest projecte d'investigació, la proteïna Top7, aparegué com a «molecula del mes» al lloc web de l'RCSB PDB a l'octubre del 2006.[49] Al logo de Rosetta@home hi apareix una superposició del nucli (residus 60–79) predit per Rosetta i el nucli trobat per la cristal·lografia de rajos X.[16]

Brian Kuhlman, un antic associat postdoctoral del laboratori de David Baker que actualment treballa com a professor associat a la Universitat de Carolina del Nord a Chapel Hill,[50] ofereix RosettaDesign com a servei en línia.[51]

RosettaDock

modifica

El 2002, RosettaDock fou afegit al paquet Rosetta durant el primer experiment CAPRI com a algorisme de predicció d'acoblament proteïna-proteïna del Laboratori Baker.[52] En aquest experiment, RosettaDock féu una predicció d'alta precisió de l'acoblament entre l'exotoxina piogènica estreptocòccica A i la cadena β dels receptors dels limfòcits T, a més d'una predicció de precisió mitjana d'un complex d'α-amilasa porcina i un anticòs de camèlid. Tot i que RosettaDock només féu dues prediccions raonablement precises de set possibles, aquest rendiment fou suficient per quedar setè entre els dinou mètodes de predicció que participaren al primer experiment CAPRI.[52]

El desenvolupament de RosettaDock es bifurcà en dues branques a les rondes següents del CAPRI. Jeffrey Gray, que havia posat les bases de RosettaDock quan treballava a la Universitat de Washington, continuà polint el mètode des del seu nou càrrec a la Universitat Johns Hopkins. Els membres del Laboratori Baker continuaren desenvolupant RosettaDock sense Gray. Les dues versions diferien una mica quant al modelatge de cadenes laterals, la selecció de cimbells i altres aspectes.[32][53] Malgrat aquestes diferències, tant el mètode de Baker com el de Gray destacaren al segon experiment CAPRI, on acabaren cinquè i sisè d'un total de trenta grups predictors.[54] El servidor de RosettaDock mantingut per Jeffrey Gray es pot utilitzar com a servei de predicció gratuït sempre que no se'n faci un ús comercial.[55]

A l'octubre del 2006 s'integrà RosettaDock a Rosetta@home. El mètode feia servir una fase de modelatge d'acoblament ràpida però rudimentària, que només utilitzava l'esquelet proteic. Després venia una fase lenta de refinament d'àtom sencer, en la qual s'optimitzaven simultàniament l'orientació de les dues proteïnes en interacció entre si i les interaccions de cadenes laterals a la interfície proteïna proteïna, per tal de trobar la conformació d'energia més baixa.[56] La capacitat de processament molt superior oferta per la xarxa Rosetta@home, juntament amb les representacions revisades dels «arbres de plegaments» per la flexibilitat del nucli i el modelatge de bucles, féu que RosettaDock acabés sisè d'un total de seixanta-tres grups predictors al tercer experiment CAPRI.[4][21]

Robetta

modifica

El servidor Robetta és un servei de predicció de l'estructura de les proteïnes ofert pel Laboratori Baker per modelatge ab initio i comparatiu no comercial.[57] Cada dos anys ha participat com a servidor de predicció automatitzada als experiments CASP des del CASP5, el 2002, i es troba entre els millors de la seva categoria.[58] Robetta ha competit als experiments CASP6 i CASP7, on superà la mitjana dels grups de predicció automatitzats i humans.[19][59][60]

A l'hora de modelar l'estructura de les proteïnes, a data de la celebració del CASP6, Robetta comença buscant homòlegs estructurals mitjançant BLAST, PSI-BLAST i 3D-Jury. Després analitza la seqüència objectiu en els seus dominis constituents, o plega unitats proteiques de manera independent relacionant la seqüència amb famílies estructurals catalogades a la base de dades Pfam. Aleshores, els dominis amb homòlegs estructurals passen per un protocol de «model basat en plantilla» (és a dir, modelatge d'homologies). El programa d'alineament del Laboratori Baker, K*sync, produeix un grup d'homòlegs de la seqüència, cadascun dels quals és modelat mitjançant el mètode de novo de Rosetta per produir un cimbell (una estructura possible). Se selecciona la predicció d'estructura final escollint el model més energèticament favorable segons una funció energètica de baixa resolució de Rosetta. Si hi ha dominis sense homòlegs estructurals detectats, se segueix un protocol de novo segons el qual es tria el model energèticament més baix d'entre un grup de cimbells generats. Aquestes prediccions de dominis són connectats entre si per tal d'investigar les interaccions terciàries entre dominis al si de la proteïna. Finalment, es modelen les contribucions de les cadenes laterals mitjançant un protocol de cerca conformacional de Monte Carlo.[61]

Per a CASP8, Robetta fou millorat perquè pogués utilitzar el mètode de refinament d'àtom complet d'alta resolució de Rosetta.[62] L'absència d'aquest mètode havia estat citat com a causa principal del dèficit de rendiment de Robetta en comparació amb la xarxa Rosetta@home a l'experiment CASP7.[20]

El 9 de maig del 2008, seguint el suggeriment d'usuaris de Rosetta@home de crear una versió interactiva del programa de computació distribuïda, el Laboratori Baker llançà Foldit, un joc de predicció de l'estructura de les proteïnes en línia basat en la plataforma Rosetta.[63] A data de 22 de gener del 2012, Foldit comptava amb més de 240.000 usuaris registrats.[64] El joc permet als usuaris dur a terme una sèrie d'accions (per exemple, «sacsejar», «bellugar» o «reconstruir») per guiar l'esquelet i les cadenes laterals d'aminoàcids de la proteïna objectiu cap a conformacions energèticament més favorables. Els usuaris poden buscar solucions individualment com a «solistes» o col·lectivament com a «evolucionadors». Ambdós sistemes donen punts als jugadors com a premi per millorar les seves prediccions.[65] Els jugadors també poden participar en «duels» contra altres usuaris. El jugador amb l'estructura energèticament més favorable després de 20 torns guanya.

Comparació amb projectes de computació distribuïda semblants

modifica

Existeixen diversos projectes de computació distribuïda que estudien problemes similars als de Rosetta@home però utilitzen un enfocament diferent:

Folding@home

modifica

Folding@home és l'únic dels grans projectes de computació distribuïda dedicats a la investigació sobre les proteïnes que no utilitza la plataforma BOINC.[66][67][68] Tant Rosetta@home com Folding@home estudien malalties provocades per un plegament proteic defectuós, com ara la malaltia d'Alzheimer, però Folding@home ho fa de manera molt més exclusiva.[69][70] Folding@home gairebé que només utilitza models de dinàmica molecular d'àtom complet per comprendre com i per què es pleguen les proteïnes (o com i per què es poden plegar defectuosament i agregar-se per provocar malalties).[71][72] En altres paraules, el punt fort de Folding@home és el modelatge del plegament proteic, mentre que el de Rosetta@home és el disseny de proteïnes basat en la computació i la predicció de l'estructura i l'acoblament de les proteïnes.

Alguns projectes de Folding@home es basen en resultats de Rosetta@home. Rosetta suggereix l'estructura més probable, però no se sap amb certesa ni si aquesta és la forma assumida per la molècula ni si és viable. Aleshores, es fa servir Folding@home per comprovar els resultats obtinguts per Rosetta@home, a més d'adquirir més informació al nivell atòmic i dades sobre com canvia de forma la molècula.[72][73]

Els dos projectes també presenten grans diferències de capacitat de processament i diversitat d'amfitrions. Amb una mitjana de 6.650 teraFLOPS proporcionats per una varietat d'amfitrions que inclou CPU, GPUi i PS3,[74] Folding@home té una capacitat de processament gairebé 108 vegades superior a la de Rosetta@home.[2]

World Community Grid

modifica

Tant la Fase I com la Fase II del Projecte de Plegament del Proteoma Humà (HPF, en anglès Human Proteome Folding Project), un subprojecte de la World Community Grid, han utilitzat el programa Rosetta per obtenir dades estructurals i funcionals de diversos genomes.[75][76] Tot i que actualment el fa servir per crear bases de dades per biòlegs, Richard Bonneau, el científic en cap del Projecte de Plegament del Proteoma Humà, participà al desenvolupament inicial de Rosetta al laboratori de David Baker mentre preparava el seu doctorat.[77] Es pot trobar més informació sobre la relació entre la Fase I, la Fase II i Rosetta@home al lloc web de Richard Bonneau.[78]

Predictor@home

modifica

Igual que Rosetta@home, Predictor@home s'especialitza en predir l'estructura de les proteïnes. Predictor@home té previst desenvolupar noves funcionalitats per la seva plataforma de computació distribuïda a l'àmbit del disseny i acoblament de proteïnes (fent servir el paquet CHARMM per la dinàmica molecular),[79] de manera similar a Rosetta@home. Rosetta@home utilitza el programa Rosetta per predir l'estructura, mentre que Predictor@home fa servir la metodologia dTASSER.[80]

Altres projectes de computació distribuïda relacionats amb les proteïnes utilitzen la plataforma BOINC, com ara QMC@home, Docking@home, POEM@home, SIMAP i TANPAKU. RALPH@home, el projecte alfa de Rosetta@home que prova noves versions, unitats de treball i actualitzacions abans que passin a Rosetta@home, també fa servir BOINC.[81]

Contribucions dels voluntaris

modifica

Per funcionar, Rosetta@home depèn de la capacitat de processament cedida pels membres del projecte. A data de 18 d'octubre del 2011, uns 40.000 usuaris provinents de 150 països diferents eren membres actius de Rosetta@home, amb uns 60.000 ordinadors cedint temps de processador i un rendiment mitjà de més de 62 teraFLOPS.[2]

 
Aquest diagrama de barres mostra els crèdits diaris de Rosetta@home al llarg d'un període de 60 dies, així com la seva capacitat de processament durant l'experiment CASP8.

Els usuaris són recompensats amb crèdits per la seva contribució. Per cada unitat de treball, s'atorga un nombre de crèdits igual al nombre de cimbells produïts per aquesta unitat de treball multiplicat per la mitjana de crèdits atorgats pels cimbells enviats per tots els amfitrions per aquesta unitat de treball. Aquest sistema fou dissenyat per resoldre les diferències importants que hi havia entre els crèdits que s'atorgaven als usuaris amb el client BOINC estàndard i un client BOINC optimitzat, així com les diferències entre els usuaris que utilitzaven Rosetta@home en un ordinador amb Windows i els que ho feien amb un ordinador amb Linux.[82] Rosetta@home atorga menys crèdits per cada segon de processament que la majoria dels altres projectes que fan servir BOINC.[83] Malgrat aquest desavantatge, Rosetta@home ocupa el cinquè lloc d'entre quaranta projectes BOINC en termes de crèdits totals.[84]

Els usuaris de Rosetta@home que prediuen estructures de proteïnes utilitzades per l'experiment CASP són mencionats a les publicacions científiques que tracten sobre els resultats corresponents.[20] Els usuaris que prediuen l'estructura energèticament més favorable d'una determinada unitat de treball apareixen a la pàgina d'inici de Rosetta@home com a «predictor del dia», juntament amb tots els equips als quals pertanyin.[85] Cada dia s'escull un «usuari del dia» a l'atzar d'entre tots els usuaris que s'han creat un perfil a Rosetta@home. L'«usuari del dia» també apareix a la portada.[86]

Referències

modifica
  1. «Portfolio Highlight: Rosetta++ Software Suite» (en anglès). UW TechTransfer – Digital Ventures. [Consulta: 7 setembre 2008].
  2. 2,0 2,1 2,2 2,3 «Rosetta@home: Credit overview» (en anglès). boincstats.com. [Consulta: 18 octubre 2011].
  3. «What is Rosetta@home?» (en anglès). Fòrums de Rosetta@home. Universitat de Washington. [Consulta: 7 setembre 2008].
  4. 4,0 4,1 Lensink MF, Méndez R, Wodak SJ «Docking and scoring protein complexes: CAPRI 3rd Edition» (en anglès). Proteins, vol. 69, 4, Desembre 2007, pàg. 704–18. DOI: 10.1002/prot.21804. PMID: 17918726.
  5. 5,0 5,1 «Download BOINC client software» (en anglès). BOINC. Universitat de Califòrnia, 2008. [Consulta: 1r desembre 2008].
  6. «Rosetta@home: Recommended System Requirements» (en anglès). Rosetta@home. Universitat de Washington, 2008. [Consulta: 7 octubre 2008].
  7. 7,0 7,1 7,2 «Rosetta@home: News archive» (en anglès). Rosetta@home. Universitat de Washington, 2010. [Consulta: 4 maig 2010].
  8. «Rosetta@home: FAQ (work in progress) (missatge 10910)» (en anglès). Fòrums de Rosetta@home. Universitat de Washington, 2006. [Consulta: 7 octubre 2008].
  9. «Rosetta@home: Random Seed (missatge 3155)» (en anglès). Fòrums de Rosetta@home. Universitat de Washington, 2005. [Consulta: 7 octubre 2008].
  10. «Rosetta@home: Quick guide to Rosetta and its graphics» (en anglès). Rosetta@home. Universitat de Washington, 2007. [Consulta: 7 octubre 2008].
  11. «Rosetta@home: Problems with minirosetta version 1.+ (missatge 51199)» (en angñès). Fòrums de Rosetta@home. Universitat de Washington, 2008. [Consulta: 7 setembre 2008].
  12. 12,0 12,1 «Rosetta Commons» (en anglès). RosettaCommons.org, 2008. [Consulta: 7 octubre 2008].
  13. Bourne PE, Helge W. Structural Bioinformatics (en anglès). Hoboken (Nova Jersey): Wiley-Liss, 2003. ISBN 978-0471201991. OCLC 50199108. 
  14. «Yearly Growth of Protein Structures» (en anglès). RCSB Protein Data Bank, 2008. [Consulta: 30 novembre 2008].
  15. «Rosetta@home: David Baker's Rosetta@home journal (missatge 55893)» (en anglès). Fòrums de Rosetta@home. Universitat de Washington, 2008. [Consulta: 7 octubre 2008].
  16. 16,0 16,1 «Rosetta@home: Research Overview» (en anglès). Rosetta@home. University of Washington, 2007. [Consulta: 7 octubre 2008].
  17. Kopp J, Bordoli L, Battey JN, Kiefer F, Schwede T «Assessment of CASP7 predictions for template-based modeling targets» (en anglès). Proteins, vol. 69 Suppl 8, 2007, pàg. 38–56. DOI: 10.1002/prot.21753. PMID: 17894352.
  18. Read RJ, Chavali G «Assessment of CASP7 predictions in the high accuracy template-based modeling category» (en anglès). Proteins, vol. 69 Suppl 8, 2007, pàg. 27–37. DOI: 10.1002/prot.21662. PMID: 17894351.
  19. 19,0 19,1 Jauch R, Yeo HC, Kolatkar PR, Clarke ND «Assessment of CASP7 structure predictions for template free targets» (en anglès). Proteins, vol. 69 Suppl 8, 2007, pàg. 57–67. DOI: 10.1002/prot.21771. PMID: 17894330.
  20. 20,0 20,1 20,2 Das R, Qian B, Raman S, et al. «Structure prediction for CASP7 targets using extensive all-atom refinement with Rosetta@home» (en anglès). Proteins, vol. 69 Suppl 8, 2007, pàg. 118–28. DOI: 10.1002/prot.21636. PMID: 17894356.
  21. 21,0 21,1 Wang C, Schueler-Furman O, Andre I, et al. «RosettaDock in CAPRI rounds 6–12» (en anglès). Proteins, vol. 69, 4, December 2007, pàg. 758–63. DOI: 10.1002/prot.21684. PMID: 17671979.
  22. 22,0 22,1 22,2 Jiang L, Althoff EA, Clemente FR et al. «De novo computational design of retro-aldol enzymes» (en anglès). Science, vol. 319, 5868, Març 2008, pàg. 1387–91. DOI: 10.1126/science.1152692. PMID: 18323453.
  23. Hayden EC «Protein prize up for grabs after retraction» (en anglès). Nature, 13-02-2008. DOI: 10.1038/news.2008.569.
  24. 24,0 24,1 «Disease Related Research» (en anglès). Rosetta@home. Universitat de Washington, 2008. [Consulta: 8 octubre 2008].
  25. «Rosetta@home: David Baker's Rosetta@home journal» (en anglès). Fòrums de Rosetta@home. Universitat de Washington, 2008. [Consulta: 7 setembre 2008].
  26. Kuhlman B i Baker D «Native protein sequences are close to optimal for their structures» (en anglès). Proceedings of the National Academy of Sciences of the United States of America, vol. 97, 19, Setembre 2000, pàg. 10383–8. DOI: 10.1073/pnas.97.19.10383. PMC: 27033. PMID: 10984534.
  27. Thompson MJ, Sievers SA, Karanicolas J, Ivanova MI, Baker D i Eisenberg D «The 3D profile method for identifying fibril-forming segments of proteins» (en anglès). Proceedings of the National Academy of Sciences of the United States of America, vol. 103, 11, Març 2006, pàg. 4074–8. DOI: 10.1073/pnas.0511295103. PMC: 1449648. PMID: 16537487.
  28. «Rosetta@home forum: Amyloid fibril structure prediction» (en anglès). Fòrums de Rosetta@home. Universitat de Washington. [Consulta: 7 setembre 2008].
  29. «Rosetta@home forum: Publications on R@H's Alzheimer's work? (missatge 54681)» (en anglès). Fòrums de Rosetta@home. Universitat de Washington. [Consulta: 8 octubre 2008].
  30. Wang C, Schueler-Furman O; Baker D «Improved side-chain modeling for protein–protein docking» (en anglès). Protein science : a publication of the Protein Society, vol. 14, 5, Maig 2005, pàg. 1328–39. DOI: 10.1110/ps.041222905. PMC: 2253276. PMID: 15802647.
  31. Gray JJ, Moughon S, Wang C, et al. «Protein–protein docking with simultaneous optimization of rigid-body displacement and side-chain conformations» (en anglès). Journal of molecular biology, vol. 331, 1, Agost 2003, pàg. 281–99. DOI: 10.1016/S0022-2836(03)00670-3. PMID: 12875852.
  32. 32,0 32,1 Schueler-Furman O, Wang C i Baker D «Progress in protein-protein docking: atomic resolution predictions in the CAPRI experiment using RosettaDock with an improved treatment of side-chain flexibility» (en anglès). Proteins, vol. 60, 2, Agost 2005, pàg. 187–94. DOI: 10.1002/prot.20556. PMID: 15981249.
  33. Lacy DB, Lin HC, Melnyk RA, et al. «A model of anthrax toxin lethal factor bound to protective antigen» (en anglès). Proceedings of the National Academy of Sciences of the United States of America, vol. 102, 45, Novembre 2005, pàg. 16409–14. DOI: 10.1073/pnas.0508259102. PMC: 1283467. PMID: 16251269.
  34. Albrecht MT, Li H, Williamson ED, et al. «Human monoclonal antibodies against anthrax lethal factor and protective antigen act independently to protect against Bacillus anthracis infection and enhance endogenous immunity to anthrax» (en anglès). Infection and immunity, vol. 75, 11, Novembre 2007, pàg. 5425–33. DOI: 10.1128/IAI.00261-07. PMC: 2168292. PMID: 17646360.
  35. Sprague ER, Wang C, Baker D i Bjorkman PJ «Crystal structure of the HSV-1 Fc receptor bound to Fc reveals a mechanism for antibody bipolar bridging» (en anglès). PLoS biology, vol. 4, 6, Juny 2006, pàg. e148. DOI: 10.1371/journal.pbio.0040148. PMC: 1450327. PMID: 16646632.
  36. «Development of IgG1 b12 scaffolds and HIV-1 env-based outer domain immunogens capable of eliciting and detecting IgG1 b12-like antibodies» (PDF) (en anglès). Global HIV Vaccine Enterprise, 2007. [Consulta: 28 setembre 2008].
  37. «David Baker's Rosetta@home journal archives (missatge 40756)» (en anglès). Fòrums de Rosetta@home. Universitat de Washington. [Consulta: 7 setembre 2008].
  38. Paulson, Tom «Gates Foundation awards $287 million for HIV vaccine research» (en anglès). Seattle Post-Intelligencer, 19-07-2006 [Consulta: 7 setembre 2008].
  39. «Homing Endonuclease Genes: New Tools for Mosquito Population Engineering and Control». Grand Challenges in Global Health. [Consulta: 7 setembre 2008].
  40. Windbichler N; Papathanos PA; Catteruccia F; Ranson H; Burt A; Crisanti A «Homing endonuclease mediated gene targeting in Anopheles gambiae cells and embryos» (en anglès). Nucleic Acids Research, vol. 35, 17, 2007, pàg. 5922–33. DOI: 10.1093/nar/gkm632. PMC: 2034484. PMID: 17726053.
  41. Ashworth J; Havranek JJ; Duarte CM; et al. «Computational redesign of endonuclease DNA binding and cleavage specificity» (en anglès). Nature, vol. 441, 7093, June 2006, pàg. 656–9. DOI: 10.1038/nature04818. PMC: 2999987. PMID: 16738662.
  42. Simons KT; Bonneau R; Ruczinski I; Baker D «Ab initio protein structure prediction of CASP III targets using ROSETTA» (en anglès). Proteins, vol. Suppl 3, 1999, pàg. 171–6. DOI: 10.1002/(SICI)1097-0134(1999)37:3+<171::AID-PROT21>3.0.CO;2-Z. PMID: 10526365.
  43. «Interview with David Baker» (en anglès). Team Picard Distributed Computing, 2006. [Consulta: 23 desembre 2008].
  44. Nauli S; Kuhlman B; Baker D; «Computer-based redesign of a protein folding pathway» (en anglès). Nature Structural Biology, vol. 8, 7, Juliol 2001, pàg. 602–5. DOI: 10.1038/89638. PMID: 11427890.
  45. Kuhlman B; Dantas G; Ireton GC; Varani G; Stoddard BL; Baker D; «Design of a novel globular protein fold with atomic-level accuracy» (en anglès). Science, vol. 302, 5649, Novembre 2003, pàg. 1364–8. Bibcode: 2003Sci...302.1364K. DOI: 10.1126/science.1089427. PMID: 14631033.
  46. Jones DT «Structural biology. Learning to speak the language of proteins» (en anglès). Science, vol. 302, 5649, Novembre 2003, pàg. 1347–8. DOI: 10.1126/science.1092492. PMID: 14631028.
  47. von Grotthuss M; Wyrwicz LS; Pas J; Rychlewski L; «Predicting protein structures accurately». Science, vol. 304, 5677, Juny 2004, pàg. 1597–9; resposta de l'autor 1597–9. DOI: 10.1126/science.304.5677.1597b. PMID: 15192202.
  48. «Articles citing: Kuhlman et al. (2003) 'Design of a novel globular protein fold with atomic-level accuracy'» (en anglès). ISI Web of Science. [Consulta: 10 juliol 2008].
  49. «October 2005 molecule of the month: Designer proteins» (en anglès). RCSB Protein Data Bank. [Consulta: 7 setembre 2008].
  50. «Kuhlman laboratory homepage» (en anglès). Kuhlman Laboratory. Universitat de Carolina del Nord. [Consulta: 7 setembre 2008].
  51. «RosettaDesign web server» (en anglès). Kuhlman Laboratory. Universitat de Carolina del Nord. [Consulta: 7 setembre 2008].
  52. 52,0 52,1 Gray JJ; Moughon SE; Kortemme T. et al. «Protein-protein docking predictions for the CAPRI experiment» (en anglès). Proteins, vol. 52, 1, Juliol 2003, pàg. 118–22. DOI: 10.1002/prot.10384. PMID: 12784377.
  53. Daily MD; Masica D; Sivasubramanian A; Somarouthu S; Gray JJ «CAPRI rounds 3–5 reveal promising successes and future challenges for RosettaDock» (en anglès). Proteins, vol. 60, 2, 2005, pàg. 181–86. DOI: 10.1002/prot.20555. PMID: 15981262.
  54. Méndez R; Leplae R; Lensink MF; Wodak SJ «Assessment of CAPRI predictions in rounds 3–5 shows progress in docking procedures» (en anglès). Proteins, vol. 60, 2, 2005, pàg. 150–69. DOI: 10.1002/prot.20551. PMID: 15981261.
  55. «RosettaDock server» (en anglès). Laboratori Grey. Johns Hopkins University. [Consulta: 7 setembre 2008].
  56. «Protein-protein docking at Rosetta@home» (en anglès). Fòrums de Rosetta@home. Universitat de Washington. [Consulta: 7 setembre 2008].
  57. «Robetta web server» (en anglès). Laboratori Baker. Universitat de Washington. [Consulta: 7 setembre 2008].
  58. Aloy P; Stark A; Hadley C; Russell RB «Predictions without templates: new folds, secondary structure, and contacts in CASP5» (en anglès). Proteins, vol. 53 Suppl 6, 2003, pàg. 436–56. DOI: 10.1002/prot.10546. PMID: 14579333.
  59. Tress M; Ezkurdia I; Graña O; López G; Valencia A «Assessment of predictions submitted for the CASP6 comparative modeling category» (en anglès). Proteins, vol. 61 Suppl 7, 2005, pàg. 27–45. DOI: 10.1002/prot.20720. PMID: 16187345.
  60. Battey JN; Kopp J; Bordoli L; Read RJ; Clarke ND; Schwede T «Automated server predictions in CASP7» (en anglès). Proteins, vol. 69 Suppl 8, 2007, pàg. 68–82. DOI: 10.1002/prot.21761. PMID: 17894354.
  61. Chivian D; Kim DE; Malmström L; Schonbrun J; Rohl CA; Baker D «Prediction of CASP6 structures using automated Robetta protocols» (en anglès). Proteins, vol. 61 Suppl 7, 2005, pàg. 157–66. DOI: 10.1002/prot.20733. PMID: 16187358.
  62. «Diari de David Baker a Rosetta@home, missatge 52902» (en anglès). Rosetta@home forums. Universitat de Washington. [Consulta: 7 setembre 2008].
  63. «Diari de David Baker a Rosetta@home (missatge 52963)» (en anglès). Rosetta@home forums. Universitat de Washington. [Consulta: 16 setembre 2008].
  64. «Online Gamers Achieve First Crowd-Sourced Redesign of Protein» (en anglès). Scientific American, 22-01-2012. [Consulta: 22 febrer 2012].
  65. «Foldit: Frequently Asked Questions». fold.it. Universitat de Washington. [Consulta: 19 setembre 2008].
  66. «Project list – BOINC» (en anglès). Universitat de Califòrnia. [Consulta: 8 setembre 2008].
  67. «High Performance FAQ» (FAQ) (en anglès). Universitat Stanford, 2010. [Consulta: 19 setembre 2011].
  68. «Re: Answers to: Reasons for not using F@H» (en anglès), 02-04-2010. [Consulta: 19 setembre 2011].
  69. «Results page updated – new key result published in our work in Alzheimer's Disease» (en anglès), 05-08-2011. [Consulta: 19 setembre 2011].
  70. «Folding@home Diseases Studied FAQ» (FAQ) (en anglès). Universitat Stanford. [Consulta: 12 setembre 2011].
  71. «How FAH works: Molecular dynamics» (en anglès), 26-09-2007. [Consulta: 10 setembre 2011].
  72. 72,0 72,1 «Re: Course grained Protein folding in under 10 minutes» (en anglès), 09-06-2011. [Consulta: 19 setembre 2011].
  73. «Rosetta@home and Folding@home: additional projects» (en anglès), 29-07-2011. [Consulta: 19 setembre 2011].
  74. «Client Statistics by OS» (en anglès). Universitat Stanford, s'actualitza automàticament. [Consulta: 18 octubre 2011].
  75. Malmström L, Riffle M, Strauss CE et al. «Superfamily assignments for the yeast proteome through integration of structure prediction with the gene ontology» (en anglès). PLoS Biology, vol. 5, 4, Abril 2007, pàg. e76. DOI: 10.1371/journal.pbio.0050076. PMC: 1828141. PMID: 17373854.
  76. «World Community Grid Message Board Posts: HPF -> HPF2 transition» (en anglès). Laboratori Bonneau, Universitat de Nova York, 2006. [Consulta: 7 setembre 2008].
  77. «List of Richard Bonneau's publications» (en anglès). Laboratori Bonneau, Universitat de Nova York. Arxivat de l'original el 07-07-2008. [Consulta: 7 setembre 2008].
  78. «World Community Grid Message Board Posts» (en anglès). Laboratori Bonneau, Universitat de Nova York. Arxivat de l'original el 04-07-2008. [Consulta: 7 setembre 2008].
  79. «Predictor@home: Developing new application areas for P@H» (en anglès). The Brooks Research Group. Arxivat de l'original el 2008-11-28. [Consulta: 7 setembre 2008].
  80. «dTASSER» (en anglès). The Scripps Research Institute, 2007. Arxivat de l'original el 06-07-2007. [Consulta: 7 setembre 2008].
  81. «RALPH@home website» (en anglès). RALPH@home forums. Universitat de Washington. [Consulta: 7 setembre 2008].
  82. «Rosetta@home: The new credit system explained» (en anglès). Rosetta@home forums. Universitat de Washington, 2006. [Consulta: 8 octubre 2008].
  83. «BOINCstats: Project Credit Comparison» (en anglès). boincstats.com, 2008. [Consulta: 8 octubre 2008].
  84. «Credit divided over projects» (en anglès). boincstats.com. [Consulta: 30 novembre 2008].
  85. «Rosetta@home: Predictor of the day archive» (en anglès). Rosetta@home. Universitat de Washington, 2008. [Consulta: 8 octubre 2008].
  86. «Rosetta@home: Protein Folding, Design, and Docking» (en anglès). Rosetta@home. Universitat de Washington, 2008. [Consulta: 8 octubre 2008].

Enllaços externs

modifica
  • Rosetta@home Lloc web del projecte (anglès)
  • Baker Lab Lloc web del Baker Lab (anglès)
  • Diari de David Baker sobre Rosetta@home (anglès)
  • BOINC Inclou una vista general de la plataforma, a més d'una guia per instal·lar BOINC i unir-se a Rosetta@home (anglès)
  • BOINCstats – Rosetta@home Estadístiques detallades de contribucions (anglès)
  • RALPH@home Lloc web del projecte de proves alfa de Rosetta@home (anglès)
  • Rosetta@home video on YouTube Vista general de Rosetta@home, feta per David Baker i membres del laboratori (anglès)
  • Rosetta Commons Organització acadèmica pel desenvolupament de la plataforma Rosetta (anglès)
  • Lloc web de Kuhlman Llar de RosettaDesign (anglès)

Serveis en línia de Rosetta

  • Robetta Servidor de predicció de l'estructura de les proteïnes (anglès)
  • RosettaDesign Servidor de disseny de proteïnes (anglès)
  • RosettaDock Servidor d'acoblaments proteïna-proteïna (anglès)

Categoria:Bioinformàtica Categoria:Proteòmica Categoria:Aplicació distribuïda