En bref
L'intelligence artificielle (IA) entraînée sur de vastes ensembles de données de séquences et de structures de protéines permet désormais de composer - sans partir de protéines trouvées dans la nature (=de novo ) des protéines avec de nouvelles formes et de nouvelles fonctions moléculaires.
De nouvelles structures protéiques et des assemblages (structure quaternaire) peuvent être conçues et vérifiés expérimentalement avec un taux de succès considérable. Et il devient possible d'attaquer des problèmes difficiles nécessitant un contrôle et un réglage des interactions moléculaires. Ces approches émergentes intègrent dès la conception des principes d'ingénierie : la réglabilité, la contrôlabilité et la modularité. Cette approche synthétique à partir de zéro permet d'explorer des fonctions cellulaires, et des voies de signalisation cellulaire. Mais de nombreux défis restent à résoudre. Traduction adaptée d'après Kortemme, T. (2024) encourage le lecteur à aller vérifier dans l'article d'origine : ici
Une nouvelle approche - plus "ingénieur" des sciences de la vie
Les protéines peuvent accélérer de plusieurs ordres de grandeur la vitesse de réactions chimiques, de convertir l'énergie lumineuse en énergie chimique et de réguler des myriades de processus au sein des cellules et des organismes avec la précision permettant la vie. Ces fonctions puissantes des protéines naturelles en ont fait des outils de choix pour l'ingénierie moléculaire. Elles ont permis la compréhension des mécanismes des fonctions moléculaires et cellulaires et des applications pratiques telles que la catalyse, la biotechnologie. Elles ont fourni des outils de précision pour la recherche scientifique et médicale.
Ce nouveau domaine de la conception de protéines révise maintenant fondamentalement cette approche. Plutôt que de ré-ingéniérer des protéines existantes, il devient possible de construire à partir de zéro des protéines avec des architectures et des fonctions complexes, aussi puissantes que celles présentes dans la nature mais nouvelles et programmables par l'utilisateur. Traduction adaptée d'après Kortemme, T. (2024) encourage le lecteur à aller vérifier dans l'article d'origine : ici
Si les méthodes classiques sont si remarquables, pourquoi réinventer ?
En effet, pourquoi construire quelque chose de nouveau si l'on peut emprunter, réutiliser et reprogrammer à partir de protéines naturelles, voire même parvenir à des fonctions n'existant pas dans la nature. En effet, l'approche consistant à faire évoluer ou recombiner des composants protéiques existants pour de nouvelles fonctions a été incroyablement réussie, et la conception de novo a longtemps été en retard en raison de ses limitations apparentes. Les protéines conçues de novo sont souvent moins actives que leurs homologues naturelles et ont nécessité, pour améliorer leur activité de vastes de criblage par évolution dirigée. De plus de nombreuses fonctions souhaitées semblaient hors de portée.
Concevoir des protéines fonctionnelles entièrement de novo, sans les caractéristiques propres aux protéines évoluées, pourrait présenter plusieurs avantages distincts (Figure 1A).
Le plus évident est de permettre des fonctions qui n'ont pas encore été observées dans la nature (pour lesquelles il n'y a pas de points de départ évidents pour l'évolution dirigée).
Le deuxième avantage est que la conception de novo pourrait permettrait de créer des protéines intégrant des principes fondamentaux d'ingénierie : la réglabilité, la contrôlabilité et la modularité.
Il s'agit donc de concevoir des protéines qui seraient
(1) réglables, de sorte qu'il soit facile de générer des versions aux paramètres biochimiques précisément modifiés,
(2) contrôlables, de sorte que la fonction protéique réponde aux stimuli internes et externes, et
(3) modulaires, de sorte que nous puissions intégrer facilement différentes fonctions dans des machines moléculaires composites et des ensembles.
Traduction adaptée d'après Kortemme, T. (2024) encourage le lecteur à aller vérifier dans l'article d'origine : ici
(A) Concevoir des protéines de novo permet de concevoir des protéines intégrant des principes d'ingénierie : être (1) réglables (tunable) dans leurs propriétés quantitatives (taux, affinités, etc.), (2) contrôlables par des entrées variées, et (3) modulaires de telle sorte que les éléments protéiques puissent être liés pour obtenir des comportements d'entrée/sortie variés.
(B) Des objectifs définis par l'utilisateur (à gauche) et des entrées (au milieu) sont utilisés pour générer des protéines avec de nouvelles structures et fonctions (à droite). Les catégories 1 à 4 représentent des instructions de plus en plus simples conduisant à des résultats de conception de plus en plus complexes. Les boîtes indiquent des objectifs de conception avec des exemples validés expérimentalement. (1) Les méthodes basées sur l'IA pour concevoir de nouvelles structures protéiques peuvent être sans contrainte (générer diverses structures protéiques ; les hélices α sont indiquées en rouge et les brins β en jaune) ou être contraintes pour diversifier une structure particulière. (2) La plupart des méthodes actuelles pour concevoir une fonction spécifient un "motif" avec des positions et des orientations de résidus définies dans un site fonctionnel. Dans une deuxième étape, une protéine est générée de novo entourant et stabilisant la géométrie précise du site fonctionnel. Ce processus est appelé "échafaudage de motif". (3) Des avancées dans les méthodes basées sur l'IA sont en développement et définissent uniquement la cible, la méthode de conception générant un liant prédit. (4) À partir d'une fonction cible (par exemple, convertir le substrat S en produit P), une méthode d'IA pourrait générer une protéine répondant à ces exigences. Actuellement, les modèles linguistiques protéiques formés sur des familles spécifiques de protéines ou de grands ensembles de données expérimentales peuvent générer de nouvelles séquences avec des fonctions similaires à celles de l'ensemble d'entraînement.
Principes de conception de la fonction : Motifs et échafaudages

Protéines de novo pour contrôler les fonctions cellulaires


Limites
De nombreux défis passionnants restent à relever. A l'horizon, la prédiction du comportement des protéines au-delà de la structure : des paramètres quantitatifs tels que les affinités de liaison, la dynamique conformationnelle et en fin de compte, les fonctions cellulaires. Les progrès dans l'apprentissage profond nécessiteront des données informatives à une échelle suffisante pour permettre une conception précise de ces comportements. Les fonctions avancées des protéines sont souvent composites, couplant les signaux d'entrée à des sorties fonctionnelles diverses ; la conception prédictive devrait donc être capable d'intégrer de multiples objectifs. L'extraction de principes à partir des données est importante pour rendre les propriétés de protéines souhaitées réellement réalisables. De nouvelles opportunités résident dans la construction de fonctions complexes à partir de zéro. Ici, les protéines de novo pourraient être conçues a priori avec les principes d'ingénierie de l'ajustabilité, de la contrôlabilité et de la modularité. Des familles de tels composants de novo, dotés de propriétés ajustables et contrôlables, pourraient être recombinées pour générer des comportements divers. L'interfaçage de ces systèmes de novo avec les processus biologiques pourrait permettre à la fois de déconstruire les fonctions cellulaires et de les contrôler. Le domaine en évolution rapide de la conception de protéines de novo offre un environnement passionnant pour la créativité des scientifiques et ingénieurs pour aborder les nombreux défis non résolus, bien plus nombreux que ceux déjà "résolus", aux interfaces des fonctions biologiques et des fonctions nouvelles à la nature. Traduction adaptée d'après Kortemme, T. (2024)

(Les membres Jump-To-Science peuvent obtenir ces articles…).
Références:
- Kortemme, T. (2024). De novo protein design—From new structures to programmable functions. Cell, 187(3), 526‑544. https://doi.org/10.1016/j.cell.2023.12.028
Aucun commentaire:
Enregistrer un commentaire