mardi 13 février 2024

Concevoir des protéine nouvelles — une approche "ingénieur" depuis de nouvelles structures jusqu'à des fonctions programmable

En bref

L'intelligence artificielle (IA) entraînée sur de vastes ensembles de données de séquences et de structures de protéines permet désormais de composer - sans partir de protéines trouvées dans la nature (=de novo ) des protéines avec de nouvelles formes et de nouvelles fonctions moléculaires.
De nouvelles structures protéiques et des assemblages (structure quaternaire) peuvent être conçues et vérifiés expérimentalement avec un taux de succès considérable. Et il devient possible d'attaquer des problèmes difficiles nécessitant un contrôle et un réglage des interactions moléculaires. Ces approches émergentes intègrent dès la conception des principes d'ingénierie : la réglabilité, la contrôlabilité et la modularité. Cette approche synthétique à partir de zéro permet d'explorer des fonctions cellulaires, et des voies  de signalisation cellulaire. Mais de nombreux défis restent à résoudre. Traduction adaptée d'après Kortemme, T. (2024) Jump-To-Science : donner envie d'accéder aux articles                plutot que vulgariser encourage le lecteur à aller vérifier dans l'article d'origine :  ici

Une nouvelle approche - plus "ingénieur" des sciences de la vie

Les protéines peuvent accélérer de plusieurs ordres de grandeur la vitesse de réactions chimiques, de convertir l'énergie lumineuse en énergie chimique et de réguler des myriades de processus au sein des cellules et des organismes avec la précision permettant la vie. Ces fonctions puissantes des protéines naturelles en ont fait des outils de choix pour l'ingénierie moléculaire. Elles ont permis la compréhension des mécanismes des fonctions moléculaires et cellulaires et des applications pratiques telles que la catalyse, la biotechnologie. Elles ont fourni des outils de précision pour la recherche scientifique et médicale. 

Ce nouveau domaine de la conception de protéines révise maintenant fondamentalement cette approche. Plutôt que de ré-ingéniérer des protéines existantes, il devient possible de construire à partir de zéro des protéines avec des architectures et des fonctions complexes, aussi puissantes que celles présentes dans la nature mais nouvelles et programmables par l'utilisateur. Traduction adaptée d'après Kortemme, T. (2024) Jump-To-Science : donner envie d'accéder aux articles                plutot que vulgariser encourage le lecteur à aller vérifier dans l'article d'origine :  ici

Si les méthodes classiques sont si remarquables, pourquoi réinventer ?

En effet, pourquoi construire quelque chose de nouveau si l'on peut emprunter, réutiliser et reprogrammer à partir de protéines naturelles, voire même parvenir à des fonctions n'existant pas dans la nature. En effet, l'approche consistant à faire évoluer ou recombiner des composants protéiques existants pour de nouvelles fonctions a été incroyablement réussie, et la conception de novo a longtemps été en retard en raison de ses limitations apparentes. Les protéines conçues de novo sont souvent moins actives que leurs homologues naturelles et ont nécessité, pour améliorer leur activité de vastes de criblage par évolution dirigée. De plus de nombreuses fonctions souhaitées semblaient hors de portée.

Concevoir des protéines fonctionnelles entièrement de novo, sans les caractéristiques propres aux protéines évoluées,  pourrait présenter plusieurs avantages distincts (Figure 1A).
Le plus évident est de permettre des fonctions qui n'ont pas encore été observées dans la nature (pour lesquelles il n'y a pas de points de départ évidents pour l'évolution dirigée).
Le deuxième avantage est que la conception de novo pourrait permettrait de créer des protéines intégrant des principes fondamentaux d'ingénierie : la réglabilité, la contrôlabilité et la modularité.
Il s'agit donc de concevoir des protéines qui seraient
(1) réglables, de sorte qu'il soit facile de générer des versions aux paramètres biochimiques précisément modifiés,
(2) contrôlables, de sorte que la fonction protéique réponde aux stimuli internes et externes, et 
(3) modulaires, de sorte que nous puissions intégrer facilement différentes fonctions dans des machines moléculaires composites et des ensembles.
Traduction adaptée d'après Kortemme, T. (2024) Jump-To-Science : donner envie d'accéder aux articles                plutot que vulgariser encourage le lecteur à aller vérifier dans l'article d'origine :  ici

Fig 1: Figure 1 design de protéines De novo avec l'AI  [img]. Source : Kortemme, T. (2024)
(A) Concevoir des protéines de novo  permet de concevoir des protéines intégrant des principes d'ingénierie : être (1) réglables (tunable) dans leurs propriétés quantitatives (taux, affinités, etc.), (2) contrôlables par des entrées variées, et (3) modulaires de telle sorte que les éléments protéiques puissent être liés pour obtenir des comportements d'entrée/sortie variés.
(B) Des objectifs définis par l'utilisateur (à gauche) et des entrées (au milieu) sont utilisés pour générer des protéines avec de nouvelles structures et fonctions (à droite). Les catégories 1 à 4 représentent des instructions de plus en plus simples conduisant à des résultats de conception de plus en plus complexes. Les boîtes indiquent des objectifs de conception avec des exemples validés expérimentalement. (1) Les méthodes basées sur l'IA pour concevoir de nouvelles structures protéiques peuvent être sans contrainte (générer diverses structures protéiques ; les hélices α sont indiquées en rouge et les brins β en jaune) ou être contraintes pour diversifier une structure particulière. (2) La plupart des méthodes actuelles pour concevoir une fonction spécifient un "motif" avec des positions et des orientations de résidus définies dans un site fonctionnel. Dans une deuxième étape, une protéine est générée de novo entourant et stabilisant la géométrie précise du site fonctionnel. Ce processus est appelé "échafaudage de motif". (3) Des avancées dans les méthodes basées sur l'IA sont en développement et définissent uniquement la cible, la méthode de conception générant un liant prédit. (4) À partir d'une fonction cible (par exemple, convertir le substrat S en produit P), une méthode d'IA pourrait générer une protéine répondant à ces exigences. Actuellement, les modèles linguistiques protéiques formés sur des familles spécifiques de protéines ou de grands ensembles de données expérimentales peuvent générer de nouvelles séquences avec des fonctions similaires à celles de l'ensemble d'entraînement.


Principes de conception de la fonction : Motifs et échafaudages

De manière générale, la conception computationnelle de fonctions (Figure 2) implique deux étapes : la première étape définit les exigences pour la fonction, et la deuxième étape optimise une structure protéique, et une séquence qui correspondent à ces exigences. Avec les progrès de l'apprentissage profond (deep learning) appliqué aux protéines, la manière dont ces étapes sont réalisées évolue rapidement, avec des taux de réussite de plus en plus remarquables. Traduction adaptée d'après Kortemme, T. (2024) Jump-To-Science : donner envie d'accéder aux articles                plutot que vulgariser encourage le lecteur à aller vérifier dans l'article d'origine :  ici
Principes de conception de la fonction : Motifs et échafaudages,De manière générale, la conception computationnelle de la fonction (Figure 3) implique deux étapes : la première étape définit les exigences pour la fonction, et la deuxième étape optimise une structure protéique et une séquence qui correspondent à ces exigences. Avec les progrès de l'apprentissage profond appliqué aux protéines, la manière dont ces étapes sont réalisées évolue rapidement, avec des taux de réussite de plus en plus remarquables.
Fig 2 : Conception De novo de fonctions moléculaires  [img]. Source : Kortemme, T. (2024)

Protéines de novo pour contrôler les fonctions cellulaires

Les systèmes de signalisation synthétiques capables de contrôler les processus biologiques ont déjà de nombreuses applications en biologie fondamentale, en bio-ingénierie et en médecine(les récepteurs d'antigènes chimériques [CAR] en sont un exemple remarquable). Jusqu'à présent, la grande majorité de ces systèmes de signalisation utilisent des composants d'origine naturelle recombinés ou reprogrammés pour de nouvelles fonctions. On peut maintenant, en principe, construire des systèmes de signalisation protéique entièrement à partir de zéro. Contrairement aux protéines naturelles qui ont évolué pour fonctionner dans des contextes spécifiques, les protéines de novo pourraient être conçues avec une fonction indépendante du contexte permettant une ajustabilité et un comportement modulaire (Figure 1). De plus, de nouvelles fonctions encore jamais observées dans la nature pourraient être réalisées : détecter de nouveaux signaux, intégrer des signaux, effectuer des opérations logiques et réguler précisément les comportements biologiques en aval (Figure 3). Pour chacune de ces fonctions, on pourrait générer des composants élémentaires avec des propriétés ajustables (telles que la cinétique de liaison et de détachement, des géométries d'assemblage diverses, etc.), et ces composants pourraient être liés de manière modulaire pour générer divers comportements de signalisation. Traduction adaptée d'après Kortemme, T. (2024) Jump-To-Science : donner envie d'accéder aux articles                plutot que vulgariser encourage le lecteur à aller vérifier dans l'article d'origine :  ici
Figure thumbnail gr4
Fig 3: Protéines de novo pour contrôler les fonctions cellulaires [img] Source : Kortemme, T. (2024)

Limites

Dans sa conclusion, Kortemme, T. (2024) liste les potentiels immenses de la conception computationnelle de novo  de protéines. (ici). Puis discutes les limites.
De nombreux défis passionnants restent à relever. A l'horizon,  la prédiction du comportement des protéines au-delà de la structure : des paramètres quantitatifs tels que les affinités de liaison, la dynamique conformationnelle et en fin de compte, les fonctions cellulaires. Les progrès dans l'apprentissage profond nécessiteront des données informatives à une échelle suffisante pour permettre une conception précise de ces comportements. Les fonctions avancées des protéines sont souvent composites, couplant les signaux d'entrée à des sorties fonctionnelles diverses ; la conception prédictive devrait donc être capable d'intégrer de multiples objectifs. L'extraction de principes à partir des données est importante pour rendre les propriétés de protéines souhaitées réellement réalisables. De nouvelles opportunités résident dans la construction de fonctions complexes à partir de zéro. Ici, les protéines de novo pourraient être conçues a priori avec les principes d'ingénierie de l'ajustabilité, de la contrôlabilité et de la modularité. Des familles de tels composants de novo, dotés de propriétés ajustables et contrôlables, pourraient être recombinées pour générer des comportements divers. L'interfaçage de ces systèmes de novo avec les processus biologiques pourrait permettre à la fois de déconstruire les fonctions cellulaires et de les contrôler. Le domaine en évolution rapide de la conception de protéines de novo offre un environnement passionnant pour la créativité des scientifiques et ingénieurs pour aborder les nombreux défis non résolus, bien plus nombreux que ceux déjà "résolus", aux interfaces des fonctions biologiques et des fonctions nouvelles à la nature. Traduction adaptée d'après Kortemme, T. (2024) Jump-To-Science : donner envie d'accéder aux articles                plutot que vulgariser encourage le lecteur à aller vérifier dans l'article d'origine :  ici

(Les membres Jump-To-Science peuvent obtenir ces articles).

Références: