Studiare il ruolo della dinamica proteica in una reazione enzimatica sn2 utilizzando superfici a energia libera e coordinate del solvente | chimica della natura

Studiare il ruolo della dinamica proteica in una reazione enzimatica sn2 utilizzando superfici a energia libera e coordinate del solvente | chimica della natura

Anonim

Soggetti

  • Chimica biofisica
  • enzimi
  • Chimica teorica

Astratto

È noto che le modifiche conformazionali sono in grado di guidare un enzima attraverso il suo ciclo catalitico, consentendo, ad esempio, il legame del substrato o il rilascio del prodotto. Tuttavia, l'influenza dei moti proteici sul passaggio chimico è una questione controversa. Una proposta è che le semplici fluttuazioni di equilibrio incorporate nella teoria dello stato di transizione sono insufficienti per spiegare l'effetto catalitico degli enzimi e che i movimenti delle proteine ​​dovrebbero essere trattati dinamicamente. Qui, proponiamo l'uso di superfici a energia libera, ottenute in funzione sia di una coordinata chimica che di una coordinata ambientale, come un modo efficace per chiarire il ruolo della struttura e dei movimenti delle proteine ​​durante la reazione. Mostriamo che la struttura della proteina fornisce un ambiente adeguato per l'avanzamento della reazione, sebbene sia necessario un certo grado di flessibilità per ottenere il pieno effetto catalitico. Tuttavia, questi movimenti non introducono correzioni dinamiche significative alla costante di frequenza e possono essere descritte come fluttuazioni di equilibrio.

Principale

Una delle caratteristiche più interessanti degli enzimi è la loro flessibilità. È stato sottolineato che, per funzionare, gli enzimi devono essere abbastanza stabili da conservare la loro struttura tridimensionale (3D), ma abbastanza flessibili da consentire l'evoluzione della proteina tra le diverse conformazioni rilevanti in ciascuna fase dell'intero processo catalitico 1, 2 Ad esempio, in molti casi è noto che le modifiche conformazionali sono necessarie per la rilegatura del supporto di stampa e il rilascio del prodotto. In effetti, la superficie multidimensionale di energia libera che corrisponde a un processo enzimatico è molto robusta e contiene più minimi che compaiono lungo le coordinate conformazionali multiple disponibili per la proteina 3 . Le transizioni tra diversi substrati conformazionali della macromolecola e la loro distribuzione della popolazione sono regolate da movimenti che si verificano in una vasta gamma di scale temporali, da millisecondi a femtosecondi 2, 4 .

Tuttavia, l'impatto della flessibilità proteica sulla costante di velocità della fase chimica rimane oggetto di un lungo dibattito nella letteratura scientifica 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 . Anche se il sito attivo è progettato per catalizzare la reazione e quindi per accogliere la distribuzione di carica dello stato di transizione (TS) 16, alcuni movimenti proteici sono ancora necessari per evolversi dallo stato reagente (RS) al TS 1, 5, 15, 17 . In altre parole, per raggiungere il TS 15 è necessario un certo grado di riorganizzazione delle proteine. Questa riorganizzazione avrebbe un ruolo simile a quello della polarizzazione dei solventi nella teoria di Marcus per il trasferimento di elettroni nella soluzione 18, sebbene componenti conformazionali molto più lenti potrebbero essere coinvolti nella catalisi enzimatica 12, 19 . In generale, la coordinata che descrive la trasformazione del sistema da reagenti a prodotti è una coordinata collettiva che coinvolge i gradi di libertà non solo del soluto / substrato, ma anche dell'ambiente (il solvente e / o l'enzima).

Le descrizioni teoriche delle reazioni chimiche negli ambienti enzimatici si basano solitamente sulla selezione di una coordinata reazione distintiva, tipicamente definita in termini di substrato o coordinate del soluto (cioè alcune coordinate di valenza correlate ai legami da rompere e / o formare). All'interno di questa descrizione, alcuni movimenti proteici possono essere accoppiati all'avanzamento del sistema lungo la coordinata di reazione. Ad esempio, i movimenti correlati all'interno della proteina promuovono il tunneling nelle reazioni di trasferimento dell'idruro 20, 21 e i movimenti locali compressivi all'interno del sito attivo facilitano l'approccio tra gli atomi donatore e accettore nelle reazioni di trasferimento 11, 22 . La partecipazione dei moti proteici all'avanzamento della reazione è quindi un fatto consolidato invocato usando una terminologia diversa: riorganizzazione proteica 15, moti accoppiati 9 o promozione di vibrazioni 8, 22 . Una domanda più controversa è il modo in cui questi movimenti devono essere descritti e se gli attuali quadri teorici sono adeguati o meno per spiegare il tasso di reazioni enzimatiche 14, 22 .

Come approccio fondamentale per descrivere la velocità di reazione delle reazioni chimiche, la teoria dello stato di transizione (TST) fornisce gli strumenti per analizzare la velocità delle reazioni enzimatiche 23 . L'assunto di base in TST è che la coordinata di reazione selezionata ( ζ ) è separabile dal resto delle coordinate del sistema in modo tale che il comportamento dinamico mediato delle traiettorie che si evolvono dai reagenti ai prodotti possa essere rappresentato come flusso di equilibrio attraverso il superficie divisoria. In questo caso la costante di frequenza può essere semplicemente correlata alla differenza di energia libera tra TS e reagenti (Δ G ). Per un processo unimolecolare

Image

dove k B, h e R sono le costanti di Boltzmann, Planck e gas e T è la temperatura assoluta. Questo approccio significa che i rimanenti gradi di libertà possono essere considerati in equilibrio a qualsiasi valore della coordinata di reazione, descritta come una distribuzione di Boltzmann. Se la coordinata di reazione è definita esclusivamente in termini di gradi di libertà del substrato (o "coordinata del soluto"), si presume che i gradi di libertà della proteina (o "coordinata del solvente") siano in equilibrio in tutte le fasi del percorso di reazione. Ovviamente, la dinamica proteica abbraccia una gerarchia di scale temporali 2, 4, 10 e solo quei movimenti molto più veloci della coordinata di reazione possono essere considerati in equilibrio. Pertanto, questo approccio si interrompe per i movimenti accoppiati alla coordinata del soluto e che avvengono in scale temporali simili o più lente. In tal caso può essere necessario un trattamento esplicito della dinamica vibrazionale nell'enzima. Questo è suggerito per alcuni casi che coprono sia i movimenti vibrazionali veloci 22 sia i lenti cambiamenti conformazionali 19 . Tuttavia, altre analisi sottolineano che il ruolo dei moti proteici può essere incorporato in modo soddisfacente nella descrizione della fase chimica come fluttuazioni di equilibrio e quindi trattamenti dinamici espliciti dei moti proteici non sono realmente necessari per modellare la catalisi enzimatica 5, 9, 13, 14, 24 .

La TST offre un comodo quadro per incorporare effetti non statistici dei moti proteici. Un coefficiente di trasmissione ( κ ) può essere calcolato da simulazioni dipendenti dal tempo e incorporato nell'espressione TST della costante di frequenza 25 :

Image

Poiché il coefficiente di trasmissione assume valori inferiori all'unità, l'approccio di equilibrio (equazione (1)) fornisce un limite superiore alla costante di velocità. Non esiste un modo inequivocabile per separare gli effetti dell'enzima sull'energia libera di attivazione (o sull'equilibrio) da quelli sul coefficiente di trasmissione (effetti di non equilibrio) perché entrambi dipendono dalla scelta della coordinata di reazione 23 . Se questo viene definito esclusivamente sulla base delle coordinate del substrato, le deviazioni dalla distribuzione dell'equilibrio dei moti proteici dovrebbero essere riflesse nel coefficiente di trasmissione. Supponendo che questi effetti siano importanti in prossimità del collo di bottiglia dinamico, il coefficiente di trasmissione può essere valutato dalla forza di attrito esercitata sulla coordinata di reazione nel TS 26 o mediante simulazioni di eventi rari che contano il numero di recrossings attraverso la divisione superficie 27 . Ad oggi, le simulazioni eseguite sulle reazioni enzimatiche mostrano che il coefficiente di trasmissione si discosta solo modestamente dall'unità per scelte ragionevoli della coordinata di reazione. I valori tipici di solito variano tra 0, 5 e 0, 9 (rif 23, 24, 28), il che riflette una modesta partecipazione dei moti proteici nel passaggio del sistema sopra la barriera.

Un modo conveniente per analizzare quantitativamente il ruolo dei moti proteici durante la trasformazione chimica è quello di proiettare la superficie multidimensionale di energia libera (FES) della reazione enzimatica in un modello 2D ottenuto in funzione di una coordinata soluto e una coordinata solvente 29, 30 . Tale FES consente di stimare, a livello quantitativo, i tempi e l'accoppiamento tra i movimenti del soluto e del solvente lungo il percorso di reazione. Inoltre, il coefficiente di trasmissione può essere derivato dalle differenze tra la superficie di divisione definita sulla FES ottenuta sotto l'approssimazione della solvatazione di equilibrio e quella ottenuta sulla FES 2D (che riflette l'accoppiamento tra le coordinate del soluto e del solvente).

Un esempio prototipico in cui gli effetti del solvente possono svolgere un ruolo importante è la reazione S N 2. Studi in soluzione acquosa hanno già stabilito che la reazione procede con un grande riarrangiamento delle molecole d'acqua attorno al nucleofilo e al gruppo uscente 30, 31 . Pertanto, il cambiamento nel potenziale elettrostatico creato dall'ambiente sul nucleofilo e sul gruppo uscente è una buona coordinata su cui seguire l'evoluzione dell'ambiente lungo il processo di reazione 32 e le distanze associate ai legami da spezzare e formare fornire un'adeguata coordinata del soluto. In questo lavoro, abbiamo studiato la reazione nucleofila S N 2 tra dicloroetano e Asp124 in DhlA, una alogenano delogenasi da Xanthobacter autotrophicus (Fig. 1) 33, 34, una reazione enzimatica analizzata teoricamente da diversi gruppi 35, 36, 37, 38 . Abbiamo anche modellato la reazione di contropartita S N 2 in soluzione acquosa, in cui una molecola di acetato viene impiegata come nucleofilo. Il confronto tra il processo enzimatico e in soluzione offre un'eccellente opportunità per analizzare il ruolo della struttura, flessibilità e dinamica dell'ambiente su una classe fondamentale di reazioni chimiche.

Image

Il sottosistema QM è rappresentato dagli atomi etichettati in blu.

Immagine a dimensione intera

risultati

I FES PM3 / MM che corrispondono all'attacco nucleofilo nella soluzione acquosa e nel sito attivo di DhlA tracciati in funzione delle coordinate del soluto ( ξ ) e del solvente ( s ) sono presentati in Fig. 2a, b, rispettivamente. La coordinata del soluto ( ξ = d (CCl) - d (CO)) si evolve da valori negativi a positivi man mano che la reazione procede. La coordinata del solvente è ottenuta dal potenziale elettrostatico creato dall'ambiente sul gruppo uscente e sul nucleofilo ( s = V Cl - V O ; vedi Metodi) e si evolve da valori negativi alla RS (dove l'atomo nucleofilo che porta la carica negativa è stabilizzato dalle interazioni elettrostatiche con l'ambiente) a valori positivi allo stato del prodotto (dove il potenziale elettrostatico assume valori positivi maggiori sul gruppo uscente che ora è caricato negativamente). Questa figura mostra anche, come linee continue sugli FES, i percorsi minimi di energia libera (MFEP) ottenuti dal gradiente di energia libera. I percorsi di energia libera ottenuti usando la coordinata del soluto e supponendo che la coordinata del solvente si equilibri ad ogni valore del primo (percorsi di energia libera di equilibrio (EFEP)) sono anche mostrati in Fig. 2 (linee tratteggiate).

Image

a, b, FES per la reazione in soluzione acquosa ( a ) e nel sito attivo di DhlA ( b ). Per aeb la coordinata distintiva del soluto è la combinazione antisimmetrica delle distanze di rottura e di formatura del legame ( ξ = d (ClC) - d (OC)); la coordinata del solvente è la combinazione antisimmetrica del potenziale elettrostatico creato dall'ambiente sul gruppo uscente e dall'ossigeno nucleofilo ( s = V Cl - V O ). Le linee isoenergetiche a energia libera rappresentano passi di 3 kcal mol −1 . Le linee rosse e blu continue rappresentano il percorso minimo di energia libera sui FES e quelle tratteggiate corrispondono al percorso ottenuto assumendo la solvatazione di equilibrio lungo la coordinata del soluto. La freccia bianca rappresenta il percorso di reazione dal complesso enzimatico Michaelis in un ambiente proteico completamente rigido.

Immagine a dimensione intera

Analisi di FES

Le differenze di energia libera tra i punti della sella e i minimi reagenti situati sugli FES sono rispettivamente 27, 4 e 37, 1 kcal mol-1 per i processi catalizzati e non catalizzati. L'energia libera di attivazione dedotta dalla costante di velocità sperimentale della reazione enzimatica a 298 K è 15, 3 kcal mol −1 (rif. 34) e la barriera stimata per il processo in soluzione acquosa è 26 kcal mol −1 (rif. 36) ( un valore di 29, 9 kcal mol-1 è stato riportato per la reazione in soluzione a 373K) 35, 39 . La sopravvalutazione osservata nei nostri valori teorici deriva dall'uso del PM3 Hamiltonian 35, 37 . Le barriere di energia libera corrette M06-2X (vedi Metodi) per i processi enzimatici e in soluzione sono rispettivamente 16, 5 e 27, 4 kcal mol-1, in un migliore accordo quantitativo con i valori sperimentali. In ogni caso, i calcoli del PM3 / MM forniscono una stima corretta dell'effetto catalitico, definito come la differenza tra le barriere enzimatiche a energia libera in soluzione. La differenza di PM3 / MM è 9, 7 kcal mol −1, in buon accordo con la differenza derivata dai valori M06-2X, 10, 9 kcal mol −1 e dai valori sperimentali, 10, 7 kcal mol −1 .

I FES mostrano notevoli differenze tra la reazione nella soluzione e nell'enzima. Per la RS la struttura proteica fornisce un ambiente molto più adeguato per l'avanzamento della reazione rispetto alla soluzione. In soluzione, RS si presenta con un valore per la coordinata del solvente di circa −100 kcal mol −1 | e | −1 e la RS enzimatica si verifica a circa −25 kcal mol −1 | e | −1 . Quest'ultimo valore della coordinata del solvente è molto più vicino al valore necessario per raggiungere il TS ( s ≈ −10 kcal mol −1 | e | −1 in entrambi gli ambienti). Per il complesso Michaelis la proteina è già organizzata, dal punto di vista elettrostatico, per favorire la reazione, ma in soluzione acquosa l'ambiente deve essere ampiamente riorganizzato per facilitare la reazione 30, 31, 38 .

Tuttavia, la struttura proteica non si comporta come un impalcatura rigida in cui avviene la reazione. La reazione sarebbe significativamente più difficile in un ambiente proteico congelato in cui la coordinata del solvente rimane invariata da RS a TS. Una linea retta dalla RS enzimatica a un valore costante della coordinata del solvente rappresenta il percorso dell'ambiente rigido. Questo percorso (freccia bianca in Fig. 2b) mostra una barriera di energia libera PM3 / MM di 31, 5 kcal mol −1, ∼ 4 kcal mol −1 superiore al valore osservato per la proteina flessibile. Una costante di velocità che corrisponde a un'ipotetica proteina rigida sarebbe circa 10 3 volte più piccola, a temperatura ambiente, rispetto a quella dell'enzima reale. Ciò significa che la flessibilità delle proteine ​​gioca un ruolo nella catalisi e che l'ambiente deve essere riorganizzato quando si passa dal complesso Michaelis al TS per raggiungere una riduzione massima dell'energia libera di attivazione.

La flessibilità può essere quantificata mediante la costante di forza associata alla coordinata del solvente. Le costanti di forza ottenute da un adattamento parabolico della variazione di energia libera lungo la coordinata del solvente in soluzione e in DhlA sono riportate nella Tabella 1. La costante di forza ottenuta nell'enzima è circa 4, 2 volte più grande di quella ottenuta nella soluzione. La struttura proteica è più rigida della struttura dell'acqua, che è legata all'esistenza di una rete di legami covalenti nel primo. Tuttavia, come detto sopra, il cambiamento necessario nella coordinata del solvente per raggiungere il TS dalla RS è molto più piccolo nell'enzima che nella soluzione. Il risultato finale è che il lavoro da fare sulla coordinata del solvente per raggiungere il TS è significativamente più piccolo nell'enzima che nella soluzione. Secondo il MFEP tracciato sui FES, la differenza di energia libera tra TS e RS può essere scritta come approssimativamente

Image

dove sto per l'ambiente (enzima o soluzione acquosa). Il primo termine del lato destro dell'equazione (3) rappresenta il lavoro da eseguire sulla coordinata del solvente e il secondo il lavoro da eseguire sulla coordinata del soluto. I valori che corrispondono alla coordinata del solvente sono circa 11 e 3 kcal mol-1 in soluzione acquosa e in DhlA, rispettivamente. Pertanto, il costo dell'energia libera associato al cambiamento lungo la coordinata del solvente nell'enzima è sostanzialmente inferiore a quello della soluzione e questa differenza rappresenta l'80% dell'effetto catalitico. È interessante notare che, nell'enzima, la probabilità di campionare le configurazioni dell'ambiente conduttivo alla reazione ( s ) è molto maggiore della probabilità di campionare valori adeguati della coordinata del soluto ( ξ ). Il lavoro associato alla riorganizzazione dell'ambiente nel processo enzimatico rappresenta solo l'11% della barriera totale di energia libera.

Tabella a grandezza naturale

Un altro aspetto importante da analizzare è la tempistica tra i movimenti del soluto e del solvente. Secondo gli MFEP ottenuti nei due ambienti, il cambiamento nella coordinata del solvente precede il cambiamento nella coordinata del soluto. Da un punto di vista dinamico ciò significa che la coordinata del solvente è più lenta della coordinata del soluto. Una differenza significativa nei tempi di questi due movimenti potrebbe comportare importanti effetti dinamici a causa del ritardo tra loro. Per caratterizzare l'evoluzione temporale dell'ambiente abbiamo calcolato le frequenze caratteristiche associate al moto lungo la coordinata del solvente nei due ambienti usando costanti di forza e masse effettive dedotte dal principio di equipartizione. Queste frequenze sono fornite nella Tabella 1. Come osservato, sia la costante di forza che la massa effettiva associata alla coordinata del solvente sono maggiori nell'enzima che nella soluzione. Entrambi gli effetti si annullano e, di conseguenza, la frequenza associata al movimento lungo la coordinata del solvente nell'enzima (410 cm −1 ) è molto simile al valore ottenuto nella soluzione (480 cm −1 ). Questi valori corrispondono essenzialmente al riorientamento dei donatori di legame idrogeno attorno al nucleofilo e al gruppo uscente, movimenti che si verificano in picosecondi o più velocemente 38 . Quindi, dal punto di vista dinamico, non vi sono differenze significative nella partecipazione dell'ambiente durante l'avanzamento della reazione in soluzione acquosa o in DhlA. Secondo gli MFEP, i movimenti lungo la coordinata del solvente, la rottura dei legami idrogeno con il nucleofilo e la formazione di nuovi legami con il gruppo uscente avvengono prima o dopo il movimento lungo la coordinata del soluto e le scale temporali associate a questi movimenti sono molto simili nel due media. È interessante notare che non abbiamo trovato alcuna prova che i lenti movimenti conformazionali della proteina influenzassero il passaggio chimico. Ovviamente, questi movimenti possono esistere, ma o non hanno conseguenze sulla coordinata elettrostatica (e quindi sull'energetica della reazione) o non avvengono nelle immediate vicinanze del complesso di Michaelis nel paesaggio di energia libera.

Una volta analizzati, possiamo confrontare i risultati ottenuti usando sia le coordinate del soluto che quelle del solvente con quelle ottenute assumendo la solvatazione dell'equilibrio a qualsiasi valore della coordinata del soluto. Questa è la consueta approssimazione utilizzata per analizzare le reazioni chimiche in ambienti condensati. Gli EFEP, presentati anche in Fig. 2, passano dal minimo reagente ai minimi del prodotto attraverso il punto di sella. Quindi, poiché l'energia libera è una funzione di stato, i profili 1D tracciati lungo la coordinata del soluto forniscono quasi le stesse energie libere di attivazione di quelle delle superfici 2D ottenute in funzione delle coordinate del soluto e del solvente (l'origine delle piccole differenze è discussa di seguito ). Tuttavia, sebbene le differenze di energia libera siano corrette, l'approccio della solvatazione di equilibrio non è in grado di descrivere correttamente i tempi tra le coordinate del soluto e del solvente. In effetti, come osservato in Fig. 2, nel trattamento di equilibrio si tira lungo la coordinata del soluto e la coordinata del solvente cambia bruscamente in prossimità del TS, ma negli MFEP, sia nella soluzione che nell'enzima, i movimenti del solvente precedono il cambia lungo la coordinata del soluto. In ogni caso, questa limitazione non influisce sulla stima della costante della velocità di reazione, poiché ciò è determinato principalmente dalla differenza di energia libera tra TS e RS.

Valutazione del coefficiente di trasmissione

Sebbene MFEP ed EFEP coincidano con RS e TS, c'è una piccola differenza nelle energie libere di attivazione stimate dai trattamenti 2D (o di non equilibrio) e 1D (o di equilibrio). L'origine di questa differenza è nella definizione dell'ensemble TS ottenuto in ciascun trattamento. Come mostrato in Fig. 3, la superficie divisoria nella descrizione 2D contiene il punto di sella e attraversa le creste che separano il reagente e le valli del prodotto. Nel trattamento 1D, viene utilizzata solo la coordinata del soluto e quindi la superficie di divisione viene definita semplicemente come ξ = ξ (rappresentata come linee tratteggiate in Fig. 3). La differenza corrisponde a una rotazione della superficie divisoria in TST 40 variazionale. Il TS più lungo lungo la superficie di divisione non di equilibrio è più stretto del TS più lungo lungo la superficie di divisione di equilibrio (vedi Fig. 3c) e quindi le frequenze associate al movimento del TS lungo la precedente superficie di divisione ( ν s , ξ ) sono più grande di quelli per quest'ultimo ( ν ξ ). Questo può essere tradotto in una differenza entropica negli insiemi TS e di conseguenza nelle energie libere di attivazione 29 :

Image

Image

a, Dividere le superfici per la reazione nella soluzione. La freccia rappresenta un'ipotetica traiettoria che ripropone la superficie di divisione dell'equilibrio. b, Divisione delle superfici per la reazione nel sito attivo di DhlA. L'angolo tra il piano di equilibrio e il non-equilibrio è più piccolo di quello nella soluzione. c, Rappresentazione schematica dei pozzi TS proiettati sulle superfici divisorie di equilibrio e di non equilibrio con le loro frequenze caratteristiche ( ν ξ e ν s , ξ ). Per a, bec le linee continue corrispondono alla superficie di divisione definita in base alla FES tracciata lungo le coordinate del soluto e del solvente. Le linee tratteggiate corrispondono alla superficie di divisione ottenuta quando si presume che la coordinata del solvente sia in equilibrio (il piano di equilibrio viene quindi definito proprio come ξ = ξ ).

Immagine a dimensione intera

Dai nostri FES abbiamo stimato che i rapporti tra le frequenze sono circa 1, 3 e 1, 1; usando questi valori abbiamo stimato che ΔΔ G a 298 K è circa 0, 2 kcal mol −1 e 0, 1 kcal mol −1 nella soluzione e nell'enzima, rispettivamente. Queste differenze di energia libera sono piuttosto piccole, al di sotto dell'incertezza statistica delle simulazioni tipiche di energia libera, e quindi gli effetti di non equilibrio danno un contributo molto piccolo alle energie libere di attivazione.

Ovviamente, un'energia libera di attivazione più piccola viene tradotta in una costante di frequenza maggiore. Questa differenza dovrebbe quindi essere compensata dalla considerazione di un coefficiente di trasmissione inferiore all'unità (vedere equazione (2)). L'origine di questo valore può essere compresa in termini di superfici divisorie ottenute nelle descrizioni di non equilibrio e di equilibrio. La superficie divisoria ottenuta dal trattamento di non equilibrio è definita in modo tale che qualsiasi traiettoria che arriva a quella superficie dal lato reagente continuerà nella regione del prodotto perché l'energia libera diminuisce continuamente in quella direzione, e quindi il coefficiente di trasmissione è uguale all'unità per quella superficie. Tuttavia, usando la superficie di divisione dell'equilibrio, alcune traiettorie che vanno dai reagenti ai prodotti trovano una barriera di energia libera dopo aver attraversato questa superficie e potrebbero ritornare sul lato del reagente (vedi Fig. 3a). Ciò significa che, in questa descrizione, il coefficiente di trasmissione sarebbe inferiore all'unità. Ovviamente, usando l'equazione (2) la stima finale della costante di velocità ottenuta dal non equilibrio e gli approcci all'equilibrio sarebbero gli stessi se il coefficiente di trasmissione fosse ottenuto come 29

Image

Usando le differenze di energia libera sopra indicate, i coefficienti di trasmissione per la reazione nella soluzione e nell'enzima ottenuti usando la coordinata del soluto come coordinata di reazione distintiva sono rispettivamente 0, 8 e 0, 9. Ovviamente, questa procedura porta a una stima molto grezza del coefficiente di trasmissione a causa degli errori statistici associati alle energie libere e del trattamento non esplicito di tutti i gradi di libertà. Una stima più accurata mostra che i coefficienti di trasmissione per questa reazione sono circa 0, 6 e 0, 8 in soluzione acquosa e nell'enzima, rispettivamente 38 . I coefficienti di trasmissione, valutati al TS, dipendono dalla partecipazione della coordinata del solvente all'evento di attraversamento della barriera, che è piuttosto piccolo per questa reazione. Tuttavia, è necessario sottolineare nuovamente che ciò non significa che la proteina rimanga invariata durante la fase chimica. I moti proteici si verificano per primi e facilitano il movimento lungo la coordinata del soluto, ma al TS possono essere considerati in equilibrio. In altre parole, sebbene le reazioni coinvolgano moti proteici accoppiati alla trasformazione chimica, la probabilità che questi moti portino il sistema al TS è determinata principalmente dall'energia libera di attivazione 1, 5, 15 .

Discussione

L'uso di una coordinata esplicita di solvente può essere una strategia utile per analizzare il ruolo di struttura, flessibilità e dinamica nella catalisi. Il confronto tra gli FES ottenuti nella soluzione e nell'enzima per una reazione prototipica S N 2 mostra che l'origine dell'efficienza catalitica dell'enzima è dovuta a una struttura proteica che fornisce un ambiente adeguato per l'avanzamento della reazione. Tuttavia, la proteina non è completamente rigida e alcuni movimenti contribuiscono a ridurre la barriera di energia libera. Questi movimenti, che si verificano su una scala temporale di un picosecondo o più veloce, precedono dinamicamente il cambiamento nella coordinata del soluto. Mostriamo anche che questi movimenti proteici possono essere trattati come fluttuazioni di equilibrio con la costante di frequenza determinata principalmente dalla differenza di energia libera tra TS e RS. Le energie libere di attivazione stimate partendo dal presupposto che la coordinata del solvente è in equilibrio con la coordinata del soluto sono solo leggermente sottostimate rispetto a quelle ottenute nella descrizione di non equilibrio. Queste differenze possono essere giustificate dall'inclusione di un coefficiente di trasmissione nella costante di velocità TST.

Riteniamo che la nostra analisi di questa reazione possa essere facilmente estesa ad altri sistemi enzimatici e quindi fornire un quadro adeguato per una discussione quantitativa sul ruolo dei moti proteici nella catalisi.

metodi

Abbiamo usato uno schema computazionale di meccanica quantistica / meccanica molecolare (QM / MM) in cui il dicloroetano e la catena laterale del residuo Asp 124 sono descritti usando il Hamilton semi-empirico 41 PM3. Il resto dell'enzima e / o molecole d'acqua formano il sottosistema MM descritto per mezzo del potenziale ottimizzato di tutti gli atomi per la simulazione liquida (OPLS) per l'enzima 42 e un potenziale TIP3P flessibile per molecole d'acqua 43 . I parametri di Lennard-Jones per le interazioni QM / MM sono anche presi dal potenziale OPLS, ad eccezione di quelli per gli atomi di cloro, che sono presi da Gao e Xia 44 .

Per il sistema in soluzione acquosa abbiamo inserito dicloroetano e acetato in una scatola pre-equilibrata di molecole d'acqua del lato 55, 8 Å, eliminando tutte quelle molecole d'acqua con atomi di ossigeno trovati a <2, 8 Å da qualsiasi atomo non idrogeno dei frammenti di soluto. Per il sistema di substrato enzimatico le coordinate della struttura del cristallo di raggi X sono state prese dalla Protein Data Bank (codice 2DHC) 45 . Lo stato di protonazione dei residui titolabili è stato determinato utilizzando il programma PropKa 46 . L'intero sistema è stato posto in una scatola cubica pre-equilibrata di molecole d'acqua del lato 79, 5 Å. Per neutralizzare la carica della proteina, sono stati aggiunti 16 ioni di sodio in modo che sia nella soluzione che nel sistema enzimatico la carica totale fosse −1. Le coordinate iniziali per i TS in entrambi gli ambienti sono tratte dal nostro precedente lavoro 37, 38 . I sistemi sono stati ulteriormente equilibrati mediante 200 ps di simulazione di dinamica molecolare nell'ensemble NVT alla temperatura di riferimento di 298 K utilizzando l'integratore di Langevin con uno step temporale di 1 fs e condizioni al contorno periodiche. Un raggio di taglio commutato tra 12, 5 e 15 Å è stato applicato per tutti i tipi di interazione.

In questo lavoro abbiamo ottenuto FES usando due coordinate diverse, una coordinata soluto ( ξ ) e una coordinata ( e ) solvente. La FES può essere espressa come

Image

dove ρ ( x N ) è la densità di probabilità di trovare il sistema nella configurazione x N. In questo caso, la coordinata del soluto ( ξ ) è la combinazione antisimmetrica delle distanze del cloruro in uscita e dell'ossigeno in entrata nell'atomo di carbonio ( ξ = d (ClC) - d (OC)). La coordinata del solvente selezionata era la combinazione antisimmetrica del potenziale elettrostatico creato dall'ambiente sull'atomo di cloro in uscita e l'atomo di ossigeno in ingresso, il potenziale elettrostatico creato dall'ambiente MM sull'atomo di cloro:

Image

dove le somme corrono sui siti M dell'ambiente con cariche puntuali q j . Questa è una coordinata collettiva che coinvolge tutti gli atomi MM con un'influenza elettrostatica sugli atomi del donatore o dell'accettore.

I FES che corrispondono alle reazioni in soluzione acquosa e l'enzima sono stati ottenuti usando il campionamento ombrello 47, applicando vincoli parabolici al soluto e alle coordinate del solvente:

Image

La dinamica molecolare esplora preferenzialmente le configurazioni più probabili del sistema attorno ai valori di riferimento ξ 0 e s 0 . Le distribuzioni di probabilità congiunte delle due coordinate sono state ottenute mediante il metodo di analisi dell'istogramma ponderato (WHAM) 48 . Per risparmiare sui costi computazionali, sono state eseguite simulazioni con qualsiasi atomo oltre 25 Å di dicloroetano tenuto congelato. Un totale di 5.454 finestre di simulazione costituite da 5 ps di equilibrazione e 50 ps di produzione sono state impiegate per tracciare i FES nella soluzione e per l'enzima erano necessarie 3.100 finestre. Le costanti di forza utilizzate per mantenere il sistema ai valori di riferimento delle coordinate del soluto e del solvente erano 2.500 kJ mol −1 Å −2 e 0, 01 kJ −1 mol | e | 2, che ha fornito un buon controllo delle coordinate 32 .

È importante sottolineare che il PM3 / MM Hamiltoniano si traduce in barriere energetiche sistematicamente sovrastimate, ma le geometrie ottenute per RS ​​e TS sono abbastanza buone per stime ragionevoli degli effetti cinetici dell'isotopo 35 . Abbiamo quindi corretto l'errore sistematico nelle energie libere di attivazione mediante calcoli a punto singolo a livelli teorici più elevati. Con questo scopo abbiamo ottimizzato dieci strutture TS a partire da diverse configurazioni selezionate dalla simulazione corrispondente. Dopo il calcolo delle coordinate di reazione intrinseca, la barriera di energia è stata ottenuta a livello di PM3 / MM e mediante calcoli a punto singolo a livello M06-2X / 6-311 + G (2df, 2p) / MM 49 . Il termine dell'energia di correzione è stato valutato come la differenza media tra le barriere energetiche semi-empiriche e M06-2X.