L'analisi di gwas implica l'induzione mediata da nf-κb di cellule T infiammatorie nella sclerosi multipla | geni e immunità

L'analisi di gwas implica l'induzione mediata da nf-κb di cellule T infiammatorie nella sclerosi multipla | geni e immunità

Anonim

Soggetti

  • Studio sul legame genetico
  • Studi di associazione su tutto il genoma

Astratto

Per identificare i geni e le vie biologicamente rilevanti associate al rischio di sviluppare la sclerosi multipla (SM), è stato applicato il metodo di riduzione del rumore Genome-Wide Association Studies (GWAS-NR) ai dati di genotipizzazione della SM. Le regioni di associazione sono state definite in base al significato dei blocchi di squilibrio del legame. I geni candidati sono stati incrociati sulla base di una revisione della letteratura attuale, con attenzione alla funzione molecolare e proteine ​​che interagiscono direttamente. Le annotazioni supplementari e i punteggi di arricchimento del percorso sono stati generati utilizzando The Database for Annotation, Visualization and Integrated Discovery. L'insieme candidato di 220 geni di suscettibilità alla SM, con priorità GWAS-NR, è stato altamente arricchito con geni coinvolti in percorsi biologici correlati alla regolazione positiva dell'attivazione di cellule, linfociti e leucociti ( P = 6.1E-15, 1.2E-14 e 5.0E-14, rispettivamente). Tra i nuovi candidati genetici vi sono i regolatori chiave della segnalazione NF-κB e dei lignaggi CD4 + T helper tipo 1 (Th1) e T helper tipo 17 (Th17). È stato scoperto che un ampio sottogruppo di geni candidati alla SM prioritizzati da GWAS-NR interagiscono in un percorso trattabile che regola l'induzione mediata da NF-κB e l'infiltrazione dei lignaggi pro-infiammatori delle cellule T Th1 / Th17 e il mantenimento della tolleranza immunitaria da parte di T- cellule regolatorie. Questo meccanismo fornisce un contesto biologico che potenzialmente collega le osservazioni cliniche nella SM al paesaggio genetico sottostante che può conferire suscettibilità.

introduzione

La sclerosi multipla (SM) è una malattia autoimmune con eziologia sconosciuta, che colpisce principalmente le guaine mieliniche degli assoni neuronali nel sistema nervoso centrale. 1 La più forte e prima associazione genetica identificata con la SM si trova all'interno del principale complesso di istocompatibilità (MHC), 2 localizzato in HLA-DR2 (DRB1 * 1501) / DQ6 (DQB1 * 0602). 3, 4, 5 Successivi studi di mappatura genica e di associazione a livello del genoma (GWAS) hanno identificato loci di suscettibilità aggiuntivi al di fuori dell'MHC, inclusi i recettori IL2RA e IL7RA. 6, 7 Dal 2007, numerose altre varianti di rischio sono state identificate al di fuori dell'MHC, principalmente attraverso la replica su larga scala, GWAS aggiuntivo e meta-analisi di GWAS. 5, 6, 7, 8, 9, 10, 11 Una strategia di identificazione complementare ha sfruttato la genotipizzazione mirata delle varianti di suscettibilità attraverso diverse malattie autoimmuni, costruendo un 'ImmunoChip' personalizzato per studiare 194 loci non-MHC aventi associazione significativa a livello del genoma con almeno una malattia autoimmune. Questa strategia ha portato a 48 nuove varianti di suscettibilità, portando a> 100 il numero più recente di varianti di rischio per la SM al di fuori dell'MHC. 12

Una varietà di vie biologiche sono state implicate nell'eziologia della SM sulla base dell'analisi dell'arricchimento genico, tra cui adesione cellulare, 12, 13 attivazione dei leucociti, apoptosi, segnalazione Janus chinasi (JAK) -STAT, 14 attivazione NF-κB, 12 e attivazione delle cellule T e proliferazione. 10 Ulteriori sforzi possono essere potenziati dall'identificazione di nuovi loci di rischio per analisi funzionali di follow-up, esame di funzioni comuni e interazioni molecolari tra geni candidati ad alta probabilità e articolazione dettagliata di meccanismi biologici che uniscono le osservazioni cliniche nella SM con i numerosi varianti genetiche che suggeriscono di influenzare la responsabilità della malattia. Questi rappresentavano gli obiettivi del presente studio.

La riduzione del rumore GWAS (GWAS-NR) è un approccio per estendere il potere degli studi GWAS per rilevare nuove associazioni oltre a quelle rilevate dal GWAS tradizionale. In un contesto genomico, il "rumore" rappresenta differenze casuali nella distribuzione di alleli tra casi e controlli che non sono guidati dal segnale di interesse: disequilibrio del legame reale (LD) con una suscettività o variante causale. GWAS-NR amplifica i segnali di associazione replicati localmente su marker vicini e su sottoinsiemi di dati indipendenti, attenuando l'effetto del rumore casuale non correlato. Nelle simulazioni che hanno confrontato GWAS-NR con analisi dell'articolazione a singolo marcatore e test di Fisher, l'algoritmo GWAS-NR ha dimostrato una maggiore potenza per rilevare veri positivi in ​​una varietà di modelli di malattia. 15 L'algoritmo GWAS-NR è stato applicato qui ai dati a livello di genoma generati dall'International Multiple Sclerosis Genetics Consortium (IMSGC).

risultati

La regione di associazione più significativa identificata da GWAS-NR era un intervallo di 4, 4 MB che copre l'MHC sul cromosoma 6 (29 616-33 997 kb). Usando la soglia di significatività di P < 1.0E-04, sono stati identificati 191 blocchi LD significativi in ​​questa regione, separati da una media di 9 kb e non più di 332 kb. Il blocco LD più significativo ( P = 2.6E-55) era 1 kb a monte di HLA-DRA , che codifica per uno dei paraloghi della catena alfa HLA di classe II.

Tra 162 363 blocchi LD al di fuori dell'MHC, sono stati identificati 221 blocchi significativi ( P < 1.0E-4), 215 dei quali avevano almeno un altro blocco significativo nelle immediate vicinanze. La fusione di blocchi significativi adiacenti separati da <250 kb ha prodotto 84 distinti cluster genomici comprendenti i più forti segnali di associazione GWAS-NR nella SM all'esterno dell'MHC, corrispondenti a 220 geni candidati. Questi cluster di associazione e geni candidati sono presentati nella Figura 1.

Image

Significativi cluster di associazione non MHC nella SM identificati da GWAS-NR. I cluster di associazione sono definiti da uno o più blocchi LD significativi ( P < 1.0E-4) separati da <250 kb. Vengono visualizzati i geni più vicini ai SNP all'interno di ciascun cluster o entro 25 kb dai confini del cluster. I candidati noti correlati al sistema immunitario sono mostrati in grassetto. I candidati classificati come dimostranti un significato precedentemente riportato (sezione Metodi) sono mostrati in testo nero, con nuovi candidati mostrati in blu. † Il cluster include un blocco LD marginalmente significativo adiacente ( P = 1.06E-4). †† STAT5A, TBX21, IL12RB1, CD6, NFKBIZ e STAT1 sono inclusi a causa della vicinanza immediata ai cluster di associazione corrispondenti.

Immagine a dimensione intera

Sono stati esaminati cluster significativi di associazione identificati da GWAS-NR che non si sovrapponevano a regioni entro 1 MB dei 97 loci ad alta confidenza basati sull'analisi ImmunoChip 12 di IMSGC, dove è stata scelta la soglia di 1 MB per definire in modo conservativo nuovi risultati. Tra i nuovi MS immuno-correlati, i candidati alla suscettibilità all'interno o immediatamente adiacenti a queste regioni non sovrapposte sono: MAP3K14 , che codifica NF-κB inducente chinasi (NIK), un componente centrale dell'attivazione non canonica di NF-κB; RELA , che codifica per la subunità p65 di NF-κB; UBASH3B , che collabora con INPP5D per regolare negativamente la segnalazione di NF-κB a valle dell'attivazione del recettore Fc; 16 NCOA2 , un regolatore dose-dipendente dell'attività NF-κB; 17 TNFAIP8 , un regolatore negativo dell'attivazione di NF-κB che mantiene l'omeostasi immunitaria; 18 KAT5 , che funge da ponte molecolare tra l'attivazione RELA e i geni target NF-κB; 19 CSF2RB , mediatore di cascate di segnalazione JAK / STAT indotte da citochine; 20 STIM2 , che regola le funzioni dell'effettore autoimmune delle cellule di tipo 17 (Th17) Th1 e T helper; 21 TXK , un fattore di trascrizione specifico della cellula Th1; 22 DPP4 (CD26), un marker di attivazione delle cellule T implicato nella patologia autoimmune ed altamente espresso sulle cellule Th17; 23 CADM1 , una molecola di adesione cellulare che promuove la citotossicità mediata dalle cellule; 24 DAP , un regolatore positivo della morte cellulare mediata da IFN-γ 25 e RGCC , un regolatore dell'apoptosi mediata da cellule T. 26

I cluster significativi di associazione GWAS-NR a più di 1 MB dai loci ImmunoChip includono anche tre geni immuno-correlati per i quali è stata segnalata un'associazione suggestiva con la SM in studi precedenti. Questi sono: NFKBIZ , che codifica per IkBζ, un repressore dell'attivatore di segnalazione NF-κB a monte della produzione di IL6 e differenziazione Th17; 27, 28 INPP5D , che codifica un regolatore negativo della segnalazione di NF-κB e della produzione di IL12 nei macrofagi; 29, 30, 31 e TEC , che codifica per una proteina tirosina chinasi richiesta per l'espressione indotta dai lipopolisaccaridi del fattore di necrosi tumorale (TNF) -α, IL1β e IL6. 14, 32

Sei geni identificati da GWAS-NR e che avevano precedentemente riportato significatività nella SM non sono coperti entro 1 MB dai 97 loci ImmunoChip. Questi includono MERTK , una tirosina chinasi recettoriale che regola negativamente l'attivazione di NF-κB indotta dai lipopolisaccaridi; 33, 34 MALT1 , che forma un complesso trimerico con BCL10 e CARD11 per regolare la segnalazione NF-κB necessaria per la generazione di cellule Thuro neuroinfiammatorie; 35 IL12B , un attivatore di STAT4 a monte della differenziazione Th1; 36 BATF , che codifica per il fattore base di trascrizione con cerniera leucina, che insieme a RORC (RORγt) fa parte della firma molecolare per tutte le cellule che producono IL-17 in vivo, 37, 38 SOX8 , un fattore di trascrizione espresso nello sviluppo della cresta neurale, 11, 39 e ZNF746 , che reprime trascrizionalmente il coattivatore PPAR-γ. 40

Per valutare la rigidità della soglia di significatività del blocco LD a priori ( P < 1.0E-04), sono stati identificati blocchi LD corrispondenti a 111 geni più vicini (definiti dalla posizione genomica) ai loci che avevano precedentemente riportato significatività nella SM sulla base di analisi a singolo marker . Cinquantanove di questi geni (53, 2%) sono stati inclusi tra i blocchi LD che soddisfano questa soglia di significatività, con quattro geni aggiuntivi di significato precedentemente riportato catturati da cluster che si uniscono a blocchi LD significativi entro 250 kb di prossimità. Un livello di significatività del blocco LD alternativo di 1.0E-03 aumenterebbe il numero di candidati suscettibili da 220 a 568.

Sulla base di 162 363 blocchi LD al di fuori dell'MHC, sono stati identificati 30 blocchi che soddisfano un livello di significatività corretto da Bonferroni di P < 3.1E-07. I candidati immunocomponenti noti in questi blocchi LD, basati sulla classificazione ImmPort (//immport.niaid.nih.gov) e sulla revisione della letteratura attuale, includevano CLEC16A , CD86 (B7-2), PTGER4 , IL2RA , FAM213B , GFI1 , TNFRSF1A , EOMES , STAT3 , FCRL3 , RPS6KB1 , GPR65 , TNFSF14 e CD58 . Sebbene MANBA non sia classificato come immuno-correlato, il blocco LD più significativo associato a questo gene è immediatamente adiacente all'NFKB1 . Solo 13 dei 111 geni con significato precedentemente riportato nella SM erano associati a blocchi LD che soddisfacevano la soglia di Bonferroni.

I 220 geni di suscettibilità candidati non-MHC identificati da GWAS-NR sono elencati nella Tabella Supplementare 1. Tra questi geni candidati, 57 erano localizzati> 1 MB da loci ImmunoChip significativi, con i restanti 163 candidati situati entro 1 MB da quei loci. I geni con significato precedentemente riportato nella SM comprendevano 63 dei 220 candidati.

I 220 geni nel set di candidati GWAS-NR sono stati esaminati per l'arricchimento funzionale nei percorsi biologici. L'arricchimento funzionale più forte riportato da DAVID 41, 42 per l'insieme di geni candidati era la regolazione positiva dell'attivazione cellulare (termine GO 0050867, P = 6, 1E-15) con una serie di vie altamente sinonime (ad esempio, regolazione positiva dell'attivazione dei linfociti, regolazione positiva dell'attivazione dei leucociti) che riflette lo stesso sottoinsieme di geni. Ulteriori percorsi significativi includevano regolazione positiva del processo del sistema immunitario (termine GO 0002684, P = 2, 6E-13), regolazione della proliferazione dei linfociti (termine GO 00050670, P = 2.2E-09), regolazione dell'immunità mediata dai linfociti (termine GO 0002706, P = 8.2E-09) e regolazione della produzione di citochine (termine GO 0001817, P = 1.7E-08). Le funzioni biologiche comuni dell'insieme di geni candidati alla SM identificato da GWAS-NR e i geni specifici responsabili dell'arricchimento del percorso sono riportati nella Tabella supplementare 2.

A fini comparativi, i geni al di fuori dell'MHC sono stati classificati in base al più piccolo valore P dell'analisi articolare a singolo marker. La soglia di significatività del marcatore singolo richiesta per acquisire 220 geni candidati era 5.4E-06. L'arricchimento funzionale più forte riportato da DAVID per questo set genetico è stato anche la regolazione positiva dell'attivazione cellulare, ma con minore significato ( P = 2.3E-12) rispetto al set candidato GWAS-NR, risultante dall'inclusione di un minor numero di geni rilevanti in questo percorso. Rispetto al significato di arricchimento del percorso tra i candidati GWAS-NR, è stato osservato un arricchimento uniformemente meno significativo tra i 10 percorsi biologici più classificati utilizzando questi geni definiti dal significato di singolo marker e nel 90% dei 20 percorsi più classificati, anche se abbinato per identici termini di ontologia genica.

Per identificare candidati potenzialmente importanti non catturati da GWAS-NR al livello di significatività a priori di 1.0E-04, sono state esaminate regioni entro 250 kb dei 97 loci ImmunoChip. 511 geni in queste regioni non sono stati inclusi nel set di candidati identificato da GWAS-NR. Come osservato nel set di candidati GWAS-NR, i più forti arricchimenti funzionali segnalati da DAVID per questi geni aggiuntivi erano in domini correlati all'immunità mediata dalle cellule, in particolare la regolazione della differenziazione dei linfociti (termine GO 00045619, P = 1, 8E-04) e regolazione di attivazione dei leucociti (termine GO 0002694, P = 3.1E-04).

Discussione

I nostri risultati indicano che al di fuori della regione MHC, il background genetico della SM è arricchito con numerose varianti che regolano l'attivazione e la proliferazione delle cellule immunitarie effettrici, estendendo le prove genetiche che implicano la SM come condizione infiammatoria autoimmune. 6 GWAS-NR dà la priorità a un intervallo combinato di 5, 2 MB del genoma non-MHC, incluse diverse nuove regioni di associazione. Il set di geni candidato risultante include componenti centrali della segnalazione di NF-κB ( MAP3K14, RELA ) e fornisce nuove prove o prove aggiuntive per la regolazione dell'attivazione di NF-κB da parte dei recettori legati alla membrana ( UBASH3B, INPP5D, NCOA2, TNFAIP8, KAT5 e NFKBIZ ) . Questi risultati rafforzano un ruolo precedentemente suggestivo per l'attivazione di NF-κB nella SM implicata da significativi loci di associazione adiacenti a BCL10 e CARD11 (rif. 12) e dall'analisi funzionale delle varianti associate alla SM in prossimità di NF-κB1 e in un introne di TNFRSF1A. 43 Ulteriori nuovi candidati identificati da GWAS-NR includono regolatori dell'induzione CD4 + Th1 e Th17 ( STIM2, DPP4, TXK ) e apoptosi ( CADM1, DAP, RGCC ), fornendo ulteriore supporto per il coinvolgimento di questi percorsi nella SM. 10, 14 Diversi candidati immuno-correlati identificati da GWAS-NR entro 1 MB di loci ImmunoChip significativi non sono inclusi tra i geni con significato precedentemente riportato nella SM, inclusi SOCS1, TNFRSF14, GFI1, STAT1, STAT5A, CD5, KLRB1, AMICA1, IL12RB1, TBKBP1, CD80 e REL .

L'esame dei punteggi di blocco LD di geni con significato precedentemente riportato nella SM suggerisce che il livello di significatività del blocco LD a priori ( P < 1.0E-04) scelto a fini di segnalazione è conservativo. I blocchi identificati coprono circa lo 0, 2% del genoma non-MHC e catturano oltre il 50% dei geni precedentemente riportati come prossimali ad almeno un polimorfismo significativo a singolo nucleotide (SNP) significativo a livello del genoma nella SM sulla base di un singolo marcatore precedentemente pubblicato analisi.

Sebbene l'algoritmo GWAS-NR sia adatto all'identificazione e alla definizione delle priorità dei candidati e delle regioni per lo studio di follow-up, il processo di filtraggio produce valori P che hanno meno probabilità di ottenere significati a livello del genoma, rispetto ai valori P a singolo marker che possono beneficiare dei contributi del rumore. Inoltre, GWAS-NR non può ottenere alcun vantaggio rispetto all'analisi a marker singolo quando i marker di fianco forniscono poche informazioni supplementari, che possono verificarsi quando un vero locus viene digitato direttamente e viene utilizzato un metodo di associazione a singolo marker. 15 È probabile che ulteriori variazioni genetiche correlate alla SM non siano identificate da alcuna tecnica di associazione a livello del genoma. Pertanto, i loci di suscettibilità candidati identificati da GWAS-NR non sono esaustivi e possono essere considerati complementari ai loci ad alta confidenza identificati con metodi alternativi.

GWAS-NR riduce il rumore statistico sfruttando la correlazione locale dei segnali di associazione attraverso più set di dati, mentre l'analisi della via biologica sfrutta la concomitanza di più geni candidati all'interno di vari processi biologici per identificare funzioni altamente rappresentate tra questi geni candidati. Il raggruppamento di candidati in cluster di associazioni locali può anche fornire un contesto informativo, sia perché i segnali di associazione in un determinato locus possono riflettere una variante causale in una posizione diversa in LD, sia perché i cluster locali di loci di suscettibilità possono includere geni funzionalmente correlati. Tutti questi approcci possono essere visti come strategie di riduzione del rumore. Applicati congiuntamente, osserviamo che la maggior parte dei cluster di associazione identificati da GWAS-NR include uno o più geni immuno-correlati con funzioni molecolari comuni a quelli di altri cluster. La tabella supplementare 1 include riferimenti aggiuntivi relativi ai singoli candidati.

Sebbene non sia possibile escludere un ruolo nella SM per i geni suscettibili candidati che non sono caratterizzati o non hanno una funzione immunologica comune o nota, numerosi candidati immuno-correlati identificati e prioritari da GWAS-NR hanno ruoli ben definiti in percorsi biologicamente rilevanti come Segnalazione TNF-α, trascrizione NF-κB, produzione di citochine, segnalazione JAK / STAT, differenziazione delle cellule T e adesione delle cellule. Molte di queste funzioni biologiche sono state implicate individualmente nella SM sulla base di precedenti analisi di arricchimento geniche. 10, 12, 13, 14, 44

Proponiamo che nella SM queste funzioni non siano distinte l'una dall'altra, ma costituiscano invece un meccanismo coordinato che può contribuire alla patologia della SM. Sulla base delle funzioni molecolari e delle interazioni precedentemente riportate tra i geni candidati alla SM identificati da GWAS-NR, i geni responsabili di un significativo arricchimento delle funzioni biologiche comuni sono stati trovati per interagire in un percorso trattabile che regola l'induzione e l'infiltrazione mediate da NF-κB lignaggi infiammatori delle cellule T Th1 / Th17 e mantenimento della tolleranza immunitaria da parte delle cellule T regolatorie soppressive. La Figura 2, costruita sulla base delle interazioni segnalate tra i geni candidati alla suscettibilità alla SM prioritizzati da GWAS-NR, fornisce una panoramica grafica di questo percorso.

Image

Regolazione mediata da NF-κB dei lignaggi infiammatori e immunosoppressivi delle cellule T CD4 +. Meccanismo proposto di patologia della sclerosi multipla implicato nell'analisi del percorso di geni candidati GWAS-NR. Questo schema semplificato presenta un insieme abbreviato di interazioni in un formato esploso per la tracciabilità, utilizza etichette generiche per diversi candidati omologhi (ad esempio, B7 rappresenta sia CD80 che CD86 ) e non descrive singolarmente ogni gene candidato implicato nella letteratura attuale come pertinente a questo percorso. L'attivazione dei recettori delle cellule T (TCR) legati alla membrana, 75 recettori di riconoscimento del modello come recettori Toll-like a cellule dendritiche e lectine di tipo C 76, 77, 78 e recettori della superfamiglia TNF 79, 80 avviano cascate di trasduzione del segnale che portano all'attivazione di programmi trascrizionali NF-κB attraverso percorsi canonici e non canonici, con conseguente produzione di citochine che determina l'equilibrio tra cellule infiammatorie Th1 e Th17 e cellule T regolatorie immunosoppressive tramite segnalazione JAK / STAT ai fattori di trascrizione specifici del lignaggio. 81 L' attivazione di NF-κB promuove anche l'espressione di molecole di adesione cellulare sull'endotelio vascolare, che consentono l'infiltrazione di cellule T infiammatorie attraverso la barriera emato-encefalica. 62, 82 CLEC, lectina di tipo C; FcR, recettore Fc; LPS, lipopolisaccaride; TLR, recettore a pedaggio; TNFR, recettore TNF-α; Th1, cella tipo T helper 1; Treg, cellula T-regolatoria.

Immagine a dimensione intera

Proponiamo questo meccanismo come rilevante per la patologia della SM sulla base di numerosi geni di rischio implicati da GWAS-NR che agiscono come mediatori chiave con ruoli cooperativi a ciascun livello di questo percorso, comprendendo sia nuovi candidati che geni precedentemente segnalati per la SM. La regolazione dell'infiammazione Th1 / Th17 mediata da NF-κB e la tolleranza Treg comporta una catena di interazioni comprendente l'attivazione del recettore, la trasduzione del segnale, la trascrizione NF-κB, la produzione di citochine, la segnalazione JAK / STAT, l'induzione delle cellule T e la motilità cellulare mediata dall'adesione e può essere ben descritto con specifico riferimento alle interazioni tra questi geni candidati.

Diversi geni della famiglia TNF sono inclusi nel set di candidati GWAS-NR. I membri della famiglia TNF sono tra gli induttori maggiormente caratterizzati della segnalazione di NF-κB. 45 La segnalazione di NF-κB è un regolatore critico dell'equilibrio tra infiammazione e tolleranza, poiché l'attivazione di NF-κB sembra essere necessaria sia per l'induzione di cellule Th17 proinfiammatorie che di cellule Treg immunosoppressive. 46

L'attivazione del membro della superfamiglia della necrosi tumorale TNFRSF14 da parte del suo ligando TNFSF14, entrambi candidati identificati da GWAS-NR, agisce come un segnale costimolatorio delle cellule T che provoca l'induzione mediata da NF-κB di geni pro-infiammatori. 47 L' induzione di NF-κB da parte di TNF-α promuove anche l'espressione delle molecole di adesione cellulare ICAM1 e VCAM1. 48 Sebbene la terapia anti-TNF non specifica non comporti la remissione dei sintomi nella SM, il blocco selettivo di TNFRSF1A sopprime significativamente l'infiltrazione di cellule infiammatorie Th1 e Th17 e migliora significativamente i risultati clinici nell'encelpalomielite autoimmune sperimentale murina, un modello animale primario di patologia della SM . 49 Al contrario, la clearance difettosa dell'accumulo di TNFRSF1A è associata all'attivazione di NF-κB, all'eccessiva secrezione di IL1β e all'infiammazione cronica. 50

NF-κB è un fattore di trascrizione composto da omo- o eterodimeri di cinque subunità: RELA, RELB, REL, NFKB1 e NFKB2. L'attivazione canonica di NF-κB innesca la produzione di citochine come IL1β, IL6 51 e IL12 ed è inibita da RPS6KB1 (S6K1). La soppressione di questa inibizione provoca una maggiore produzione di citochine infiammatorie. 19 La risposta delle citochine alla segnalazione di NF-κB dipende dal profilo di attivazione della subunità, 52 ed è soggetta alla regolazione coordinata da altri percorsi di segnalazione.

L'attivazione ottimale del recettore delle cellule T della via canonica NF-κB richiede la costimolazione 53 da CD80 (B7-1) o CD86 (B7-2) ed è mediata da un complesso trimerico di proteine ​​adattatrici noto come CARD11-BCL10-MALT1 ( CBM) complesso. La via non canonica NF-κB prevede l'attivazione di MAP3K14 ('NIK') da parte dei membri della famiglia TNF, come ad esempio l'attivazione CD40 di TRAF3. Tutti i precedenti sono tra i candidati al rischio per la SM identificati da GWAS-NR. L'espressione di NIK da parte delle cellule dendritiche è necessaria per stabilire le risposte Th1 e Th17. 54 NIK coordina anche la segnalazione da parte del recettore delle cellule T e IL6 per l'attivazione di STAT3, contribuendo all'induzione delle cellule Th17. 55

Le cellule T CD4 + si differenziano in cellule effettrici o cellule T regolatorie a seconda dei segnali specifici del lignaggio determinati dal patogeno e dal microambiente risultante che si incontra. La produzione di citochine attiva i trasduttori di segnale JAK e gli attivatori della via di trascrizione (STAT). Le cellule dendritiche non infette producono TGFβ, che attiva l'induzione STAT5 di FOXP3, il fattore di trascrizione specifico del lignaggio per le cellule T regolatorie. La differenziazione di Th1 dipende rispettivamente dall'attivazione di IL12 e IFN-γ di STAT4 e STAT1, con conseguente induzione del fattore di trascrizione TBX21. Il fattore di trascrizione EOMES può compensare la carenza di TBX21 e favorisce lo sviluppo di Th1. 56 Il programma di differenziazione Th17 prevede l'attivazione IL6 di STAT3, che è migliorata da SOCS1, e induce il fattore di trascrizione specifico del lignaggio RORC. 57 Poiché IL6 è una delle citochine NF-κB più fortemente indotte, 58 NF-κB ha un ruolo particolarmente importante nell'induzione delle cellule infiammatorie del Th17. REL e RELA inducono direttamente RORC e ​​NF-κB regola anche la produzione di IL6 e IL23. 18

Le citochine IL2 e IL7 aiutano a regolare l'equilibrio tra infiammazione e tolleranza. L'espressione di IL2RA e la presenza di IL2 sono fondamentali per la generazione di cellule Treg. 59 IL2 ha un ruolo centrale nel mantenimento della tolleranza periferica eliminando le cellule T autoreattive e il knockout di IL2RA (CD25) provoca la malattia autoimmune nei topi. 60 IL7 è essenziale per la sopravvivenza delle cellule T e il recettore ad alta affinità IL7R è espresso anche sulle cellule Treg. Tuttavia, la presenza di IL7 compromette la capacità delle cellule Treg di sopprimere la proliferazione delle cellule T autoreattive in risposta all'attivazione del recettore delle cellule T da parte degli autoantigeni, promuovendo la loro espansione incontrollata di ambienti ricchi di IL7. 61

Le cellule T infiammatorie normalmente non attraversano la barriera emato-encefalica a meno che non vengano interrotte. L'espressione delle molecole di adesione cellulare ICAM1 e VCAM1 sull'endotelio vascolare è promossa dall'attivazione di NF-κB e inibita da S1PR5. Il knockdown di S1PR5 abolisce la quiescenza della barriera emato-encefalica e aumenta l'espressione di ICAM1 e VCAM1 in modo dipendente da NF-κB, 62 creando un ambiente permissivo per l'infiltrazione delle cellule T infiammatorie nel sistema nervoso centrale. AMICA1 contribuisce anche al legame dei leucociti che esprimono integrina α4β1 (VLA-4) sulle loro membrane plasmatiche alle molecole di adesione endoteliale. 63

La regolazione dell'infiammazione Th1 / Th17 mediata da NF-κB e la tolleranza Treg implicate dal set di geni candidato GWAS-NR è coerente con le osservazioni cliniche nella SM. Le cellule T attivate da pazienti con SM producono livelli elevati di IL-17. Il blocco della segnalazione di IL6R riduce questa produzione, aumenta il rilascio di IL10 da parte delle cellule T CD4 + attivate e ripristina la capacità dell'idrocortisone di inibire la proliferazione delle cellule T. 64 Un'associazione positiva tra percentuali di cellule Th17 e Treg si trova in pazienti con SM con remissione, ma non durante la recidiva, 65 mentre la prevalenza di cellule Th17 nella CSF è significativamente elevata durante la recidiva. 66 Espressione elevata di IFN-γ è osservata sia in fase precoce che in recidiva, l'espressione di 67 e STAT3 è persistentemente più elevata nelle cellule T CD4 + nei pazienti che successivamente si convertono in SM clinicamente definita rispetto ai pazienti che non lo fanno e controllano. 67 Questo profilo di citochine è coerente con l'infiltrazione di lignaggi pro-infiammatori Th1 / Th17 durante le esacerbazioni, con immunosoppressione da parte delle cellule Treg durante la remissione.

A livello trascrizionale, l'analisi del trascrittoma a cellule T identifica la regolazione aberrante dell'espressione genica da parte di NF-κB come biomarcatore di recidiva nella SM sulla base di 43 geni espressi in modo differenziato. 68 La sovraregolazione della colorazione nucleare sia per NF-κB che per JNK è stata trovata su una grande percentuale di oligodendrociti ai margini delle lesioni attive e su microglia / macrofagi attraverso placche attivamente demielinizzanti. 69

Materiali e metodi

Il set di dati utilizzato per l'analisi comprendeva 9772 soggetti con SM e 17 376 controlli sani da 15 paesi; la maggior parte dei quali sono stati assunti dall'IMSGC e dal consorzio Wellcome Trust Case Control. Tutte le persone in questo studio hanno dato il consenso informato con l'approvazione dei Comitati etici locali competenti o dei consigli di revisione istituzionale. I dettagli dello schema di accertamento e del controllo di qualità dei campioni sono stati descritti in precedenza. 10 Per massimizzare la capacità di GWAS-NR nell'amplificare segnali di associazione replicati localmente su loci in sottoinsiemi di dati indipendenti, i campioni sono stati divisi in sette strati specifici della popolazione: Australia (793 MS, controllo 2160), Europa centrale (2242 MS, 2046 controllo), Mediterraneo (950 MS, controllo 1317), Finlandia (581 MS, controllo 2165), Scandinavia (MS 1970, controllo 2049), Regno Unito (MS 1854, controllo 5175) e Stati Uniti (1382 MS, controllo 2464).

Pertanto, oltre al controllo di qualità SNP che è stato effettuato in precedenza, 10 risultanti in 465 434 SNP autosomici, il controllo di qualità è stato effettuato all'interno di ciascuno di questi strati assegnati. Ciò ha incluso la rimozione di SNP con un basso tasso di chiamata (<95%), con una mancanza differenziale tra individui con SM e controlli sani ( P < 1.0E-03) e che erano fuori equilibrio Hardy-Weinberg (HWE) ( P < 1.0E -05). Ciò ha comportato 447 419 SNP che hanno superato il controllo di qualità in tutti e sette gli strati e sono stati successivamente analizzati.

Eigenstrat 70 è stato eseguito separatamente all'interno di ogni strato usando SNPs 43K indipendenti ( R 2 <0, 1) con frequenza allelica minore 0, 1 attraverso il genoma. L'analisi della regressione logistica è stata eseguita all'interno di ogni strato usando PLINK 71 e adattando i primi cinque componenti principali di Eigenstrat per tenere conto della stratificazione residua della popolazione. Dopo l'aggiustamento della dimensione del campione, il fattore di inflazione genomica in ciascuno strato era <1, 05, indicando prove minime per la stratificazione residua della popolazione. 72

Un valore P comune su tutti gli strati è stato ottenuto usando una meta-analisi della varianza inversa dei sette strati, secondo un modello a effetti fissi. I valori P di ciascuno strato e dell'analisi congiunta sono stati quindi inseriti nell'algoritmo GWAS-NR. L'algoritmo GWAS-NR (versione 2) è stato eseguito come uno script Matlab ed è disponibile da //hihg.med.miami.edu/software-download/gwas-nr-version-2.0. La riduzione del rumore si ottiene applicando un filtro lineare all'interno di una finestra scorrevole per identificare le regioni genomiche che dimostrano profili correlati di associazione tra più sottoinsiemi; catturare segnali di associazione dai marker circostanti in LD e sopprimere segnali che non sono replicati in più set di dati o attraverso marker di fianco. L'algoritmo produce un valore P ponderato per ciascun SNP, da utilizzare nel dare priorità alle regioni genomiche e ai geni associati per lo studio di follow-up. 15

Il GWAS-NR e i metodi di analisi congiunta sono stati confrontati per la sensibilità e la specificità nell'identificazione dei loci target definiti, a fini comparativi, poiché tutti i loci genotipizzati entro 250 kb di 97 segnali di associazione MS indipendenti precedentemente identificati dall'IMSGC usando un array di genotipizzazione 'ImmunoChip' personalizzato con 29 300 soggetti con SM e 50 794 controlli. 12 L' area sotto la curva caratteristica operativa del ricevitore era 0, 635 per l'analisi congiunta e 0, 719 per GWAS-NR. Ad ogni livello di specificità, GWAS-NR ha dimostrato una maggiore sensibilità rispetto all'analisi congiunta nell'identificazione di questi loci target.

Per valutare i risultati di GWAS-NR da più punti di vista, sono stati esaminati loci significativi attraverso singoli geni, blocchi LD e cluster di associazione definiti da più blocchi LD significativi nelle immediate vicinanze. Questo contesto è stato considerato potenzialmente informativo in quanto segnali di associazione forti in un dato marker possono riflettere una variante causale in una posizione diversa in LD con quel marker e poiché i cluster fisici di loci suscettibili nella stessa regione di associazione possono includere geni funzionalmente correlati. 73

I blocchi LD sono stati definiti usando PLINK 71 e secondo il metodo proposto da Gabriel et al. 74 SNP singoli non in un blocco LD con marker circostanti e tra due blocchi LD sono stati trattati come blocchi SNP singoli. A qualsiasi SNP situato tra due SNP all'interno dello stesso blocco LD è stato assegnato lo stesso ID blocco.

Il significato di questi blocchi LD è stato calcolato utilizzando il Metodo del prodotto troncato di Zaykin. 74 È stato calcolato un punteggio combinato per i marker in ciascun blocco LD, basato sul prodotto dei valori P GWAS-NR che erano al di sotto di una soglia di 0, 05. Un algoritmo Monte Carlo è stato utilizzato per testare il significato del punteggio combinato. Per generare una serie ridotta di candidati associativi ad alta priorità, è stato scelto un livello di significatività a priori di P < 1.0E-04 a fini di rendicontazione.

Per identificare regioni genomiche distinte che comprendono i segnali di associazione GWAS-NR più forti, i cluster di associazione sono stati definiti unendo blocchi LD adiacenti significativi ( P < 1.0E-04) separati da <250 kb. Per i cluster che comprendono più di un blocco LD, il valore P più basso tra questi blocchi è stato identificato ai fini dell'ordinamento e della discussione. Il set di geni candidato è stato definito per includere il gene più vicino (definito dalla posizione genomica) a ciascun SNP all'interno di ciascun cluster, nonché il gene più vicino a ciascun SNP entro 25 kb dai confini del cluster. Sono stati esaminati come potenziali candidati anche geni correlati all'immunità e blocchi LD marginalmente significativi ( P < 1.1E-04) immediatamente adiacenti a cluster di associazione significativi.

I geni candidati sono stati classificati come dimostranti un significato precedentemente riportato nella SM se inclusi tra 111 geni segnalati dall'IMSGC come prossimali a un SNP che dimostrano un significato a livello del genoma ( P < 5.0E-08) o basato su associazione forte ( P < 5.0E-07) su analisi di genotipizzazione GWAS 10, 11 e ImmunoChip. 12 Sebbene questa classificazione sia indicativa di geni candidati corrispondenti a loci di associazione statisticamente significativi e precedentemente riportati, non rappresenta un elenco esaustivo di geni che potrebbero altrimenti essere implicati nella SM e le varianti associate potrebbero non essere stabilite come rilevanti per la SM in base a prove funzionali.

Per studiare le relazioni funzionali tra i geni dell'insieme dei candidati, ogni candidato è stato annotato manualmente e referenziato, sulla base di una revisione della letteratura attuale, con attenzione alla funzione molecolare e proteine ​​direttamente interagenti. I geni candidati sono stati classificati come immuno-correlati in base al coinvolgimento segnalato nella funzione immunitaria o all'inclusione nell'elenco completo dei geni immuno-correlati gestito dal Database di immunologia e dal portale di analisi (ImmPort //immport.niaid.nih.gov). Le annotazioni funzionali supplementari e i punteggi di arricchimento del percorso sono stati generati utilizzando DAVID (The Database for Annotation, Visualization and Integrated Discovery) versione 6.7. 41, 42

conclusioni

Il GWAS-NR è stato applicato ai dati della SM, con l'obiettivo di dare la priorità alle regioni genomiche e ai geni associati per l'analisi dei percorsi biologici, sequenziamento mirato e analisi funzionale di follow-up. GWAS-NR dà la priorità a un intervallo combinato di 5, 2 MB comprendente ~ 0, 2% del genoma non-MHC. L'insieme candidato risultante di 220 geni di suscettibilità alla SM è altamente arricchito con geni coinvolti nella regolazione positiva dell'immunità mediata dalle cellule. Tra i nuovi candidati vi sono i principali regolatori della segnalazione di NF-κB e la regolazione dei lignaggi CD4 + Th1 e Th17. Sulla base di funzioni e interazioni molecolari precedentemente riportate, è stato scoperto che un ampio sottogruppo di geni candidati alla SM interagiscono in un percorso trattabile che regola l'induzione mediata da NF-κB e l'infiltrazione dei lignaggi pro-infiammatori delle cellule T Th1 / Th17 e il mantenimento di tolleranza immunitaria da parte delle cellule T regolatorie. Questo meccanismo fornisce un contesto biologico che potenzialmente collega le osservazioni cliniche nella SM al panorama genetico sottostante che può conferire suscettibilità e può aiutare a informare gli sforzi per sviluppare terapie mirate.

Informazione supplementare

File Excel

  1. 1.

    Tabella supplementare 1

  2. 2.

    Tabella Supplementare 2

    Informazioni supplementari accompagnano questo documento sul sito Web di G enes e Immunity (//www.nature.com/gene).