Le basi genomiche degli adattamenti della tempistica circadiana e circalunare in un moscerino | natura

Le basi genomiche degli adattamenti della tempistica circadiana e circalunare in un moscerino | natura

Anonim

Soggetti

  • Regolamento circadiano
  • Genetica ecologica
  • Genetica evolutiva
  • genoma

Astratto

Gli organismi utilizzano orologi endogeni per anticipare cicli ambientali regolari, come giorni e maree. Le varianti naturali che comportano un comportamento o una fisiologia a tempo diverso, noti come cronotipi nell'uomo, non sono state ben caratterizzate a livello molecolare. Abbiamo sequenziato il genoma di Clunio Marinus , un moscerino marino la cui riproduzione è cronometrata da orologi circadiani e circalunari. I moscerini di diverse località mostrano adattamenti di temporizzazione genetica specifici per ceppo. Abbiamo esaminato la variazione genetica in cinque ceppi di C. marinus da diverse posizioni e mappato loci di tratti quantitativi per cronotipi circalunari e circadiani. La regione più fortemente associata ai cronotipi circadiani genera differenze specifiche del ceppo nell'abbondanza delle varianti di giunzione calcio / calmodulina-chinasi II.1 (CaMKII.1). Dato che varianti equivalenti hanno dimostrato di alterare l'attività di CaMKII in Drosophila melanogaster e C. marinus ( Cma ) - CaMKII.1 aumenta l'attività trascrizionale del dimero delle proteine ​​circadiane Cma- CLOCK e Cma- CYCLE, suggeriamo che la modulazione dello splicing alternativo è un meccanismo per l'adattamento naturale nei tempi circadiani.

Principale

Intorno alla luna nuova o piena, durante alcune ore specifiche che circondano la bassa marea, milioni di moscerini non mordaci della specie C. marinus emergono dal mare per eseguire la loro danza nuziale. Gli adulti vivono solo per poche ore, durante le quali si accoppiano e oviposano. Devono quindi emergere in modo sincrono e - dato che lo sviluppo embrionale, larvale e pupale ha luogo nel mare - in un momento in cui le maree più estreme espongono in modo affidabile l'habitat larvale. Le basse maree più basse si verificano in modo prevedibile durante giorni specifici del mese lunare a una determinata ora del giorno. Di conseguenza, l'emergenza adulta in C. marinus è sotto il controllo degli orologi circalunari e circadiani 1, 2 . In particolare, anche se la bassa marea più bassa si ripresenta invariabilmente in una determinata posizione, la loro tempistica differisce tra le posizioni geografiche 3 . Di conseguenza, ceppi di C. marinus provenienti da posizioni diverse (Extended Data Fig. 1a) mostrano adattamento locale nei tempi di emergenza circadiani e circalunari (Extended Data Fig. 1b, c). Gli incroci tra i ceppi di Jean e Por hanno mostrato che le differenze nei tempi circadiani e circalunari sono determinate geneticamente 4, 5 e ampiamente spiegate da due loci di tratti quantitativi circadiani e due circalunari (QTL) 6 .

Gli studi sulla variazione temporale o sui cronotipi negli animali e nell'uomo si sono spesso concentrati sui geni candidati dall'oscillatore trascrizionale trascrizionale circadiano. In D. melanogaster , i polimorfismi nel periodo dei geni dell'orologio circadiano centrale, il tempo senza tempo e il criptocromo sono associati a differenze adattative nella compensazione della temperatura 7, foto-reattività dell'orologio circadiano 8 e ritmi di emergenza 9 . Mentre questi studi offrono approfondimenti sull'evoluzione delle molecole note dell'orologio circadiano, gli studi di associazione su tutto il genoma 10, 11 e altri approcci genetici avanzati (rivisti in rif.12) sono essenziali per fornire una valutazione completa e imparziale della variazione temporale naturale, per esempio sottostante disturbi della fase del sonno umana. Mentre la natura adattativa dei cronotipi umani rimane poco chiara, i cronotipi di C. marinus rappresentano adattamenti evolutivi al loro habitat. Il nostro studio mirava a identificare le basi genetiche dell'adattamento di C. marinus alla sua specifica "nicchia temporale" ecologica. Inoltre, la dissezione genetica di varianti naturali adattive di ritmi non circadiani 13, come anche presente in C. marinus, può fornire un punto di accesso ai loro meccanismi molecolari sconosciuti.

Come punto di partenza per queste analisi, abbiamo sequenziato, assemblato, mappato e annotato un genoma di riferimento di C. marinus .

Il genoma di Clunio e QTL per il timing

Il nostro genoma di riferimento CLUMA_1.0 del ceppo di laboratorio Jean conteneva 85, 6 Mb di sequenza (Tabella 1), vicino alla precedente stima basata sulla citometria a flusso di 95 Mb 6, sottolineando che i chironomidi hanno generalmente piccoli genomi 14, 15, 16 . L'assemblaggio finale ha un'impalcatura N50 di 1, 9 Mb. La genotipizzazione a livello del genoma di una famiglia di mappatura con sequenziamento del DNA associato al sito di restrizione ha consentito l'ancoraggio costante del 92% della sequenza di riferimento lungo una mappa di collegamento genetico (Fig. 1a e Dati estesi Fig. 2), migliorando la mappa di collegamento originale (Supplementare Metodi 5). L'annotazione del genoma automatizzata ha prodotto 21.672 modelli genici. La somiglianza proteica e le trascrizioni disponibili supportano 14.041 modelli genici (Tabella Supplementare 1), all'interno della gamma di conteggi genetici per D. melanogaster (15.507) e Anopheles gambiae (13.460). Pertanto, il piccolissimo genoma di C. marinus sembra essere completo (Tabella 1, Dati estesi Fig. 3, Nota supplementare 1 e Tabella supplementare 2). Il genoma di riferimento di C. marinus rende i chironomidi la terza sottofamiglia di dipterano con un genoma annotato ricostruito su scala cromosomica (Fig. 1a e Extended Data Figs 2, 3b – f).

Tabella a grandezza naturale

Image

a, I tre gruppi di collegamento di C. marinus con ponteggi di riferimento (a destra) ancorati su una mappa di collegamento genetico (a sinistra). Impalcature ordinate e orientate, barre nere; non orientato, barre grigie; né ordinato né orientato, barre bianche. Ombreggiatura grigia, grandi regioni non ricombinanti. QTL, circadiano (arancione), circalunare (ciano). Un QTL circadiano e circalunare si sovrappongono, risultando in tre regioni QTL fisiche (C1 / L1, C2 e L2, rispettivamente in viola, arancione e ciano). b, Analisi genomica della popolazione di QTL C2. Analisi dei ceppi di Por e Jean (rispettivamente in blu e rosso, nei due pannelli centrali). Pannello superiore, differenziazione genetica per singoli SNP (punti rossi) e finestre da 5 kb (linea nera). Secondo pannello, diversità genetica ( θ ) in finestre da 20 kb (linea sottile) e 200 kb (linea spessa). Terzo pannello, disequilibrio del collegamento ( r 2 ) in finestre da 100 kb. Pannello inferiore, punteggio di correlazione (CS) per la differenziazione genetica con valori di timing circadiano (in alto), timing circalunare (in mezzo) e distanza geografica (in basso) per i ceppi di Vigo, Jean, Por, He e Ber. Numeri inferiori, ID dell'impalcatura. Per ulteriori dettagli, compresi i QTL C1 / L1 e L2, vedere Dati estesi Fig. 5a, b.

Immagine a dimensione intera

  • Scarica la diapositiva di PowerPoint

Abbiamo eseguito una caratterizzazione di base del genoma e un confronto con altri dipteran. Abbiamo delineato i cinque bracci cromosomici C. marinus (Nota integrativa 2, Dati estesi Fig. 3c e Tabella supplementare 3) e li abbiamo omologati a D. melanogaster e A. gambiae mediante confronti diretti (Dati estesi Fig. 3 e 4, Nota integrativa 2 e Tabella supplementare 3). Abbiamo anche trovato il locus legato al sesso simile a ZW in C. marinus 6 al di fuori dell'omologo cromosomico X (Nota complementare 2) e rilevato un elevato tasso di riorganizzazione cromosomica (Fig. 1a, Nota integrativa 3 e Dati estesi Fig. 2, 3b – f, 4). Nel loro insieme, il genoma di riferimento di C. marinus appare ben assemblato.

Come passo successivo verso l'identificazione delle basi molecolari degli adattamenti della tempistica circadiana e circalunare in C. marinus , abbiamo perfezionato le posizioni QTL di temporizzazione precedentemente identificate 6 sulla base dei nuovi marcatori di sequenziamento del DNA associati al sito di restrizione ad alta densità (Tabella supplementare 4 e Nota complementare 4) e determinato la sequenza di riferimento corrispondente agli intervalli di confidenza QTL (Fig. 1, barre arancioni e ciano; e tabella supplementare 4). Nessuno dei principali geni dell'orologio circadiano si trovava all'interno di questi QTL (Fig. 1a). Solo il timeout / timeless2 , un omologo senza tempo con un ruolo minore nel ripristino dell'orologio circadiano 17, si trova all'interno dei QTL.

Variazione genetica nei ceppi di temporizzazione Clunio

Abbiamo quindi sequenziato nuovamente i ceppi Por e Jean (Extended Data Fig. 1), per i quali è stata eseguita l'analisi QTL iniziale 6 . Due gruppi di 300 individui catturati sul campo sono stati sequenziati con una copertura> 240 × (Tabella supplementare 5). Le letture della mappatura rispetto al genoma di riferimento hanno identificato 1.010.052 polimorfismi a singolo nucleotide (SNP), il 72% dei quali era presente sia nei ceppi di Por che di Jean. Sulla base di tutti i SNP abbiamo determinato la differenziazione genetica ( F ST ), la diversità genetica ( θ ) e lo squilibrio del legame a corto raggio (misurato come r 2 ) (Fig. 1b e Extended Data Figs 3c, 5a, b).

La differenziazione genetica a livello del genoma tra i ceppi di Por e Jean è moderata ( F ST = 0, 11), fornendo una buona base per lo screening del genoma per l'adattamento del timing locale basato sulla divergenza genetica. Secondo l'analisi QTL, i due QTL circadiani spiegano l'85% della differenza di temporizzazione giornaliera e i due QTL circalunari spiegano l'intera differenza di temporizzazione mensile (Tabella supplementare 4 e riferimento 6). Poiché ogni locus ha quindi un forte effetto sulla tempistica, la selezione contro gli alleli disadattati deve essere forte e i loci di temporizzazione dovrebbero essere fortemente differenziati.

All'interno degli intervalli di confidenza dei QTL, 158 SNP e 106 indels (inserzioni o eliminazioni) sono fortemente differenziati ( F ST ≥ 0, 8; Fig. 1b e Extended Data Fig. 5; SNP, punti rossi nei pannelli F ST, per tutto il genoma confronto vedi nota complementare 5). Abbiamo compilato un elenco di geni candidati per adattamenti della tempistica circadiana e circalunare in base alla loro vicinanza a SNP differenziati e indels nei QTL (Tabella supplementare 6). I geni candidati non comprendono né i geni del clock circadiano di base ( senza tempo2 / timeout , max. F ST ≤ 0, 5; media F ST = 0, 07), né sono arricchiti per alcun percorso particolare (analisi del termine ontologico genico; Tabella supplementare 7).

Fenotipo temporale con correlazione genotipica

Supponendo che gli alleli associati all'adattamento del timing probabilmente abbiano avuto origine dalla variazione genetica permanente (Nota integrativa 5), ​​la variazione genetica nei loci di timing non dovrebbe variare liberamente tra i ceppi, ma piuttosto i ceppi con timing simili dovrebbero condividere alleli funzionalmente rilevanti. Per identificare tali loci, abbiamo esteso lo schermo genomico a tre ulteriori ceppi: da Vigo (Vigo), Helgoland (He) e Bergen (Ber; Extended Data Fig. 1 e Tabelle Supplementari 5, 8). Abbiamo quindi testato tutti e cinque i ceppi sequenziati per correlazioni tra differenziazione genetica ( F ST ) e differenze di temporizzazione, o distanze geografiche come modello nullo (Tabella supplementare 8).

Nel complesso, la differenziazione genetica a livello del genoma non era correlata alle differenze di tempo circadiano ( r = 0, 10, P = 0, 31) o circalunare ( r = 0, 56, P = 0, 12), ma con la distanza geografica ("isolamento per distanza"; r = 0, 88, P = 0, 008). Contro questo segnale di sfondo genomico di isolamento per distanza, abbiamo proiettato il genoma in finestre scorrevoli da 5 kb per picchi di correlazione tra differenziazione genetica e tempismo, risultando in un punteggio di correlazione (Fig. 1b e Dati estesi Fig. 5a, b, pannelli CS, punteggio compreso tra 0 e 5; per i dettagli vedere Metodi). Combinando le prove dallo schermo del ceppo F contro Por versus Jean (tabella supplementare 6) con questi schemi di correlazione tra tempismo e divergenza genetica, è stato ridotto l'elenco dei geni candidati a 49 geni (tabella supplementare 9).

Di particolare nota, una singola regione nel QTL C2 circadiano è stata sorprendentemente differenziata (Fig. 1b). In questa regione, il legame disequilbrium nel ceppo di Por è stato significativamente elevato (test di permutazione; P = 0, 002) e la diversità genetica è diminuita significativamente in alcuni tratti (test di permutazione; P = 0, 037 e 0, 020), rispetto alla media del genoma di Por. Ciò può indicare un recente episodio di selezione in Por, potenzialmente durante l'adattamento della temporizzazione, poiché questa regione è anche fortemente arricchita per polimorfismi correlati alla temporizzazione (Fig. 1b, pannello CS). I valori più estremi di differenziazione genetica, diversità genetica e correlazione temporale sono localizzati nel locus CaMKII.1 e nella sezione anteriore di un gene omologa al gene big bang (bbg) .

CaMKII influisce sul core clock circadiano

Non solo il locus CaMKII.1 ospita il più alto numero di polimorfismi differenziati (tabella supplementare 9), ma è stato anche dimostrato che CaMKII influenza il timing circadiano. Il mouse CaMKIIα fosforila CLOCK e ne facilita la dimerizzazione con BMAL in vivo 18 . I topi con CaMKIIα K42R inattivo, morto in chinasi hanno un ritmo circadiano attenuato e un periodo di corsa libera circadiano prolungato 18 . CaMKII inoltre fosforila la proteina CLOCK 19 nella linea cellulare D. melanogaster S2 e l' inibizione in vivo di Dme- CaMKII in uno sfondo sensibilizzato con livelli ridotti di Ca 2+ allunga il periodo circadiano 20, suggerendo che il ruolo di CAMKII in il tempismo circadiano è conservato tra gli animali.

Per determinare se CaMKII può influenzare anche il core clock circadiano in C. marinus , abbiamo testato l'effetto di Cma -CaMKII.1 in un saggio basato su cellule usando cellule D. melanogaster S2 19, 21 . Abbiamo ripetuto precedenti esperimenti 19 che mostravano che l'inibizione chimica del Dme -CaMKII endogeno riduce la quantità di luciferasi generata (Extended Data Fig. 6a), mentre l'aggiunta di una variante indipendente da [Ca 2+ ], e quindi costitutivamente attiva, di CaMKII ( mouse, T286D) aumenta le quantità di luciferasi (Extended Data Fig. 6b). Quindi abbiamo generato costrutti per l' orologio di C. marinus , il ciclo di C. marinus e le versioni mutate della chinasi-morto (K42R) e [Ca 2+ ] -indipendente (T286D) di Cma-CaMKII.1 . La trasfezione dell'orologio Cma e del ciclo Cma nelle cellule D. melanogaster S2 porta all'attività della luciferasi guidata dal promotore 3X69 derivato dal promotore del periodo Dme (Fig. 2a). L'aggiunta di Cma-CaMKII.1 T286D indipendente da [Ca 2+ ] porta ad un sostanziale aumento del segnale della luciferasi (Fig. 2a), mentre l'aggiunta del Cma morto-chinasi - CaMKII.1 K42R non migliora l'attività della luciferasi ( Fig. 2a). Questi dati suggeriscono che l'attività della chinasi CaMKII migliora la trascrizione dipendente dalla E-box, come indicato dalla produzione di luciferasi guidata dal promotore 3X69 , tramite il dimero CLOCK – CYCLE in C. marinus .

Image

a, Ulteriori C. marinus CaMKII.1 aumenta l'attività trascrizionale di C. marinus Clk e Cyc in un saggio di luciferasi su cellule S2 di D. melanogaster utilizzando il potenziatore contenente E-box 3X69 ( periodo 3X69– luc (rif. 21)). I dati sono rappresentati come media ± sem; test a due campioni Welch a due facciate; replicati biologici, n = 5, ad eccezione del controllo senza clk , n = 3, ciascun replicato biologico rappresenta la media di tre replicati della preparazione. *** P <0.0005. b, esoni di trascrizioni Cma-CaMKII.1 complete (RA – RD) e parziali (RE – RO). c, Distribuzione di SNP (nero), indels (arancione) e un inserimento di 125 bp (punto rosso) lungo il locus Cma-CaMKII.1 , tutti con F ST ≥ 0, 8.

Immagine a dimensione intera

  • Scarica la diapositiva di PowerPoint

La giunzione CaMKII.1 è correlata con i tempi

Abbiamo quindi studiato come i polimorfismi nel locus Cma-CaMKII.1 influenzano l'enzima. Abbiamo trovato due alleli CaMKII.1 : uno nei primi ceppi Por, He e Ber emergenti e un altro nei ceppi emergenti Jean e Vigo. La maggior parte dei polimorfismi specifici per ceppo si trovano negli introni (Fig. 2b, c e Tabella supplementare 9). Se questi polimorfismi fossero significativi, dovrebbero influenzare l' espressione e / o la giunzione di CaMKII.1 . Cma-CaMKII.1 ha quattro domini funzionali 22 (Fig. 2b). La maggior parte dei polimorfismi differenziati si raggruppa nella regione del dominio del linker variabile (Fig. 2b, c), incluso un inserimento di 125 bp (punto rosso in Fig. 2c; Dati estesi Fig. 7). Abbiamo identificato quattro trascrizioni a lunghezza intera alternate di Cma-CaMKII.1 (RA – RD), che differiscono nella lunghezza del linker (Fig. 2b). Il sequenziamento dell'RNA ad alta copertura ha dato prova dell'uso differenziale dell'esone tra i ceppi Jean e Por, nonché di esoni precedentemente non annotati all'interno della regione del linker variabile (Extended Data Fig. 6c). Il sequenziamento PCR e Sanger ha confermato diverse trascrizioni parziali di ulteriori varianti di giunzione della regione del linker (RE – RO; Fig. 2b). Abbiamo usato qPCR specifico per trascrizione per quantificare tutte le trascrizioni da larve di terzo instar. Generalmente, le trascrizioni RE – RO sono espresse a livelli molto bassi. Di questi, solo RO ha mostrato differenze di espressione quantificabili tra i ceppi di Jean e Por (Fig. 3a e Extended Data Fig. 6d). È importante sottolineare che qPCR specifico per trascrizione ha confermato una significativa espressione differenziale delle principali trascrizioni nei ceppi Jean contro Por (Fig. 3a, Dati estesi Fig. 6d), abbinando i dati di sequenziamento dell'RNA (RNA-seq) (Dati estesi Fig. 6c) . Coerentemente, le varianti con long linker (RA, RB) hanno mostrato un'espressione più alta nella varietà Por, mentre le varianti più brevi (RD, RO) hanno mostrato un'espressione più alta nella varietà Jean (Fig. 3a e Extended Data Fig. 6c, d).

Image

a, valori qPCR per le varianti di giunzione CaMKII.1 da ceppi Por e Jean, normalizzati a Por (per dati non normalizzati, vedere Dati estesi Fig. 6d). I dati sono rappresentati come media ± sem; Por, n = 9 replicati biologici; Jean, n = 10; RO, Por, n = 3; Jean n = 8; RO non è stato rilevato in sei replicati biologici di Por, suggerendo una differenza di espressione ancora maggiore; test di somma dei ranghi di Wilcoxon su due lati; * P <0, 05; ** P <0, 005; *** P <0.0005; NS, non significativo; Correzione del leccio per test multipli. Per la quantificazione dei dati RNA-seq, vedere Dati estesi Fig. 6c. b, giunzione differenziale della regione di collegamento CaMKII.1 in cellule D. melanogaster S2R +, normalizzata a Por, n = 7 replicati biologici; test a due campioni a due facciate, altrimenti come a . c, sezioni rappresentative di gel di fosforilazione come quantificate per b, due corsie separate dallo stesso gel (per il gel completo, vedere Dati sorgente). d, ritmo libero dell'emergenza adulta sotto luce bianca fioca costante (circa 100 lx). Lui e Por condividono gli alleli di CaMKII.1 , mentre Jean ha l'altro allele. Per calcolare il periodo di funzionamento libero, è stata calcolata la media del tempo tra i picchi di emergenza successivi, ponderando ciascun picco in base al numero di individui.

Immagine a dimensione intera

  • Scarica la diapositiva di PowerPoint

Se le differenze rilevate nell'abbondanza delle varianti di giunzione CaMKII.1 sono associate alle differenze di temporizzazione, dovrebbero essere direttamente causate dai polimorfismi specifici del ceppo nel locus CaMKII.1 . Per testare questo, abbiamo generato minigeni che contenevano la regione di collegamento alternata del locus CaMKII.1 dal ceppo Jean o Por. I due minigeni sono stati trasfettati in cellule della linea cellulare D. melanogaster S2R + e l'espressione delle varianti di giunzione è stata analizzata mediante RT-PCR radioattiva (Fig. 3b, c). Abbiamo rilevato quattro varianti, corrispondenti alle varianti di giunzione RB, RC, RD e RO. Tutte le varianti hanno mostrato le stesse differenze di abbondanza specifiche del ceppo nel test cellulare S2R + rispetto ai ceppi di C. marinus in vivo (Fig. 3a, b). Poiché il contesto cellulare è lo stesso per entrambi i minigeni Jean e Por nel test S2R +, gli elementi transattivi possono essere esclusi come causa di giunzione differenziale, il che implica che è un risultato diretto delle differenze di sequenza genomica nel Cma-CaMKII .1 locus. Mentre le varianti di giunzione RB, RC e RD e i loro esoni costitutivi sono conservati in D. melanogaster (vedi annotazioni Flybase e rif. 23), non esiste una controparte RA di D. melanogaster . Questo potrebbe spiegare perché questa variante non è rilevabile nelle cellule S2R + (Fig. 3b).

Dalle varianti di giunzione alle differenze di temporizzazione

Le varianti di lunghezza del linker CaMKII sono state studiate in diverse specie. Le isoforme di D. melanogaster CaMKII corrispondenti alle varianti RB, RC e RD di C. marinus hanno affinità e velocità di fosforilazione target differenti 23 . Queste differenze di attività sono spiegate dal fatto che CaMKII funziona come un dodecamero e la lunghezza del linker determina la compattezza e quindi l'accessibilità del substrato dell'oloenzima - gli enzimi con linker lunghi hanno un'attività più elevata. Questa relazione struttura-funzione è forse universale, poiché è conservata tra umani e C. elegans 22, 24 .

L'inattivazione o l'inibizione di CaMKII allunga i periodi circadiani nel topo e nelle farfalle 18, 20 . Una connessione tra la durata del periodo circadiano e la fase di attività nei cicli luce-buio è nota dalle mutazioni nel periodo in D. melanogaster 25 e cronotipi umani 26 . Questi risultati implicano che in C. marinus le varianti CaMKII.1 più attive e più prontamente attivate da Ca 2+ a legame lungo dovrebbero far avanzare l'emergenza adulta accorciando il periodo dell'orologio circadiano. In effetti, scopriamo che i primi ceppi Por ed He emergenti, che possiedono gli stessi alleli CaMKII.1 distorti a legante lungo, hanno periodi di orologio circadiano a corsa libera più brevi rispetto al ceppo Jean emergente (Fig. 3d).

Integrando i nostri risultati con quelli della letteratura summenzionata, proponiamo che la regolazione del rapporto tra le varianti di giunzione di CaMKII.1 costituisca un meccanismo evolutivo per adattare il timing circadiano (Extended Data Fig. 8): le differenze nella sequenza genomica di CaMKII.1 portano a giunzione differenziale e attività CaMKII.1 . Tra un certo numero di possibili obiettivi, ciò influenza la trascrizione dimero-dipendente CLOCK – CYCLE, che a sua volta influenza la durata del periodo circadiano e alla fine si traduce in differenze nel tempo di emergenza dell'adulto.

Discussione

I ritmi annuali, lunari e di marea, nonché la variazione temporale naturale tra gli individui, sono fenomeni importanti e diffusi che sono poco conosciuti. Il genoma di riferimento di C. marinus e il pannello di variazione genetica per cinque ceppi con diversi tempi circadiani e circalunari stabiliscono nuove risorse per ulteriori studi su questi argomenti.

Abbiamo identificato gli ortologhi di C. marinus per tutti i geni dell'orologio circadiano di base, nessuno dei quali sembra essere coinvolto in adattamenti della tempistica circadiana o circalunare. Per i tempi circalunari, ciò supporta l'indipendenza molecolare dell'orologio circalunare dall'orologio circadiano, come riportato per Platynereis dumerilii 27 .

Per il timing circadiano, la modulazione specifica del ceppo nello splicing alternativo di CaMKII.1 emerge come un possibile meccanismo di adattamento naturale. Alla luce dei precedenti esperimenti in D. melanogaster e topi 18, 19, 20, 23, sembra molto probabile che le differenze nell'attività di CaMKII delle diverse forme di giunzione portino a differenze temporali circadiane attraverso la fosforilazione di CLOCK – CYCLE (Extended Data Fig. 8).

È anche ipotizzabile che CaMKII influenzi il tempismo circadiano attraverso altri bersagli. Ad esempio, è noto che CaMKII ha fosforilato la proteina di legame dell'elemento di risposta cAMP (CREB) 28, 29 . Il CREB è collegato all'orologio circadiano dagli elementi di risposta cAMP (CRE) nei promotori del periodo e dai geni senza tempo 30, 31 e dall'interazione fisica della proteina legante CREB (CBP) con CREB, CLOCK e CYCLE 32, 33 . Inoltre, uno dei ruoli più ben studiati di CaMKII è la modulazione morfologica della plasticità e della connettività neuronale 34, 35, 36 . Tali cambiamenti nella connettività sono stati sempre più implicati come parte del meccanismo di temporizzazione circadiano in D. melanogaster e nei mammiferi 37 . È interessante notare che il ruolo di CaMKII nel modellare la connettività neuronale è stato anche suggerito di collegarsi a diverse malattie neuropsichiatriche 38, che spesso si verificano con interruzioni cronobiologiche 39, 40, 41, 42 . Sono necessari ulteriori studi per determinare se la modulazione dell'attività di CaMKII costituisce un legame molecolare tra questi fenomeni.

metodi

Non sono stati usati metodi statistici per predeterminare la dimensione del campione. Gli esperimenti non sono stati randomizzati e gli investigatori non sono stati accecati dall'allocazione durante gli esperimenti e la valutazione dei risultati.

Cultura animale e regimi di luce

Le scorte di laboratorio di C. marinus sono state allevate secondo Neumann 1, la cura è stata fornita dalla struttura acquatica MFPL. In breve, C. marinus fu tenuto in contenitori di plastica da 20 × 20 × 5 cm con sabbia e acqua di mare naturale diluita a 15 ‰ con acqua dissalata, diatomee alimentate ( Phaeodactylum tricornutum , ceppo UTEX 646) nelle prime fasi larvali e polvere di ortica nelle fasi successive. La temperatura nelle camere climatiche era impostata a 20 ° C e il ciclo luce-buio era 12:12 (tranne dove diversamente indicato). Moonlight è stato simulato con una lampadina a incandescenza (circa 1 lx), che è stata accesa tutta la notte per quattro notti successive ogni 30 giorni.

Assemblea del genoma

Il processo di assemblaggio del genoma (Extended Data Fig. 9a) si basava su tre librerie di sequenziamento (Tabella supplementare 10): una libreria di inserti da 0, 2 kb è stata preparata da un singolo maschio adulto del ceppo da laboratorio Jean (stabilito da campioni di campo prelevati a St. Jean-de-Luz, Francia, nel 2007;> 12 generazioni in laboratorio), affamato e tenuto in acqua di mare con penicillina (60 unità per ml), streptomicina (60 μg ml −1 ) e neomicina (120 μg ml - 1 ) durante le ultime 2 settimane di sviluppo. Il DNA è stato estratto con un metodo di salatura 46, tranciato su un sononic Covaris S2 (modalità di scansione della frequenza; 4 ° C; ciclo di lavoro, 10%; intensità, 7; cicli per scoppio, 300; fibra microTUBE AFA 6 × 16 mm; 30 s) e preparato per il sequenziamento Illumina con protocolli standard. Una libreria di inserti da 2, 2 kb e 7, 6 kb sono stati preparati da un pool di DNA polimorfico di> 300 maschi adulti Jean catturati in campo da Eurofins MWG Operon (Ebersberg, Germania) secondo il protocollo del produttore. Ciascuna libreria è stata sequenziata in una corsia di un Illumina HiSeq2000 con letture di fine coppia da 100 bp presso l'unità di sequenziamento di nuova generazione delle strutture di base del biocentro di Vienna (//vbcf.ac.at).

Le letture sono state filtrate per sequenze di adattamento e distanziatore di qualità di lettura con cutadapt 47 (−b −n 3 −e 0, 1 −O 8 −q 20 −m 13) e i duplicati sono stati rimossi con fastq-mcf da ea-utils 48 (−D 70 ). Le coppie di lettura sono state intercalate con ngm-utils 49, lasciando solo letture accoppiate. La contaminazione con il DNA umano trovato nella libreria da 0, 2 kb è stata rimossa eliminando le letture corrispondenti al genoma umano con un punteggio di qualità in scala phred ≥ 20 (allineamento con BWA 50 ).

L'assemblaggio in contigs con Velvet 51 (ponteggi disabilitati; km di 57 bp come determinato da VelvetOptimiser 52 ) si basava esclusivamente sulla libreria meno polimorfica di 0, 2 kb. Circa 600 rimanenti sequenze di adattatori alle estremità dei contigs assemblati sono state ritagliate con cutadapt (−O 8 −e 0, 1 −n 3). Per le statistiche sugli assiemi, consultare la Tabella 11 aggiuntiva.

L'impalcatura dei contigs era basata su tutte e tre le librerie ed eseguita con SSPACE 53 in due iterazioni, ovvero gli scaffold del primo round sono stati nuovamente impalcati. L'uso di parametri diversi nelle iterazioni (tabella supplementare 12) ha consentito di realizzare connessioni diverse e quindi una maggiore connettività del ponteggio (tabella supplementare 13). L'effetto è probabilmente dovuto alla natura polimorfica delle librerie da 2, 2 kb e 7, 6 kb; si traduce in un "accordo più comune per il consenso della popolazione delle impalcature". Il processo di ponteggio iterativo è stato eseguito con e senza applicare un limite di dimensione escludendo i contigs <1 kb, risultando in due assiemi indipendenti (CLUMA_0.3 e CLUMA_0.4; vedere i dati estesi Fig. 9a), che differivano nella connettività e nella sequenza complessive contenuto (tabella supplementare 11), ma anche nell'identità e nella struttura dei grandi ponteggi. Al fine di combinare sia la connettività che il contenuto della sequenza, e al fine di risolvere le contraddizioni nella struttura dei più grandi ponteggi, i due assiemi sono stati confrontati e riconciliati in un processo manuale di super-ponteggi, come dettagliato nel Metodo Supplementare 1. In breve, il la sovrapposizione di ponteggi dai due assiemi è stata testata con ricerche BLAST e rappresentata in una struttura di rete grafica. Impalcature con contenuto di sequenza congruente in entrambi gli assiemi porterebbero a una rete lineare, mentre impalcature con contenuto di sequenza contraddittoria comporterebbero reti ramificate. Allo stesso tempo, entrambi gli assiemi erano soggetti alla mappatura del legame genetico basata su genotipi ottenuti dal sequenziamento del DNA associato al sito di restrizione (sequenziamento RAD) di una famiglia di mappatura pubblicata 6 (Metodo Supplementare 2). Le informazioni sul legame genetico risultanti sono servite a risolvere le reti di diramazione nelle sottoreti lineari non ambigue più lunghe possibili con informazioni di collegamento genetico coerenti (vedere lo schema A nel Metodo supplementare 1). Infine, la struttura dei super ponteggi risultanti è stata codificata in formato YAML e tradotta in sequenza di DNA con Scaffolder 54, ottenendo 75 super ponteggi mappati.

Le rimanenti impalcature piccole e non mappate sono state filtrate per frammenti del genoma mitocondriale, il cluster di geni dell'istone e il cluster di geni rDNA ribosomiale 18S / 28S, che sono stati assemblati separatamente (Metodo Supplementare 3; Dati estesi Fig. 10). I ponteggi non mappati sono stati inoltre filtrati per l'evidente contaminazione da altre specie (Metodo Supplementare 3). Il grado in cui le rimanenti impalcature non mappate sono le rimanenti varianti polimorfiche di parti delle superimpalcature mappate è stato stimato facendo saltare le prime contro le seconde (Metodo Supplementare 3 e Tabella Supplementare 14).

Tutti i ponteggi sono stati soggetti a chiusura del gap con GapFiller 55 e bordi ripetuti, ovvero gap con sequenze pressoché identiche su entrambi i lati che generalmente non sono chiusi a causa di polimorfismi genetici, sono stati valutati e se possibile rimossi con uno script personalizzato (Metodo Supplementare 4; codice disponibile fornito come file di dati di origine).

L'assemblaggio finale CLUMA_1.0 è stato presentato nell'ambito del progetto PRJEB8339 (75 impalcature mappate; 23.687 impalcature non mappate ≥100 bp). L'assemblaggio e ulteriori informazioni possono anche essere ottenuti da ClunioBase (//cluniobase.cibiv.univie.ac.at).

Ricostruzione dei cromosomi e analisi QTL

Le informazioni di collegamento genetico per gli ultimi 75 super-ponteggi sono state ottenute ripetendo la mappatura di lettura sul genotipo chiamando l'esperimento di sequenziamento RAD come descritto sopra (Metodo supplementare 2), ma ora con l'assemblaggio CLUMA_1.0 come riferimento. Questo ci ha permesso di posizionare e orientare i super-ponteggi lungo la mappa del legame genetico (Fig. 1a e Extended Data Fig. 2). Le posizioni degli eventi di ricombinazione all'interno di un'impalcatura sono state approssimate come il mezzo tra le posizioni dei due marcatori RAD tra i quali il modello di marcatore è cambiato da una posizione della mappa alla successiva. La mappa dei collegamenti genetici pubblicata è stata perfezionata e rivista (Metodo Supplementare 5 ed Extended Data Fig. 2). Sulla base della raffinata mappa dei collegamenti, l'analisi QTL della famiglia di mappatura pubblicata è stata ripetuta come descritto 6 (Tabella supplementare 4 e Nota supplementare 5). Usando la corrispondenza tra il gruppo di riferimento e la mappa del legame genetico, siamo stati in grado di identificare direttamente le regioni genomiche corrispondenti agli intervalli di confidenza dei QTL (Fig. 1 e Dati estesi Fig. 5a, b).

Sequenza della trascrizione

Trascrizioni assemblate di una libreria di cDNA normalizzata di tutte le fasi della vita e vari ceppi di C. marinus (454 sequenziamento) erano disponibili da esperimenti precedenti e dati di sequenziamento dell'RNA erano disponibili per gli adulti di ceppo Jean (sequenziamento Illumina). Inoltre, in particolare per l'annotazione del genoma, l'RNA da 80 larve di terzo stadio dei ceppi di laboratorio Jean e Por è stato preparato ciascuno per il sequenziamento dell'RNA secondo i protocolli standard (Metodo Supplementare 6). Ogni campione è stato sequenziato su una singola corsia di un Illumina HiSeq 2000. Tutte le letture della trascrizione sono state inviate all'European Nucleotide Archive (ENA) nell'ambito del progetto PRJEB8339.

Per i dati di sequenziamento dell'RNA adulto e larvale, le letture grezze sono state verificate con fastqc 56, ritagliate per la qualità degli adattatori con cutadapt 47 e filtrate per contenere solo coppie di letture usando il comando interleave in ngm-utils 49 . Reads were assembled separately for larvae and adults with Trinity 57 (path_reinforcement_distance: 25; maximum paired-end insert size: 1, 500 bp; otherwise default parameters).

Annotazione del genoma

Automated annotation was performed with MAKER2 58 . Repeats were masked based on all available databases in repeatmasker. MAKER2 combined evidence from assembled transcripts (see above), mapped protein data sets from Culex quinquefasciatus (CpipJ1), Anopheles gambiae (AgamP3), Drosophila melanogaster (BDGP5), Danaus plexippus (DanPle_1.0), Apis mellifera (Amel4.0), Tribolium castaneum (Tcas3), Strigamia maritima (Smar1) and Daphnia pulex (Dappu1) and ab initio gene predictions with AUGUSTUS 59 and SNAP 60 into gene models. AUGUSTUS was trained for C. marinus based on assembled transcripts from the normalized cDNA library. SNAP was run with parameters for A. mellifera , which had the highest congruence with known C. marinus genes in preliminary trials (Supplementary Method 7). MAKER was set to infer gene models from all evidence combined (not transcripts only) and gene predictions without transcript evidence were allowed. Splice variant detection was enabled, single-exon genes had to be larger than 250 bp and intron size was limited to a maximum of 10 kb.

All gene models within the QTL confidence intervals, as well as all putative circadian clock genes and light receptor genes were manually curated: exon–intron boundaries were corrected according to transcript evidence (approximately 500 gene models), chimeric gene models were separated into the underlying individual genes (approximately 100 gene models separated into around 300 gene models) and erroneously split gene models were joined (approximately 15 gene models). Finally, this resulted in 21, 672 gene models, which were given IDs from CLUMA_CG000001 to CLUMA_CG021672 ('CLUMA' for Clunio marinus , following the controlled vocabulary of species from the UniProt Knowledgebase; CG for 'computated gene'). Splice variants of the same gene (detected in 752 gene models) were identified by the suffix '-RA', '-RB' and so on, and the corresponding proteins by the suffix '-PA', '-PB' and so forth.

Gene models were considered as supported if they overlapped with mapped transcripts or protein data (Supplementary Table 1). Gene counts for D. melanogaster were retrieved from BDGP5, version 75.546 and for A. gambiae from AgamP3, version 75.3. The putative identities of the C. marinus gene models were determined in reciprocal BLAST searches, first against UniProtKB/Swiss-Prot (8, 379 gene models assigned) and if no hit was found, second against the non-redundant protein sequences (nr database) at NCBI (1, 802 additional genes assigned). Reciprocal best hits with an e value < 1 × 10 −10 were considered putative orthologues (termed 'putative gene X'), non-reciprocal hits with the same e value were considered paralogues (termed 'similar to'). All remaining gene models were searched against the PFAM database of protein domains (111 gene models assigned; termed 'gene containing domain X'). If still no hit was found, the gene models were left unassigned ('NA').

Synteny comparisons

Genome-wide synteny between the C. marinus , D. melanogaster and A. gambiae genomes was assessed based on reciprocal best BLAST hits ( e value < 10 × 10 -10 ) between the three protein data sets (Ensembl Genomes, Release 22, for D. melanogaster and A. gambiae ). Positions of pairwise orthologous genes were retrieved from the reference genomes (BDGP5, AgamP3 and CLUMA_1.0) and plotted with Circos 61 . C. marinus chromosome arms were delimited based on centromeric and telomeric signatures in genetic diversity and linkage disequilibrium (Extended Data Fig. 3c and Supplementary Table 3; for data source see 'strain re-sequencing' below). Homologues for C. marinus chromosome arms were assigned based on enrichment with putative orthologous genes from specific chromosome arms in D. melanogaster and A. gambiae (Extended Data Figs 3, 4 and Supplementary Table 3). Additionally, for the 5, 388 detected putative 1:1:1 orthologues ( C. marinus : D. melanogaster : A. gambiae ), microsynteny was assessed by testing if all pairs of directly adjacent genes in one species were also directly adjacent in the other species. The degree of microsynteny was then calculated as the fraction of conserved adjacencies among all pairs of adjacent genes. From this fraction the relative levels of chromosomal rearrangements in the evolutionary lineage leading to C. marinus were estimated (Supplementary Note 3 and Extended Data Fig. 4).

Strain re-sequencing

Genetic variation in five C. marinus strains (Extended Data Fig. 1) was assessed based on pooled-sequencing data from field-caught males from the strains of St. Jean-de-Luz (Jean; Basque Coast, France; sampled in 2007; n = 300), Port-en-Bessin (Por; Normandie, France; 2007; n = 300), as well as Vigo (Spain; 2005; n = 100), Helgoland (He; Germany; 2005; n = 300) and Bergen (Ber; Norway; 2005; n = 100). Samples from Vigo and Bergen, were provided by D. Neumann and C. Augustin, respectively. For each strain we chose the largest available number of individuals to obtain the best possible resolution of allele frequencies. Females are not available, because they are virtually invisible in the field. For an overview of the experimental procedure, see Extended Data Fig. 9b. DNA was extracted with a salting-out method 46 from sub-pools of 50 males, the DNA pools were mixed at equal DNA amounts, sheared and prepared as described above and sequenced on four lanes of an Illumina HiSeq2000 with paired-end 100-bp reads (Ber and Vigo combined in one lane, distinguished by index reads). All reads were submitted to the European Nucleotide Archive (ENA) under project PRJEB8339. Sequencing reads were filtered for read quality and adaptor sequences with cutadapt 47 (−b −n 2 −e 0.1 −O 8 −q 13 −m 15), interleaved with ngm-utils 49 and duplicates were removed with fastq-mcf from ea-utils 48 (−D 70). Reads were aligned to the mapped super-scaffolds of assembly CLUMA_1.0 with BWA 50 (aln and sampe; maximal insert size (bp): −a 1500).

Detection of re-arrangements

Based on the unfiltered alignments, the samples from Por and Jean were screened for genomic inversions and indels relative to the reference sequence with the multi-sample version of DELLY 62 . Paired-end information was only considered if the mapping quality was high ( q ≥ 20) (see also Supplementary Note 3).

Population genomic analysis of the timing strains

For population genomic analysis (Extended Data Fig. 9b), the alignments of the pool-sequencing (pool–seq) data from Vigo, Jean, Por, He and Ber were filtered for mapping quality ( q ≥ 20), sorted, merged and indexed with SAMtools 63 . Reads were re-aligned around indels with the RealignerTargetCreator and the IndelRealigner in GATK 64 . The resulting coverage per strain is given in Supplementary Table 5.

For identification of SNPs, a pileup file was created with the mpileup command of SAMtools 63 . Base Alignment Quality computation was disabled (−B); instead, after creating a synchronized file with the mpileup2sync script in PoPoolation2 65, indels that occurred more than ten times were masked (including 3 bp upstream and downstream) with the identify-indel-regions and filter-sync-by-gtf scripts of PoPoolations2. F ST values were determined with the fst-sliding script of PoPoolation2, applying a minimum allele count of 10 (so that any false-positive SNPs resulting from the remaining unmasked indels were effectively excluded) and a minimum coverage of 40× for the comparison between Por and Jean or 10× for the comparison of all five strains. F ST was calculated at a single base resolution, as well as in windows of 5 kb (step size, 1 kb). Individual SNPs were only considered for further analyses or plotted if they were significantly differentiated as assessed by Fisher's exact test (fisher-test in PoPoolation2).

Average genome-wide genetic differentiation between timing strains, as obtained by averaging over 5-kb sliding-windows, was compared to the respective timing differences and geographic distances (see Supplementary Table 8) in Mantel tests (Pearson's product moment correlation; 9, 999 permutations), as implemented in the vegan package in the R statistical programming environment (ref. 66). Geographic distances and circadian timing differences were determined as described previously 67 (see Supplementary Table 8). For determination of lunar timing differences when comparing lunar with semilunar rhythms see Supplementary Note 6. In order to find genomic regions for which genetic differentiation is correlated with the timing differences between strains, the Mantel test was then applied to 5-kb genomic windows every 1 kb along the reference sequence. 5 kb is roughly the average size of a gene locus in C. marinus . Windows with a correlation coefficient of r ≥ 0.5 were tested for significance (999 permutations). For each genomic position the number of overlapping significantly correlated 5-kb windows was enumerated, resulting in a correlation score (CS; ranging from 0 to 5).

Genetic diversity, measured as Watterson's theta ( θ W ), for each strain was assessed with PoPoolation1.1.2 (ref. 68) in 20-kb windows with 10-kb steps. In order to save computing time, the pileup files of Jean, Por and He were linearly downscaled to 100× coverage with the subsample-pileup script ('fraction' option), positions below 100× coverage were discarded. Indel regions were excluded (default in PoPoolation 1.1.2) and a minimum of 66% of a sliding window needed to be covered. SNPs were only considered in θ W calculations if present ≥2 times, leading to slight inconsistencies in θ W estimates between strains due to differing coverage, but not affecting diversity comparisons within strains.

Linkage disequilibrium between the SNPs was determined for the Por and Jean strains with LDx 69, assuming physical linkage between alleles on the same read or read pairs. r 2 was determined by a maximum likelihood estimator, minimum and maximum read depths corresponded to the 2.5% and 97.5% coverage depths for each population (Jean, 111–315; Por, 98–319), total insert distance was limited to 600 bp, minimum phred-scaled base quality was 20, minimum allele frequency was 0.1 and a minimum coverage per pair of SNPs was 11. SNPs were binned by their physical distance for the plots (0–200 bp, 200–400 bp, 400–600 bp), with the mean value plotted.

Finally, small indels (<30 bp) in the Por and Jean strains were detected with the UnifiedGenotyper (−glm INDEL) in GATK 64 for positions with more than 20× coverage. Genetic differentiation for indels was calculated with the classical formula F ST = ( H T − H S )/ H T, where H S is the average expected heterozygosity according to Hardy–Weinberg Equilibrium (HWE) in the two subpopulations and H T is the expected heterozygosity in HWE of the hypothetical combined total population. If more than two alleles were present, only the two most abundant alleles were considered in the calculation of F ST .

Assessment of candidate genes

Gene models from the automated annotation were considered candidate genes, if they fulfilled the following criteria. (1) The gene was located within the reference sequence corresponding to the QTL confidence intervals as determined for the Por and Jean strains. (2) The gene contained a strongly differentiated SNP or small indel or it was directly adjacent to such a SNP or small indel ( F ST ≥ 0.8 for Por versus Jean, that is, the strains used in QTL mapping). This resulted in a preliminary list of 133 genes based on the comparison between Por and Jean (Supplementary Table 6). These candidate genes were narrowed down based on their overlap with genomic 5-kb windows, for which genetic differentiation between five European timing strains correlated with their timing differences (Fig. 1a, Extended Data Fig. 5a, b and Supplementary Table 9).

The location and putative effects of the SNPs and indels relative to the gene models were assessed with SNPeff 70 (−ud 0, otherwise default parameters; Extended Data Fig. 5c, d and Supplementary Tables 6, 9).

For Gene Ontology (GO) term analysis, all C. marinus gene models with putative orthologues in the UniProtKB/Swiss-Prot and non-redundant protein sequences (nr) databases based on reciprocal best BLAST hits (see above) were annotated with the GO terms of their detected orthologues (6, 837 gene models). Paralogues were not annotated. The enrichment of candidate SNPs and indels ( F ST ≥ 0.8 between Por and Jean) in specific GO terms was tested with SNP2GO 71 (min.regions = 1, otherwise default parameters). Hyper-geometric sampling was applied to test if individual genes of a GO term or a whole pathway of genes are enriched for SNPs (Supplementary Table 7).

Molecular characterization of CaMKII.1

RNA-seq data of the Por and Jean strains for CaMKII.1 were obtained from the larval RNA sequencing experiment described above. Besides four assembled full-length transcripts (RA–RD) from RNA-seq and assembled EST libraries, additional partial transcripts (RE–RO) were identified by PCR amplification (for PCR primers see Supplementary Table 15), gel extraction (QIAquick Gel Extraction Kit, Qiagen), cloning with the CloneJET PCR Cloning Kit (Thermo Scientific) and Sanger sequencing with pJET1.2 primers (LGC Genomics & Microsynth). cDNA was prepared from RNA extracted from third instar larvae of the Por and Jean laboratory strains (RNA extraction with RNeasy Plus Mini Kit, Qiagen; reverse transcription with QuantiTect Reverse Transcription Kit, Qiagen).

qPCR was performed with variant-specific primers and actin was used as a control gene (Supplementary Table 16). cDNA was obtained from independent pools of 20 third instar larvae of the Por and Jean strains. Sample size was ten pools per strain to cover different time points during the day and to test for reproducibility (two samples each at zeitgeber times 0, 4, 8, 16 and 20; for one Por sample extraction failed; RNA extraction and reverse transcription as above). qPCR was performed with Power SYBR Green PCR Master Mix on a StepOnePlus Real Time System (both Applied Biosystems). Fold-changes were calculated according to ref. 72 in a custom excel sheet. The assumption of equal variance was violated for the RD comparison ( F -test) and the assumption of normal distribution was violated for the data of RA and RC in the Por strain (Shapiro–Wilk normality test), possibly reflecting circadian effects in the samples from different times of day. Thus, expression differences were assessed for significance in a two-tailed Wilcoxon rank-sum test (wilcox.test in R 66 ). Holm correction 73 was used for multiple testing (default in p.adjust function of R).

CaMKII.1 minigenes

PCR fragments containing the CaMKII.1 linker region (exons 10–15) were amplified from genomic Por or Jean DNA, respectively, with primers CaMKII-Sc61-F-344112 and CaMKII-Sc61-R-351298 (Supplementary Table 15), cloned with the CloneJET PCR Cloning Kit (Thermo Scientific), transferred into the pcDNA3.1+ vector using NotI and XbaI (Thermo Scientific). These constructs were transfected into D. melanogaster S2R+ cells and RNA was prepared 48 h after transfection. After DNase digestion, isoform expression was analysed by radioactive, splicing-sensitive RT–PCR (primers in Supplementary Table 17) and phosphorimager quantification as described 74 . Identity of isoforms is based on size and sequencing of PCR products. To test for reproducibility, there were seven biological replicates (raw data in Supplementary Table 18). As the assumptions of equal variance ( F -test) and normal distribution of data (Shapiro–Wilk normality test) were not violated, the significance of expression differences was assessed in unpaired, two-sided two-sample t -tests. Holm correction 73 was used for multiple testing (default in p.adjust function of R). S2R+ cells were obtained from the laboratory of S. Sigrist, regularly authenticated by morphology and routinely tested for absence of mycoplasma contamination. The entire experiment was reproduced several months later with three biological replicates (raw data in Supplementary Table 18).

S2 cell luciferase assay

Firefly luciferase is driven from a period 3X69 promoter under control of the CLOCK and CYCLE protein 19, 21 . The D. melanogaster pAc–clk construct was obtained from F. Rouyer, pCopia–Renilla luciferase and period 3X69–luc reporter constructs from M. Rosbash, a [Ca 2+ ]-independent mouse CaMKII T286D was provided by M. Mayford. The CaMKII inhibitor KN-93 was purchased from Abcam (#ab120980).

C. marinus Cyc , C. marinus Clk and C. marinus CaMKII.1–RD were cloned into the pAc5.1/V5–His A plasmid (Invitrogen) with stop codons before the tag. The Q5 Site-Directed Mutagenesis Kit (NEB) was used to make kinase-dead and [Ca 2+ ]-independent versions of C. marinus CaMKII.1–RD (for primers, see Supplementary Table 17).

D. melanogaster S2 cells (Invitrogen) were cultured at 25 °C in Schneider's D. melanogaster medium (Lonza) supplemented with fetal bovine serum (FBS, 10%, heat-inactivated), penicillin (100 U ml −1 ), streptomycin (100 μg ml −1 ) and 2 mM l -glutamine; Sigma). Cells were seeded into 24-well plates (800, 000 cells per well) and transfected with Effectene transfection reagent (Qiagen) according to the manufacturer's instructions. Experiment with mouse [Ca 2+ ]-independent CaMKII: 25 ng pCopia–Renilla , 10 ng period 3X69–luc , 0.5 ng D. melanogaster pAc–clk , 200 ng mouse pAc–CaMKII T286D . Experiment with CaMKII inhibitor KN-93: 25 ng pCopia–Renilla , 10 ng period 3X69–luc , 0.5 ng D. melanogaster pAc–clk , various amounts of KN-93. Experiment with C. marinus genes: 25 ng pCopia–Renilla , 10 ng period 3X69–luc , 100 ng C. marinus pAc–cyc , 100 ng C. marinus pAc–clk , 200 ng C. marinus CaMKII.1–RD K42R or 200 ng C. marinus CaMKII.1–RD T286D . In all experiments, the transfection mix was filled up with empty pAc5.1/V5–His A vector to a total of 435 ng DNA per well. After 48 h, cells were washed with PBS and lysed with Passive Lysis Buffer (Promega). Luciferase activities were determined on a Synergy H1 plate reader (Biotek) using a Dual-Luciferase Reporter Assay System (Promega). For each biological replicate three independent cell lysates were measured and their mean value determined. Firefly luciferase activity was normalized to Renilla luciferase activity and values were normalized to controls transfected with D. melanogaster pAc–clk or C. marinus pAc–clk and C. marinus pAc–cyc , respectively. S2 cells (Invitrogen/Life Technologies, Cat.no. R690-07) were regularly authenticated by morphology and routinely tested for absence of mycoplasma contamination (Lonza MycoAlert). Sample size was chosen to test for reproducibility.

Circadian free-run experiments

For circadian free-run experiments, culture boxes of the Por, He and Jean strains were transferred from light–dark cycle (16:8) to constant dim light (light–light cycle, about 100 lx). Emerging adults were collected in 1-h intervals by a custom made C. marinus fraction collector (similar to those described in ref. 75) and counted once a day. Because collection was automated, the experimenter had no influence on the results and blinding was not necessary. As the circalunar clock restricts adult emergence to a few days, the circadian emergence rhythm can only be assessed over a few days. Several culture boxes were transferred to a light–light cycle at different time points. The resulting emergence data were combined for each strain using the switch to a light–light cycle as a common reference point. We used the maximum number of available individuals. Free-running period was calculated as the mean interval between subsequent emergence peaks, weighting each peak by the number of individuals.

Disponibilità dei dati

All sequence data are deposited in the European Nucleotide Archive (ENA) under PRJEB8339. The reference genome is also on ClunioBase (//cluniobase.cibiv.univie.ac.at). Machine readable super-scaffolding data and the computer source code for the removal of repeated edges are supplied as source data files.

Dati estesi

Dati estesi

  1. 1.

    The biology of Clunio marinus .

  2. 2.

    The reconstructed chromosomes of C. marinus based on the genetic linkage map.

  3. 3.

    C. marinus genome characterization.

  4. 4.

    Synteny analyses of C. marinus chromosome arms.

  5. 5.

    Population genomic analysis of QTLs C1/L1 and C2 and genome-wide analysis of locations and putative effects of SNPs and indels.

  6. 6.

    CaMKII regulates CLK/CYC transcriptional activity and exhibits strain-specific splice variants.

  7. 7.

    A differentiated 125-bp insertion in the CaMKII locus.

  8. 8.

    Model of circadian timing adaptation via sequence differences in the CaMKII.1 genomic locus.

  9. 9.

    Analyses overview.

  10. 10.

    Arrangement of the mitochondrial genome and of the histone gene cluster in C. marinus .

Informazione supplementare

File PDF

  1. 1.

    Informazione supplementare

    This file contains Supplementary Tables 1-19, Supplementary Methods, Supplementary Notes, Supplementary References and a Supplementary Figure – see contents page for details.

File zip

  1. 1.

    Dati Supplementari

    This zipped file contains .yaml files containing all changes made to the genome assembly during the super-scaffolding process.

  2. 2.

    Dati supplementari

    This zipped file contains the source code for the software "Repeated Edge Remover (RE 2 )".

Commenti

Inviando un commento, accetti di rispettare i nostri Termini e le Norme della community. Se trovi qualcosa di offensivo o non conforme ai nostri termini o linee guida, segnalalo come inappropriato.