base di conoscenza
CTRL+F per cercare la tua parola chiave

Sequenziamento a cella singola

Il sequenziamento di singole celle esamina le informazioni di sequenza di singole celle con tecnologie di sequenziamento di prossima generazione (NGS) ottimizzate, fornendo una risoluzione più elevata delle differenze cellulari e una migliore comprensione della funzione di una singola cellula nel contesto del suo microambiente. Il sequenziamento del DNA delle singole cellule può fornire informazioni sulle mutazioni portate da piccole popolazioni di cellule, ad esempio nel cancro, mentre il sequenziamento degli RNA espressi dalle singole cellule può fornire informazioni sull'esistenza e sul comportamento di diversi tipi di cellule, ad esempio nello sviluppo.

sfondo

Una tipica cellula umana è costituita da circa 2 x 3,3 miliardi di paia di basi di DNA e 600 milioni di basi di mRNA. Solitamente una combinazione di milioni di cellule viene utilizzata nel sequenziamento del DNA o dell'RNA usando metodi tradizionali come il sequenziamento Sanger o il sequenziamento Illumina. Usando il sequenziamento profondo del DNA e dell'RNA da una singola cellula, le funzioni cellulari possono essere approfondite. Come i tipici esperimenti NGS, i protocolli di sequenziamento di singole cellule generalmente contengono le seguenti fasi: isolamento di una singola cellula, estrazione e amplificazione di acido nucleico, preparazione di librerie di sequenziamento, sequenziamento e analisi di dati bioinformatici. È più impegnativo eseguire il sequenziamento di singole celle rispetto al sequenziamento di celle in blocco. La quantità minima di materiali di partenza da una singola cella fa sì che la degradazione, la perdita del campione e la contaminazione esercitino effetti pronunciati sulla qualità dei dati di sequenziamento. Inoltre, a causa del livello di picogramma della quantità di acidi nucleici utilizzati, è spesso necessaria un'amplificazione pesante durante la preparazione del campione del sequenziamento di singole cellule, con conseguente copertura irregolare, rumore e quantificazione imprecisa dei dati di sequenziamento.

I recenti miglioramenti tecnici rendono il sequenziamento di singole celle uno strumento promettente per affrontare una serie di problemi apparentemente inaccessibili. Ad esempio, campioni eterogenei, tipi di cellule rare, relazioni di lignaggio cellulare, mosaicismo dei tessuti somatici, analisi di microbi che non possono essere coltivate e l'evoluzione della malattia possono essere chiarite attraverso il sequenziamento di singole cellule. Il sequenziamento di singole cellule è stato selezionato come metodo dell'anno 2013 da Nature Publishing Group.

Sequenziamento del genoma a singola cellula (DNA)

Il sequenziamento del genoma del DNA a singola cellula implica l'isolamento di una singola cellula, l'esecuzione dell'amplificazione dell'intero genoma (WGA), la costruzione di librerie di sequenziamento e quindi il sequenziamento del DNA utilizzando un sequencer di prossima generazione (ad esempio Illumina, Ion Torrent). Un genoma costruito in questo modo è comunemente indicato come un singolo genoma amplificato o SAG. Può essere utilizzato negli studi sul microbioma, al fine di ottenere dati genomici da microrganismi non coltivati. Inoltre, può essere unito con l'ordinamento cellulare ad alto rendimento di microrganismi e cancro. Un metodo popolare utilizzato per il sequenziamento del genoma a singola cellula è l'amplificazione dello spostamento multiplo e questo consente la ricerca in varie aree come la genetica microbica, l'ecologia e le malattie infettive. Inoltre, i dati ottenuti dai microrganismi potrebbero stabilire processi per la coltura in futuro. Alcuni degli strumenti di assemblaggio del genoma che possono essere utilizzati nel sequenziamento del genoma a singola cellula includono: SPAdes, IDBA-UD, Cortex e HyDA.

Metodo

L'amplificazione a spostamento multiplo (MDA) è una tecnica ampiamente utilizzata, che consente di amplificare i femtogrammi del DNA dal batterio ai microgrammi per l'uso del sequenziamento. I reagenti richiesti per le reazioni MDA includono: primer casuali e DNA polimerasi da batteriofago phi29. Nella reazione isotermica di 30 gradi, il DNA viene amplificato con i reagenti inclusi. Mentre le polimerasi producono nuovi filamenti, ha luogo una reazione di spostamento del filamento, sintetizzando più copie da ciascun DNA modello. Allo stesso tempo, i fili che sono stati estesi in precedenza verranno spostati. I prodotti MDA hanno una lunghezza di circa 12 kb e vanno fino a circa 100 kb, consentendone l'uso nel sequenziamento del DNA. Nel 2017, un notevole miglioramento di questa tecnica, chiamato WGA-X, è stato introdotto sfruttando un mutante termostabile della phi29 polimerasi, portando a un migliore recupero del genoma dalle singole cellule, in particolare quelle con alto contenuto di G + C. Altri metodi includono MALBAC.

limitazioni

La MDA dei genomi delle singole cellule provoca una copertura del genoma molto irregolare, ovvero una sovrarappresentazione relativa e una sottorappresentazione di varie regioni del modello, portando alla perdita di alcune sequenze. Ci sono due componenti in questo processo: a) sovra e sotto-amplificazione stocastica di regioni casuali; e b) distorsione sistematica nei confronti delle regioni GC% elevate. Il componente stocastico può essere affrontato riunendo reazioni MDA a singola cellula dello stesso tipo di cellula, impiegando l'ibridazione in situ fluorescente (FISH) e / o la conferma post-sequenziamento. La distorsione dell'MDA rispetto alle regioni GC ad alta percentuale può essere affrontata usando polimerasi termostabili, come nel processo chiamato WGA-X.

I polimorfismi a singolo nucleotide (SNP), che sono una grande parte della variazione genetica nel genoma umano e copiano la variazione del numero (CNV), pongono problemi nel sequenziamento di singole cellule, così come la quantità limitata di DNA estratto da una singola cellula. A causa delle scarse quantità di DNA, un'analisi accurata del DNA pone problemi anche dopo l'amplificazione poiché la copertura è bassa e suscettibile di errori. Con la MDA, la copertura media del genoma è inferiore all'80% e i SNP che non sono coperti dalle letture di sequenziamento verranno disattivati. Inoltre, l'MDA mostra un alto rapporto di abbandono dell'allele, non rilevando gli alleli dai campioni eterozigoti. Vari algoritmi SNP sono attualmente in uso, ma nessuno è specifico per il sequenziamento di singole celle. La MDA con CNV pone anche il problema di identificare falsi CNV che nascondono i CNV reali. Per risolvere questo problema, quando è possibile generare schemi da falsi CNV, gli algoritmi possono rilevare ed eliminare questo rumore per produrre varianti reali.

applicazioni

I microbiomi sono tra i principali obiettivi della genomica a singola cellula a causa della difficoltà di coltivare la maggior parte dei microrganismi nella maggior parte degli ambienti. La genomica a singola cellula è un modo potente per ottenere sequenze di genoma microbico senza coltivazione. Questo approccio è stato ampiamente applicato su microbiomi marini, terrestri, sotterranei, organici e di altro tipo al fine di affrontare una vasta gamma di domande relative all'ecologia microbica, all'evoluzione, alla salute pubblica e al potenziale delle biotecnologie.

Il sequenziamento del cancro è anche un'applicazione emergente di scDNAseq. I tumori freschi o congelati possono essere analizzati e classificati relativamente a SCNA, SNV e riarrangiamenti abbastanza bene usando approcci DNAS dell'intero genoma. Il cancro scDNAseq è particolarmente utile per esaminare la profondità della complessità e le mutazioni del composto presenti in bersagli terapeutici amplificati come i geni della tirosina chinasi del recettore (EGFR, PDGFRA ecc.) In cui gli approcci convenzionali a livello di popolazione del tumore di massa non sono in grado di risolvere il co- modelli di occorrenza di queste mutazioni all'interno di singole cellule del tumore. Tale sovrapposizione può fornire ridondanza di attivazione della via e resistenza delle cellule tumorali.

Sequenziamento del metiloma a singola cellula del DNA

Il sequenziamento del metiloma del DNA a singola cellula quantifica la metilazione del DNA. Questo è simile al sequenziamento del genoma a singola cellula, ma con l'aggiunta di un trattamento al bisolfito prima del sequenziamento. Le forme includono il sequenziamento del bisolfito dell'intero genoma e il sequenziamento del bisolfito a rappresentazione ridotta

Saggio a singola cellula per cromatina accessibile con trasposasi con sequenziamento (scATAC-seq)

Il sequenziamento della cromatina accessibile da singola cellula mappa l'accessibilità della cromatina attraverso il genoma. Una trasposasi inserisce gli adattatori di sequenziamento direttamente nelle regioni aperte della cromatina, consentendo a tali regioni di essere amplificate e sequenziate.

Sequenziamento dell'RNA a cellula singola (scRNA-seq)

Metodi standard come microarrays e analisi standard di RNA-seq di massa analizzano l'espressione di RNA da vaste popolazioni di cellule. Nelle popolazioni di cellule miste, queste misurazioni possono oscurare differenze critiche tra le singole cellule all'interno di queste popolazioni.

Il sequenziamento dell'RNA a singola cellula (scRNA-seq) fornisce i profili di espressione delle singole cellule. Sebbene non sia possibile ottenere informazioni complete su ogni RNA espresso da ciascuna cellula, a causa della piccola quantità di materiale disponibile, i modelli di espressione genica possono essere identificati attraverso analisi di clustering genico. Questo può scoprire l'esistenza di rari tipi di cellule all'interno di una popolazione cellulare che potrebbero non essere mai stati visti prima. Ad esempio, rare cellule specializzate nel polmone chiamate ionociti polmonari che esprimono il regolatore di conduttanza transmembrana della fibrosi cistica sono state identificate nel 2018 da due gruppi che eseguono scRNA-Seq su epiteli polmonari.

Procedure sperimentali

Gli attuali protocolli scRNA-seq prevedono i seguenti passaggi: isolamento di singole celle e RNA, trascrizione inversa (RT), amplificazione, generazione di librerie e sequenziamento. I primi metodi separavano le singole cellule in pozzi separati; metodi più recenti incapsulano le singole cellule in goccioline in un dispositivo microfluidico, dove ha luogo la reazione di trascrizione inversa, convertendo gli RNA in cDNA. Ogni gocciolina porta un "codice a barre" del DNA che identifica in modo univoco i cDNA derivati ​​da una singola cellula. Una volta completata la trascrizione inversa, i cDNA di molte cellule possono essere mescolati insieme per il sequenziamento; le trascrizioni da una particolare cella sono identificate dal codice a barre univoco.

Le sfide per scRNA-Seq includono la conservazione dell'abbondanza relativa iniziale di mRNA in una cellula e l'identificazione di trascrizioni rare. La fase di trascrizione inversa è fondamentale in quanto l'efficienza della reazione RT determina quanta parte della popolazione di RNA della cellula verrà infine analizzata dal sequencer. La processività delle trascrittasi inverse e le strategie di innesco utilizzate possono influenzare la produzione di cDNA a lunghezza intera e la generazione di librerie distorte verso la fine dei geni da 3 "o 5".

Nella fase di amplificazione, la PCR o la trascrizione in vitro (IVT) sono attualmente utilizzate per amplificare il cDNA. Uno dei vantaggi dei metodi basati sulla PCR è la capacità di generare cDNA a lunghezza intera. Tuttavia, l'efficienza della PCR diversa su sequenze particolari (ad esempio, contenuto GC e struttura di snapback) può anche essere amplificata in modo esponenziale, producendo librerie con copertura irregolare. D'altra parte, mentre le librerie generate da IVT possono evitare distorsioni di sequenza indotte dalla PCR, sequenze specifiche possono essere trascritte in modo inefficiente, causando così l'abbandono della sequenza o generando sequenze incomplete. Sono stati pubblicati diversi protocolli scRNA-seq: Tang et al., STRT, SMART-seq, CEL-seq, RAGE-seq, Quartz-seq. e C1-CAGE. Questi protocolli differiscono in termini di strategie per la trascrizione inversa, la sintesi e l'amplificazione del cDNA e la possibilità di accogliere codici a barre specifici della sequenza (cioè UMI) o la capacità di elaborare campioni in pool.

Nel 2017, sono stati introdotti due approcci per misurare simultaneamente l'espressione di mRNA a singola cellula e di proteina attraverso anticorpi marcati con oligonucleotide noti come REAP-seq e CITE-seq.

applicazioni

scRNA-Seq sta diventando ampiamente usato in tutte le discipline biologiche tra cui sviluppo, neurologia, oncologia, malattie autoimmuni e malattie infettive.

scRNA-Seq ha fornito una visione approfondita dello sviluppo di embrioni e organismi, tra cui il verme Caenorhabditis elegans e la planariana rigenerativa Schmidtea mediterranea . I primi animali vertebrati ad essere mappati in questo modo furono Zebrafish e Xenopus laevis . In ogni caso sono stati studiati più stadi dell'embrione, consentendo di mappare l'intero processo di sviluppo su base cellula per cellula e la scienza ha riconosciuto questi progressi come la svolta dell'anno 2018.

considerazioni

Isolamento di singole celle

Esistono diversi modi per isolare le singole cellule prima dell'amplificazione e del sequenziamento dell'intero genoma. L'ordinamento cellulare attivato dalla fluorescenza (FACS) è un approccio ampiamente utilizzato. Le singole cellule possono anche essere raccolte mediante micromanipolazione, ad esempio mediante diluizione seriale o utilizzando una pipetta patch o un nanotubo per raccogliere una singola cellula. I vantaggi della micromanipolazione sono la facilità e il basso costo, ma sono laboriosi e suscettibili all'identificazione errata dei tipi di cellule al microscopio. La microdissezione laser-capture (LCM) può essere utilizzata anche per la raccolta di singole cellule. Sebbene LCM preservi la conoscenza della posizione spaziale di una cellula campionata all'interno di un tessuto, è difficile catturare un'intera singola cellula senza anche raccogliere i materiali dalle cellule vicine. I metodi ad alto rendimento per l'isolamento di singole cellule includono anche la microfluidica. Sia il FACS che la microfluidica sono accurati, automatici e in grado di isolare campioni imparziali. Tuttavia, entrambi i metodi richiedono innanzitutto il distacco delle cellule dal loro microambiente, causando in tal modo perturbazioni ai profili trascrizionali nell'analisi dell'espressione dell'RNA.

Numero di celle da analizzare

scRNA-Seq

In generale, per un tipico esperimento di sequenziamento di RNA (RNA-seq) a cellule sfuse, vengono generati dieci milioni di letture e viene considerato espresso un gene con una soglia superiore a 50 letture per kb per milione di letture (RPKM). Per un gene che è lungo 1kb, ciò corrisponde a 500 letture e un coefficiente di variazione (CV) minimo del 4% sotto l'ipotesi della distribuzione di Poisson. Per una tipica cellula di mammifero contenente 200.000 mRNA, i dati di sequenziamento di almeno 50 singole cellule devono essere raggruppati per raggiungere questo valore CV minimo. Tuttavia, a causa dell'efficienza della trascrizione inversa e di altri rumori introdotti negli esperimenti, sono necessarie più cellule per analisi accurate dell'espressione e identificazione del tipo di cellula.