Grande

Notizia

CasaCasa / Notizia / Grande

Aug 03, 2023

Grande

Parassiti e vettori volume 16, numero articolo: 265 (2023) Cita questo articolo 90 Accessi 4 Dettagli metriche altmetriche I flavivirus sono un gruppo eterogeneo di virus a RNA, che includono il virus eziologico

Parassiti e vettori volume 16, numero articolo: 265 (2023) Citare questo articolo

90 accessi

4 Altmetrico

Dettagli sulle metriche

I flavivirus sono un gruppo eterogeneo di virus a RNA, che comprendono gli agenti eziologici di Zika, dengue e febbre gialla trasmessi dalle zanzare. I flavivirus non codificano la trascrittasi inversa e non possono trascriversi inversamente nel DNA, tuttavia le sequenze di DNA dei flavivirus si trovano sia integrate nei cromosomi delle zanzare Aedes a Egypti sia come sequenze extracromosomiche. Abbiamo precedentemente esaminato l'Ae. aegizi per identificare le integrazioni di flavivirus e analizzare la conservazione di queste sequenze tra i dati dell'intero genoma di 464 Ae. aegizi raccolti in 10 paesi in tutto il mondo. Qui, abbiamo esteso questa analisi identificando sequenze di flavivirus in questi campioni indipendentemente dall'Ae. assemblea di riferimento dell'Egitto. Il nostro obiettivo era identificare l'insieme completo di sequenze virali, comprese quelle assenti nel genoma di riferimento, e la loro distribuzione geografica. Abbiamo confrontato le sequenze identificate utilizzando BLASTn e metodi di apprendimento automatico applicati per identificare cluster di sequenze simili. Oltre ai cluster di sequenze che corrispondono ai quattro eventi di integrazione virale che avevamo precedentemente descritto, abbiamo identificato 19 cluster più piccoli. L'unico cluster con una forte associazione geografica era costituito da sequenze simili a virus dell'agente di fusione cellulare specifiche della Thailandia. I restanti cluster non avevano un'associazione geografica e consistevano per lo più in brevi sequenze quasi identiche senza forte somiglianza con alcun genoma flavivirale noto. I dati di sequenziamento a lettura breve non ci hanno permesso di determinare se le sequenze identificate fossero extracromosomiche o integrate in Ae. cromosomi egiziani. I nostri risultati suggeriscono che il ceppo di Liverpool e il campo Ae. a Egypti hanno una varietà simile di DNA flavivirale conservato, il cui ruolo funzionale dovrebbe essere studiato in studi di follow-up.

Nella nostra precedente pubblicazione [1], abbiamo esaminato i genomi di riferimento di Aedes a Egypti e Ae. albopictus per identificare sequenze di flavivirus integrate per migliorare la nostra comprensione degli elementi virali endogeni non retrovirali (nrEVE) (vedere [2] per una revisione recente). Abbiamo anche esaminato i dati di sequenziamento dell’intero genoma Aedes disponibili al pubblico per comprendere la conservazione delle sequenze virali identificate. Abbiamo scoperto che nrEVE in Ae. albopictus erano molto diversi e con poca conservazione. Al contrario, abbiamo scoperto che quasi tutti i nrEVE nell'Ae. a Egypti ha avuto origine da quattro distinti eventi di integrazione virale (VIE). Abbiamo concluso che la diversità delle sequenze nrEVE flavivirali nel genoma di riferimento è il risultato della duplicazione e frammentazione di questi quattro VIE. L'Ae. a Egypti nrEVE frammenti erano presenti in quasi tutti gli isolati sequenziati esaminati, ma mostravano una struttura filogenetica a stella senza cladi, indicativa di un recente evento di espansione della popolazione da un antenato comune.

Oltre a questi quattro eventi principali, nel nostro lavoro precedente abbiamo osservato molte sequenze brevi (< 50 nt) simili a flavivirus nell'Ae. a Egypti, che all’epoca non analizzammo [1]. Inoltre, altre indagini hanno trovato lunghe sequenze con un'identità molto elevata (> 95%) di un virus agente di fusione cellulare (NC_001564.2), con una certa specificità geografica [3, 4]. Altri studi hanno scoperto che il DNA virale è generato dalle zanzare Aedes durante l’infezione da flavivirus [5, 6].

Il limite del nostro approccio precedente era l’attenzione agli nrEVE presenti nei genomi di riferimento delle zanzare. In questo breve rapporto, affrontiamo questa limitazione esaminando il panorama del presunto DNA flavivirale (pfDNA) in Ae. a Egypti indipendentemente dal genoma di riferimento. Nello specifico, miravamo a identificare qualsiasi pfDNA geograficamente specifico che fosse assente nel genoma di riferimento. In un'analisi approfondita, abbiamo incluso deliberatamente anche sequenze di alta qualità con una lunghezza di corrispondenza molto breve tra il DNA della zanzara e le sequenze virali per rafforzare qualsiasi segnale di sequenza conservato nelle regioni geografiche. Poiché stiamo utilizzando dati di sequenziamento a lettura breve, non siamo in grado di determinare se le sequenze di pfDNA sono intra o extracromosomiche. Inoltre non riesaminiamo le sequenze che appartengono ai quattro eventi di integrazione virale (da VIE1 a VIE4), come descritto in precedenza [1]. Per la nostra analisi abbiamo allineato 464 Ae pubblicamente disponibili. a Egypti per il sequenziamento dell'intero genoma (WGS) [7] in tutte le sequenze di Flaviviridae del database RefSeq dell'NCBI (n = 118, ad aprile 2020) [7] e nrEVE precedentemente identificati [1] (Tabella 1, File aggiuntivo 2: Fig. S1). Per l'allineamento, abbiamo utilizzato il software bowtie2 [8] con impostazioni molto sensibili (-D 15 -R 2 -N 0 -L 11 -i S, 1, 0,75). Le letture mappate sono state assemblate de novo utilizzando il software SPAdes (v3.13.0) [9] in 25.049 contig, con un numero medio di 53 contig per isolato (intervallo: 8–138). La distribuzione delle lunghezze contigue ha seguito una distribuzione di tipo esponenziale con una lunghezza media di 200 nt e un contig più lungo di 10.057 nt.

 97%) compared to Calbertado virus [1]. Thus, cluster 3 corresponds to what we previously termed VIE1. Based on our analysis here, the Ae. aegypti AaegL5 reference assembly has only half of the VIE1 sequence. This result is consistent with our previous observation that VIE1 is less conserved than VIE2, VIE3 or VIE4 [1]./p> 95% identity. The cluster was most prevalent in Ghana (19%) and Senegal (13%)./p> 100 nt (Additional file 3: Table S1). This bifurcation of clusters into those that contain only sequences < 50 nt and those that include sequences > 100 nt serves to separate white noise from genuine hits./p> 95% identity to sequences of these VIEs. Consequently, these 46 contigs also had hits against the Ae. aegypti reference genome. In addition, all four Madagascan samples had an identical 606-nt sequence that matched a 743–1349-nt region of a Cell-fusing agent virus with 86% identity. The remaining 516 contigs in the cluster had short (25–72 nt) hits against the viral genome and similar length hits (28–72 nt) against the Ae. aegypti reference genome. In post-clustering quality control, we found that clustering of these sequences was a statistical artifact. The e-value for pairs of contigs without any BLASTn hit was set to 1.0, and as a result the main similarity between these 516 contigs was dissimilarity to other contigs./p>