O echipă de specialiști și studenți ai Departamentului de Genetică al Facultății de Biologie din cadrul Universității din București a realizat prima secvențiere a genotipului unui organism eucariot pluricelular (din aceasta categorie fac parte toate plantele si animalele) realizată integral în România. Denumirea de genotip este mai potrivită pentru informația genetică a unui individ sau a unei populații locale decât termenul general, de genom, care ar trebui utilizat pentru specie.

Echipa laboratorului Drosophila a secvențiat genotipul (Whole Genome Sequencing)unei linii autohtone de Drosophila melanogaster (musculița de oțet), derivată din indivizi colectați din locația sub-montană Romanii de Sus – Horezu (Vâlcea) și stabilizată în cadrul laboratorului.

Experiența practică dobândită în cadrul acestui proiect pilot va permite echipei laboratorului Drosophila din cadrul Facultății de Biologie a UB să abordeze numeroase aspecte teoretice și practice legate de genomica și genetica speciei D.melanogaster, dar și să ia în calcul secvențierea genotipurilor și genomurilor altor linii sau specii de interes, inclusiv Homo sapiens.

De altfel, una dintre principalele activități de cercetare desfășurate în laboratorul Drosophila al Facultății de Biologie a UB este analiza bioinformatică a prezenței, frecvenței și distribuției elementelor genetice mobile, numite transpozoni, în genotipul liniei Horezu.

Interpretarea datelor de secvențiere reprezintă o mare provocare în ceea ce privește complexitatea softwarelor de bioinformatică și puterea de calcul necesare pentru adnotarea structurală a transpozonilor de interes din genotipul liniei D. melanogaster-Horezu.

Acest demers experimental permite abordarea unor aspecte teoretice și practice legate de genomica și genetica speciei D. melanogaster, iar caracterizarea transpozonilor din clasa II în linii autohtone reprezintă subiectul unei teze de doctorat aflată în plină desfășurare în laboratorul Drosophila.

Interpretarea datelor de secvențiere referitoare la linia românească de D. melanogaster a fost realizată în laboratorul Drosophila al Facultății de Biologie a UB, inclusiv cu ajutorul programului de bioinformatică Genome ARTIST (www.genomeartist.ro), dezvoltat tot în acest laborator.

Membrii echipei implicate în experimentul de secvențiere sunt lect. univ. dr. Rațiu C. Attila, doctorand Bologa M. Alexandru, masterand Ghiță C. Iulian, student Bălănescu V. Mihnea și conf. univ. dr. Alexandru Al. Ecovoiu.
Obținerea și prelucrarea secvențelor de nucleotide a solicitat un calculator echipat cu 32 Gb RAM DDR4, procesor i7-6500U, SSD 500 Gb și sistem de operare LINUX MINT, la care a fost conectat dispozitivul de secvențiere Oxford Nanopore MinION, pus la dispoziție cu generozitate de către colegii microbiologi.

După 48 de ore de secvențiere efectivă, au fost generate 36,5 Gb de date specifice, a căror prelucrare ulterioară în format special a solicitat încă 4 zile de calcul continuu, astfel încât calculatorul a rulat neîntrerupt aproximativ 6 zile, în perioada 28 februarie – 4 martie 2020.

Colecția de reads-uri (secvențe) a fost depozitată în baza de date internațională National Center for Biotechnology Information (NCBI), iar link-ul poate fi accesat aici.

În imaginea disponibilă aici este reprezentată o ierarhie taxonomică a reads-urilor depuse în NCBI. După cum poate fi observat, o porțiune mare din reads-uri acoperă regiuni din genomul D. melanogaster, în timp ce o fracțiune mai mică de reads-uri sunt asociate genomurilor unor bacterii din microbiota intestinală a musculițelor (specii cum ar fi Providencia rettgeri, Leuconostoc pseudomesenteroides, Serratia marcescens, Chryseobacterium timonianum).