Glazgo universiteto mokslininkai padėjo sukurti naują metodą, skirtą suprasti skirtingų DNR sekų ryšius ir jų kilmę.
Ši informacija plačiai taikoma – nuo virusų, tokių kaip SARS-CoV-2, koronaviruso atmaina, sukelianti COVID-19, vystymosi supratimo iki tikslios medicinos, požiūrio į ligų gydymą ir prevenciją, kai atsižvelgiama į individualią genetinę informaciją.
Tyrimas, kuriam vadovavo Big Data Institute, paskelbtas m GENETIKA ir yra 2024 m. rugsėjo mėn. leidimo pagrindinis straipsnis.
Genetika greitai tampa mūsų kasdienio gyvenimo dalimi. Beveik kiekvieną savaitę laikraščio antraštė apie genetiką ir žmogaus protėvius pasirodo su didžiuliais DNR sekų duomenų rinkiniais, kurie reguliariai generuojami ir naudojami medicininiams tyrimams.
Šiuos genominius didelius duomenis galime suprasti išnagrinėję istorinį procesą, kuris juos sukūrė, kitaip tariant, iš kur atsirado DNR sekos. Jei paimtume nedidelę kažkieno DNR dalį, žinome, kad ji turėjo būti gauta iš vieno iš dviejų pastarosios kartos tėvų, o anksčiau iš vieno iš keturių jų senelių ankstesnėje kartoje ir pan. Tai reiškia, kad galime pavaizduoti skirtingų DNR sekcijų istoriją, atsekdami jas atgal per laiką.
Jei tai padarysime su dideliu DNR sekų rinkiniu iš skirtingų žmonių, galime sukurti genetinių „šeimos medžių“ rinkinį, DNR sekų genealogiją. Šis didysis paveldėjimo tinklas kartais vadinamas protėvių rekombinacijos grafiku (ARG). Ankstesnis tos pačios tyrimų grupės darbas parodė, kad tokie tinklai gali būti naudojami ne tik mūsų genomo istorijai nušviesti, bet ir DNR duomenims suspausti bei genetinėms analizėms paspartinti.
Pagrindinis autorius ir evoliucijos genetikas iš Didžiųjų duomenų instituto dr. Yan Wong sakė: „Stebėtinai mažai sutarta, kaip tiksliai pavaizduoti tokį protėvių rekombinacijos grafiką kompiuteryje. Šiame tyrime aprašome paprastą ir veiksmingą genetinių duomenų kodavimą. genealogijos, kuriose kiekvienas protėvis gali būti laikomas fragmentiniu DNR ilgiu arba „protėvių genomu“ tam tikru momentu praeityje. Šiandieninių genetinių sekų istorija atsekama per tuos protėvių genomus, stebint, kurie DNR gabalai buvo sukurti. iš kurių protėvių paveldėjo“.
Dr. Anastasija Ignatjeva iš Glazgo universiteto Matematikos ir statistikos mokyklos yra tyrimo bendraautorė ir prisidėjo kuriant naują metodiką. Daktarė Ignatjeva sakė: „Genetinius ryšius tarp atrinktų individų galima pavaizduoti diagrama, vadinama genetine genealogija.
„Genealogijų atkūrimas iš sekos duomenų yra itin aktyvi dabartinių populiacijos genetikos tyrimų tema, nes jie leidžia mums sužinoti apie evoliucinius procesus, kurie formuoja genetinę įvairovę. Mūsų darbe pateikiamas universalus būdas koduoti genealogijas kaip grafikus, leidžiančias lengviau dalytis ir skirtingų mokslininkų grupių visame pasaulyje gautų rezultatų palyginimas.
Naudojant šią paprastą schemą, įrašant informacijos perdavimą iš genomo į genomą, tyrimas rodo, kad tas pats genetinis protėvis gali būti saugomas skirtingais tikslumo laipsniais. Tai reiškia, kad ryšius tarp skirtingų DNR sekų galima pavaizduoti net nežinant ar atspėjus tikslaus sujungimų ir skilimų laiko, kuriais grindžiama tikroji paveldėjimo istorija.
Tyrėjai taip pat rodo, kad jų genetinio paveldėjimo aprašymas yra pakankamai lankstus, kad būtų galima susidoroti su daugybe skirtingų metodų, kuriuos mokslininkai šiuo metu naudoja genetinės istorijos rekonstrukcijai.
Šis metodas leidžia mokslininkams saugoti ir analizuoti didelius genetinių duomenų kiekius standartiniame nešiojamajame kompiuteryje ir jis apibendrina visas gyvybės rūšis žemėje. Pavyzdžiui, ji sudaro daugiau nei 7000 viešai prieinamų viso žmogaus genomo sekų, kurias mokslininkai paskelbė anksčiau, „vieningos genealogijos“ pagrindą. Šiuo metu jie kuria milijonų SARS-CoV-2 genomų, surinktų per koronaviruso pandemijos laikotarpį, genealogiją, kuri leis analizuoti naujausią viruso istoriją ir tiksliai nustatyti naujų mišrių (arba „rekombinantinių“) atsiradimą. padermės.
Dr Wong pridūrė: „Tikimės, kad šis formalus genetinių genealogijų vaizdavimo standartas gali padėti suvienodinti genetinės istorijos sritį ir padėti mokslininkams lengviau analizuoti, dalytis ir palyginti rezultatus. Tai bus labai svarbu, kai pereisime prie genominės medicinos era, kai genetiniai duomenys bus naudojami ligoms diagnozuoti ir gydyti, o mūsų genomų istorijos supratimas bus labai svarbus norint suprasti mūsų sveikatą ir protėvius.