Ar esame linkę sirgti tam tikromis ligomis, didžiąja dalimi priklauso nuo daugybės mūsų genomo variantų. Tačiau, ypač kalbant apie genetinius variantus, kurie retai pasitaiko populiacijoje, iki šiol buvo sunku nustatyti įtaką tam tikrų patologinių požymių atsiradimui.
Vokietijos vėžio tyrimų centro (DKFZ), Europos molekulinės biologijos laboratorijos (EMBL) ir Miuncheno technikos universiteto mokslininkai pristatė giluminiu mokymusi pagrįstą algoritmą, galintį numatyti retų genetinių variantų poveikį.
Straipsnis „Variantų anotacijų integravimas naudojant giluminius tinklus skatina retų variantų testavimą“ buvo paskelbtas Gamtos medicina .
Metodas leidžia tiksliau atskirti asmenis, turinčius didelę ligų riziką, ir palengvina genų, susijusių su ligų vystymusi, identifikavimą.
Kiekvieno žmogaus genomas skiriasi nuo kitų žmonių genomo milijonais atskirų elementų. Šie genomo skirtumai yra žinomi kaip variantai. Daugelis šių variantų yra susiję su tam tikrais biologiniais bruožais ir ligomis. Tokios koreliacijos dažniausiai nustatomos naudojant vadinamuosius genomo masto asociacijų tyrimus.
Tačiau asociacijų tyrimuose statistiškai dažnai nepaisoma retų variantų, kurių populiacijoje pasitaiko tik 0,1% ar mažiau, įtaka.
„Ypač reti variantai dažnai turi žymiai didesnę įtaką biologinio požymio ar ligos pateikimui“, – sako Brianas Clarke'as, vienas pirmųjų šio tyrimo autorių.
„Todėl jie gali padėti identifikuoti tuos genus, kurie vaidina svarbų vaidmenį vystant ligą ir gali nukreipti mus naujų terapinių metodų link”, – priduria pirmoji autorė Eva Holtkamp.
Siekdamos geriau numatyti retų variantų poveikį, komandos, vadovaujamos Oliverio Stegle'o ir Briano Clarke'o iš DKFZ ir EMBL bei Julieno Gagneur iš Miuncheno technikos universiteto, dabar sukūrė rizikos vertinimo įrankį, pagrįstą mašininiu mokymusi. „DeepRVAT“ (retų variantų asociacijos testavimas), kaip šį metodą pavadino mokslininkai, yra pirmasis, kuris naudoja dirbtinį intelektą (AI) genominės asociacijos tyrimuose, kad iššifruotų retus genetinius variantus.
Iš pradžių modelis buvo apmokytas pagal 161 000 asmenų iš JK Biobank sekos duomenis (egzomų sekas). Be to, mokslininkai teikė informaciją apie genetiškai paveiktus atskirų žmonių biologinius požymius, taip pat apie genus, susijusius su šiomis savybėmis.
Treniruotėms naudojamos sekos sudarė apie 13 milijonų variantų. Kiekvienam iš jų pateikiamos išsamios „anotacijos“, suteikiančios kiekybinę informaciją apie galimą poveikį, kurį atitinkamas variantas gali turėti ląstelių procesams arba baltymų struktūrai. Šios anotacijos taip pat buvo pagrindinė mokymo dalis.
Po treniruotės DeepRVAT gali kiekvienam asmeniui nuspėti, kurių genų veikimas yra sutrikęs dėl retų variantų. Tam algoritmas naudoja atskirus variantus ir jų anotacijas, kad apskaičiuotų skaitinę reikšmę, kuri nusako geno pažeidimo mastą ir galimą jo poveikį sveikatai.
Tyrėjai patvirtino DeepRVAT pagal genomo duomenis iš JK Biobank. 34 ištirtų bruožų, ty su liga susijusių kraujo tyrimų rezultatuose, tyrimo metodas nustatė 352 sąsajas su susijusiais genais, gerokai pranokstančias visus ankstesnius modelius. Rezultatai, gauti naudojant DeepRVAT, pasirodė esą labai patikimi ir geriau atkartojami nepriklausomuose duomenyse nei alternatyvių metodų rezultatai.
Kitas svarbus DeepRVAT pritaikymas – genetinio polinkio sirgti tam tikromis ligomis įvertinimas. Tyrėjai derino DeepRVAT su poligeniniu rizikos balu, pagrįstu įprastesniais genetiniais variantais. Tai žymiai pagerino prognozių tikslumą, ypač didelės rizikos variantų atveju.
Be to, paaiškėjo, kad DeepRVAT atpažino daugelio ligų, įskaitant įvairias širdies ir kraujagyslių ligas, vėžio tipus, medžiagų apykaitos ir neurologines ligas, genetines koreliacijas, kurios nebuvo nustatytos atliekant esamus tyrimus.
„DeepRVAT gali žymiai patobulinti personalizuotą mediciną. Mūsų metodas veikia nepriklausomai nuo bruožo tipo ir gali būti lanksčiai derinamas su kitais bandymo metodais”, – sako fizikas ir duomenų mokslininkas Oliveris Stegle. Jo komanda dabar nori kuo greičiau toliau išbandyti rizikos vertinimo įrankį didelio masto bandymuose ir pritaikyti jį.
Pavyzdžiui, mokslininkai jau bendrauja su INFORM organizatoriais. Šio tyrimo tikslas – panaudoti genominius duomenis, siekiant nustatyti individualiai pritaikytus gydymo būdus vėžiu sergantiems vaikams, kenčiantiems nuo atkryčio. DeepRVAT galėtų padėti atskleisti tam tikrų vaikų vėžio genetinį pagrindą.
„Manau, kad galimas DeepRVAT poveikis retų ligų taikymui yra jaudinantis. Vienas iš pagrindinių iššūkių retųjų ligų tyrime yra didelio masto, sistemingų duomenų trūkumas. Naudojant dirbtinio intelekto galią ir pusę milijono egzomų JK Biobanke, objektyviai nustatėme, kurie genetiniai variantai labiausiai pažeidžia genų funkciją“, – sako Julienas Gagneuras iš Miuncheno technikos universiteto.
Kitas žingsnis – integruoti DeepRVAT į Vokietijos žmogaus genomo fenomeno archyvo (GHGA) infrastruktūrą, kad būtų lengviau taikyti diagnostiką ir fundamentinius tyrimus.
Kitas DeepRVAT privalumas yra tas, kad šiam metodui reikia žymiai mažesnės skaičiavimo galios nei panašiems modeliams. „DeepRVAT“ galima įsigyti kaip patogus programinės įrangos paketas, kurį galima naudoti su iš anksto parengtais rizikos vertinimo modeliais arba apmokyti naudojant pačių mokslininkų duomenų rinkinius specializuotiems tikslams.