AI mokosi „kalbėti“ genetine „dialektu“ ateityje SARS-COV-2 Mutacijos numatymui

AI mokosi „kalbėti“ genetine „dialektu“ ateityje SARS-COV-2 Mutacijos numatymui

Ligos, sindromai

Praėjo penkeri metai nuo tada, kai Covidid-19 buvo paskelbtas pasauline pandemija. Kai SARS-COV-2 pereina prie endeminio statuso, išlieka klausimai apie jo ateitį. Tikėtina, kad atsiras nauji viruso variantai, kuriuos lemia teigiamas pasirinkimas tokiems bruožams kaip padidėjęs perdavimas, ilgesnė infekcijos trukmė ir galimybė išvengti imuninės gynybos. Šie pokyčiai galėtų leisti virusui plisti tarp anksčiau imunizuotų populiacijų, o tai gali sukelti naujas infekcijos bangas.

Numatant naujas virusų mutacijas, labai svarbu tobulinti gyvybės mokslo tyrimus, ypač bandant suprasti, kaip virusai vystosi, skleidžia ir veikia visuomenės sveikatą. Tradiciškai tyrėjai, norėdami ištirti mutacijas, pasikliauja šlapio laboratorijos eksperimentais. Tačiau šie eksperimentai gali būti brangūs ir reikalaujantys daug laiko.

Floridos Atlanto universiteto Inžinerijos ir informatikos koledžo tyrėjai sukūrė naują metodą, skirtą numatyti baltymų sekų mutacijas, vadinamą „Deep Novel“ mutacijų paieška (DNMS), dirbtinio intelekto modelio, kuris naudoja gilius neuroninius tinklus, mutacijų.

Tyrimui jie sutelkė dėmesį į SARS-COV-2 Spike baltymą-dalį viruso, atsakingo už pagalbą jam patekti į žmogaus ląsteles, ir panaudojo baltymų kalbos modelį, kad būtų galima numatyti galimas naujas šio baltymo mutacijas, kurių dar niekada nematė.

Norėdami tai padaryti, tyrėjai naudojo kalbos modelį „Protbert“, kuris buvo ypač sureguliuotas, kad suprastų SARS-COV-2 Spike baltymų „tarmę“. Modelis veikia pažvelgdamas į galimas mutacijas ir jas reitinguodamas remiantis keliais veiksniais. Tai apima gramatiškumą, kuris nurodo, kaip tikėtina ar „teisinga“ mutacija yra pagal modelio išmoktas gramatines taisykles, taip pat kaip panaši mutavusi seka yra nuo pradinio baltymo, kuris matuojamas semantiniais ir dėmesio pokyčiais.

Tyrimo rezultatai, paskelbti žurnale Ryšių biologijaparodykite, kad DNMS kalbos modelis gali atskirti sekas į grupes pagal jų panašumus. Modelis gali numatyti, kurios mutacijos gali įvykti ieškant mutacijų, sukeliančių tik nedidelius baltymo struktūros ir funkcijos pokyčius. Tai svarbu, nes daugeliu atvejų virusai, tokie kaip SARS-COV-2, vystosi per mažus pokyčius, leidžiančius jiems prisitaikyti drastiškai nepakeisdami savo bendros funkcijos.

DNMS metodas naudoja visą turimą informaciją apie seką ir mutacijas, kad būtų galima tiksliai numatyti, kurios mutacijos greičiausiai įvyks. Skirtingai nuo ankstesnių tyrimų, kuriuose paprastai nagrinėjami etaloninių baltymų sekos pakeitimai, DNMS pristato tėvų ir vaikų mutacijų numatymo modelį. Mutacijoms numatyti naudojama pirminė seka (esama baltymų seka), ir šios mutacijos analizuojamos atsižvelgiant į tai, kaip jos gali vystytis bėgant laikui.

„Mūsų modelis įvertina visas įmanomas mutacijas, kad surastų tas, kurios greičiausiai įvyks ateityje“, – sakė Xingquan „Hill“ Zhu, Ph.D., vyresnysis autorius ir FAU elektros inžinerijos ir informatikos katedros dėstytojas. „Mūsų tyrimas rodo, kad mutacijos po baltymo gramatikų, kurių pokyčiai buvo minimalūs, palyginti su pradine seka ir žemo dėmesio skirtumais, laikomos labiausiai tikėtinomis ateities mutacijomis.”

AI mokosi „kalbėti“ genetine „dialektu“ ateityje SARS-COV-2 Mutacijos numatymui

Metodas pirmiausia užima nurodytą SARS-COV-2 smaigalį baltymų seką ir imituoja visas įmanomas vieno taško mutacijas. Kiekvienai mutavusiems baltymo versijoms DNMS naudoja „Protbert“ modelį, kad apskaičiuotų, kaip tikėtina, kad kiekviena mutacija bus sekti baltymo „gramatika“ (gramatija) ir kokia panaši mutavusi seka yra nuo pirminės sekos (semantinis pokytis). Be to, modelyje nagrinėjamas dėmesys, matas, kuris buvo naudojamas tiriant baltymų struktūrą ir funkcijas, tačiau niekada anksčiau nebuvo taikomas mutacijų prognozei.

„Mūsų metodo raktas yra pagrindinė sekos pateiktas kontekstas. Šis kontekstas yra labai svarbus vertinant, ar potenciali mutacija atitinka baltymo” gramatiką „, – sakė Zhu. „DNMS veikia pasirinkdamas pirminę seką iš filogenetinio medžio – iš esmės virusinių padermių šeimos medis – ir imituodamas visas įmanomas mutacijas.”

Tyrime taip pat buvo nagrinėjamas numatomų mutacijų ir viruso tinkamumo ryšys arba tai, kaip gerai jis gali atkartoti ir išgyventi. Rezultatai rodo, kad mutacijos, turinčios didelį gramatiškumą, nedidelius semantinius pokyčius ir mažai dėmesio pokyčių, buvo susijusios su didesniu viruso tinkamumu. Tai rodo, kad mutacijos, kurios gerai atitinka baltymo biologines „taisykles“ ir sukelia minimalų baltymo struktūros ar funkcijos sutrikimą, yra labiau tikėtina, kad virusai bus naudingi.

„Mes tikime, kad vien tik sekos duomenų naudojimas gali padėti padaryti šias prognozes, nes baltymai laikosi tam tikrų biologinių taisyklių“, – sakė Zhu.

Tyrėjai išbandė DNM veiksmingumą atlikdami statistinę analizę. Jų rezultatai rodo, kad DNMS pralenkia kitus metodus prognozuodami naujas mutacijas, nes visus svarbius veiksnius sujungia į vieną tikslesnį prognozavimo modelį.

„Mūsų tyrėjų sukurtas tiksliai sureguliuotas, iš anksto apmokytas kalbos modelis gali numatyti, kurios SARS-COV-2 mutacijos labiau linkusios įvykti ateityje“,-teigė inžinerijos ir informatikos kolegijos dekanas Stella Batalama, Ph.D., Ph.D.

„Šis metodas gali būti naudingas atliekant eksperimentinius tyrimus, nes jis pateikia prognozes apie mutacijas, kol jos nėra stebimos populiacijoje, ir padeda visuomenės sveikatos pareigūnams sekti ir pasiruošti naujoms mutacijoms, kol jos plačiai plinta.”

Tyrimo bendraautorius yra Magdalyn E. Elkin, FAU elektrotechnikos ir informatikos katedros doktorantas.