Atviros prieigos ištekliai supaprastina vėžio potipių klasifikavimą tyrėjams

Atviros prieigos ištekliai supaprastina vėžio potipių klasifikavimą tyrėjams

Gyvensena mityba, dietos, judėjimas

Daugiainstitucinė mokslininkų komanda sukūrė nemokamą, viešai prieinamą šaltinį, padedantį klasifikuoti pacientų navikų mėginius, remiantis skirtingomis molekulinėmis savybėmis, kurias nustatė Vėžio genomo atlaso (TCGA) tinklas.

Išteklių sudaro klasifikatorių modeliai, kurie gali paspartinti vėžio potipių specifinių tyrimų rinkinių, naudojamų klinikiniams tyrimams ir vėžio diagnostikai, kūrimą. Tai svarbi pažanga, nes skirtingiems potipiams priklausantys navikai gali skirtis savo atsaku į vėžio gydymą.

Šis išteklius yra pirmasis tokio pobūdžio šaltinis, kuris užpildo atotrūkį tarp didžiulės TCGA duomenų bibliotekos ir klinikinio įgyvendinimo.

Straipsnis, kuriame aprašomos šiandien internete paskelbtos priemonės Vėžio ląstelė.

„TCGA nustatė kiekvieno pagrindinio vėžio tipo molekulinius potipius. Naudodami šį išteklį siekėme suteikti klinikinėms ir mokslo bendruomenėms priemones, leidžiančias naujai diagnozuotą naviką priskirti vienam iš šių nustatytų potipių”, – sakė daktaras Peteris W. Lairdas. D., Peterio ir Emajeano Cooko epigenetikos katedra Van Andelio institute ir tyrimo pagrindinis autorius.

„Mūsų naujasis išteklius bus galingas turtas kuriant klinikinius tyrimus, pagrįstus įvairiais vėžio molekuliniais skirtumais.”

TCGA buvo dešimtmetį trukęs Nacionalinio vėžio instituto vadovaujamas pastangas sukurti išsamius 33 vėžio tipų molekulinius žemėlapius. Skirtingai nuo tradicinių metodų, kurie apibrėžia vėžį pagal organą ar audinį, kuriame jie atsiranda, TCGA nustatė niuansuotas genomines, epigenomines, proteomines ir transkriptomines savybes, kurios tiksliau apibūdina vėžio potipius.

Andrew D. Cherniackas, Ph.D. iš Plačiojo MIT instituto ir Harvardo, ir Kyle'as Ellrottas, Ph.D. iš Knight Cancer Institute Oregono sveikatos ir mokslo universitete, taip pat yra atitinkami šio straipsnio autoriai. daugiau nei dešimčių mokslinių tyrimų organizacijų mokslininkų pastangos.

„Kadangi daugelis TCGA molekulinių potipių buvo sukurti naudojant šimtus ar tūkstančius funkcijų iš kelių duomenų tipų, mokslininkai ir gydytojai paprašė mūsų pagalbos sudarant jų mėginius“, – sakė Cherniackas. „Mūsų ištekliai labai supaprastina šį procesą.”

Komanda sukūrė naują šaltinį, panaudodama duomenis iš 8 791 TCGA vėžio mėginio, kuris sudarė 26 vėžio kohortas ir 106 vėžio potipius. Tada jie naudojo esamus mašininio mokymosi įrankius, kad sukurtų ir išbandytų beveik pusę milijono modelių šešiose kategorijose – genų ekspresija, DNR metilinimas, miRNR, kopijų skaičius, mutacijų iškvietimai ir multi-omika – ir atrinko tuos, kurie geriausiai pasirodė įtraukti į internetinį šaltinį. .

Iš viso šaltinyje yra 737 paruošti naudoti modeliai, kurie atspindi geriausius kiekvienos iš 26 vėžio grupių modelius, penkis mokymo algoritmus ir šešis duomenų tipus.

„Pagrindinis šių pastangų elementas buvo siekis užtikrinti, kad šiuos modelius galėtų panaudoti kitos grupės į naujus duomenų rinkinius“, – sakė Ellrottas. „Pernelyg dažnai tokio tipo darbus sunku pakartoti arba pritaikyti naujiems pavyzdžiams.”