Tyrėjai apibūdina pažadus, iššūkius suprasti AI biologiniams atradimams

Tyrėjai apibūdina pažadus, iššūkius suprasti AI biologiniams atradimams

Gyvensena mityba, dietos, judėjimas

Mašinų mokymasis yra galingas kompiuterinės biologijos įrankis, leidžiantis analizuoti įvairius biomedicininius duomenis, pvz., genomines sekas ir biologinį vaizdą. Tačiau kai mokslininkai naudoja mašininį mokymąsi skaičiavimo biologijoje, modelio elgesio supratimas išlieka labai svarbus norint atskleisti pagrindinius sveikatos ir ligų biologinius mechanizmus.

Neseniai paskelbtame straipsnyje Gamtos metodaiCarnegie Mellon universiteto Kompiuterių mokslo mokyklos mokslininkai siūlo gaires, kuriose nurodomos spąstos ir galimybės naudoti interpretuojamus mašininio mokymosi metodus sprendžiant skaičiavimo biologijos problemas. Perspektyvų straipsnis „Interpretuojamo mašininio mokymosi taikymas skaičiavimo biologijoje – spąstai, rekomendacijos ir galimybės naujiems pokyčiams“ yra publikuojamas žurnalo rugpjūčio mėn. specialiame leidime apie AI.

„Interpretuojamas mašininis mokymasis sukėlė didelį jaudulį, nes mašininis mokymasis ir dirbtinio intelekto įrankiai yra taikomi vis svarbesnėms problemoms spręsti“, – sakė CMU mašininio mokymosi katedros (MLD) docentė Ameet Talwalkar.

„Kadangi šie modeliai tampa vis sudėtingesni, yra daug pažadų ne tik kurti labai nuspėjančius modelius, bet ir kurti įrankius, kurie padeda galutiniams vartotojams suprasti, kaip ir kodėl šie modeliai daro tam tikras prognozes. Tačiau labai svarbu pripažinti, kad interpretuojamas mašininis mokymasis dar pateikti šios aiškinamumo problemos sprendimus iki galo.

Straipsnyje bendradarbiauja doktorantai Valerie Chen iš MLD ir Muyu (Wendy) Yang iš Ray ir Stephanie Lane skaičiavimo biologijos katedros. Ankstesnis Cheno darbas, kritikuojantis interpretuojamo mašininio mokymosi bendruomenės nepakankamą pagrindą tolesnio naudojimo atvejais, įkvėpė straipsnį, o idėja buvo sukurta diskutuojant su Yang ir Jian Ma, Ray ir Stephanie Lane skaičiavimo biologijos profesoriais.

„Mūsų bendradarbiavimas prasidėjo nuo gilaus nardymo į skaičiavimo biologijos dokumentus, kad būtų galima ištirti interpretuojamų mašininio mokymosi metodų taikymą“, – sakė Yang. „Pastebėjome, kad daugelis programų šiuos metodus naudojo šiek tiek ad hoc būdu. Mūsų tikslas šiuo dokumentu buvo pateikti gaires, kaip patikimiau ir nuosekliau naudoti interpretuojamus mašininio mokymosi metodus skaičiavimo biologijoje.”

Viena iš pagrindinių popieriaus spąstų yra pasikliauti vienu interpretuojamu mašininio mokymosi metodu. Vietoj to, mokslininkai rekomenduoja naudoti kelis interpretuojamus mašininio mokymosi metodus su įvairiais hiperparametrų rinkiniais ir palyginti jų rezultatus, kad būtų galima išsamiau suprasti modelio elgesį ir jo pagrindines interpretacijas.

„Nors atrodo, kad kai kurie mašininio mokymosi modeliai veikia stebėtinai gerai, dažnai nesuprantame, kodėl“, – sakė Ma. „Mokslo srityse, tokiose kaip biomedicina, norint atrasti pagrindinius biologinius mechanizmus, labai svarbu suprasti, kodėl modeliai veikia.”

Straipsnyje taip pat įspėjama, kad vertinant interpretuojamus mašininio mokymosi metodus negalima rinkti rezultatų, nes tai gali lemti neišsamius arba šališkus mokslinių išvadų aiškinimus.

Chenas pabrėžė, kad gairės gali turėti platesnį poveikį platesnei tyrėjų auditorijai, besidomintiems interpretuojamų mašininio mokymosi metodų taikymu savo darbe.

„Tikimės, kad mašininio mokymosi tyrėjai, kuriantys naujus interpretuojamus mašininio mokymosi metodus ir įrankius, ypač tie, kurie aiškins didelius kalbos modelius, atidžiai apsvarstys į žmogų orientuotus interpretuojamo mašininio mokymosi aspektus“, – sakė Chenas. „Tai apima supratimą, kas yra jų tikslinis vartotojas ir kaip metodas bus naudojamas ir įvertintas.”

Nors modelio elgsenos supratimas išlieka labai svarbus moksliniams atradimams ir iš esmės neišspręstai mašininio mokymosi problemai, autoriai tikisi, kad šie iššūkiai paskatins tolesnį tarpdisciplininį bendradarbiavimą, siekiant palengvinti platesnį AI naudojimą siekiant mokslinio poveikio.