Hindi maipaliwanag na Kahulugan ng Pagtatakda ng Mga Regulasyon sa Pagkontrol sa DNA

Gumamit ang mga mananaliksik ng pagkakasunud-sunod ng DNA mula sa mga eksperimento na may mataas na resolusyon upang sanayin ang isang neural network na tinatawag na BPNet, na ang pagpapaandar sa loob ng “itim na kahon” ay pagkatapos ay isiniwalat upang ipakita ang mga pattern ng pagkakasunud-sunod at mga terminong programmatic para sa code ng pagkontrol ng genome. Kredito: Paglalarawan ni Mark Miller, Stowers Institute para sa Medical Research

Buksan ang itim na kahon upang makita ang mga patakaran ng code ng pagkontrol ng genome.

Ang mga mananaliksik sa Stowers Institute for Medical Research, na nakikipagtulungan sa mga kasamahan sa Stanford University at Munich Technical University, ay nakabuo ng matalinong-kahulugan (AI) na intelihensiya sa paglalakbay na panteknikal na nililinaw ang mga tagubiling kontrol na kasama sa DNA. Sa isang ulat na nai-publish sa online noong Pebrero 18, 2021, sa Kapaligirang Genetic, Natuklasan ng koponan na ang isang neural network na sinanay sa mga mapa ng pakikipag-ugnayan ng protina-DNA na may mataas na resolusyon ay maaaring makakita ng mga nakatagong mga pattern ng pagsasaliksik ng DNA sa mga gen at magbigay ng isang mas malalim na pag-unawa sa kung paano naka-program ang pagkakasunud-sunod na ito upang makontrol ang mga gen.

Ang mga neural network na makapangyarihang mga modelo ng AI ay maaaring matuto ng mga kumplikadong pattern mula sa iba’t ibang mga mapagkukunan ng data tulad ng mga imahe, signal ng pagsasalita, o tekstong mahuhulaan na mga tekstong mahuhulaan na nakakagulat na mataas. kawastuhan. Gayunpaman, maraming nakikita ang mga modelong ito bilang hindi maipaliwanag dahil ang mga mapag-isipang pamamaraan na natutunan ay mahirap na kunin mula sa modelo. Ang likas na ito ng itim na kahon ay hadlangan ang malawakang paggamit ng mga neural network sa biology, kung saan ang pagtukoy ng mga pattern ng haka-haka ay napakahalaga.

Ang isa sa pinakamalaking hindi malutas na isyu sa biology ay ang pangalawang code ng genome – ang control code. Ang mga base ng DNA (karaniwang kinakatawan ng mga titik na A, C, G, at T) ay hindi limitado sa mga tagubilin sa kung paano nabuo ang mga protina, ngunit din kung kailan at saan bumubuo ang mga protina at saan. Ang control code ay binabasa ng isang protina na tinatawag na transcript factor na nagbubuklod sa mga maikling extension ng DNA na tinatawag na mga motibo. Gayunpaman, kung paano ang isang partikular na kumbinasyon at pag-aayos ng mga motif na tumutukoy sa pag-andar ng kontrol ay isang lubhang kumplikadong isyu na mahirap lutasin.

Ngayon, isang koponan ng multidisciplinary ng mga biologist at mananaliksik sa computer na pinangunahan ng Stowers Investigator na si Julia Zeitlinger, PhD, at Anshul Kundaje, PhD, ng Stanford University, ay nakabuo ng isang neural network – tinatawag na Base Pair Network ng BPNet – na maaaring isalin upang makabuo ng control code ng hinuhulaan ang pagkakasunud-sunod ng mga umiiral na mga pagkakasunud-sunod ng DNA na may walang uliran kawastuhan. Ang susi ay upang maisagawa ang isang umiiral na pagsubok sa factor-DNA at gumawa ng isang modelo ng computer ng pinakamataas na resolusyon, hanggang sa antas ng mga indibidwal na base ng DNA. Ang pinataas na resolusyon na ito ay pinapayagan silang bumuo ng mga bagong tool sa pagsasalin upang maibukod ang mga pangunahing pattern ng pagkakasunud-sunod tulad ng mga kadahilanan na nagbubuklod ng kadahilanan at mga panuntunang nagbubuklod kung saan ang mga motif ay nagtutulungan bilang isang control code

“Napakasisiyahan nito,” sabi ni Zeitlinger, “dahil ang mga resulta ay umaayon sa mayroon nang mga resulta sa pagsubok, at nakakuha ng ilang nakakagulat na mga pananaw.”

Halimbawa, ang mga modelo ng neural network ay nagbibigay-daan sa mga mananaliksik na makahanap ng isang kapansin-pansin na batas na namamahala sa pagbubuklod ng isang mahusay na pinag-aralan na sangkap na tinatawag na Nanog. Nalaman nila na ang Nanog ay nagbubuklod kasama ang DNA kapag ang mga duplicate ng sangkap nito ay matatagpuan paminsan-minsan na lilitaw sa parehong bahagi ng helix ng DNA.

“Nagkaroon ng mahabang linya ng katibayan upang patunayan na ang mga pansamantalang agwat ay minsan nasa balangkas ng regulasyon,” sabi ni Zeitlinger. “Gayunpaman, ang sitwasyon ay katakut-takot, at si Nanog ay hindi pa naging isang pinaghihinalaan. Ang pag-alam na si Nanog ay may ganoong pattern, at nakikita ang higit pang mga detalye ng kanyang pakikipag-ugnayan, nakakagulat dahil hindi namin direktang hinahanap ang pattern.”

“Ito ay isang mahusay na bentahe ng paggamit ng mga neural network sa gawaing ito,” sabi ni Aviga Avsec, PhD, unang may-akda ng papel. Ang Avsec at Kundaje ay gumawa ng unang uri ng modelo kung saan binisita ni Avsec si Stanford habang nag-aaral para sa isang titulo ng doktor sa board ng Julien Gagneur, PhD, sa Technical University sa Munich, Germany.

“Mas maraming tradisyonal na bioinformatics ang lumalapit sa sample na data na gumagamit ng mahuhulaan na mga patakaran batay sa magagamit na kaalaman. Gayunpaman, ang biology ay labis na mayaman at kumplikado, “sabi ni Avsec. “Sa pamamagitan ng paggamit ng mga neural network, maaari naming sanayin ang mga nababaluktot at naiiba na mga modelo na natututo ng mga kumplikadong pattern mula sa simula nang walang paunang kaalaman, kaya pinapayagan ang pagtuklas ng mga nobela.”

Ang disenyo ng network ng BPNet ay katulad ng mga neural network na ginamit para sa pagkilala sa mukha sa mga imahe. Halimbawa, ang neural network ay nagsisimulang hanapin ang mga gilid sa mga pixel, pagkatapos ay natututunan kung paano bumubuo ang mga gilid ng mga bagay na pangmukha tulad ng mata, ilong, o bibig, at sa wakas ay natuklasan kung paano nagkakilala ang mga bagay sa mukha upang mabuo ang mukha. Sa halip na matuto mula sa mga pixel, natututo ng BPNet ang berdeng pagkakasunud-sunod ng DNA at natututo upang mahanap ang pagkakasunud-sunod ng mga motif at sa wakas ay may mga patakaran ng mataas na pagkakasunud-sunod kung saan hinuhulaan ng mga elemento ang pangunahing data ng umiiral.

Kapag ang modelo ay sinanay upang maging mas tumpak, ang mga pattern ng pag-aaral ay nakuha sa mga tool sa pagsasalin. Ang output signal ay sinusundan pabalik sa pagkakasunud-sunod ng pag-input upang ipakita ang mga motif ng pagkakasunud-sunod. Ang pangwakas na hakbang ay ang paggamit ng modelo bilang isang orakulo at pormal na magtanong tungkol sa mga tiyak na pagkakasunud-sunod ng mga pagkakasunud-sunod ng DNA, tulad ng kung ano ang maaaring gawin upang subukan ang pang-eksperimentong pag-iisip, upang mabalangkas ang mga batas na gumagana sa pagkakasunud-sunod ng mga bagay sa isang interactive na paraan.

“Ang magandang bagay ay ang modelo ay maaaring mahulaan ang mas sunud-sunod na mga pamamaraan na maaari naming subukan sa pamamagitan ng pagsubok,” sinabi ni Zeitlinger. “Bukod dito, sa pamamagitan ng paghula ng kinalabasan ng pagkasira ng pang-eksperimentong, mahahanap natin ang mas matatag na mga pagsubok upang mapatunayan ang modelo.” Sa katunayan, sa tulong ng genetic predisposition ng CRISPR, nakumpirma ng mga mananaliksik na ang mga hula ng modelo ay mas tumpak.

Dahil ang pamamaraang ito ay nababaluktot at naaangkop sa iba’t ibang mga uri ng data at uri ng cell, nangangako itong humantong sa isang mabilis na lumalagong pag-unawa sa control code at kung paano nakakaapekto ang pagkakaiba-iba ng genetiko sa pagsasaayos ng gen. Ang parehong Zeitlinger Lab at Kundaje Lab ay gumagamit na ng BPNet upang tumpak na makilala ang mga motif na nagbubuklod sa iba pang mga uri ng cell, nag-link ng mga motif na may mga biophysical na parameter, at pag-aralan ang iba pang mga tampok na tukoy sa genome tulad ng mga nauugnay sa pagsunud-sunod ng DNA. Upang paganahin ang iba pang mga siyentipiko na gumamit ng BPNet at iakma ito sa kanilang mga pangangailangan, ginawang magagamit ng mga mananaliksik ang buong balangkas ng software sa pamamagitan ng mga teksto at kurso.

Sanggunian: “Pangunahing mga solusyon para sa mga modelo ng pagbigkis ng teksto na nagpapahayag ng isang malambot na motif na syntax” ni Žiga Avsec, Melanie Weilert, Avanti Shrikumar, Sabrina Krueger, Amr Alexandari, Khyati Dalal, Robin Fropf, Charles McAnany, Julien Gagneur, Zehullinger, Anshul Kont Pebrero 18, 2021, Kapaligirang Genetic.
SEKSYON: 10.1038 / s41588-021-00782-6

Ang iba pang mga kalahok sa pag-aaral ay kasama sina Melanie Weilert, Sabrina Krueger, PhD, Khyati Dalal, Robin Fropf, PhD, at Charles McAnany, PhD, mula sa Stowers; at Avanti Shrikumar, PhD, at Amr Alexandari ng Stanford University.

Ang gawaing ito ay suportado ng bahagi ng Stowers Institute for Medical Research at ng National Human Genome Research Institute (iginawad ang R01HG009674 at U01HG009431 sa AK at R01HG010211 sa JZ) at ng National Institute of General Medical Science (DP2GM123485 sa AK) para sa National Institutes of Health (NIH). Kasama sa karagdagang suporta ang German Bundesministerium für Bildung und Forschung (proyekto MechML 01IS18053F sa ZA) at ang Stanford BioX Fellowship at ang Howard Hughes Medical Institute International Student Research Fellowship (sa AS). Ang follow-up ay isinasagawa sa Stowers Institute for Medical Research at University of Kansas Medical Center Genomics Core na suportado ng mga parangal ng NIH mula sa National Institute of Child Health and Human Development (U54HD090216), Office of the Director (Instrumentation S10OD021743), at National Institute of General Medical Science (COBRE P30GM122731). Ang nilalaman ay ang nag-iisang responsibilidad ng mga may-akda at hindi dapat kinakailangang ipakita ang mga opisyal na pananaw ng NIH.

Itakda ang Buod ng Mga Natuklasan

Kilala ang DNA sa pag-encode ng protina nito. Naglalaman din ito ng isa pang code – control code – na nagdidirekta kung kailan at saan nagagawa ang mga protina. Sa isang ulat na nai-publish sa online noong Pebrero 18, 2021, sa Kapaligirang Genetic, Ang mga mananaliksik mula sa lupon ng Julia Zeitlinger, PhD, mananaliksik sa Stowers Institute for Medical Research, at mga kalahok mula sa Stanford University at ang Technical University ng Munich ay inilarawan kung paano nila ginamit ang tunog na lohika upang matulungan linawin ang code ng pagkontrol sa genome.

Ang mga mananaliksik ay nakabuo ng isang neural network na ang panloob na pag-andar ay maaaring napansin sa pamamagitan ng paglalantad ng mga pattern ng pagkontrol sa pagkakasunud-sunod ng DNA at ang kanilang mga layunin sa pagpaplano ng mataas na antas mula sa mataas na antas na data ng genomics. Inaasahan ng Zeitlinger Lab na ang mga modelo ng haka-haka, panuntunan, at mapa na ginawa gamit ang ganitong uri ng pamamaraan ay hahantong sa isang mas mahusay na pag-unawa sa pagkakaiba-iba ng genetiko na nauugnay sa kalikasan at sakit sa mga rehiyon ng pagkontrol ng DNA.

Related articles

Comments

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Share article

Latest articles

Ang paglulunsad ng NASA Walnops rocket ay makikita sa East America

Mapa ng visibility ng Kinnet-X. Kredito: NASA A. Mission upang tuklasin ang transportasyon sa kalawakan gamit ang enerhiya a NASA Ang rocket na tunog...

Bakit kaya mahirap magamot ang COVID-19? Isang Komprehensibong Pagsuri sa Alam Namin

Lumalagong Mga Punto ng Katibayan ng Hindi Karaniwang Nakakahawang Profile Isang komprehensibong pagsusuri ng alam namin COVID-19 at kung paano ito gumagana ay nagmumungkahi na...

Nakikita ng NASA ang mga alon sa ibabaw ng dagat [Video]

Ang mga alon sa loob, o mga papasok na alon, ay maaaring umabot ng daan-daang mga paa sa ibaba ng ibabaw ng karagatan, ngunit...

Mga Kamangha-manghang Dinosauro na Naghahanap ng Kadiliman

Muling pagbuo ng Shuvuuia deserti artist. Kredito: Viktor Radermaker Ang maliit na dinosauro na nakatira sa disyerto ng Shuvuuia ay may natatanging paningin at...

Ang “Molecular glue” ay nagdaragdag ng kahusayan at ginagawang mas maaasahan ang pereskite solar cells sa paglipas ng panahon

Ginamit ng mga mananaliksik ang self-assemble na solong-layer na "molekular na pandikit" upang patigasin ang mga interface sa pereskite solar cells upang gawing mas...

Newsletter

Subscribe to stay updated.