Napredni napovedni modeli na osnovi genomskih in drugih molekularnih podatkov za diagnosticiranje in spremljanje kroničnih imunskih bolezni

Akronim: ModGenImuno
Trajanje projekta: 5 mesecev
Klasius-P-16: 9 - Zdravstvo in socialna varnost

OSNOVNI PODATKI VISOKOŠOLSKEGA ZAVODA
Medicinska Fakulteta, Univerza v Mariboru, Taborska Ulica 8, 2000 Maribor
Telefonska številka: (02)2345854
Elektronski naslov: uros.potocnik@um.si
Zakonit zastopnik visokošolskega zavoda: Prof. dr. Zdravko Kačič, rektor UM

OSNOVNI PODATKI ORGANIZACIJE IZ NEGOSPODARSKEGA ALI NEPROFITNEGA PODROČJA
Daniel Tement, informacijske tehnologije, s.p.
Zakonit zastopnik: Daniel Tement
Strokovni sodelavec: Daniel Tement

Utemeljitev in cilji projekta
Podjetje Daniel Tement, informacijske tehnologije, s.p., se ukvarja z raziskovalno in razvojno dejavnostjo na področju bioinformatike, predvsem razvojem novih računalniških algoritmov in aplikacij v medicinski diagnostiki. Med dosedanje največje dosežke podjetja spada razvoj računalniškega algoritma za interpretacijo  podatkov pridobljenih z aparatom za neinvazivno merjenje koncentracije glukoze v krvi.( patent PCT/IB2015/001788 ).  V zadnjem času se podjetje usmerja v kompleksno analizo genomskih podatkov in podatkov biokemijskih in drugih molekularnih biooznačevalcev. Podjetje želi razviti algoritme, bioinformatsksa orodja in računalniške aplikacije, ki bodo v pomoč znanstvenikom pri raziskovalnem delu na področju biomedicine kot tudi zdravnikom pri uspešnejšem diagnosticiranju in zdravljenju bolnikov ter samim bolnikom pri lažjem spremljanju poteka bolezni.  
Center za humano molekularno genetiko in farmakogenomiko (CHMGF) Medicinske fakultete Univerze v Mariboru že od leta 2005 aktivno in uspešno raziskuje genetske dejavnike tveganja za splošne pogoste kompleksne (multifaktorske) genetske bolezni, kar dokazujejo tudi odmevne objave s tega področja (Nature 2012, 491 (7422), 119-24). V okviru dosedanjih raziskav je CHMGF razvil biobanko kliničnih vzorcev (DNA, RNA, proteini), v katero je vključenih več kot 6000 bolnikov, ki so diagnosticirani za več kot 20 različnih bolezni. Biobanka je opremljena z osnovnimi laboratorijskimi in  kliničnimi podatki, vključno s potekom zdravljenja. Na vzorcih so bile izvedene številne analize genoma z najsodobnejšimi zmogljivimi tehnologijami različnih"omik", kot so genomika, transkriptomika, ki proizvajajo velike podatke in zahtevajo kompleksno bioinformatsko analizo. CIlj sodelovanja CHMGF in podjetja Tement sp. je združiti vrhunsko znanje biokemije, genetike in farmakogenomike CHMGF, razpoložljive podatke z znanjem, ki ga ima podjetje na področju razvoja računalniških algoritmov in bioinformatskih orodij.  

Nedavno je bilo dokazano, da je možno samo na osnovi analize  parametrov najosnovnejših krvnih preiskav s kompleksnimi algoritmi strojnega učenja diagnosticirat številne različne bolezni z več kot 60%-80% zanesljivostjo (Sci Rep. 2018 Jan 11;8(1):411.). Na osnovi teh izsledkov podjetja že tržijo aplikacije, ki so v pomoč zdravnikom pri diagnosticiranju bolezni. Na drugi strani so številne genetske študije dokazale, da k nastanku pogostih kroničnih bolezni v veliki meri prispeva genetski dejavnik, ki ga opišemo s kombinacijo variacij v dednem zapisu, predvsem polimorfizmi posameznega nukleotida (ang. SNP za Single Nucleotide Polymorphism). Raziskave asociacijskih študij celotnega genoma (ang. GWAs za Genome Wide Association) v katerih s tehnologijo mikromrež (biočipov) sočasno genotipiziramo več kot miljon SNPjev, so dokazale, da imajo posamezne bolezni različno genetsko arhitekturo. CIlj študije je ugotoviti, s kakšno zanesljivostjo lahko na podlagi analize genoma ločimo različne bolezni. Na osnovi podatkov GWAs analize in ostalih molekularnih biooznačevalcev bomo z metodami strojnega učenja poskušali izdelati napovedne modele za diagnosticiranje različnih vrst kroničnih imunskih bolezni (kronična vnetna črevesna bolezen, astma, multipla skleroza) in ugotoviti v kakšni meri se genetska arhitektura teh bolezni loči od ostalih bolezni, za katere imamo genomske podatke v naši biobanki (kronična bolezen ledvic, rak dojke, rak glave in vratu).
Cilj študije je:
-ugotoviti možnost razlikovanja med različnimi kroničnimi boleznimi samo na osnovi genetskih podatkov (GWAs, NGS)
-ugotoviti možnost razlikovanja med različnimi kroničnimi boleznimi na osnovi kombinacije genetskih podatkov (GWAs, NGS) in ostalih biooznačevalcev (transkriptom, genska ekspresija, epigenetika, podatki krvne analize)
-izdelati podlage za razvoj novih bioinformatskih orodij, ki bi bile v pomoč raziskovalcem pri interpretacije podatkov -omik.

Izvedljivost vsebinske zasnove projekta
Za dosego cilja bomo izvedli:
Najprej bomo iz podatkovnih zbirk naše biobanke sestavili panel vzorcev, za katere imamo na razpolago podatke genotipizacije polimorfizmov SNP z biočipom iCHIP in Illumina GSA. Izvedli bomo imputacijo do cca 10 milj SNPjev na vzorec.  Za dodatne izbrane polimorfizme bomo oblikovali genetske teste (začetne oligonukleotide) in načrtovali reakcije genotipizacije. Izbrane polimorfizme bomo genotipizirali na izolirani DNK z metodami PCR-RFLP, PCR-HRM ali TaqMan tehniko. V nadaljevanju bomo uporabili različne pristope strojnega učenja za optimalno diagnosticiranje različnih bolezni na osnovi genetskih podatkov. Izvedli bomo
-izdelavo filogenetsko drevo za izbrane  bolezni na osnovi genetske arhitekture;
-raziskovanje in generiranje bolj kompleksnih in natančnih napovednih modelov od bootstrap aggregated SVMs (npr. napovedovanje, ali je verjetno, da bo bolnik imel dober odziv na določeno zdravilo na osnovi genetskih podatkov in kliničnih parametrov);
-izdelava orodja za redukcijo kompleksnosti bioloških podatkov in za iskanje podskupin - hierarhični klastering.
Prav tako bomo načrtovali teste za merjenje ekspresije in izvedli laboratorijske eksperimente merjenja genske ekspresije.
Vloga podjetja je predvsem pri razvoju algoritmov strojnega učenja, ki jih bo možno uporabiti za napovedne modele nejverjetnejše diagnoze. Za  najbolj zanesljive modele bo podjetje preverilo tudi možnosti razvoja aplikacij, ki bi na uporabniku prijazen način pomagali zdravnikom pri postavitvi diagnoze.