Naslov | Predviđanje genskog izražaja modelima dubokih neuronskih mreža |
Naslov (engleski) | Prediction of gene expression by deep neural network models |
Autor | Mateo Dokić |
Mentor | Goran Mauša (mentor) |
Član povjerenstva | Miroslav Joler (predsjednik povjerenstva) |
Član povjerenstva | Goran Mauša (član povjerenstva) |
Ustanova koja je dodijelila akademski / stručni stupanj | Sveučilište u Rijeci Tehnički fakultet Rijeka |
Datum i država obrane | 2024-09-12, Hrvatska |
Znanstveno / umjetničko područje, polje i grana | TEHNIČKE ZNANOSTI Računarstvo |
Sažetak | Ovaj rad istražuje primjenu dubokih neuronskih mreža, konkretno modela Enformer i CRMnet, u predviđanju genskog izražaja, što je ključno u području bioinformatike i molekularne biologije. Predviđanje genskog izražaja ima značajne primjene u biomedicinskim znanostima, uključujući personaliziranu medicinu, identifikaciju terapeutskih meta, razvoj novih lijekova, te poboljšanje otpornosti i produktivnosti biljaka u poljoprivredi. Kroz analizu performansi ovih modela na specifičnim skupovima podataka, CRMnet se pokazao superiornim u preciznosti predviđanja na skupu podataka za kvasac, primjerice s Pearsonovim koeficijentom korelacije (R) od 0.8797, dok je Enformer postigao nižu vrijednost od 0.6130. Unatoč naprednoj arhitekturi, Enformer je pokazao ograničenja pri radu s velikim i kompleksnim skupovima podataka, kao što su DNA sekvence ljudskog i mišjeg genoma. Rad također ističe izazove s obradom i interpretacijom rezultata, posebice kod većih skupova podataka, te naglašava potrebu za daljnjom optimizacijom ovih modela kako bi se poboljšala njihova primjenjivost u različitim znanstvenim i industrijskim kontekstima. |
Sažetak (engleski) | This thesis explores the application of deep neural networks, specifically the Enformer and CRMnet models, in gene expression prediction, which is crucial in the fields of bioinformatics and molecular biology. Gene expression prediction has significant applications in biomedical sciences, including personalized medicine, the identification of therapeutic targets, drug development, and improving crop resistance and productivity in agriculture. Through the analysis of these models' performance on specific datasets, CRMnet proved to be superior in prediction accuracy on the yeast dataset, with a Pearson correlation coefficient (R) of 0.8797, while Enformer achieved a lower value of 0.6130. Despite its advanced architecture, Enformer demonstrated limitations when working with large and complex datasets, such as DNA sequences of the human and mouse genomes. The paper also highlights the challenges in processing and interpreting results, particularly with larger datasets, and emphasizes the need for further optimization of these models to improve their applicability in various scientific and industrial contexts. |
Ključne riječi |
|
Ključne riječi (engleski) |
|
Jezik | hrvatski |
URN:NBN | urn:nbn:hr:190:563193 |
Studijski program | Naziv: Računarstvo Vrsta studija: sveučilišni Stupanj studija: preddiplomski Akademski / stručni naziv: sveučilišni/a prvostupnik/ prvostupnica (baccalaureus/baccalaurea) inženjer/inženjerka računarstva (univ. bacc. ing. comp) |
Vrsta resursa | Tekst |
Način izrade datoteke | Izvorno digitalna |
Prava pristupa | Otvoreni pristup |
Uvjeti korištenja | |
Datum i vrijeme pohrane | 2024-09-11 08:14:41 |