Sažetak | Multiple studies within the medical field have highlighted the remarkable effectiveness of using convolutional neural networks for predicting medical conditions, sometimes even surpassing that of medical professionals. Despite their great performance, convolutional neural networks operate as black boxes, potentially arriving at correct conclusions for incorrect reasons or areas of focus. Our work explores the possibility of mitigating this phenomenon by identifying and occluding confounding variables within images. Specifically, we focused on the prediction of osteopenia, a serious medical condition, using the publicly available GRAZPEDWRI-DX dataset. After detection of the confounding variables in the dataset, we generated masks that occlude regions of images associated with those variables. By doing so, models were forced to focus on different parts of the images for classification. Model evaluation using F1-score, precision, and recall showed that models trained on non-occluded images typically outperformed models trained on occluded images. However, a test where radiologists had to choose a model based on the focused regions extracted by the GRAD-CAM method showcased different outcomes. The radiologists' preference shifted towards models trained on the occluded images. These results suggest that while occluding confounding variables may degrade model performance, it enhances interpretability, providing more reliable insights into the reasoning behind predictions. The code to repeat our experiment is available on the following link: https://github.com/mikulicmateo/osteopenia. |
Sažetak (hrvatski) | Brojne studije u medicini su istaknule izvanredne rezultate konvolucijskih neuronskih mreža u predviđanju medicinskih stanja pacijenata, a ponekad čak nadmašujući medicinske stručnjake. Unatoč njihovim izvanrednim performansama, konvolucijske neuronske mreže često se percipiraju kao algoritmi "crne kutije" (engl. black box algorithm), što znači da nije jasno koje značajke pridonose određenom predviđanju. Zbog principa "crne kutije" postoji pitanje dolaze li konvolucijske neuronske mreže do točnih zaključaka iz pogrešnih razloga i fokusiraju li se na pogrešna područja. Postoji mogućnost da slika sadrži varijable koje utječu na predviđanje, a nisu relevantne za to predviđanje, već se slučajno pojavljuju zajedno s relevantnim varijablama. Te varijable se nazivaju zbunjujuće varijable. Primjerice, kod smanjene gustoće kostiju česte su frakture kostiju, ali se fraktura ne mora dogoditi zbog smanjene gustoće kostiju – prema tome, ako želimo klasificirati smanjenu gustoću kostiju, fraktura predstavlja zbunjujuću varijablu. Ovaj rad istražuje mogućnost ublažavanja utjecaja zbunjujućih varijabli unutar slika na predviđanje konvolucijskih neuronskih mreža na način da se zbunjujuće varijable identificiraju i uklone. Konkretno, fokus je na predviđanju osteopenije, ozbiljnog medicinskog stanja koje prethodi osteoporozi. Za ovaj zadatak korišten je javno dostupan GRAZPEDWRI-DX skup podataka, iz kojeg je odabran podskup rendgenskih snimki pacijenata s osteopenijom koji sadrži 3731 snimku. Nakon što su identificirane zbunjujuće varijable u korištenom skupu podataka, generirane su maske koje zaklanjaju regije slika povezane s tim varijablama. Također, označene su "lažne maske" koje se nasumično primjenjuju na ostale slike kako ne bi bile uvedene nove zbunjujuće varijable u obliku maski. Okluzijom dijelova slike maskama, modeli su prisiljeni fokusirati se na različite dijelove slike koji su relevantni za detekciju zadanog stanja. Evaluacija modela pomoću uobičajenih metrika poput F1-mjere, preciznosti, odziva i točnosti, pokazala je da su modeli trenirani na slikama bez maski obično nadmašili modele trenirane na slikama s maskama. Međutim, nepristrani test s radiolozima pokazao je drugačije rezultate. Radiolozi su preferirali modele trenirane na slikama s maskama. U testu su radiolozi birali model na temelju regija slika na koje je model fokusiran prilikom predviđanja, pri čemu su regije dobivene GRAD-CAM metodom. Rezultati sugeriraju da uklanjanje zbunjujućih varijabli može smanjiti performanse modela prema uobičajenim metrikama, ali pruža pouzdaniji uvid u razloge koji utječu na predviđanja modela. Ovaj rad naglašava važnost interpretabilnosti i performansi konvolucijskih neuronskih mreža iz perspektive kliničke prakse, a ne samo znanstvenih istraživanja. |