Master Degree / Yüksek Lisans Tezleri

Permanent URI for this collectionhttps://hdl.handle.net/11147/3008

Browse

Search Results

Now showing 1 - 7 of 7

Diyabetik Retinopati Görüntülerinin Analizi için Uyarlanır Yeniden Boyutlandırıcı Bütünleştirilmiş Derin Üretken Öznitelik Üretim Çerçevesi
(2025) Harsa, Ahmet Emre; Gümüş, Abdurrahman; Atakan, Barış
Diyabetik Retinopati (DR), diyabet hastalarında oluşan görme kaybının önde gelen nedenlerinden biri olup, erken ve doğru tespiti ciddi komplikasyonların önlenmesi açısından hayati öneme sahiptir. Bu tez, çeşitli verisetlerinde doğruluğu ve sağlamlığı artırmak için tasarlanmış olan Uyarlanır Yeniden Boyutlandırıcı Bütünleştirilmiş Derin Üretken Öznitelik Üretim (AR+DRFG) mimarisi ortaya koyarak fundus görüntülerinden otomatik DR tespiti için yeni bir yaklaşım sunmaktadır. Araştırma, DR tespiti için giriş görüntüsü küçültülmesi ve öznitelik çıkarma işlemleri için mevcut literatürdeki kritik boşlukları ele almaktadır. Önerilen çerçeve, giriş görüntülerini öznitelik çıkarımı için en uygun çözünürlüklere akıllıca yeniden boyutlandıran bir Uyarlanır Yeniden Boyutlandırıcı (AR) bileşenini, yeniden boyutlandırılmış görüntülerden sağlam ve üretken öznitelikler üreten bir Derin Üretken Öznitelik Üretim (DRFG) modeli ile bütünleştirir. Bu mimari, çeşitli tıbbi görüntüleme uygulamaları için geliştirilmiş genelleştirilebilirlik ve zengin öznitelik çıkarma kapasitelerini hedeflemektedir. Çalışmada yaygın olarak tanınan ve kamuya açık üç fundus görüntüsü veriseti kullanılmıştır: APTOS, MESSIDOR-2, ve IDRiD. Veri kıtlığını gidermek ve model genelleştirmesini iyileştirmek için veri artırımı teknikleri uygulanmıştır. Önerilen AR+DRFG mimarisi, hem Sınama Seti Doğrulama (hold-out validation), hem de k-Katlı Çapraz Doğrulama (k-Fold cross-validation) yöntemleri kullanılarak, VGG, ResNet, Inception, MobileNet, EfficientNet ve DenseNet ailelerine ait son teknoloji CNN kıyaslama modellerine karşı sistematik olarak değerlendirilmiştir. Kapsamlı deneysel sonuçlar, önerilen mimarinin her üç veriseti için de üstünlüğünü göstermektedir. Performans değerlendirmesi, basit doğruluk ölçütlerinin ötesinde, her DR şiddet seviyesi için ayrıntılı karışıklık matrisi analizi ile doğruluk ve kayıp grafikleri aracılığıyla eğitim dinamiklerinin incelenmesini de içermektedir. Sonuçlar, modelin sağlam genelleştirme kapasitelerini ve hastalığın farklı evreleri arasında ayrım yapmadaki güçlü yönlerini de ortaya koymaktadır. Bu araştırmanın temel katkısı, DR tespiti için son teknoloji genelleştirilebilirlikli zengin ve çeşitlendirilmiş öznitelik çıkarımı gerektiren birçok kullanım senaryolarına uygulanabilen daha doğru ve sağlam bir otomatikleştirilmiş sistem geliştirilmesinde yatmaktadır. Önerilen AR+DRFG mimarisi, diyabetik retinopatinin tespiti için tıbbi görüntü analizinde önemli bir ilerlemeyi temsil etmektedir.
Deep learning based adaptive resizing of high resolution images for improved segmentation performance
(01. Izmir Institute of Technology, 2025) Fidan, Ekrem; Gümüş, Abdurrahman
Yüksek çözünürlüklü tıbbi görüntülerin derin öğrenme modelleri için küçültülmesi, geleneksel yeniden boyutlandırma yöntemleriyle bilgi kaybı nedeniyle tanısal doğruluğu sıkça tehlikeye atmaktadır. Bu tez, tıbbi görüntü analizini geliştirmek için uyarlanabilir yeniden boyutlandırma tekniklerini araştırmakta ve ilerletmektedir. Başlangıç çalışmaları, CRAG veri seti üzerinde kolorektal bezi segmentasyonu için mevcut bir uyarlanabilir yeniden boyutlandırıcının bilineer interpolasyona göre üstünlüğünü doğrulamış, Kesişim üzeri Birleşim (IoU) oranını %8.2'ye kadar artırmıştır. Bu bulgular üzerine inşa edilen temel katkı, altı yeni uyarlanabilir yeniden boyutlandırıcı mimarisinin geliştirilmesi ve titiz bir şekilde değerlendirilmesidir. Bunlar, hem segmentasyon/sınıflandırma performansını hem de hesaplama verimliliğini optimize etmek için tasarlanmıştır. Önerilen yeniden boyutlandırıcılar, Yüksek Çözünürlüklü Fundus (HRF) veri seti kullanılarak retina damar segmentasyonunda ve Hint Diyabetik Retinopati Görüntü Veri Seti (IDRiD) ile diyabetik retinopati sınıflandırmasında test edilmiştir. Deneysel sonuçlar, önerilen mimarilerin genellikle mevcut yöntemlerden daha iyi performans gösterdiğini ortaya koymaktadır. Segmentasyon için, 'Resizer MFY' bilineer interpolasyona göre ortalama IoU artışında +%.21.04 ile en yüksek performansı elde etmiştir. Sınıflandırmada, 'Resizer A2' bilineere göre ortalama F1 skorunda +%.22.39 artışla en etkili olduğunu kanıtlamıştır. Kritik olarak, 'Minimal V1' mimarisi, yeni uyarlanabilir yeniden boyutlandırıcılar arasında sürekli olarak en düşük hesaplama yükünü göstermiştir. Orijinal uyarlanabilir yeniden boyutlandırıcı da dahil olmak üzere diğer uyarlanabilir yöntemlere göre önemli ölçüde daha hafifken, dikkate değer performans iyileştirmeleri sunmaktadır. Bu araştırma, bu yeni uyarlanabilir yeniden boyutlandırıcıların tıbbi görüntülemede derin öğrenme modeli doğruluğunu önemli ölçüde artırabildiğini başarılı bir şekilde göstermektedir. Çalışma, özel olarak tasarlanmış, hesaplama açısından dikkate değer çözümler sunarak, analiz ardışık düzeninde yeniden boyutlandırma stratejisinin önemini vurgulamakta ve daha etkili tanı araçlarının önünü açmaktadır.
Hardware acceleration with fpga Based electronic boards for machine learning
(01. Izmir Institute of Technology, 2024) Akkuş, Batuhan; Gümüş, Abdurrahman; Apaydın, Mehmet Serkan
Son yıllardaki makine ög˘renmesi algoritmalarındaki gelis¸meler uç cihazlardaki kullanımını da arttırmıs¸tır (Merenda et al., 2020). Makine ög˘renimi algoritmaları genel- likle GPU tabanlı bilgisayarlarda çalıs¸tırılmaktadır, bu da yüksek enerji tüketimi (De- sislavov et al., 2021), yog˘un donanım kaynag˘ı gereksinimleri ve büyük fiziksel boyutları (Liu et al., 2022) nedeniyle uç cihazlar için uygun olmamaktadır. Bu tez, donanım hızlandırıcısı olarak FPGA platformlarında makine ög˘renmesi algoritmalarının, özellikle derin sinir ag˘larının uygulanması ve çıkarım yapılmasını aras¸tırarak, düs¸ük güç tüke- timi, verimli donanım kullanımı ve yüksek çıkarım performansı elde etmeyi hedefle- mektedir. Bu sistemlerin uç cihazlara adaptasyonu için esneklig˘i ve verimlilig˘i artırmak amacıyla, CNV ag˘ının (Umuroglu et al., 2017b) daha hafif bir varyasyonu olan CNV light gelis¸tirilmis¸. Bu ag˘, PyTorch tabanlı bir araç olan Brevitas (Pappalardo et al., 2019) ile nicemleme-farkında-eg˘itim yöntemi, kullanılarak 1, 2, 4 ve 8-bit seviyelerine nicemleme yapılmıs¸tır. CNV light ag˘ı CIFAR-10, SVHN, GTSRB ve MNIST veri setleri üzerinde Brevitas ile eg˘itilmis¸tir. Modeller FINN çerçevesi (Umuroglu et al., 2017a) kullanılarak FPGA'ya sentezlenmis¸tir. Modeller en fazla, en az ve sabit FPS seviye donanım kul- lanımına göre ayarlanmıs¸tır. Xilinx XC7Z020-1CLG400C FPGA, modelin metriklerini deg˘erlendirmek ve raporlamak için kullanılmıs¸tır. GTSRB veri setinde, ikili (W1A1) nicemleme yapılmıs¸ CNV light ag˘ı, tüm donanım kullanımları için %95.12 dog˘ruluk ve en fazla donanım kullanımında 12,191 FPS performansı ve 3.20W güç tüketimi elde etti, minimum donanım kullanımı için ise 6 FPS ve 1.62W güç tüketti. Sonuçlar, FPGA'ların uç cihazlarda makine ög˘renmesi modellerini verimli ve ölçeklenebilir platformlar olarak kullanılabileceg˘ini göstermektedir.
Human-centric artificial intelligence systems for visual assistance and multimodal emotion analysis
(01. Izmir Institute of Technology, 2024) Dede, İbrahim; Gümüş, Abdurrahman
İnsan merkezli yapay zeka sistemleri, günlük yaşamı iyileştiren ve gerçek dünyadaki zorlukları ele alan teknolojiler yaratmak için çok önemlidir. Bu perspektifte, iki proje önerilmektedir. İlk proje olan Vis-Assist, görme engelli bireylere yardımcı olmak için tasarlanmış bir giyilebilir görsel yardımcı cihazdır. Nesneleri algılar ve sınıflandırır, mesafelerini ölçer ve harici sunuculara ihtiyaç duymadan entegre düşük maliyetli bir hesaplama birimi kullanarak titreşim motoru dizisi aracılığıyla gerçek zamanlı dokunsal geri bildirim sağlar. Bu cihaz, kullanıcıların 19 farklı nesne sınıfı arasında ayrım yapmasına ve güvenli bir şekilde gezinmesine olanak tanır. Geliştirilen giyilebilir cihazın performansı, dört katılımcıyla iki tür deney yoluyla değerlendirildi. Sonuçlar, kullanıcıların nesnelerin yerini belirleyebildiğini ve böylece engellerle çarpışmayı önleyebildiğini göstermektedir. Kullanıcılar ortalama olarak, 40 m²'lik boş bir alanda bir sandalye gibi önceden tanımlanmış bir nesneyi 94 saniyeden kısa bir sürede bulabilir ve nesneleri bulmak için engellerin etrafından dolaşabilir ve 121 saniyeden kısa bir sürede nesneleri bulabilir. İkinci proje, az sayıda atış öğrenmesi kullanarak çok modlu duygu sınıflandırmasına odaklanıyor. Yapay zekadaki geleneksel yöntemler, genellikle metin, görüntü, zaman serisi sinyali, ses spektrogramı gibi tek bir kaynak türünden gelen girdilere dayanır. Bu kaynaklar, modelin performansını iyileştirmek için çok modlu yaklaşımla birleştirilebilir. Bu araştırmada, OpenAI'nin CLIP çerçevesini kullanarak bir yapay zeka modeli geliştirildi ve Tip-Adapter algoritması üç tür girdiyi (metin, ses ve video) işleyecek şekilde uyarlandı. Modelin performansı, iki veri kümesi kullanılarak bir duygu sınıflandırma görevi üzerinde test edildi. Sonuçlar, çok modluluğun tek bir modalite kullanmaya kıyasla doğruluğu artırdığını göstererek, karmaşık, gerçek dünya ortamlarını anlayabilen ve bunlara yanıt verebilen insan merkezli AI sistemlerinin önemini vurguluyor.
Deep Learning-Based Analysis of Electrochemical, Biomedical, and Optical Signals
(01. Izmir Institute of Technology, 2024) Gümüş, Abdurrahman; Yeke, Muhammet Çağrı; Gümüş, Abdurrahman; Odacı, Dilek
Bu tez, derin öğrenme (DÖ) tekniklerinin çeşitli alanlardaki uygulamalarını inceleyerek, karmaşık verilerin tespiti, sınıflandırılması ve analizi konularında önemli iyileştirmeler sağlamaktadır. Çalışma, DÖ modellerini farklı analitik yöntemlerle entegre ederek performansı artırmayı amaçlamaktadır. Elektrokimyasal analiz alanında, CD36'nın tespiti ve sınıflandırılması için bir immünobiyosensör kullanılarak DÖ tabanlı bir yaklaşım geliştirilmiştir. Geleneksel teknikler, özellikle düşük analit konsantrasyonlarında duyarlılık ve hızlı analizde yetersiz kalmaktadır. Tek boyutlu evrişimli sinir ağı (1B-ESA) ve hibrit 1B-ESA – uzun kısa süreli bellek (UKSB) ağları gibi DÖ modellerinin entegrasyonu, biyosensörün duyarlılığını ve özgüllüğünü önemli ölçüde artırmıştır. Biyomedikal uygulamalarda, yüzey elektromiyografi (yEMG) sinyalleri kullanılarak el hareketlerinin sınıflandırılması için Vision Transformer (ViT) teknikleri kullanılmıştır. sEMG verileri, ileri zaman-frekans analizi (TFA) yöntemleri ve çeşitli ViT modelleri ile analiz edilerek yüksek doğruluk elde edilmiştir. Optik algılama alanında, Faza Duyarlı - Zaman Bölgesinde Optik Geriyansımalı Ölçüm Tekniği (Faz-OTDR) verilerinin analizi için DÖ teknikleri kullanılmıştır. DÖ yöntemlerinin Faz-OTDR tabanlı akım algılama sistemlerinin verimliliğini artırdığı gösterilmiştir. 1B-ESA, 1B-ESA – UKSB ve 1B-ESA – Çift yönlü UKSB modelleri kullanılarak, akım değerlerinin doğru bir şekilde sınıflandırılması sağlanmıştır. Ayrıca, optik sinyalleri görüntüye çevirme metodu uygulanarak, aktarımlı öğrenme modelleri ile yüksek sınıflandırma doğruluğu elde edilmiş ve veri depolama daha verimli hale getirilmiştir. Bu tez, DÖ tekniklerinin çeşitli analitik yöntemlerle entegrasyonunun önemli ilerlemeler sağlama potansiyelini göstermektedir. Çalışmalar, DÖ'nün veri analizi performansını artırmadaki çok yönlülüğünü, daha doğru, hassas ve verimli çözümler sunarak ortaya koymaktadır. Geliştirilen metodolojiler, diğer biyomarkerlar, sinyal türleri ve analitik zorluklara genişletilebilir.
Deep Learning Based Real-Time Sequential Facial Expression Analysisusing Geometric Features
(01. Izmir Institute of Technology, 2023) Köksal, Talha Enes; Gümüş, Abdurrahman
In this thesis, macro and micro facial expression sequences from various datasets are trained using neural networks to classify them in one of the basic emotions. In macro expression experiments, for each frame of the sequences facial landmarks are extracted using MediaPipe FaceMesh solution and geometric features using both spatial and temporal information based on these landmarks are created. To classify the features, ConvLSTM2D followed by multilayer perceptron blocks are used. In order to achieve real time classification performance, all algorithms are implemented compatible to run on GPU. The proposed method for macro expressions is tested with CK+, Oulu-CASIA VIS, Oulu-CASIA NIR and MMI datasets. In micro expression experiments, apart from geometric features also blendshape features provided by MediaPipe are used. In order to improve classification performance, Phase-Based Video Motion Processing technique is used to magnify subtle facial movements of micro expressions. Experiments are conducted separately on same classification layers that consist of ConvLSTM1D followed by multilayer perceptron blocks. The proposed method for micro expressions is tested with SAMM and CASME II datasets. The datasets utilized in this study were accessed upon signing corresponding license agreements. Each dataset is specifically designated for academic purposes and is made available under these agreements. Only data from subjects who provided consent for their information to be used in publications was included in the thesis. The license agreements for each dataset can be found in the appendices section.
Development of Real Time Blood Vessel Imaging System for Early Diagnosis of Vascular Diseases
(01. Izmir Institute of Technology, 2020) Altay, Ayşe; Gümüş, Abdurrahman
Disorders in the circulatory system may cause various diseases and tissue damage. The early detection of abnormalities in blood circulation has an important role in terms of treatment and also raising awareness of the patient. Vascular imaging methods used by today's technology are invasive, and/ or radiation-based. As an alternative to high-cost near infrared (NIR) vascular imaging devices in the market, a microcomputer-based, real-time, non-contact and safe vascular imaging system has been developed with low- cost. Due to the higher absorption coefficient of blood than skin and fat and also the differences in the spectra of oxy and deoxyhemoglobin in blood, the vascular structures were obtained using light at NIR region. A device, which uses NIR LED light operated at 850 nm, was designed using optical and electronic components. Image and video analysis were performed using OpenCV, which is an open-source software library, and data visualization libraries. Tests were carried out to optimize the best imaging conditions for the device. To be able to show abnormalities in the vascular structures and to test the effectiveness of the device, "diabetes", which can cause various vascular disease complications, was selected. Superficial vascular structures were observed in the near infrared images captured from people at different stages of this disease. As expected, the vessel images captured from the participants revealed deterioration in vascular structures in diabetic patients compared to healthy people. In order to make a clear inference about the accuracy of the images, it is necessary to compare them to the angiography images of the individuals and be interpreted by vascular surgery specialist.

Master Degree / Yüksek Lisans Tezleri

Browse

Filters

Settings

Sort By

Results per page

Search Results