Phd Degree / Doktora

Permanent URI for this collectionhttps://hdl.handle.net/11147/2869

Browse

Search Results

Now showing 1 - 10 of 15
  • Doctoral Thesis
    Improving Low-Budget Semi-Supervised Approaches for Model Extraction Attacks
    (01. Izmir Institute of Technology, 2024) Genç, Didem; Baştanlar, Yalın; Tomur, Emrah
    Makine öğrenimi (ML) modelleri, etkinlikleri nedeniyle birçok alanda yaygın olarak kullanılmaktadır; ancak yüksek doğruluğa sahip modelleri eğitmenin maliyeti de yüksektik. Bu bağlamda, MLaaS (Machine Learning as a Service) platformları, API'ler aracılığıyla erişilebilen bulut tabanlı kara kutu modeller sunarak, model çalma saldırıları gibi güvenlik sorunlarını gündeme getirmektedir. Model çalma saldırıları, bulutta konuşlandırılmış bir makine öğrenimi modelini yalnızca kara kutu sorgulamalarıyla kopyalamayı amaçlamaktadır. Bu tez çalışmasında, etiketlenmemiş veriye erişimin kolay olduğu ancak etiketli verinin maliyetli olduğu senaryolarda, maliyet etkin ve yüksek doğruluklu bir model çalma saldırısı geliştirilmiştir. Literatürde sentetik veri setleri oluşturma, doğal veri setlerinden aktif öğrenme ile veri seçme ve yarı denetimli öğrenme gibi stratejiler önerilmektedir. Bu çalışmada ise, API üzerindeki kara kutu bir modele saldırmak için öz-denetimli öğrenen modellerden faydanılması önerilmiştir. Bu yöntemde, saldırganın geniş bir etiketlenmemiş veri havuzuna erişimi olduğu varsayılmakta ve bu veri, öz-denetimli SimCLR modelini eğitmek için kullanılmaktadır. Etiketsiz veri kümesinden belirli bir alt küme seçilir ve hedef modele sorgular gönderilerek bu veriler etiketlenir. Bu işlem sonucunda transfer veri seti oluşturulur. İlk ikame model, transfer veri setiyle SimCLR encoder'ına eklenen bir çok katmanlı algılayıcı (MLP)'nın ince ayar yapılarak eğitilmesi ile elde edilir. İkame modelin doğruluğunu artırmak için kalan etiketlenmemiş verilere otomatik etiketleme uygulanır; yüksek güvenli çıktılar doğrudan etiket olarak kullanılırken, düşük güvenli çıktılar hedef modelin etiketlediği örneklerle olan benzerliğe göre etiketlenir. Bu süreç, modelin karmaşık örüntüleri öğrenmesini ve veri çeşitliliğini artırmasını sağlayarak ikame modelin doğruluğunu hedef modele yaklaştıracak şekilde artırır. Önerilen methodun verimliliği CIFAR10 ve SVHN datasetleri üzerinde deneyler yapılarak verilmiştir.
  • Doctoral Thesis
    Graphlet mining in big data
    (01. Izmir Institute of Technology, 2024) Ergenç Bostanoğlu, Belgin; Çalmaz, Büşra; Bostanoğlu, Belgin Ergenç
    This thesis explores graphlet counting algorithms, which are crucial for understanding the structural principles of complex networks such as bioinformatics, social networks, and network model evaluation. Counting graphlets in large networks is computationally challenging due to the combinatorial explosion of possibilities, particularly for larger graphlet sizes. To address this, we focus on clique graphlets, fully connected subgraphs, which reveal critical patterns in areas like protein structure analysis, social network modeling, community detection, and spam detection. Counting k-cliques (subgraphs with $k$ nodes) becomes infeasible for large datasets and high $k$ values. Existing exact and approximate algorithms struggle with large $k$, often failing when $k$ exceeds 10. To tackle these limitations, we propose BDAC (Boundary-Driven Approximations of K-Cliques), a novel algorithm that efficiently approximates k-clique counts using classical extremal graph theorems. BDAC uniquely provides lower and upper bounds for k-clique counts at both local (per vertex) and global levels, making it particularly suited for large, dense graphs with high $k$ values. Unlike existing methods, the algorithm's complexity remains unaffected by the value of $k$. We validate BDAC's efficiency and scalability through extensive comparisons with leading algorithms on diverse datasets, spanning k values from minor (e.g., 8) to large (e.g., 50). Parallelization techniques enhance its performance, making it highly scalable for analyzing large and dense networks. BDAC offers a significant advancement in k-clique counting, enabling the analysis of previously considered computationally intractable networks.
  • Doctoral Thesis
    Knowledge hiding on graph data
    (01. Izmir Institute of Technology, 2024) Tekin, Leyla; Bostanoğlu, Belgin Ergenç
    Çizgelerde anlamlı alt yapılar olan alt çizgeler ve topluluklar, ağ yapılarının daha derinlemesine anlaşılması için önemli bilgiler sağlar. Ancak çizge analiz araçları daha gelişmiş hale geldikçe, bu durum, çizge verilerinden gereğinden fazla bilgi çıkarılması riski gibi yeni bir zorluğu da beraberinde getirir. Böylelikle, bilgi gizleme tekniklerinin araştırılmasına yol açmıştır. Bu tez kapsamında, çizge verilerinin mahremiyetini koruyan teknikler olarak alt çizge gizleme ve topluluk gizleme incelenmektedir. Alt çizge gizleme, işlemsel çizge veritabanındaki hassas alt çizgeleri tanımlamayı ve verilerin yayınlanmasından sonra onların ifşa edilmesini önlemek için veritabanını dönüştürmeyi içerirken, orijinal verileri mümkün olduğunca korur. Topluluk gizleme ise çizgeyi stratejik olarak değiştirerek toplulukların gizlenmesini veya karartılmasını içerir. Kullanıcıların topluluk üyeliği gibi hassas bilgilerinin gizliliğini koruyan topluluk gizlemeye yönelik çalışmalarla birlikte, gizlemeye etkili bir şekilde karşı koyabilecek dayanıklı topluluk tespit algoritmalarına olan ihtiyaç daha da belirgin hale gelir. Bu tezde öncelikle alt çizge gizleme teknikleri incelenmiş ve çeşitli kenar silme tabanlı algoritmalar önerilmiştir. Daha sonra, topluluk gizleme teknikleri araştırılmış ve tekniklerin üç ölçekte kapsamlı bir şekilde ele alınması için bir araştırma yapılmıştır. Ayrıca, klikler kullanılarak küresel topluluk gizleme için bir algoritma önerilmiştir.
  • Doctoral Thesis
    Mıcrom: Mikroservis Tabanlı Mimariler için Büyüklük Ölçüm Yöntemi
    (01. Izmir Institute of Technology, 2024) Ünlü, Hüseyin; Demirörs, Onur
    Yazılım mimarisindeki paradigma değişimi, mikroservis tabanlı yazılım mimarisi (MSYM) gibi yeni nesil yazılım projelerinin veri odaklı olmaktan uzaklaşmasına ve davranış odaklı bir yapıya evrilmesine neden olmuştur. Tek bir veri tabanı kullanımı, her mikroservisin bağımsız olarak geliştirildiği ve kendi veri tabanına sahip olduğu yapılarla değiştirilmiştir. Geleneksel monolitik mimariler veri transferi için fonksiyonlara dayanırken, MSYM iletişim için olay kuyrukları gibi yapılar kullanmaktadır. Efor ve maliyet kestirimi için birincil girdi olarak İşlevsel Büyüklük Ölçüm (İBÖ) yöntemleri, monolitik yazılım mimarilerinin nesnel boyut ölçümü için yaygın olarak kullanılmıştır. Ancak, bu yöntemler veri hareketlerine dayandıkları için günümüz uygulamalarının, örneğin MSYM'nin büyüklük ölçümüne yanıt vermeyebilir. Bu tezde, MSYM'ler için özel olarak geliştirilmiş, MSYM'nin yapı taşları olan olayları büyüklük ölçümü için kullanan MicroM adlı bir büyüklük ölçüm yöntemi önerilmiştir. MicroM, MSYM'nin özelliklerini dikkate alır ve mevcut İBÖ yöntemlerinin eksikliklerini giderir. Önerilen yöntem, olayları işlevsel, mimari ve algoritmik düzeylere özgün bir şekilde kategorize eder. Önerilen yöntemin başarısını, gerçek organizasyon verileri kullanarak üç farklı vaka çalışmasında COSMIC İBÖ yöntemiyle karşılaştırarak değerlendirilmiştir. MicroM yöntemi ile oluşturulan efor kestirim modellerinde, COSMIC İBÖ yöntemine kıyasla Ortalama Göreli Hata (MMRE) oranında %32'ye varan iyileşme sağlanmıştır.
  • Doctoral Thesis
    Microarc: an Analysis and Design Method for Microservice Based Systems
    (01. Izmir Institute of Technology, 2024) Yıldız, Ali; Demirörs, Onur
    Hızla gelişen İnternet altyapısı, yazılım uygulamalarının neredeyse sınırsız ve ölçeklenebilir kaynaklardan yararlanmasını sağlamıştır. Mikroservis tabanlı mimari (MSbA), dağıtılmış bulut tabanlı bir altyapının faydalarından yararlanmak için bir çözüm olarak ortaya çıkmıştır. MSbA, bakımı kolay, kolayca ölçeklenebilir ve yüksek oranda kullanılabilir sistemlerin tasarımını ve geliştirilmesini sağlaması nedeniyle dağıtılmış yazılım sistemleri oluşturmak için popüler bir yaklaşım haline gelmektedir. Mikroservisler , üst düzey süreçleri yürütmek için bir ağ üzerinden iletişim kuran, gevşek bir şekilde bağlanmış ve son derece uyumlu bağımsız hizmetlerden oluşur. Mikroservisler bağımsız olarak güncellenebilir ve dağıtılabilir ve operasyonlarındaki kesintiler tüm sistemi etkilemez. HTTP ve REST gibi teknolojiden bağımsız protokolleri kullanarak iletişim kurabilirler ve geliştiriciler, her bir mikroservis için işlevselliğine en uygun olan farklı geliştirme dilleri veya platformları seçebilirler. Olay odaklı mimari, ölçeklenebilirlik, dağıtılmış veri ve ölçeklenmiş veri paylaşımı gibi dağıtılmış sistemlerdeki zorlukların üstesinden gelmek için güçlü bir yaklaşımdır. Olay odaklı Mikroservis mimarisinde, ayrıştırılmış hizmetler olaylara yanıt vererek etkileşime girer ve olay akışları aralarında veri paylaşımını kolaylaştırır. Bu avantajlara rağmen, bu mimarideki sistemlerin analizi ve tasarımı için yaygın kullanılan bir yöntem yoktur. Kuruluşlar, analiz ve tasarım için iyi tanımlanmış metodolojilerin olmaması nedeniyle genellikle mikroservis tabanlı sistemler geliştirmede zorluklarla karşılaşırlar. Bu tez, mikroservis mimarisinde yazılım geliştirme için olay odaklı bir analiz ve tasarım yöntemi önermiştir. Yöntem üç ana bileşenden oluşur; analiz ve tasarım aşamalarında kullanılacak süreçler, bu süreçlerde kullanılan modelleme notasyonları ve analiz ve tasarım aşamalarını destekleyen sezgisel yöntemlerdir.
  • Doctoral Thesis
    Efficient Image Matching Using Hyperdimensional Computing and Group Testing
    (01. Izmir Institute of Technology, 2024) Çine, Ersin; Baştanlar, Yalın; Özuysal, Mustafa
    Yaygın olarak kullanılan imge eşleme yaklaşımı, imgeler arasında yerel özniteliklerin kapsamlı bir şekilde eşleştirilmesine dayanmaktadır. Bizler, bunu karşımıza alıyor ve en yakın komşular üzerinden tahmin yaparak değil de hiyerarşik bir yaklaşım kullanarak eşleme verimliliğinin artırılmasını inceliyoruz. En benzer ancak geometrik olarak rastgele öznitelik eşlemelerinin aksine, yeterince benzer ve geometrik olarak anlamlı öznitelik eşlemelerinin verimli bir şekilde saptanmasının, daha düşük hesaplama karmaşıklığı ile eşleşme performansını artırabileceğini veya koruyabileceğini varsayıyoruz. Grup güdümlü en yakın komşular adında yeni bir yöntem öneriyoruz. Bu yöntem, öznitelik gruplarının bir olarak eşleşmesini ve ardından yalnızca eşleşen gruplar arasında bireysel özniteliklerin eşleşmesini içerir. Hiper boyutlu hesaplama ve grup testi kavramlarından ilham alan hiyerarşik boru hattı, öznitelik eşlemenin zaman karmaşıklığını n kareden n kök n'ye düşürür. Homografi ve poz tahminine ilişkin deneysel sonuçlar, bizim yöntemimizin standart en yakın komşu algoritmasından daha iyi bir sonuç verdiğini ve diğer yöntemlerin performansını yakaladığını göstermektedir. Önerilen yöntemi, değişen seviyelerde hesaplama maliyetlerine sahip yöntemlerin devamlılığını sunan genel bir çerçeve olarak ifade ediyoruz. Ayrıca öncelikle en belirgin özniteliklerin diğer imgenin öznitelik gruplarına üyeliklerini test eden, ardından bu belirgin öznitelikleri yalnızca eşleşen grupların üyeleriyle eşleştiren bir doğrusal zamanlı eşleme algoritması sunuyoruz. Deneyler gösteriyor ki, bu algoritma karesel zaman algoritmalarının doğrusal zaman uyarlamalarından daha iyi bir performans sergiliyor. Homografi tahmini için daha iyi sentetik imge çifti veri kümeleri oluşturulması ve imge eşleme boru hatlarının daha hızlı değerlendirilmesi için teknikler de sunuyoruz. Bu katkılar sonucunda verimli eşleştiriciler, gerçekçi veri kümeleri ve hızlı değerlendirme içeren bir imge eşleme çerçevesi ortaya çıkmaktadır.
  • Doctoral Thesis
    Local Citation Recommendation With Graph Convolutional Networks
    (01. Izmir Institute of Technology, 2024) Keklik, Onur; Tuğlular, Tuğkan
    Local Citation Recommendation is a task that finds the missing reference in the corresponding citation placeholder. It is mainly contextual since context identifies the citation. On the other hand, a context can be a descriptor for a set of papers. In other words, there can be more than one candidate citation for a context. Thus, a further matching of a context with candidate papers is beneficial. Titles and abstracts of candidate papers serve as a global context to match with the local one. This work proposes a state-of-the-art approach for the Local Citation Recommendation task that exploits the similarities between global and local contexts to generate citation predictions. By utilizing a Graph Convolutional Network (GCN) with BERT embeddings, our proposed model demonstrates superior performance over previous methods. It not only outperforms all prior approaches on the benchmark datasets of ACL-200, FullTextPeerRead, RefSeer, and arXiv but also strikes a balance between speed, memory, and computational requirements. Once deployed as a production-level Local Citation Recommendation, it is fast enough to enable real-time recommendations for researchers.
  • Doctoral Thesis
    Classification of Maneuvers of Vehicles in Front for Driver Assistance Systems
    (01. Izmir Institute of Technology, 2023) Nalçakan, Yağız; Baştanlar, Yalın
    Predicting vehicle maneuvers is a critical task for developing autonomous driving. These maneuvers have been identified as leading causes of fatal accidents, underscoring the need for robust and reliable detection systems. This thesis addresses this critical issue by developing and evaluating novel methodologies for classifying maneuvers, especially lane change and cut-in maneuvers in front of the vehicle. Two specific methods are proposed in this thesis work, and their effectiveness is evaluated on two datasets: the Prevention Lane Change Prediction dataset and the BDD-100K Cut-in/Lane-pass Classification Subset. The first method is a model that utilizes features extracted from the bounding boxes of the target vehicle, feeding them into a single-layer LSTM network for cut-in/lane-pass classification. The second method involves training a 3-dimensional residual neural network in a self-supervised manner using contrastive video representation learning. For the self-supervised training phase, a novel scene representation is proposed to highlight vehicle motions. Afterward, the same model is fine-tuned using labeled video data. Lastly, an ensemble learning approach is introduced, which combines the predictive capabilities of the proposed LSTM-based and self-supervised contrastive video representation learning models, leveraging the strengths of both methods to enhance the overall maneuver classification performance. The proposed methods made significant contributions to the field. The LSTM-based model achieved high classification accuracies compared to other studies in the literature. The self-supervised video representation learning model represents the first application of contrastive learning in maneuver classification. The ensemble learning approach has shown a significant improvement in the performance of the maneuver detection system.
  • Doctoral Thesis
    Location Privacy in Cellular Networks
    (01. Izmir Institute of Technology, 2022) Yaman, Okan; Ayav, Tolga; Erten, Yusuf Murat; Ayav, Tolga; Erten, Yusuf Murat
    Many third-party utilities and applications that run on devices used in cellular networks keep track of our location data and share it. This vulnerability affects even the subscribers who use dumbphones. This thesis defines three location tracing attacks which are based on utilizing the background data and compares them with the most relevant known attacks. We have demonstrated that any attacker who knows two associated cells of a subscriber with adequate background data can deduce the intermediate cell IDs. Also, utilizing the Hidden Markov Model (HMM) increases the accuracy of an attack. In this dissertation, we introduced novel accuracy metrics for all the anticipated attacks and exploited these for detailed analysis of the threats in a real-life case, a 5G network. This work demonstrates improvements in the current privacy-preserving methods, including adaptation to 5G, and provides insights into preventing this location privacy breach. Various methods have been proposed to overcome these threats and preserve privacy against possible attacks based on this information. A friendly jamming (FJ) based solution, which offers efficient usage of resources, including computing power and energy, was introduced as a solution for these problems. However, one of the tradeoffs of FJ is its viability. Although some studies try to cope with this challenge, they are complicated and focus on old technologies. We propose a lightweight and flexible FJ scheme to address these challenges. We also demonstrate that our model has the same performance as one of the mentioned studies above in a more straightforward way.
  • Doctoral Thesis
    Semantic Segmentation of Panoramic Images and Panoramic Image Based Outdoor Visual Localization
    (01. Izmir Institute of Technology, 2022) Orhan, Semih; Baştanlar, Yalın
    360-degree views are captured by full omnidirectional cameras and generally represented with panoramic images. Unfortunately, these images heavily suffer from the spherical distortion at the poles of the sphere. In previous studies of Convolutional Neural Networks (CNNs), several methods have been proposed (e.g. equirectangular convolution) to alleviate spherical distortion. Getting inspired from these previous efforts, we developed an equirectangular version of the UNet model. We evaluated the semantic segmentation performance of the UNet model and its equirectangular version on an outdoor panoramic dataset. Experimental results showed that the equirectangular version of UNet performed better than UNet. In addition, we released the pixel-level annotated dataset, which is one of the first semantic segmentation datasets of outdoor panoramic images. In visual localization, localizing perspective query images in a panoramic image dataset can alleviate the non-overlapping view problem between cameras. Generally, perspective query images are localized in a panoramic image database with generating its virtual 4 or 8 gnomonic views, which is deforming sphere into cube faces. Doing so can simplify the searching problem to perspective to perspective search, but still there might be a non-overlapping view problem between query and gnomonic database images. Therefore we propose directly localizing perspective query images in panoramic images by applying sliding windows on the last convolution layer of CNNs. Features are extracted with R-MAC, GeM, and SFRS. Experimental results showed that the sliding window approach outperformed 4-gnomonic views, and we get competitive results compared with 8 and 12 gnomonic views. Any city-scale visual localization system has to be robust against long-term changes. Semantic information is more robust to such changes (e.g. surface of the building), and the depth maps provide geometric clues. In our work, we utilized semantic and depth information while pose verification, that is checking semantic and depth similarity to verify the poses (retrievals) obtained with the approach that use only RGB image features. Semantic and depth information are represented with a self-supervised contrastive learning approach (SimCLR). Experimental results showed that pose verification with semantic and depth features improved the visual localization performance of the RGB-only model.