Hierarchical Image Classification With Self-Supervised Vision Transformer Features

dc.contributor.advisor Özuysal, Mustafa
dc.contributor.author Karagüler, Caner
dc.date.accessioned 2022-12-28T12:46:08Z
dc.date.available 2022-12-28T12:46:08Z
dc.date.issued 2022
dc.description Thesis (Master)--Izmir Institute of Technology, Computer Engineering, Izmir, 2022 en_US
dc.description Includes bibliographical references (leaves. 49-53) en_US
dc.description Text in English; Abstract: Turkish and English en_US
dc.description.abstract There are lots of works about image classification and most of them are based on convolutional neural networks (CNN). In image classification, some classes are more difficult to distinguish than others because of non-even visual separability. These difficult classes require domain-specific classifiers but traditional convolutional neural networks are trained as flat N-way classifiers. These flat classifiers can not leverage the hierarchical information of the classes well. To solve this issue, researchers proposed new techniques that embeds class-hierarchy into the convolutional neural networks and most of these techniques exceed existing convolutional neural networks' success rates on large-scale datasets like ImageNet. In this work, we questioned if a hierarchical image classification with self- supervised vision transformer features can exceed hierarchical convolutional neural networks. During this work, we used a hierarchical ETHEC dataset and extract attention features with the help of vision transformers. Using these attention features, we implemented 3 different hierarchical classification approaches and compared the results with CNN alternative of our approaches. en_US
dc.description.abstract Görüntü sınıflandırma ile ilgili pek çok çalışma bulunuyor ve bunların çoğu evrişimli sinir ağları (CNN) temel alınarak gerçekleştirilmiştir. Görüntü sınıflandırmada, eşit olmayan görsel ayrılabilirlik nedeniyle bazı sınıfları diğerlerinden ayırt etmek daha zordur. Bu zor sınıfların ayrılabilmesi için, ilgili alana özgü sınıflandırıcılar gerekmektedir, ancak geleneksel evrişimli sinir ağları, düz N-yollu sınıflandırıcıları olarak eğitildiği için sınıflar arasındaki hiyerarşik bilgiden yeteri kadar yararlanamazlar. Bu sorunu çözmek için araştırmacılar, sınıf hiyerarşisini evrişimli sinir ağlarına dahil eden yeni teknikler keşfettiler ve bu tekniklerin çoğu, ImageNet gibi büyük ölçekli veri kümelerinde mevcut evrişimli sinir ağlarının başarı oranlarını geçmektedir. Bu çalışmada, özdenetimli görü dönüştürücü özniteliklerini kullanan bir hiyerarşik imge sınıflandırıcının hiyerarşik evrişimli sinir ağlarını geçip geçemeyeceğini sorguladık. Bu çalışma sırasında hiyerarşik bir ETHEC veri seti kullandık ve görüntü transformatörleri yardımıyla dikkat öznitelikleri çıkardık. Bu dikkat özelliklerini kullanarak 3 farklı hiyerarşik sınıflandırma yaklaşımı uyguladık ve sonuçları yaklaşımlarımızın CNN alternatifi ile karşılaştırdık. en_US
dc.format.extent x, 53 leaves
dc.identifier.uri https://hdl.handle.net/11147/12699
dc.identifier.uri https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=CG8WvdvvxJP04Unr7Yecf_EdZpsGvLascURfMxTrn8VOtZoubVojsCUf04qgffb_
dc.language.iso en en_US
dc.publisher Izmir Institute of Technology en_US
dc.rights info:eu-repo/semantics/openAccess en_US
dc.subject Convolutional neural networks en_US
dc.subject Image classification en_US
dc.subject Data sets en_US
dc.title Hierarchical Image Classification With Self-Supervised Vision Transformer Features en_US
dc.title.alternative Özdenetimli görü dönüştürücü öznitelikleri ile hiyerarşik imge sınıflandırması en_US
dc.type Master Thesis en_US
dspace.entity.type Publication
gdc.author.id 0000-0002-2361-5505
gdc.author.id 0000-0002-2361-5505 en_US
gdc.coar.access open access
gdc.coar.type text::thesis::master thesis
gdc.description.department Thesis (Master)--İzmir Institute of Technology, Computer Engineering en_US
gdc.description.publicationcategory Tez en_US
gdc.description.scopusquality N/A
gdc.description.wosquality N/A
gdc.identifier.yoktezid 726888 en_US
relation.isAuthorOfPublication.latestForDiscovery c5de0144-5a8c-4c0a-93b2-334507777064
relation.isOrgUnitOfPublication.latestForDiscovery 9af2b05f-28ac-4014-8abe-a4dfe192da5e

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Name:
10458869.pdf
Size:
5.71 MB
Format:
Adobe Portable Document Format
Description:
Master Thesis File

License bundle

Now showing 1 - 1 of 1
Loading...
Name:
license.txt
Size:
3.2 KB
Format:
Item-specific license agreed upon to submission
Description: