Computer Engineering / Bilgisayar Mühendisliği

Permanent URI for this collectionhttps://hdl.handle.net/11147/10

Browse

Search Results

Now showing 1 - 7 of 7
  • Research Project
    Haber Zincirlerinde Tutarlılık ve Güvenilirlik Değerlendirmesi
    (2017) Tekir, Selma
    Çok hızlı ve büyük miktarda haber akısının oldugu günümüzde haber analizi büyük bir gereksinimdir. Haberi takip etmek, dogrulugunu denetlemek, yorumlamak özellikle kurumsal bazda çok önemlidir. Bunun yapılabilmesi bir bilgi isleyis döngüsünün çalıstırılması ile mümkündür. Bilginin toplanması, hedefler dogrultusunda islenip analiz edilerek ise yarar bilgiye dönüstürülmesi beklenmektedir. Projenin amacı haber güvenilirliginin ölçülüp degerlendirilmesine yönelik bir yaklasım gelistirmektir. Haber güvenilirligi haberalma faaliyetinin olmazsa olmazları arasındadır. Kurumsallasmıs medya kurulusları (BBC, The New York Times vb.) hâlihazırda çok büyük miktarda yapısal veri sunmaktadır. Haberi dogrulama, kaynak geçerligini denetleme gereksinimi had safhadadır. Projede bir haber zinciri üzerinde güvenilirlik ölçümü ve degerlendirmesi yapılacaktır. Projede haber zinciri, noktaları birlestirelim (connecting the dots) yaklasımı ile karsılanmaktadır. Noktaları birlestirelim yaklasımı, haber zincirini biri baslangıç digeri bitis noktası olarak tanımlanabilecek iki haber belgesini tutarlı bir sekilde birlestiren haber belgeleri dizisi olarak tanımlamaktadır. Güvenilirlik degerlendirmesi ele alınacak haber zincirinin tutarlılık degerlendirmesi ile birlikte gerçeklestirilecektir. Haber güvenilirligi; haberin dogrulugu, fikirlerden ziyade somut gerçeklere dayanmasıdır. Haber kaynagının güvenilirligi ise iki temel boyutta ele alınmaktadır: Haber kaynagına duyulan güven ve kaynagın o konudaki uzmanlıgı [21]. Haber güvenilirliginin ölçümünde ?Gerçegi fikirden ayırıyor mu? ve ?Fikirlere mi gerçeklere mi dayanmakta? faktörleri baz alınacaktır. Fikir madenciligi kullanılarak gerçekler fikirlerden ayırdedilmeye çalısılacaktır. Haber zincirini olusturan belgelerin gerçegi fikirden ayırıp ayırmadıkları, belge yapısındaki gerçek/fikir tümcelerinin organizasyonu irdelenecektir. Belgelerdeki gerçek/fikir yapılanmasına ek olarak gerçek/fikir oranı da tespit edilip haber zincirini olusturan dokümanların bu açıdan bütünsellik tasıyıp tasımadıgı sınanacaktır. Ayrıca ardısık dokümanlar arasındaki geçisin gerçek/fikir bilgisine dayalı bir degerlendirme mekanizması kurulacaktır. Güvenilirlik kavramının ölçümüne iliskin benzer bir yaklasım mevcut olmadıgından proje oldukça yenilikçidir. Haber zincirinin güvenilirlik degerlendirmesi tutarlılık degerlendirmesinden bagımsız degildir. Haber zinciri baglamında tutarlılıgı karsılamak üzere yöntemler mevcuttur ancak yeni arayıslara gereksinim vardır. Proje kapsamında tutarlı haber zinciri elde etmeyi saglayacak yeni bir yöntem gelistirilecektir. Gelistirilecek yöntem tutarlı haber zincirinin kafes (lattice) yapısı ile iyi temsil edilecegi sezgisine dayanmaktadır. Kafes yapısının dügümleri, haber belgelerinde geçen sözcükler ve bu sözcüklerin geçtigi haber belgeleri ikilileri ile temsil edilecektir. Tutarlı haber zincirlerine ait kafeslerin tam kafes niteligine sahip olması beklenmektedir. Zaki ve Ramakrishnan [17]?ın kapalı tanım kümesi kafesi (closed description set lattice) olusturma algoritması bu amaçla kullanılarak iyi haber zincirleri elde edilip edilmeyecegi sınanacaktır. Önerilen yöntem güvenilirlik degerlendirmesi yapılacak haber zincirlerini üretmesi açısından önemli ve aynı ölçüde özgündür. Proje tamamlandıgında elde edilecek çıktıların bilgi kesfi ve veri madenciligi alanında bilimsel katkı sunması beklenmektedir. Önerilen tekniklerin olgunlasması bunların yeni teknolojilerde kullanılmasını mümkün hale getirecektir. Ayrıca haberalma toplumun sosyo-ekonomik yapısında etkili olan bir islevdir. Özellikle sosyal medya bu alanı yeniden sekillendirmektedir. Bu alanda, alınan haberlerin dogru sekilde islenmesi ve haber güvenilirligi konusunda farkındalıgın artırılması büyük önem arz etmektedir.
  • Conference Object
    Citation - WoS: 2
    Citation - Scopus: 4
    Çok-etiketli Film Türü Sınıflandırması için Türkçe Konu Modellemesi Veri Kümesi
    (Institute of Electrical and Electronics Engineers, 2020) Jabrayilzade, Elgün; Poyraz Arslan, Algın; Para, Hasan; Polatbilek, Ozan; Sezerer, Erhan; Tekir, Selma
    Statistical topic modeling aims to assign topics to documents in an unsupervised way. Latent Dirichlet Allocation (LDA) is the standard model for topic modeling. It shows good performance on document collections, documents being relatively long texts but it has poor performance on short texts. Topic modeling on short texts is on the rise due to the potential of social media. Thus, approaches that are able to nd topics on short texts as well as long texts are sought. However, there is a lack of datasets that include both long and short texts which have the same ground-truth categories. In this work, we release a Turkish movie dataset which contain both short lm descriptions and long subscripts where lm genre can be considered as topic. Furthermore, we provide multi-label movie genre classication results using a Feed Forward Neural Network (FFNN) taking LDA document-topic or Doc2Vec dense representations. © 2020 IEEE.
  • Conference Object
    Doğal Dil Çıkarımı Modellerinde Bert Vektörlerinin Başarım Değerlendirmesi
    (Institute of Electrical and Electronics Engineers Inc., 2021) Oğul, İskender Ülgen; Tekir, Selma
    Doğal dil çıkarımı, düşünce ifade eden cümlelerin arasındaki ilişkiyi; karşıtlık, gerekseme veya tarafsızlık olarak sınıflandırmayı hedefler. Sınıflandırma görevini gerçekleştirmek için metinsel kaynaklar, vektör ya da gömme olarak adlandırılan matematiksel gösterimlere dönüştürülür. Bu çalışmada, hem statik (Glove, OntoNotes5) hem de bağlamsal (BERT) kelime gömme yöntemleri kullanılmıştır. Fikirsel cümleler arasındaki mantıksal ilişkilerin sınıflandırılması zordur zira cümleler karmaşık gramer yapılarına sahiptir ve cümlelerin işlenerek mantıksal gösterimlere dönüştürülmesi geleneksel doğal dil işleme çözümleri ile yetersiz kalmaktadır. Bu çalışma, sınıflandırma görevini gerçekleştirmek için ayrıştırılabilir ilgi ve doğal dil çıkarımı için gelişmiş LSTM (ESIM) derin öğrenme modellerini kullanmıştır. En iyi sonuç olan %88 doğruluk değeri SNLI veri kümesi üzerinde ESIM-BERT ile elde edilmiştir.
  • Conference Object
    Citation - Scopus: 1
    Türkçe Tweetler Üzerinden Yapay Sinir Ağları ile Cinsiyet Tahminlemesi
    (Institute of Electrical and Electronics Engineers Inc., 2019) Sezerer, Erhan; Polatbilek, Ozan; Tekir, Selma
    Yazar ayrımlaması, yazarı bilinmeyen bir metin üzerinden yazarına dair cinsiyet, yaş ve dil gibi bazı anahtar özniteliklerin belirlenmesidir. Özellikle güvenlik ve pazarlama alanında önem arz etmektedir. Bu çalışmada, kullanıcıların tweetleri kullanılarak cinsiyetleri tahminlenmektedir. Yinelemeli Sinir Ağı (YSA) ve ilgi mekanizmasının birleşiminden oluşan bir model önerilmiştir. Bildiğimiz kadarıyla bu çalışma Twitter veri kümesi ile Türkçe’de ilk defa yapılmıştır. Önerilen model Türkçe, İngilizce, İspanyolca ve Arapça dillerinde sınanmış ve sırasıyla 80.63, 81.73, 78.22, 78.5 doğruluk değerlerine ulaşılmıştır. Elde edilen doğruluk değerleri Türkçe’de en gelişkin, diğer dillerde ise rekabetçi bir başarım ortaya koymaktadır.
  • Conference Object
    13. Ulusal Yazılım Mühendisliği Sempozyumu
    (Izmir Institute of Technology, 2019) Ayav, Tolga; Tekir, Selma; Erten, Murat
    The 13th National Software Engineering Symposium (UYMS) of Turkey was held Izmir Institute of Technology on 23-25 September 2019. There has been a great interest in this year’s symposium, as in previous years. UYMS is a platform which helps bring together the software industry and the academicians working in this area. It is being organized since 2003 and it plays an important role in shaping the future of the software industry in Turkey. We would like to thank all the participants whose contributions led to the successful realization of this symposium. We would also like to express our belief that these contributions will lead to a better and more productive efforts in the field of software engineering. Along with the main area of UYMS, in the thematic areas of Software Test Engineering, Software Engineering for Health, Software Modeling, and Graduate Theses, a total of 77 papers were accepted this year. At least three referees reviewed each paper and the papers were evaluated based on these reviews. We thank all the program committee members who served as referees.
  • Conference Object
    Doğruluk Problemi için Veri Kümesi Hazırlanması
    (CEUR Workshop Proceedings, 2018) Karabayır, Arif Kürşat; Tek, Ozan Onur; Çınar, Özgür Fırat; Tekir, Selma
    Internet has become one of the most important information sources. With the advent of Internet, the ease of access and sharing of information have caused the emergence of conflicting information. The increase in conflicting information makes it a challenge to find the truth out of it. This problem is named as the veracity problem. The algorithms that were developed in response to this problem accept structured data as in¬ put. Thus, to be able to use these algorithms on Internet, there is a need to transform the unstructured data on the Internet into a structured form. This need is hard to fulfill in a domain-independent and automatic way considering the variety on Internet. In this work; structured data preparation to test the effectiveness of the truth-finder algorithms is experienced. The process of transforming the unstructured data on the Internet into a structured form is described in steps to contribute its generalization in a domain-independent way. As a result of this process, a new quotes data set is constructed and a truth-finder algorithm is tested on this dataset by giving some comments on it.
  • Conference Object
    Bir Platform Oyununa Kullanıcı Performansı Temelinde Yapay Zeka Uyarlaması
    (CEUR Workshop Proceedings, 2015) Türkmen, Sercan; Mungan, Hilmi Yalın; Tekir, Selma
    Oyun programlama, video oyunlarının yazılım geliştirme bölümüdür. Diğer yazılımlardan farklı olarak oyun içindeki nesnelerin sürekli güncellenmesini gerektirmektedir. Güncelleme işlevinde, nesnenin dünya içinde bulunduğu yer, hız, ivme gibi fiziksel özellikleri, çarpışma işlemleri, animasyon güncellemeleri ve kullanıcı girdisinin ele alınması gibi çok çeşitli işlemler kapsanmaktadır. Yüksek güncelleme frekansı gereksinimi de dikkate alındığında yazılan kodun performansı ve kalitesi ön plana çıkmaktadır. Oyun alanı, yazılım karakteristiklerinden kullanılabilirliğin ötesinde kullanıcının eğlenmesini sağlamayı hedeflemektedir. Yapay zekanın uygulama alanlarının ve tekniklerinin gelişmesi oyunların eğlendirici yönünü arttırmaktadır. Bu çalışmada, bir platform oyunu (Dawn) geliştirilerek oyun içerisindeki kurguyu, geçerli kullanıcıya göre uyarlayan bir yapay zeka entegre edilmesi amacıyla platform oyununu karakterize edebilecek öznitelikler çıkarılmış ve ölçülmüştür. Genel olarak, çıkarılan öznitelikler girdi ve çıktı öznitelikleri olarak gruplandırılarak girdi özniteliklerinin çıktı öznitelikleri ile ilişkisi ortaya konmaya çalışılmıştır. Belirlenen en temel çıktı özniteliği, kullanıcı performansıdır. Kullanıcı performansının ölçümünde bölüm tamamlanma zamanı, kahramanın ölüm nedeni ve bölümlerde uğradığı zarar öznitelikleri baz alınmıştır. Sistem, bu sayede bölüm içerisindeki düşman seçimini ve bir sonraki bölüm önerisini kullanıcının performansına göre belirlemektedir.