Enrichment of Turkish Question Answering Systems Using Knowledge Graphs

dc.contributor.advisor Tekir, Selma
dc.contributor.advisor Soygazi, Fatih
dc.contributor.author Çiftçi, Okan
dc.date.accessioned 2023-11-03T13:40:07Z
dc.date.available 2023-11-03T13:40:07Z
dc.date.issued 2023
dc.description Thesis (Master)--İzmir Institute of Technology, Computer Engineering, Izmir, 2023 en_US
dc.description Includes bibliographical references (leaves. 40-43) en_US
dc.description Text in English; Abstract: Turkish and English en_US
dc.description.abstract In the era of digital communication, the ability to effectively process and interpret human language has become a key research area. Natural Language Processing (NLP) has emerged as a field that enables machines to better understand and analyze human language. One of the most important applications of NLP is the development of question answering systems, which are essential in various domains such as customer service, search engines, and chatbots. To answer incoming queries, question answering systems rely on knowledge graphs as a reliable source. This thesis proposes a Turkish Question Answering (TRQA) system that utilizes a knowledge graph. The research focuses on the automatic construction of a knowledge graph specific to the film industry, as well as the creation of a multi-hop question-answering dataset that can be queried from this graph. Building upon these constructions, we develop a deep learning based method for answering questions using the constructed knowledge graph. The constructed knowledge graph is compared with various knowledge graphs presented in the literature using DistMult, ComplEx and SimplE methods for the link prediction task. Additionally, the proposed question answering system is compared with the baseline study and compared with a generative large language model through quantitative and qualitative analyses. en_US
dc.description.abstract Dijital iletişim çağında, insan dilini etkili bir şekilde işleme ve yorumlama yeteneği önemli bir araştırma alanı haline gelmiştir. Doğal Dil İşleme, makinelerin insan dilini daha iyi anlamalarını ve analiz etmelerini sağlayan bir alan olarak ortaya çıkmıştır. Doğal Dil İşleme'nin en önemli uygulamalarından biri, müşteri hizmetleri, arama motorları ve sohbet botları gibi çeşitli alanlarda önemli olan soru cevap sistemlerinin geliştirilmesidir. Gelen sorgulara cevap verebilmek için soru cevaplama sistemleri, güvenilir bir kaynak olarak bilgi çizgelerinden yararlanır. Bu tez, bilgi çizgesi kullanan bir Türkçe soru-cevap sistemini önermektedir. Çalışma, film endüstrisi ile ilgili bir bilgi çizgesinin otomatik olarak oluşturulmasına odaklanmakta, ayrıca bu bilgi çizgesi üzerinden sorgulanabilen çoklu adımlı bir sorucevap veri kümesi oluşturulmasını kapsamaktadır. Bu iki oluşuma dayanarak, oluşturulan bilgi çizgesi kullanılarak derin öğrenme tabanlı bir soru-cevap yöntemi geliştirilmiştir. Oluşturulan bilgi çizgesi, bağlantı tahmini görevi için DistMult, ComplEx ve SimplE yöntemlerini kullanarak literatürde yer alan çeşitli bilgi çizgeleri ile karşılaştırılmıştır. Ek olarak, önerilen cevap sistemi, hem referans alınan çalışma ile karşılaştırılmış olup, hem de üretken büyük dil modeli ile nicel ve nitel analizler yoluyla karşılaştırılmıştır. en_US
dc.format.extent x, 47 leaves
dc.identifier.uri https://hdl.handle.net/11147/13933
dc.language.iso en en_US
dc.publisher 01. Izmir Institute of Technology en_US
dc.rights info:eu-repo/semantics/openAccess en_US
dc.subject Natural language processing en_US
dc.subject Turkish Question Answering en_US
dc.subject Knowledge graph en_US
dc.title Enrichment of Turkish Question Answering Systems Using Knowledge Graphs en_US
dc.title.alternative Türkçe soru cevaplama sistemlerinin bilgi çizgeleri ile zenginleştirilmesi en_US
dc.type Master Thesis en_US
dspace.entity.type Publication
gdc.author.id 0000-0002-9435-8980
gdc.coar.access open access
gdc.coar.type text::thesis::master thesis
gdc.description.department Thesis (Master)--İzmir Institute of Technology, Computer Engineering en_US
gdc.description.publicationcategory Tez en_US
gdc.description.scopusquality N/A
gdc.description.wosquality N/A
gdc.identifier.yoktezid 823359 en_US
relation.isAuthorOfPublication.latestForDiscovery 57639474-3954-4f77-a84c-db8a079648a8
relation.isOrgUnitOfPublication.latestForDiscovery 9af2b05f-28ac-4014-8abe-a4dfe192da5e

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Name:
10563982.pdf
Size:
834.82 KB
Format:
Adobe Portable Document Format
Description:
Master Thesis

License bundle

Now showing 1 - 1 of 1
Loading...
Name:
license.txt
Size:
3.2 KB
Format:
Item-specific license agreed upon to submission
Description: