A Language Modeling Approach To Detect Bias

dc.contributor.advisor Tekir, Selma
dc.contributor.author Atik, Ceren
dc.date.accessioned 2021-07-04T09:36:08Z
dc.date.available 2021-07-04T09:36:08Z
dc.date.issued 2020
dc.description Thesis (Master)--Izmir Institute of Technology, Computer Engineering, Izmir, 2020 en_US
dc.description Includes bibliographical references (leaves: 39-41) en_US
dc.description Text in English; Abstract: Turkish and English en_US
dc.description.abstract Technology is developing day by day and is involved in every area of our lives. Technological innovations such as artificial intelligence can strengthen social biases that already exist in society, regardless of the developers' intentions. Therefore, researchers should be aware of this ethical issue. In this thesis, the effect of gender bias, which is one of the social biases, on occupation classification is investigated. For this, a new dataset was created by collecting obituaries from the New York Times website and they were handled in two different versions, with and without gender indicators. Since occupation and gender are independent variables, gender indicators should not have an impact on the occupation prediction of models. In this context, in order to investigate gender bias on occupation estimation, a model in which occupation and gender are learned together is evaluated as well as models that make only occupation classification are evaluated. The results obtained from models state that gender bias has a role in classification occupation. en_US
dc.description.abstract Teknoloji günden güne gelişerek hayatımızın her alanına dahil olmaktadır. Yapay zekâ gibi teknolojik yenilikler, geliştiricilerin niyetlerinden bağımsız olarak toplumda zaten var olan sosyal önyargıları güçlendirebilir. Bu nedenle, araştırmacılar bu etik sorunun farkında olmalıdır. Bu tez çalışmasında, sosyal önyargılardan biri olan cinsiyet yanlılığının meslek sınıflandırması üzerindeki etkisi araştırılmaktadır. Bunun için New York Times web sitesinden anma yazıları toplanarak yeni bir veri kümesi oluşturulmuş ve bu anma yazıları cinsiyet göstergeleri dahil ve hariç olmak üzere iki farklı versiyonuyla ele alınmıştır. Meslek ve cinsiyet birbirinden bağımsız değişkenler olduğu için cinsiyet göstergelerinin modellerin meslek tahmini üzerinde bir etkisi olmadığı varsayılmaktadır. Bu bağlamda, meslek tahmini üzerinde cinsiyet yanlılığını araştırmak için sadece meslek sınıflandırması yapan modellerin yanında meslek ve cinsiyetin aynı anda öğrenildiği bir model de değerlendirilmiştir. Deneysel sonuçlar meslek tahmininde cinsiyet yanlılığının etkili olduğunu ortaya koymaktadır en_US
dc.format.extent x, 44 leaves
dc.identifier.citation Atik, C. (2020). A language modeling approach to detect bias. Unpublished master's thesis, İzmir Institute of Technology, İzmir, Turkey en_US
dc.identifier.uri https://hdl.handle.net/11147/10999
dc.language.iso en en_US
dc.publisher Izmir Institute of Technology en_US
dc.rights info:eu-repo/semantics/openAccess en_US
dc.subject Neural networks en_US
dc.subject Artificial intelligence en_US
dc.subject Social biases en_US
dc.subject Gender bias en_US
dc.title A Language Modeling Approach To Detect Bias en_US
dc.title.alternative Taraflılığın Tespiti için Bir Dil Modeli Yaklaşımı en_US
dc.type Master Thesis en_US
dspace.entity.type Publication
gdc.coar.access open access
gdc.coar.type text::thesis::master thesis
gdc.description.department Thesis (Master)--İzmir Institute of Technology, Computer Engineering en_US
gdc.description.publicationcategory Tez en_US
gdc.description.scopusquality N/A
gdc.description.wosquality N/A
relation.isAuthorOfPublication.latestForDiscovery 57639474-3954-4f77-a84c-db8a079648a8
relation.isOrgUnitOfPublication.latestForDiscovery 9af2b05f-28ac-4014-8abe-a4dfe192da5e

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Name:
631237.pdf
Size:
856 KB
Format:
Adobe Portable Document Format
Description:
Master Thesis