Machine-learning-assisted de novo design of molybdenum disulfide binding peptides

dc.contributor.advisor Yücesoy, Deniz Tanıl
dc.contributor.advisor Apaydın, Mehmet Serkan
dc.contributor.author Öğüt, Alp Deniz
dc.date.accessioned 2024-10-25T23:28:52Z
dc.date.available 2024-10-25T23:28:52Z
dc.date.issued 2024
dc.description Includes bibliographical references (leaves. 48-56) en_US
dc.description Thesis (Master)--İzmir Institute of Technology, Bioengineering, Izmir, 2024 en_US
dc.description Text in English; Abstract: Turkish and English en_US
dc.description.abstract Kısa amino asit zincirleri, peptitler, biyolojik süreçler ve yüksek teknoloji uygulamaları için vazgeçilmez moleküllerdir. Geniş kullanım alanları arasında, moleküler tanıma özelliği ile bio-nano arayüzler oluşturmak ilgi toplayan bir araştırma konusu olmuştur. Yapılan çalışmalar sonucunda yönlendirilmiş evrim metodolojileri oluşturulmuş ve çeşitli hedeflere -enzim, antijen veya inorganik yapılar- bağlanan fonksiyonel peptit tanısı mümkün hale gelmiştir fakat bu geleneksel yaklaşım ölçeklenebilirlik ve sekans uzayındaki ilişkilerin anlaşılması konusunda zayıflıklar taşımaktadır. Bu zafiyetler, yüksek çıktılı sekanslama ve hesaplama verimlerinin artması ile beraber derin yönlendirilmiş evrim gibi daha güçlü teknolojilerinin geliştirilmesini motive etmiştir. Bu yöntemle üretilen büyük veri setleri, sekans-fonksiyon ilişkilerinin makine öğrenmesi ile modellenebilmesinin önünü açmıştır. Bu tezin amacı bu veri setlerine uygun bir makine öğrenmesi akışı oluşturmaktır. Bu düzlemde Random Forest algoritması ve derin nöral ağlar kullanılmış, eğitilen modellerin bağlanma puanı öngörüleri beraber kullanıldığında mutlak hata sırasıyla, 0.0304, Pearson korelasyon ölçütü 0.904 olarak elde edilmiştir. Bu modelleri kullanarak rastgele arama ve tekrarlayan optimizasyonlar ile güçlü bağlanan örnek bir peptit tasarlanmıştır. Bulgular alan bilgisinin makine öğrenme modeli eğitimdeki yerini vurgulamış, kullanılan örnek ağırlıklarının ve semantik amino asit vektörlerinin başarıya önemli katkıları gözlemlenmiştir. Bu çalışma çeşitli fonksiyonlara sahip peptit tasarlayabilen bir platform oluşturabilmek için temel noktaları göz önüne serer. en_US
dc.description.abstract Peptides are molecular entities with a diverse set of functionalities vital for biological processes and biotechnological applications. Among their roles, the ability of peptides to bind to solid materials has gathered attention, particularly as building blocks in constructing bio-nano interfaces and molecular linkers. Directed evolution techniques such as iterative phage display, have emerged as capable tools for identifying peptides and proteins with specific affinities for various targets despite its constraints, particularly its low-throughput nature. Those limits have motivated the work on more advanced methodologies such as deep-directed evolution, which integrates high-throughput sequencing. By collecting massive amounts of data, deep-directed evolution provides a broad landscape of sequence information, thus enabling computational modeling and optimization of peptide sequences. This thesis aims to develop machine learning workflows that capture the sequence-function relationship from the data, allowing the design of peptides with desired functionalities. Two machine learning approaches were employed: the Random Forest algorithm (RF) and deep neural networks (DNN). By aggregating binding score predictions from the two models, the predictor achieved a Pearson correlation coefficient of 0.904 and a mean absolute error of 0.0304 on the high- confidence test set and was employed to design a candidate peptide as a proof of principle. Our findings emphasize the importance of including domain knowledge via peptide abundance weighting and amino acid encoding types while designing training strategies. The procedures outlined in this work demonstrate key steps towards designing a peptide sequence-function prediction platform with broad implications for bio-nanotechnology and engineering. en_US
dc.format.extent xi, 64 leaves: en_US
dc.identifier.uri https://hdl.handle.net/11147/14984
dc.language.iso en en_US
dc.publisher 01. Izmir Institute of Technology en_US
dc.subject Two-dimensional materials en_US
dc.subject Peptides en_US
dc.subject Neural networks en_US
dc.subject Deep learning en_US
dc.subject Biomimetic materials en_US
dc.subject Machine learning methods en_US
dc.subject Artificial intelligence en_US
dc.title Machine-learning-assisted de novo design of molybdenum disulfide binding peptides en_US
dc.title.alternative Molibden Disülfid Bağlayıcı Peptitlerin Makine Öğrenimi Destekli de Novo Tasarımı
dc.type Master Thesis en_US
dspace.entity.type Publication
gdc.author.id 0009-0004-0577-5195
gdc.author.id 0009-0004-0577-5195 en_US
gdc.author.institutional Öğüt, Alp Deniz
gdc.coar.type text::thesis::master thesis
gdc.description.department Thesis (Master)--İzmir Institute of Technology, Bioengineering en_US
gdc.description.endpage 75 en_US
gdc.description.publicationcategory Tez
gdc.identifier.yoktezid 889985 en_US
relation.isAuthorOfPublication.latestForDiscovery 57561b2c-b83b-4e91-973e-28ff1765a031
relation.isOrgUnitOfPublication.latestForDiscovery 9af2b05f-28ac-4018-8abe-a4dfe192da5e

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Name:
14984.pdf
Size:
3.23 MB
Format:
Adobe Portable Document Format
Description:
Master Thesis