İsmine Chat GPT ve Gemini gibi büyük dil modelleri olan sohbet robotlarından aşina olduğumuz yapay zekanın günümüzde online alışveriş sitelerinden ekonomistlere, gökbilimcilerden mikrobiyolojicilere kadar pek çok alanda boy gösterdiği kuşku duyulmaz bir gerçek. Bu yazımda ise yıllardır ele alınan proteinlerin aminoasit zincirlerinden nasıl katlanarak oluştuğunu ve nihai şekillerini öğrenmek uğruna geçmişten günümüze olan çalışmaların kısa tarihini aktaracağım.
En başta “protein katlanması” ifadesine yoğunlaşmak için “Protein nedir?” ya da “Neden proteinlerin şekli bizim için önemli” gibi daha temel sorularla başlamakta yarar var. Proteinler en küçüklerinden en büyüklerine kadar tüm canlılar için çok önemli ve temel moleküllerdir. Canlılığın bilgi aktarımını sağlamak için daha stabil bir formda olan DNA’ya kıyasla proteinler daha kolay bozunabilirler ve zaten bu yüzden DNA’nın bilgisiyle üretilen iş görevlileri diyebiliriz onlar için. Temel yapı taşları olan amino asitler DNA daki genetik bilgiye göre sıralanırlar. Bu amino asit zinciri yani polipeptit görev yapmak için hazır değildir ve bazı katlanmalar gerçekleştirmesi gerekir. Bu katlanmalar amino asitlerin çeşidine yani içerdikleri radikal gruba bağlı olarak gerçekleşir. Bu radikal gruptaki atomların elektronegatifliklerine bağlı olarak itiş ve çekişleri, polarlıkları veya içerdikleri hidrojen bağlarına bağlı olarak çeşitli çokça katlanma gerçekleştirebilirler. Her proteinin kendine has katlanmasıyla oluşturduğu spesifik şekli o kadar önemlidir ki yanlış bir katlanmada ya da çevresel etkilere bağlı olarak oluşabilecek bozunmalarla proteinin bir enzimse substratına bağlanamamasına, hormonsa reseptöre bağlanamamasına neden olur. Bu durum da işlevini düzgün yerine getirememesine sebebiyet verir. Proteinlerin şekli onların fonksiyonlarını belirler, aminoasit zincirini ise DNA’daki genler. Günümüzde birçok hastalık/anomali DNA’sındaki geni aktif olmadığından spesifik bir proteinin üretilememesinden kaynaklanabiliyor. İki proteinin şekillerinden yola çıkarak benzerlikleriyle fonksiyonları arasında bağlantı kurabilmek mümkün. Ayrıca proteinlerde meydana gelebilecek bozunmaların ya da genteki mutasyonlarla oluşan protein yapısının şekline bakarak orijinali ile arasındaki fonksiyonel farklılıkları anlayabilmek için proteinin 3D yapısına hakim olmak gerek. Bu serüven ise ilk olarak protein kristalizasyonu ile başlıyor.
Karmaşık proteinlerin yapısını başarılı bir şekilde ilk defa belirleyen ve 1962 yılı Nobel Kimya ödülünü almaya layık görülen Kristalografi, John Kendrew ve Max Perutz tarafından miyoglobinin kristalleştirilmesi ile ilk başarılı örneğini verdi. Adı üzerinde ilk aşaması araştırılan molekülün kristalleştirilmesi ile başlayan bu proje gerçek bir görüntü elde edilebilmesi için kristalin üzerine gönderilen x-ray ışınları ile çeşitli kırınım desenleri elde ediliyor. Miyoglobinin 3 boyutlu görüntüsünün elde edilmesi 12 yılı aldı en sonunda ortaya çıkan görüntü pek çok kişiyi şaşkına çevirdi. İnsanlar matematiksel olarak daha anlamlı bir şekil beklerken karşılaştıkları tabiri caizse yamuk yumuk pek de hoş görünmeyen bir şeydi. Kristalografiden birkaç yıl önce Linus Pauling protein katlanmasının temelde iki yapıdan oluştuğu çıkarımına vardı: α sarmalları ve β katlanmaları. Bu yapılar proteinin sekonder yani ikincil yapısını oluşturuyordu ve çok daha yerel bir yapıydı. Proteinin nihai şekline ulaşması için başka aşamalardan daha geçmesi gerekiyordu ama yine de Pauling proteinlerin yapısını anlamak için çok önemli bir adım atmıştı. Cyrus Levinthal kaba bir hesapla kısa bir amino asit zincirinin bile astronomik rakamlarla ifade edilebilecek kadar farklı şekillerde katlanabileceğini ve bunun rastgele bulunmasının ne kadar uzun zaman alacağını “Levinthal Paradoksu” ile vurguladı.
Kristalografinin on bin dolarları bulabilmesi ve çok meşakkatli bir süreç olmasından ötürü aslında tam olarak bu noktada bilgisayarlar devreye giriyor. John Moult “CASP” adını verdiği bir yarışma başlattı. 1994’ten beri iki yılda bir düzenlenen bu etkinlik geçtiğimiz sene 16. yarışmasını gerçekleştirdi. Bir amino asit zinciri verdiğimizde çıktı olarak 3 boyutlu yapısını ortaya koyacak bir program tasarlamanın amaç olduğu bu yarışmada %90 üzerindeki uyumluluk başarılı sayılacaktı. Süreci hızlandırmak için yapılan bir başka gelişmeyse David Baker’ın Rosetta@home isimli algoritmasıydı. Baker Foldit ismini verdiği oyunuyla gönüllü birçok kişinin bilgisayarından oynayabileceği bir oyuna bu algoritmayı yerleştirerek sürecin tek bir bilgisayarla hesaplanmasından ziyade pekçok bilgisayarla ve oyun konseptiyle hızlandırmayı amaçlamıştı. Bu oyunu oynayanlardan birisiyse Demis Hassabis’ti. Demis Hassabis DeepMind adını verdikleri AI’ları ile zamanın dünya GO şampiyonu Lee Sedolin’i yenmeyi başarmıştı. DeepMind ekibi Foldit için bir AI yani AlphaFold’u geliştirmeye başladılar. AlphaFold girdi olarak amino asit dizisi alıyordu lakin aynı proteinin başka bir canlıda farklı amino asit gösterimi olabiliyordu. Sonuçta oluşan proteinin şeklinin birbirine benzemesi benzer itiş ve çekiş etkileri gösteren aminoasitler ya da amino asit grupları sayesinde oluyordu ve AlphaFold temelde bunu anlamaya çalışıyordu. Bu sebeple proteinin farklı canlılardaki aminoasit gösterimini de girdi olarak alıyordu. Çıktı olarak direkt 3 boyutlu şeklini vermek yerine önce basit bir 2 boyutlu matriste uzaklık tablosu şeklinde bir çıktı veriyordu. AlphaFold, CASP13’te önceki yarışmalardaki tüm örneklerine nazaran ciddi bir ölçüde fark atmıştı ama yeterli değildi. Bu yüzden AlphaFold2 üzerinde çalışmaya başladılar. Daha iyi bir yapay zeka algoritması oluşturmaları gerekiyordu. AlphaFold2 aynı proteinin farklı canlılardaki gösterimine bakarak ikili mutasyonlar ortak ve farklılıklara daha çok anlam yükleyerek geometrik yapıyı anlamlandırmada çok daha ustaca ilerliyordu. Geometriksel olarak imkansız olabilecek şeyleri mantıksal olarak ilişkilendirmiyor mantıksal olarak ilişkilendirilebilecek şeyleri de geometriksel olarak inceliyordu. AlphaFold’un bilmediği ve aslında şaşırtıcı olan bir gerçekse aminoasitlerin zincir olmak zorunda olmasıydı ama bunu modelin sıkışmaması için eklememişlerdi. Günün sonunda AlphaFold2 CASP14’te 90 barajını geçerek başarılı bir model olmuştu. AlphaFold’un etkisini daha iyi vurgulamak gerekirse kendisinden önce binlerce insan uğraşıp o zamana kadar 150.000 kadar proteinin yapısını bulabilmişti, AlphaFold bu sayıyı iki yüz milyona çıkarttı. Protein yapısının bilinmesiyle sentetik protein üretiminin önü açıldı.
Kaynakça
https://en.wikipedia.org/wiki/X-ray_crystallography
https://www.pnas.org/doi/10.1073/pnas.2034522100
https://www.nasonline.org/wp-content/uploads/2024/06/levinthal-cyrus.pdf