Makine öğrenimi kavramı eminim daha önce bir yerlerde karşınıza çıkmıştır. Spotify uygulamasının haftalık keşif listeleri, internette hemen her yerde karşımıza çıkan e-ticaret sitelerinin kişiye özel reklamları, otonom sürüş özelliklerine sahip otomobiller, e-postamızın spam kutusu… makine öğreniminin sunduğu imkanlar sayesinde hayat buluyor. Yapay zekanın bir alt kolu gibi değerlendirilen makine öğrenimi büyük veri (big data) sayesinde işlevsellik kazanıyor. Günlük hayatın pek çok alanında farklı makine öğrenimi uygulamalarına denk gelmek mümkün, peki ya iktisadi bir araştırmada? Geride bıraktığımız Kasım ayında farklı araştırma kurumları ve üniversitelerden beş araştırmacı Fransa’daki şehirlerin gelişimi, tarımsal üretkenlik ve insan topluluklarının evrimi üzerine yaptıkları bir çalışmayı paylaştılar. Bu çalışmada makine öğrenimi sayesinde geçmiş tarihlere ait haritalar incelenmiş ve haritalardan edinilen bilgiler bir şekilde verilerin diline çevrilmiş. Bu çalışmanın detayları da yöntemi kadar ilgi çekici, fakat bundan bahsetmeden önce vurgulanması gereken önemli bir konu var: verinin olduğu hemen her yerde makine öğreniminin kullanılabilmesi olasılığı. Bu tür araştırma yöntemlerinin, gelecekte iktisat literatüründe de daha fazla yer bulacağına ise şüphe yok.
Kısaca Makine Öğrenimi
IBM internet sitesinde yer alan tanımla, “makine öğrenimi, sistemin açık programlamayla değil, verilerden öğrenmesini sağlayan bir yapay zekâ biçimidir.” İlk önce bir makine öğrenimi algoritması oluşturulur, daha sonra da bu algoritma eğitim verileri kullanılarak geliştirilir. Eğitim verilerini bir bisikletin destek tekerleri gibi düşünebiliriz. Algoritma bu verilerden öğrenerek gelişir ve bir makine öğrenimi modeli elde edilir. Bu modele bir girdi sağlandığında, model eğitim verilerinden öğrendikleri doğrultusunda bir çıktı sunar. Modelin kullanımı da sürekli öğrenmeye dayalı bir süreçtir. Modeller her yeni girdide gelişir, iyileşir. Gözetimli, gözetimsiz, pekiştirmeli, derin öğrenme olarak anılan farklı makine öğrenimi yaklaşımları mevcuttur. Eldeki verinin özelliklerine ve modelin gerçekleştirmesi istenilen görevin ayrıntılarına göre bu yaklaşımlardan birisi tercih edilebilir. Bu konu hakkında daha pek çok şey söylemek mümkün, ancak bu yazının kapsamı doğrultusunda bu kadarıyla yetiniyorum. Meraklısı için https://www.ibm.com/tr-tr/analytics/machine-learning sitesinde daha fazla bilgiye ve “Machine Learning for Dummies” adlı bir e-kitaba ulaşmak mümkün.
Makine Öğrenmesinden Yararlanarak Şehir Ekonomilerini Anlamak
Bölgelerin, şehirlerin ve hatta mahallelerin gelişimini anlamak için geçmişe dayalı belgeler ve tarihi dokümanlar oldukça zengin bir araştırma alanı sunuyor. Örneğin haritalara bakarak bir bölgenin çok uzun vadedeki gelişimini, bölgedeki ekonomik aktivitenin değişimini gözlemlemek mümkün. Ancak yine de bir harita, tutarlı bir veri yapısından yoksun olduğu için ideal bir veri havuzu olma özelliği taşımıyor. Arşivlerde taranan haritaların sınıflandırılması, kodlanması, değişkenlerin analize uygun şekilde sayısallaştırılması tahmin edilebileceği üzere oldukça emek yoğun bir iş. Öyle ki, bu alandaki araştırma maliyetlerinin yüksekliği araştırmanın önündeki en büyük engellerden biri olarak karşımıza çıkıyor. Bu araştırmada da Combes, Duranton, Gobillon, Gorin ve Zylberberg adlı beş araştırmacı, insan gücünden yararlanan külfetli araştırma teknikleri yerine makine öğreniminden yararlanan bir model kullanılmasını öneriyorlar. Araştırmaları kolaylaştırması ve maliyetleri ciddi anlamda düşürmesi bakımından bu yöntem pek çok yeni araştırmanın önünü açabilir. Şehir ekonomileri alanında makine öğreniminin sunduğu imkanlar kullanılarak yapılabilecek birçok araştırma mevcut.
Örneğin, tarımsal verimlilik ve kentleşme arasındaki ilişkinin ulaşım maliyetlerine bağlı olması oldukça muhtemel. Bu maliyetler yüksek olduğunda, yüksek tarımsal üretkenliğe sahip bölgeler hızla kentleşiyor, imalat sektörüne ve şehirlere doğru işgücü geçişleri gözlemleniyor. Ulaşım maliyetleri düşük olduğunda ise, tarımsal verimliliği yüksek bölgeler tarımda uzmanlaşıyor ve tarım ürünlerinin ihracatına dayalı bir gelişme modeli takip ediyorlar. Sanayileşmeden ve imalat sektöründen uzak kalan bu bölgeler göreceli olarak daha az gelişiyor. Makine öğrenimi; kentleşme, tarımsal verimlilik ve ulaşım ağları arasındaki ilişkilerin derinlemesine incelenmesine olanak tanıyor.
Benzer şekilde, şehir yapılarının uzun vadedeki evrimi, şehirlerdeki arazi kullanımını şekillendiren temel etkileri aydınlatmaya olanak tanıyor. Çevre kirliliğine yol açan fabrikaların konumu, alt gelir gruplarının şehirlerin daha çok kirletilen bölgelerinde yoğun olarak ikamet etmeleri gibi pek çok faktör günümüz büyük şehirlerindeki bölgesel ve sınıfsal ayrımların anlaşılmasında yardımcı olabilir. Tüm bu dinamiklerin anlaşılması için gereken tarihsel verilerin analizi de yine makine öğrenimindeki gelişmeler sayesinde çok daha kolaylaşıyor.
Büyüyen başka bir literatür ise, göçlerin tarihsel belirleyicilerini ve uzun dönem etkilerini araştırıyor. Bu tür hareketlerin tespiti içinse nüfus sayımları, zorunlu askerlik listeleri, göçmenlik kartları ve gemi yolcu varış listeleri gibi tarihi belgelerin incelenmesi gerekiyor. Bireysel nüfus hareketlilikleri ve arşiv kayıtları arasındaki bağlantıların kurulması ise bu konudaki en temel zorluklardan birisi. Makine öğrenimi farklı nüfus kayıtları arasında bireyleri tanımak için benzersiz bir kaynak ve imkân sunuyor.
Haritadan Veriye
Haritalar; düzensiz yazılar, semboller, çizgiler ve renkli yüzeylerden oluşan oldukça dağınık materyaller ve bunların bir araştırmada kullanılabilmesi için yorumlanmaları ve verilere dönüştürülmeleri gerekiyor. Çoğu zaman tarihsel süreç içinde orijinal haritalar hasar görüyor, farklı nesneleri belirtmek için aynı renk kullanılabiliyor veya bir haritada aşırı bilgi yüklemesi olabiliyor. Tüm bunlar da veriye dönüştürme sürecini güçleştiriyor.
Bu noktada “random forest” adı verilen bir teknik devreye giriyor. Karar şemalarından yararlanan “random forest” tekniğinde amaç haritayı oluşturan görüntü piksellerini önceden tanımlanmış kategorilerle (yerleşim yeri, orman, tarla, su…) eşleştirebilmek. Kontur seviyeleri veya harita üzerindeki yazılardan doğabilecek ölçüm hatalarını azaltmak için pikselleri daha büyük “süper piksellere” dönüştürmek de mümkün. “Random forest” tekniği bir eğitim seti (eğitim verisi), yani önceden sınıflandırılmış ve etiketlenmiş bir dizi piksel gerektiriyor. Sınıflandırılabilecek milyarlarca pikselin yanında, birkaç milyon pikselden oluşan bu eğitim setinin iyi oluşturulması büyük önem taşıyor. Araştırmacılar bu çalışmada Fransa’nın çeşitli bölgelerinden haritalar kullanıyorlar. Resimlerde de görülebileceği üzere makine öğrenimi teknikleri sayesinde haritaları basitleştirip iktisadi bir araştırmanın girdilerine dönüştürmek mümkün.
Bu tekniğin geliştirilmesi sayesinde şehirleşmenin ve kentsel gelişimin tarihsel değişimini çok daha iyi anlamak mümkün olabilecek. Makine öğreniminin akademik araştırmalarda kullanılması ise bambaşka birçok imkân ve yenilik sunuyor.
Kaynakça
IBM. Veri bilimi ve makine öğrenimi. tarih yok. 5 Aralık 2020. <https://www.ibm.com/tr-tr/analytics/machine-learning>.
Combes, Pierre-Philippe, et al. “(Decision) trees and (random) forests: Urban economics, historical data, and machine learning .” 2020.