banner564

Veri madenciliği

Günümüzde teknoloji hızla gelişiyor. Teknolojinin gelişmesindeki en önemli iki etken, bilgisayar sistemleri günden güne ucuzlaması ve aynı zamanda işlem güçlerinin de artmasıdır. Bilgisayar sistemlerindeki bu gelişmeyle birlikte, özellikle ucuzluyor olmasından dolayı kullanımı da her gün daha da yaygınlaşıyor.
Bu gelişmeyle paralel üretilen sayısal bilgi miktarı da artmaktadır. Kullandığımız her elektronik cihaz veri depolayan ve gönderen algılayıcılarla kuşatılmış haldeyiz. Google, Facebook, Youtube ve daha nice iletişim hizmetlerinin tek varoluş nedeni bizim verilerimizdir.
Fakat oluşan bu büyük sayısal veriler bir sorunu daha beraberinde getirmiştir ki, veri yığınlarının depolanması, yönetilmesi ve anlamlı hale getirilmesidir.
Çünkü veriler kendi başlarına değersizdirler, ancak amacınız doğrultusunda verileri anlamlı bilgiye dönüştürebiliriz. 
Büyük veriler incelendiği zaman insanın aklına gelmeyecek ilişkiler ortaya çıkarabiliyor. Bu ilişkilerin ortaya çıkarılması çalışmalarına veri madenciliği deniyor. Şu örneği bir düşünün.
Amerika'daki bir araştırma projesi prematüre bebekler ile ilgili bir teşhis programı geliştirdi.
Yeni doğan bebek için 16 farklı veri akışı (kalp, kan basıncı, oksijen düzeyi gibi…) gerçek zamanlı olarak toplandı. Toplanan veriler sorgulandığında prematüre doğan bebeklerde, ciddi bir enfeksiyon ortaya çıkmadan önce, hayati değerleri normal bir hal alıyor. Prematüre bebeklerde bu durum normalde doktorları rahatlatırken, söz konusu prematüre bebekler olunca, bu stabil durum enfeksiyonun gelişini gösteren bir uyarı sinyali olabiliyor. Çünkü toplanan verilerde prematüre bebeklerin ciddi bir enfeksiyona yakalanmadan 24 saat önceki hayati verileri stabil bir seyir gösterdiği, toplanan verilerden anlaşılmıştır.
Söz konusu bebekler olunca, gebelik testinin toplanan verilerden de yapıla bilineceğini düşündünüz mü?
Hamile kadınlar genelde reklamlardan çok etkilenmektedirler, çünkü tüketici alışkanlıklarını yeniden planlamaya çalışırlar. Dolayısıyla hamile bir kadının internette ziyaret edeceği siteler, hamilelik veya bebek ürünleri ile ilgili olacaktır. Dolayısıyla belirli bir algoritma geliştirilerek, hamile olan kadınların tespit edile biliniyor.
Büyük miktardaki veriler, gelecekle ilgili doğru tahmin yapmamızı sağlıyor. Veri miktarı ne kadar fazla olursa doğruluk oranı artmaktadır. Dünya genelinde yapılan örnek çalışmalar şunu göstermiştir;
“Çocuk bezi alan müşterilerin 30%’u bira da alır.”, birliktelik analizi
“Genç kadınlar küçük araba satın alır.”, sınıflama analizi
“İlk üç taksitini geç ödemiş olan müşterilerin %60’ı olasılıkla krediyi geriye ödeyemiyor.”, zaman içinde sıralı örüntüler analizi.
Gelişen teknoloji çok farklı bilimsel çalışma alanları yaratmaktadır. Bilişim ve eğitim adası olma vizyonu ve misyonunda olan siyasilerimizin, toplumumuzun sayısal verilerinin depolanmasına özel önem vermeleri gerektiğidir. Hemen şunu da belirtmeliyim ki, depolanan verilerin bilimsel çalışmalara açık olmaları gerekliliğidir. Çünkü bilimsel çalışmalara açık olmayan veri, yastık altında saklanan altın gibidir, hiçbir değeri olmaz. Maalesef coğrafyamızda veriye ulaşmak, elde etme nerdeyse imkânsız gibi bir şey. Her ne kadar bilgi edinme yasamız olsa da… Herkese iyi pazarlar.
YORUM EKLE

banner608

banner473