Yeni Başlayanlar İçin Big Data’ya Giriş 2018

Big Data Nedir?

Big Data, yeni veri kaynaklarından türetilen çok çeşitli, karmaşık ve hızlı değişen verileri açıklayan genel bir terimdir. Adından da anlaşılacağı üzere Big Data (Büyük veri) setleri o kadar geniştir ki, geleneksel veri işleme yazılımı veya geleneksel yazılım yönetim araçları ile yönetilmesi oldukça güçtür. Teknoloji ve pazarlamanın son dönemlerde oldukça iç içe geçmesi sebebiyle şimdilerde, her organizasyon bu rekabetçi pazarda markalaşmayı hedefliyor. Bunun için etkili veri yönetimi son derece önemlidir ancak büyük veri yığınlarını ele almak hiçte kolay bir iş değildir.  Bu notka ise Big Data’nın resmin içine girdiği yerdir.

İlk olarak bilinmesi gereken en önemli nokta, veri yönetimi sadece bir başka yeterlilik faktörü değildir. Söylemek istediğim şey, piyasada kazananları belirleyebilecek daha çok daha önemli ve kritik bir rolü olduğudur ve bir bakıma farklılaştırıcıdır.  Önemli olan veri miktarı değil. En önemlisi, işletmelerin verileri ne kadar iyi yönettikleri ve bu verilerle ne yaptıklarıdır.

 

Big Data (Büyük Veri) ile Ne Yapılabilir?

  1. Büyük veriler kullanıcı davranışını belirleyebilir.
  2. Büyük veriler tahmin analizi yapabilir.
  3. Büyük veriler, iş stratejilerini çerçevelemek için analizler elde etmede yardımcı olur.
  4.  Büyük veriler, veri kümelerinden değer elde etmek için işlemler gerçekleştirebilir.

Yukarıda belirtilen tüm faktörleri göz önünde bulundurarak, şu an dünya genelindeki tüm kuruluşlar ve işletmeler büyük veri gelişimini dört gözle bekliyor. Ayrıca, Big Data’yı dahil ederek, herhangi bir işi dönüştürme yeteneğine sahip yeni girişimlerde ortaya çıkacaktır.

Buna ek olarak, Big Data uygulamaları sadece yazılım veya uygulama geliştirme ile sınırlı değildir. Büyük Veri gelişimi, diğer birçok sektörde kullanılmaktadır. Örneğin:

  • Finansak Teknolojiler (Fintech)
  • Robotik (Robotics)
  • Meteoroloji (Meteorology)
  • Tıp (Medicine)
  • Çevresel Araştırma (Environmental research)
  • Bilişim ve Siber Güvenlik (Informatics and cyber security)

Tüm sektörlerdeki gelişimler dikkate alındığında Big Data miktarı katlanarak artmaya devam ettiği için, analiz etmek hiçte kolay değildir. Ancak, parça parça dahi olsa bu verilerin doğru yönetimi ve doğru çalışması, işletmelerin doğru karar verebilmesine yardımcı olacaktır.

Big Data

Big Data (Büyük Veri) Türleri Nelerdir?

Başlangıç olarak Big Data’yı genel olarak üç kategoriye ayırabiliriz.

1) Yapılandırılmış Veriler

Sabit bir biçimde saklayabileceğiniz, işleyebileceğiniz ve erişebileceğiniz herhangi bir veri, yapılandırılmış veriler olarak sınıflandırılabilir. Veriler, veritabanlarında düzenli olarak saklanmaktadır. Verilerin formatı ve bunun nasıl çıkarılacağı önceden bilinmelidir.

Yapılandırılmış veri örneği: Herhangi bir veritabanı yazılımında saklanan bilgiler.

2) Yapılandırılmamış Veriler

Bilinmeyen bir yapıya veya biçime sahip herhangi bir veri, yapılandırılmamış veri olarak adlandırılabilir. Veri boyutunun ve çeşitliliğinin büyük olduğu durumlarda bu verileri düzgün yorumlamak kolay değildir. Veriler, metin dosyaları, videolar ve görüntülerin bir karışımını içerebilir.

Yapılandırılmamış veri örneği: Google’da yaptığınız herhangi bir arama sonucu.

3) Yarı Yapılandırılmış Veriler

Yukarıdaki verilerin her ikisini de içerir. Çoğu zaman, eğer veri tanımlanmışsa fakat yapılandırılmamışsa, yarı yapılandırılmış veri olarak sınıflandırılabilir. Yarı yapılandırılmış veriler, organizasyonel özellikleri içeren ancak geleneksel veritabanı biçiminde olmayan bilgileri içerir.

Yarı yapılandırılmış veri örneği: XML dosyasında saklanan veriler.

Big Data

Big Data’nın 3 V’si Nedir?

2000’lerin başlarında, Gartner analisti Doug Laney, Big Data kavramını üç V şeklinde ifade etmiştir. Bunlar; Volume (Hacim), Velocity (Hız) ve Variety (Çeşitlilik)’dir.

1. Volume(Hacim)

Yukarıda açıkladığım üzere Big Data’nın tanımı, bol miktarda veriyi ifade etmektedir. Herhangi bir işletmenin yaşam döngüsü günlük, aylık ve yıllık olarak dikkate alındığında; iş anlaşmaları, işlemler ve yatırımlar, sosyal medya istatistikleri ve diğer verilerden toplanan verileri içeren çok büyük miktarda veriye sahiptir. Bu veri yığınının doğru yorumlanması şirketin geleceği hakkında fikir verdiği için veri hacmi çok önemlidir.

Ayrıca, belirli bir veri kümesinin büyük veri olarak belirlenip belirlenemeyeceği, verilerin hacmine bağlıdır. Eğer Big Data ile, yüksek hacimli düşük yoğunluklu verileri işleyecekseniz. Verilerin boyutunun terabayt veya petabayt arasında değişebileceğini unutmayın!

Bu nedenle, Hacim, Büyük Veri ile çalışırken göz önünde bulundurulması gereken önemli bir parametredir.

2. Velocity(Hız)

Velocity(Hız), verinin üretilme hızı anlamına gelir. Üretme hızı, verilerin alınması ve veriler üzerinde gerçekleştirilen eylem olmak üzere her ikisini de içerir. Verilerin ne kadar hızlı üretildiği ve işlendiği, verilerin gerçek potansiyelini belirler.

Dolayısıyla, Big Data’daki hız, verinin hangi kaynaklardan ne kadar hızlı aktığını ele alır. Veri trafiğinin; çeşitli kaynaklar, sosyal medya siteleri, uygulama günlükleri ve diğer ağlar gibi çeşitli kaynaklardan geldiği göz önünde bulundurulduğunda trafiğin ne kadar sürekli ve hacimli olduğu anlaşılabilir.

Bu eşi görülmemiş veri akışıyla verilerin doğru biçimde işlenmesi , verilerin gerçek potansiyelini belirleyecektir. Bu yüzden Büyük Veri için hız çok önemlidir.

3. Variety(Çeşitlilik)

Günümüzde, veriler söz konusu olduğunda, sadece düz metin verisi veya veritabanları biçimindeki yapısal verilerle sınırlı değiliz. Veriler, farklı türlerde veriler – yapılandırılmış, yapılandırılmamış, sayısal, ses, video, pdf, finansal işlemler ve satır verileri anlamına gelir. Tüm bu farklı veri türlerini ayrıştırabilmek için, farklı ön işlemler gerekmektedir.

Ayrıca, çeşitlilik demek her bir veri türünü belirlemek, saklamak ve analiz etmek için farklı yollar anlamına gelir. Uygulamalar büyük hacimli kullanıcılara dönüştükçe, Agile(Çevik proje yönetimi) sürece ihtiyaç duyulmaktadır çünkü geleneksel veritabanları iş değeri üretmek yeterli değildir.

Özet Olarak;

Big Data analizi şirketlerin işleyişi açısından çok önemlidir. Big Data’yı işletmenize dahil etmek size beş önemli avantaj sağlayacaktır;

  • Maliyeti azaltma
  • Büyüme
  • Akıllı karar verme
  • Optimize edilmiş teklifler
  • Azaltılmış ürün geliştirme süresi

Tüm yukarıda anlattıklarım göz önüne alındığında günümüzde gittikçe daha fazla sayıda işletme, Big Data’yı rakiplerinden daha iyi performans gösterip veriyi analiz etmek için için kullanıyor. Ayrıca, Big Data gelişimi, işiniz için yeni fırsatlar yaratacak ve tüketici tercihleri konusunda daha iyi bir perspektif elde etmenize yardımcı olacaktır. Big Data’yı yüksek güçlü analitiklerle birleştirmek, karmaşık görevlerinizi sorunsuz bir şekilde tamamlamanıza yardımcı olacaktır.

Big Data

Kaynaklar:

1 yorum

  1. Görkem CAN

    19 Ekim 2018 at 08:29

    Böylesine faydalı bir bilgiyi bizlerle paylaştığınız için teşekkür ederiz.

Yorum Yap

This site uses Akismet to reduce spam. Learn how your comment data is processed.