Veri Analitiğine Genel Bakış
Veri analitiği nedir?
Veri analitiği, çeşitli algoritma ve uygulamalar aracılığı ile verilerin incelenmesi ve bu incelemeler ışığında içerdiği bilgilere yönelik çıkarımlar yapılması olarak tanımlanabilir. Veri bilimi multidisipliner yani çok disiplinli bir alandır. Veri biliminden doğan ve günümüzün en kritik bilimlerinden biri haline gelen veri analitiği de oldukça geniş kapsamlı bir çalışma alanına sahiptir.
Yaşadığımız yüzyılda ortaya çıkmış “big data” yani büyük verilerin incelenmesinde kullanılan veri analitiği, aslında birçok farklı sektöre yardımcı olan bir alandır. Veri analitiğinden yararlanarak geliştirilen teknolojiler veya kampanyalar, yaşamımıza en çok dokunan gelişmeler ve trendler haline gelmiştir.
Veri analitiğinin tek faydasının ticari işlemlere yönelik olduğunu söylemek yanlış olur. Veri analitiği aynı zamanda bilimsel alanda yapılan teori ve hipotezleri kontrol ederek doğruluğunu ya da yanlışlığını ortaya çıkarmaya da yardımcı olur.
Veri biliminde, verileri analiz etmenin birçok yöntemi bulunur. Veri analitiği ne olduğuyla alakalı bir fikir edindikten sonra veri analitiği türlerine göz atalım.
Veri analitiği süreci birkaç adımdan oluşur:
- İlk adım veri gereksinimlerini veya verilerin nasıl gruplandığını belirlemektir. Veriler yaş, demografik, gelir veya cinsiyete göre ayrılabilir. Veri değerleri sayısal olabilir veya kategoriye göre bölünebilir.
- Veri analitiğindeki ikinci adım, veri toplama sürecidir. Bu, bilgisayarlar, çevrimiçi kaynaklar, kameralar, çevresel kaynaklar gibi çeşitli kaynaklar veya personel aracılığıyla yapılabilir.
- Veriler toplandıktan sonra analiz edilebilecek şekilde organize edilmelidir. Organizasyon, bir elektronik tablo veya istatistiksel veri alabilen başka bir yazılım biçiminde gerçekleşebilir.
- Daha sonra veriler analizden önce temizlenir. Bu, çoğaltma veya hata olmadığından ve eksik olmadığından emin olmak için temizlendiğini ve kontrol edildiğini gösterir. Bu adım, analiz edilecek bir veri analistine geçmeden önce hataların düzeltilmesine yardımcı olur.
[Önemli: Veri analitiği, analistin halen bildiği bilgiler üzerinden sonuçlara varmaya odaklanır.]
Kaynak: SmartData Collective
Büyük veri analitiği
Büyük veri analitiği, farklı kaynaklardan ve terabaytlardan zetabaytlara kadar farklı boyutlarda yapısal, yarı yapısal ve yapısal olmayan verileri içeren çok büyük, çeşitli veri kümelerine karşı gelişmiş analitik tekniklerin kullanılmasıdır.
Büyük veri, boyutu veya türü, geleneksel ilişkisel veritabanlarının düşük gecikme süresiyle verileri yakalama, yönetme ve işleme yeteneğinin ötesinde olan veri kümeleri için uygulanan bir terimdir. Büyük verilerde aşağıdaki özelliklerden biri ya da birkaçı vardır: yüksek hacim, yüksek hız ya da fazla çeşitlilik. Yapay zeka, mobil, sosyal ve Nesnelerin İnterneti (IoT), veri karmaşıklığını yeni formlar ve veri kaynakları ile yönlendiriyor. Örneğin, büyük veri; çoğunluğu gerçek zamanlı ve çok büyük ölçekte oluşturulmuş olarak sensörler, cihazlar, video/ses, ağlar, log dosyaları, işlemsel uygulamalar, web ve sosyal medyadan geliyor.
Büyük verilerin analizi, analistlerin, araştırmacıların ve iş kullanıcılarının daha önce erişilemeyen ya da kullanılamayan verileri kullanarak daha iyi ve daha hızlı kararlar vermelerini sağlıyor. İşletmeler, önceden kullanılmamış veri kaynaklarından bağımsız olarak ya da var olan kurumsal verilerle birlikte yeni içgörüler elde etmek için metin analitiği, makine öğrenimi, tahmine dayalı analitik, veri madenciliği, istatistik ve doğal dil işleme gibi gelişmiş analitik tekniklerini kullanabiliyor.
Veri analitiği türleri
Veri analitiğinde bilginin çözümlenebilmesi ve istenilen sonuca ulaşabilmek için belirli kalıplarda sorular sorulur. Sorulan farklı sorular neticesinde veri analitiği çeşitlenir ve farklı yöntemlere ayrılır. Veri analitiği türlerini 4 başlıkta incelemek mümkündür. Bu türler:
1. Tanımlayıcı Analitik (Descriptive Analytics)
Tanımlayıcı analitik, “ne oldu?” sorusuna yanıt verir. Tanımlayıcı analitik, geçmişe ilişkin değerli öngörüler sağlamak için birden çok veri kaynağından gelen ham verileri bir araya getirir. Bununla birlikte bu bulgular, nedenini açıklamadan bir şeylerin yanlış veya doğru olduğunu gösterir. Bu nedenle veri danışmanları, yüksek düzeyde veriye dayalı şirketlerin yalnızca tanımlayıcı analitikle yetinmelerini önermezler. Tanımlayıcı analitiği diğer veri analitiği türleri ile birleştirmeyi tavsiye ederler.
2. Teşhis Edici Analitik (Diagnostic Analytics)
Teşhis edici analitik, nedeni, olayı veya bir şeyin neden olduğunu anlamak için verileri inceleme sürecidir. Detaya inme, veri keşfi, veri madenciliği ve korelasyonlar gibi teknikler sıklıkla kullanılır. Bu veri türünde cevaplanan asıl soru “neden oldu?” dur.
Teşhis edici analitik, bir şeyin neden oluştuğunu yanıtlamaya yardımcı olur. Keşif ve uyarılar ile sorgulama ve detaya inme aşamalarıyla sonuçlar çıkarır. Bir rapordan daha fazla ayrıntı almak için sorgulama ve detaylandırmalar kullanılır.
Keşif ve uyarılar, olası bir sorunu ortaya çıkmadan önce bildirir. Örneğin şirketinizdeki yeni bir pozisyon için en nitelikli adayı ve ona dair dair bilgileri “keşfetmek” için teşhis edici analitik kullanabilirsiniz.
3. Tahmine Dayalı Analitik (Predictive Analytics)
Tahmine dayalı analitik, “potansiyel gelecekteki sonuçları” tahmin ederek, tanımlayıcı ve tanılama analizlerinizin sonuçlarını karar verme için eyleme geçirilebilir kavramlara dönüştürmeye başladığınız yerdir.
Tahmine dayalı analitik, gelecekteki sonuçları tahmin ederken “Piyasaya yeni bir rakip katılacak mı?” gibi bir sorunun cevabını içeren durumun gerçekleşmesinin ihtimal dahilinde olup olmadığına dair bir yargıda bulunmaz. Bunun yerine “2020’de bir rakibin pazara katılmasıyla ilgili verilere dayanarak satışlarımız %20 düşebilir” gibi bir sonucu almamızı sağlar. Amaç; bir eğilim, korelasyon, nedensellik veya olasılık belirlemektir.
Tahmine dayalı analitik ile bir veri analisti, veri kümesinin nicel analizini kullanır ve genellikle tahmine dayalı modelleme olarak adlandırılan sonuçlar alır. Bu, tahminleri karakterize etmeyi, modelleri doğrulukları açısından incelemeyi amaçlayan daha geniş bir yaklaşımdır. Makine öğrenimi algoritmaları, sınıflandırma modelleri ve regresyon modelleri tahmine dayalı analitik alanının bir parçasıdır.
4. Öngörüye Dayalı Analitik (Prescriptive Analytics)
Öngörüye dayalı analitik, istenilen potansiyel (öngörülen) sonuçlara dayalı olarak önerilen (öngörülen) eylemlerin belirlenmesine yardımcı olarak tahmine dayalı analitik üzerine kuruludur. Öngörüye dayalı analitik kurumların iş hedeflerine ulaşmasına yardımcı olur. Öngörüye dayalı analitik modelleri, eylem ve olay ilişkilerini sürekli olarak analiz etmek ve en uygun çözümü önermek için geri bildirim mekanizmaları aracılığıyla sürekli olarak “öğrenir”. Çözümü simüle ederek, herhangi bir şey uygulanmadan önce sonucun doğru metrik hedeflere ulaşmasını sağlamak için tüm temel performans kriterlerini inceleyebilir.
Öngörüye dayalı analitikte doğru çıkarımlara ulaşılabilmesi için yapay zeka, makine öğrenimi, kurumsal hedefler, kurum tarafından belirlenen sınırlamalar ve diğer birçok faktör yardımcı olarak sıklıkla kullanılır.
“Veri analitiği nedir?” sorusunu yanıtladıktan sonra veri analitiği türlerini de incelemiş olduk. Veri analitiğinin henüz gelişme döneminde olmasına rağmen günümüzde pek çok alanda kullanıldığına daha önce de değinmiştik. Şimdi de veri analitiğinin kullanım alanlarının nereler olduğuna bakalım.
Yazımızın bundan sonraki bölümünü okuyarak veri analitiğinin en çok kullanıldığı alanlara ve kullanım şekillerine dair ayrıntılı bilgi edinebilirsiniz.
Veri analitiği kullanım alanları
Veri analitiğinin sayısız kullanım alanı vardır. Çevrimiçi alışverişten, yüksek teknoloji endüstrilerinden devlete kadar herkes karar verme, bütçeleme, planlama vb. konularda kendilerine yardımcı olmak için veri analitiğini kullanır. Veri analitiği aşağıdakiler gibi çeşitli alanlarda kullanılır:
1. Ulaşım
Veri analitiği, ulaşım sistemlerini ve çevrelerindeki zekayı iyileştirmeye yardımcı olmak için uygulanabilir. Analizin tahmine dayalı yöntemi, trafik veya ağ tıkanıklıkları gibi ulaşım sorunlarının bulunmasına yardımcı olur. Örneğin düğün sezonu veya tatil sezonu boyunca ulaşım tesisleri, tahmin araçları ve teknikleri kullanılarak bir yerden başka bir yere seyahat eden çok sayıda yolcuyu barındıracak şekilde hazırlanır.
2. Lojistik ve Teslimat
Genel operasyonlarını yönetmek için veri analitiğini kullanan birçok lojistik şirketi vardır. Veri analitiği uygulamalarını kullanarak en iyi nakliye rotalarını, yaklaşık teslimat sürelerini belirleyebilir ve ayrıca GPS izleyicileri kullanarak gönderilen malların gerçek zamanlı durumunu takip edebilirsiniz. Veri analitiği çevrimiçi alışverişin daha kolay ve daha çok tercih edilen hale getiren en önemli faktörlerdendi.
3. Web araması veya internet web sonuçları
Yahoo, Bing, Duckduckgo, Google gibi web arama motorları, bir veri aradığınızda size cevap vermek için bir dizi veri kullanır. Arama düğmesine her bastığınızda arama motorları, sınırlı bir zaman dilimi içinde en iyi aranan sonuçları sunmak için veri analizi algoritmalarını kullanır. Herhangi bir bilgi aradığımızda ortaya çıkan veri seti, veri analitiği yoluyla elde edilir.
Aranan veriler bir anahtar kelime olarak kabul edilir ve ilgili tüm bilgiler, kişinin kolayca anlayabileceği şekilde sıralanmış bir şekilde sunulur. Örneğin Amazon’da bir ürün aradığınızda sosyal medya profillerinizde görünmeye devam eder veya sizi o ürüne ikna etmek için ürünün ayrıntılarını size sunar.
4. İmalat
Veri analitiği, imalat sanayilerinin tahmin analizi, regresyon analizi, bütçeleme vb. gibi belirli araçlar aracılığıyla genel çalışmalarını sürdürmelerine yardımcı olur. Birim, talep örneklerinden toplanan ve analiz edilen verilere göre üretilmesi gereken ürün sayısını hesaplayabilir ve benzer şekilde diğer birçok operasyonda da işletme kapasitesini ve karlılığını artırır.
5. Güvenlik
Veri analizleri, kuruluşlara en üst düzeyde güvenlik sağlar, Güvenlik Analitiği, proaktif güvenlik çalışmaları sağlamak için bilgilerin incelenmesine odaklanan çevrimiçi korumayla başa çıkmanın bir yoludur. Hiçbir kurum, özellikle güvenlik tehlikeleri söz konusu olduğunda geleceği öngöremez. Ancak güvenlik olaylarını inceleyebilen güvenlik soruşturması aygıtları sayesinde tehlikeyi tespit etmek veya hakkında tahminler yürütmek mümkün olur.
6. Eğitim
Eğitimde veri analitiği uygulamaları mevcut senaryoda en çok ihtiyaç duyulan bilim alanıdır. Çoğunlukla uyarlanabilir öğrenmede, yeniliklerde, uyarlanabilir içerikte vb. kullanılır. Anlama ve öğrenmeyi kolaylaştırma ve öğrenmenin gerçekleştiği koşullar nedeniyle öğrenciler ve onların özel durumları hakkındaki bilgilerin tahmini, çeşitliliği, araştırılması ve detaylandırılması veri analitiğinin görevleri arasındadır.
7. Sağlık
Sağlık hizmetlerinde veri analitiği uygulamaları, çeşitli hastalıklara yönelik tedavi seçeneklerini veya yanıtlarını keşfetmek için çok büyük bilgi ölçümlerini saniyeler içinde kanalize etmek için kullanılabilir. Bu sadece kayıtlı verilere bağlı olarak kesin düzenlemeler sağlamakla kalmaz, aynı zamanda belirli hastalar için istisnai endişeler için de doğru cevaplar verebilir.
https://blog.mikro.com.tr/veri-analitigi-nedir-veri-analitigi-turleri-nelerdir/
https://www.ibm.com/tr-tr/analytics/hadoop/big-data-analytics
https://www.scnsoft.com/blog/4-types-of-data-analytics