Kategoriler

Veri biliminde, makine öğrenmede, istatistikte ve analitikte uzman bir veri bilimcisi bulmak hiç de kolay değildir ve bu da şaşılacak bir durum da değildir. Şirketler hepsi bir arada uzmanlar bulamayınca, tek yönlü uzmanlara para yağdırıyorlar. Peki hepsi bi arada uzmanlar ve yoksa tek yönlü yetenekler bizi sonuca ulaştırır mı? Veri biliminde günümüz modası, bilim-kurgu ayarında gösterişli karmaşık ve iş piyasasında yapay zekayla makine öğrenme seviliyor destekleniyor. Peki ya analitiğe ne demeli?

İkinci sınıf vatandaş olarak “Analitik”

Eğer birincil olarak analitik yeteneğin varsa (veri madenciliği veya iş zekası), muhtemelen yapay öğrenme ve istatistiklerle bozguna uğrayacak özgüvenin, şirketler, iş pazarı ve medya tarafından ödüllendirilir.

Ancak tecrübesi olmayanın nadiren kavrayabileceği şey, veri biliminin kanatları altında birbirinden tamamen farklı 3 mesleği barındırması ve bu meslek erbabları aynı yöntemleri ve değerleri kullanabilmeleri. Bu aşamadan sonra benzerlikleri son bulur. İyi veri analistleri yapacağınız veri çalışmaları için ön koşuldur. Eğer onlara iyi bakıp takdiri esirgemezseniz sizin için iyi olur. Olumsuz bir durumda istifa etmeleri ihtimali vardır.

Bir analistten istatistiklerini veya makine öğrenme yetilerini geliştirmelerini istemek yerine, ilk önce kendi uzmanlıklarının doruklarına çıkmalarını teşvik etmeyi düşünün. Veri biliminde bir yönelimdeki mükemmellik, sıradan olmaktan iyidir. Gelin, veri bilimleri disiplinlerinin her birinde gerçekten mükemmeli yakalamanın ne demek olduğunu, hangi işte yararlı olduklarının ve her bir işten alnının akıyla çıkmak için hangi kişilik özelliklerinin gerekli olduğunu inceleyelim. Bunu yaparak analistlerin neden değerli olduğunu ve kurum-kuruluşların bunları nasıl kullanması gerektiğini açıklamaya çalışalım.

İstatistikte mükemmeliyetçilik

İstatistikçiler, verilerinizin güvenli bir şekilde sonuca ulaşması konusunda uzmandır. Ayrıca belirsiz bir dünyada kendinizi kandırmaya karşı en iyi korumanızdır. Onlar için, özensiz bir çıkarım yapmak beyninizi bomboş bırakmaktan daha büyük bir günahtır. Öyleyse, heyecana kapılmayıp iyi bir istatistik uzmanını bekleyin. Çünkü uygulanan yöntemlerin çözüme ulaşmada doğru olup olmadığına derinden önem veriyorlar ve eldeki bilgilerden hangi çıkarımların geçerliliği konusunda uğraşırlar.

Sonuç ne peki? Liderlerin risk kontrolünde önemli kararlar almasına yardımcı olabilecek bir bakış açısı. Başka bir deyişle, mantık dışı bir sonuca varma olasılığını en aza indirmek için verileri kullanırlar.

Makine öğrenmede mükemmellik: Performans

“Bahse girerim% 99.99999 doğrulukta testten başarılı bir model oluşturamazsınız” cevabınız “İzle şimdi!” ise, uygulamalı bir makine öğrenim veya yapay zeka mühendisi olabilirsiniz. Kodlama ile çalışan hem prototipleri hem de üretim sistemlerini kurmak  yoğun bir çaba gerektirir ve mühendisiniz olayı inada bindirirse gerekirse birkaç yıl günün her saati defalarca başarısız sonuçları göze alır, çünkü makine öğrenme uzmanları çözümün ders kitaplarında olmadığını gayet iyi bilirler. Bunun yerine, deneme yanılma maratonuyla meşgul olurlar. Her yeni farklı çözüm yolu denemelerinin ne kadar zaman alacağı konusunda iyi bir tahmin yeteneğine sahip olmak büyük bir artıdır ve algoritmalar hakkındaki ayrıntılı bir bilgiden daha değerlidir. Performans, bir metriğin açığa çıkmasından daha fazla anlamlıdır. Bu aynı zamanda üretimde iyi performans gösteren güvenilir, ölçeklenebilir ve bakımı kolay modeller anlamına gelir. Mühendislik alanında mükemmellik bir zorunluluktur.

Sonuç ne peki? İstatistik uzmanının büyük engelleri aşacak kadar zorlu bir görevi makineleştiren ve bir işverenin istediği sağlam performansı sunan bir sistem.

Geniş derine karşı

Önceki iki rolün ortak noktası, her ikisinin de belirli sorunlara yoğun çaba harcanan çözümler sunmasıdır. Ele alınan sorunlar çözülmeye değer değilse, zamanınızı ve paranızı boşa harcamış olursunuz. İş verenler arasında sık sık duyulan şey, “Veri bilimi ekibimiz işe yaramaz!” ve buradaki sorun genellikle, analitik uzmanının olmaması durumunda kaynaklanır. İstatistikçiler ve makine öğrenim mühendisleri dar ve derin çalışırlar bunu tavşan deliğine benzetmek mümkün, bu yüzden sarf ettikleri çabalarından ötürü haklarını teslim etmek gerçekten önemlidir. Uzmanlarınız yanlış sorunlara odaklanırsa, veri bilimine yaptığınız yatırımların geri dönüşü düşük seviyede olacaktır. Dar ve derin çalışan uzmanları iyi şekilde kullanabilmeyi sağlamak için, doğru problemlere odaklanıldığından emin olun ya da doğru sorunu bulmak için kapsalı ve sığ bir yaklaşıma ihtiyaç olduğunun farkına varın.

Analitikte mükemmellik: Hız

En iyi analistler, büyük veri kümelerini hızlı bir şekilde tarayabilen, diğer uzmanların “beyaz tahta” olarak söyleyebileceğinden daha hızlı bir şekilde karşılaştırabilen yıldırım hızındaki kodlayıcılardır. Çok özenilmemiş kodlama stilleri geleneksel yazılım mühendislerini şaşkına çevirirdi ama artık o da geride kaldı. Onlar için hız en büyük erdem ve potansiyel olarak yararlı pırlanta değerinde verileri belirleme kabiliyetiyle yakından takip eder. Bilgiyi görselleştirmedeki ustalık da destek olur; güzel ve etkili grafikler, zihnin daha hızlı bilgi hazmetmesini sağlar ve bu da potansiyele sahip olan görüşlerde zamanla karşılığını verir. Sonuç olarak, işin nabzı yoklanır ve önceden bilinmeyen bilinmeyenler de göz önünde olur. Bu da karar veren organlarına istatistikçiler ve makine öğrenme mühendisleri göndermek için önemli sorumluluklar seçmelerinde yardımcı olan ve onları işe yaramaz tavşan deliklerinin matematiksel yönden etkileyici kazılarından kurtarmaya yardımcı ilham kaynağıdır.

Özensiz saçma anlatım mı yoksa yıldızlı hikaye anlatımı mı?

‘’Ama ama ama!’’ diye itiraz eden istatistikçiler ‘’Onların sözde içgörülerinin çoğu saçmalıktan ibaret!’’. Keşiflerinin sonuçları yalnızca gürültü kirliliği olabilir. Belki de hikaye için daha fazlası vardır.

Analistler bir nevi veri hikaye anlatıcılarıdır. Görevleri, ilginç gerçekleri özetlemek ve ilham vermek için verileri kullanmaktır. Karar mercileri için bazı organizasyonlarda bu gerçekler ilham verici tavsiyelere dönüşür. Ancak daha karmaşık veri işlemlerinde, veriye güdümlü ilham, uygun istatistiksel takip için işaretlenir. İyi analistler, mesleklerinin bir altın kuralına koşulsuz saygı duyarlar, ‘’Verinin ötesindeki sonuçlara varma!’’. Bu amaçla, iyi bir analisti tespit etmenin bir yolu yumuşatılmış, mesafeli dili kullanılır. Örneğin, “sonuçlandırıyoruz” değil, “meraklanmak için esin kaynağı arıyoruz”. Ayrıca, her içgörü için çok sayıda olası yorumu vurgulayarak işverenlerin güvenini sarsarlar. Genellikle analistler gerçeklere sadık olarak sadece “Burada olan bu” derler ve kendilerini çok ciddiye alınmazlarsa, yapabilecekleri en kötü tavır, birisinin kendileri tarafından çalıştırıldığı zamanını boşa harcama düşüncesi olur.

Hipotezleri test etmek için istatistiksel beceriler gerekirken, analistler ilk başta bu hipotezleri ortaya çıkarmak için en iyi kozunuz olur. Mesela “Sadece bir korelasyon, ama bunun neden olabileceğinden şüpheleniyorum” gibi bir şey söyleyebilirler ve sonra neden böyle düşündüklerini açıklarlar. Bu durum, verilerin ötesinde neler olabileceği konusunda güçlü bir sezgiyi gerektirir ve seçenekleri karar merciine ulaştırmak için iletişim becerileri, tipik bir istatistikçinin çabasını garantiye almak için hipotezinin yeterince önemli olduğuna dikkat çeker. Analistler geliştikçe, ilginç olanlara ek olarak neyin önemli olduğuna karar vermekten vazgeçmeye başlarlar ve karar mekanizmalarının aracı olma görevinden uzaklaşmalarını sağlar.

Karar merciilerinin en büyük varisi sayılan üç daldan analistlerdir. Konusundaki uzmanlık, verilerinizdeki ilginç kalıpları daha hızlı belirlemenize yardımcı olmak için uzun bir yol izlediğinden, en iyi analistler, kendi alanlarıyla tanınmak konusunda ciddilerdir. Bunu yapmamak kırmızı alarm demektir. Analistlerin merak duygusu iş için bir anlam geliştirmeye zorlarken, ürünlerinin yanlış alarm kargaşasında karar organlarının daha fazla ilgilenmesi olabilecek hassas yaklaşımlı bir içgörülere geçmesini bekler.
 

Karar organları için analitik

Zaman kaybını önlemek için, analistler anlatmaya hevesli oldukları hikayeyi anlatmalı ve karar merciilerine gitmeden önce uygun olup olmadığını farklı yaklaşımlarla test etmeli. Karar kurulu daha sonra keşifsel veri analitiği ve istatistiksel titizlikle bir filtreleme görevi görmeli. Karar sorumluluğu olan biri analistin bir karar için ümit vaat ettiğini belirlerse, sonrasında daha titiz bir analiz yapmak için zaman harcayan bir istatistikçiye imza attırabilirler. (Bu süreçte, analistlere istatistiklerde daha iyi olmalarını söylemenin, neden önemli bir nokta olduğunu gösterir.)

Makine öğrenme ve yapay zeka için analitik

Makine öğrenimi uzmanları algoritmalar yoluyla bir dizi potansiyel veri girişinde bulunmuş, ayarları değiştirmiş ve doğru çıktılar üretene kadar yinelemeye devam etmiştir. Burada analitik için bir rol yokmuş gibi görünse de, uygulamada çoğu zaman bir işletmeyi bir kerede karıştırıcıya sokuşturmak için çok fazla potansiyel içeriğe sahiptir.(?) Denemek için gelecek vaat eden bir veri grubuna filtre uygulamanın etkileyiciliği uzmanlık alanıdır. Başka bir yol da analitiktir. Yemek yapma benzetmesini kullanacak olursak, makine öğrenim mühendisi mutfakta yemek yapmada harikadır ancak şu anda potansiyel malzemelerle dolu kocaman ve karanlık bir deponun önünde boş boş dururlar. Ya onları ele geçirmeye ve mutfaklarına geri sürüklemeye başlayabilirler, ya da önce depodan bir el feneri ile silahlanmış bir maraton koşucusunu gönderirler. İşte o maraton koşucusu analistlerdir. Hızlı bir şekilde yardımcı olmak yetenekleri, burada olanı görmeniz ve özetlemeniz için işiniz için süper kahraman konumundadır.

Takdir eksikliğinin analistlere olumsuz etkileri

Kusursuz bir analist, makine öğrenim mühendisinin değersiz bir versiyonu değildir. Kodlama stilleri, isteğe bağlı hızlı olabilmek için optimize edilmiştir. Belirsizlikle değil, gerçeklerler ilgilenirler, bu da onların kötü istatistikçi olduklarını göstermez. Analistin öncelikli işi şöyle olur: ’’Bakalım verilerimizde neler var. Bunun ne anlama geldiği hakkında konuşmak benim işim değil, ama karar merciileri soruyu istatistikçilerle değerlendirmesi ilham verebilir.’’

İşe alma ve ödüllendirme yeteneklerini makine öğrenim ve istatistik konularında gereğinden fazla vurgularsanız, analistlerinizi kaybedersiniz. Peki bu durumda hangi sorunların çözülmeye değer olduğunu bulmanıza kim yardımcı olacak? Böyle bir gerçeklikte, işe yaramaz sefil bir proje grubuyla baş başa kalırsınız ve verileriniz dağınık biçimde kullanılmaz hale gelir.

Şüpheye düştüğünüz durumda, diğer rollerden önce analistleri işe alın. Onları takdir edin ve ödüllendirin. Kariyer tercihlerinin doruklarına çıkmalarını teşvik edin. Bu hikayede geçen karakterlerin kullanımı, her işte lazım olacak karar merciileri ve analistlerdir. Diğerlerine iş kollarını, yalnızca tam olarak neye ihtiyaç duyduğunuzu kavradığınız zaman kullanabileceksiniz. Analitikle başlayın, yeni yeteceğinizle gurur duyun ve gözlerinizi yeni zenginliklere ve gelecek güzel bilgilere doğru açın. Veri güdümlü ilham, güçlü bir şeydir.


Çeviri: Hüseyin Onur Teksan / VOYD Üyesi

Kaynak: HBR