Video: Как обезопасить себя с помощью картона (Kasım 2024)
İşletmeler, altyapılarının ne kadar verimli çalıştığı veya topladıkları tüm Büyük Verileri ne kadar yükseğe koyabilecekleri konusunda hiçbir puan almazlar. Önemli olan, verilerin ürettiği analitik ve zekanın kalitesidir.
Son birkaç yılda, Hadoop veri alımı, işlemesi ve dönüştürmesi ile en fazla eşanlamlı olan kelimedir. Dağıtılmış veri depolama ve işlemeye yönelik bu açık kaynaklı çerçeve, kendi kurumsal alanını genişletti ve tüm büyük bulut platformlarına girmesini sağladı. Hadoop, konuşmaya değer tek Büyük Veri teknolojisinden uzaktır, ancak başkalarının üzerine kurulu olduğu hale gelmiştir.
İşletmeler için sorun, Hadoop alanının dağıtım ve takım seçenekleriyle doludur ve Gartner Araştırma Direktörü Nick Heudecker’in de dediği gibi, çoğu aynı görünüyor. Araştırmaları, Büyük Veri ve NoSQL alanlarını içeren bilgi yönetimini kapsayan Heudecker, genel veri işleme seçeneklerine bakarsanız, pek çok satıcının çok benzer özellikler sunduğunu söyledi.
Piyasayı Parçalamak
Üç ana saf oyun Hadoop start-up'ı var: Cloudera, Hortonworks ve MapR- ve hepsi 2015 yılında istikrarlı bir şekilde büyüdü. Gartner'e göre, her biri yaklaşık 700 müşteriye sahip, dünya pazarını araştırarak yüzde 10 veriyor Dünya çapında 2.100-2.400 Hadoop müşterisi. Üçü de Hadoop dağıtımının hem ücretsiz bir hem de kurumsal bir seviyesini sunar ve her biri Apache Software Foundation (ASF) başlığı altındaki projelere önemli ölçüde açık kaynak katkılar sağlar.
Heudecker, "Verilerimiz Hadoop kullanımının yüzde 44'ünün ücretsiz olduğunu gösteriyor" dedi. “Net bir lider var mı? Sanmıyorum. Hepsi pazar payını kapıyor çünkü çok yeni bir alan.”
Son birkaç ayda, bu üçlü arasındaki rekabetin çoğu, veri analitiği yetenekleri ve gerçek zamanlı veri akışlarından makine öğrenimine kadar kullanım durumları olan açık kaynaklı bir Büyük Veri İşleme motoru olan Apache Spark'ı entegre etmenin yaratıcı yolları konusunda rekabete düşmüştür. . MapR kısa bir süre önce Hadoop, Spark tabanlı akış işleme ve analitiği birleştiren "bütünleşik veri platformunun" bir parçası olarak MapR Streams'ı duyurdu. Hortonworks, Hortonworks Veri Platformu'na (HDP) bellek içi Spark analitiği ile bir güncelleme yaptı ve Cloudera, One Platform Girişimi ile birlikte Spark eğitim sınıfları sunarken çeşitli açık kaynaklı Spark entegrasyonları sunuyor.
Heudecker, “Bilgi yönetimi ve bilgi altyapısı alanlarında çok şey var ve hepsi Hadoop değil” dedi. "Spark'ın gelişimi hala erken aşamada olmasına rağmen, Spark'ın hızının ve bellek merkezli veri işleme modelinin ardında muazzam bir momentum var. Spark, veri işlemede bugün SQL'de olduğu gibi bir başka dil öğrenimi olacak ve kesinlikle bazı ayakları olduğuna dair işaretler gösteriyor Gittikçe daha fazla şirket yatırım yapıyor. "
Heudecker, bulut oyuncularının Big Data'daki önemini de vurguladı; Hadoop ve diğer Büyük Veri teknolojilerini mevcut Hizmet Olarak Altyapı (IaaS) tekliflerine entegre eden teknoloji devleri.
Amazon Web Servisleri (AWS), bulut tabanlı Hadoop düzenlemesi için Amazon Elastik MapReduce (EMR) servisini kullanır. Microsoft, Azure bulut platformu içinde, SQL tabanlı Azure Data Lake ve Azure Data Analytics ile birlikte Apache Hadoop, Spark, HBase ve Storm yönetimi için HDInsight hizmetinde Hortonworks ile ortak bir dizi Büyük Veri hizmeti sunmaktadır. IBM, hem Hadoop için hem de üzerinde çalışacak bir analitik paketi olan IBM BigInsights ile birlikte, Bluemix bulutunda yönetilen Hadoop ve Apache Spark-hizmet olarak Apache'nin sunduğu şirket içi IBM Açık Platformu'nu sunmaktadır. Liste devam eder ve işletmeler bulutta daha uygun kullanım durumlarını bulur.
Heudecker, “Sadece AWS'nin yaklaşık 5.000 müşterisi olduğunu tahmin ediyoruz, bu yüzden saf oyunların müşteri tabanının iki katından fazla” dedi. "Buluta geçmenin avantajlarından biri ekosisteme sahip olmanızdır. IaaS tekliflerinden herhangi birinde saf oyun Hadoop dağıtımlarını elde edebilirsiniz. MapR, IBM dışında, düşündüğünüz tüm bulutlarda mevcuttur; aynı Cloudera ve Hortonworks için. Bir tedarikçiyle diğeri arasında seçim yaparken bulut kullanılabilirliğinin çok büyük bir etken haline gelmediğini gördük. "
Kurumsal Veri Stratejisi Seçme
Hem küçük hem de orta ölçekli işletmeler (KOBİ'ler) ve büyümekte olan işletme işletmeleri için veri işleme ve analitik çözümlerine yatırım yaparken, Heudecker karar verme faktörünün hangi platformun en yüksek düzeyde hizmet sunabileceğini belirlediğini belirtti. Gartner'a göre, işletmeler için en büyük zorluk, beceri açığı - yani kurulduktan ve yerleştirildikten sonra platformu kimin yönettiğini bulmak.
“Eğer şirketler bir veri platformu ortağı arıyorlarsa, onlara veri alımı konusunda kim yardım edecek? Analitik uygulama geliştirmelerinde onlara kim yardım edecek?” Üç oyunlu Hadoop’a gelince, değerlendirme kriterleri buralarda olma eğilimindedir. yönetim araçlarının ve konsollarının vadesi, veri yönetişim araçları ve performans. "
Bir Hadoop platformu seçmenin diğer ilginç yanı sadakat eksikliğidir. Şirketler, veri işleme bileşenlerinin hala uygun olup olmadığını görmek için 6-12 ayda bir, alanın ne kadar hızlı değiştiğine ve büyük oyuncuların kendilerini ne kadar az farklılaştırdıklarına bakmak için Hadoop platformlarını sık sık yeniden değerlendiriyorlar. Heudecker, veri merkezlerinde veya bulutlarında çalışan birden fazla Hadoop dağıtımına sahip olduklarından bahsettiği şirketlerin yüzde 20'sini ya farklı ekiplerin kendi tercih platformlarını seçmelerine izin vererek ya da sadece bir Hadoop dağıtımına takılmamak için bilinçli olarak çeşitlendirdiklerini söyledi.
Bu çeşitlendirilmiş platform portföyü, Gartner Araştırma Başkan Yardımcısı ve Saygın Analist’in dijital stratejiye odaklanan Frank Buytendijk’in “bilgiyi bir varlık olarak” dediği şeyi beslemektedir. Buytendijk, sermaye, emek, malzeme ve fiziksel ya da sanal imkanlar olmadan bir işletmeyi yönetemeyeceğiniz gibi, Buytendijk bilgi olmadan iş yapamayacağınızı söyledi.
“İşe üç akış açısından bakardık: birincil akış mallardı, ikincil akış paraydı ve üçüncül akış malların ve paranın aynı hizada olmasını sağlamak için bilgi idi. Şimdi çoğu işletmede tersi yönde Birincil akış, tanımlama ve konfigürasyondan içerik pazarlamasına vb. Olan bilgilerdir. Buna Büyük Veri diyor olsanız da önemli değil. "
"Büyük Veri" Güncel Değil
Buytendjik, Büyük Veri'yi işletmeler için ayrı bir teknoloji olarak görmediğini, ancak genel dijital stratejinizdeki tek bir tema veya zihniyet olarak gördüğünü söyledi.
Buytendjik, "Büyük Veri stratejisine sahip olduğuna inanmıyorum." Dedi. “Artık dijital bileşenleri olmayan bir iş stratejisi yok, bu yüzden her türlü teknolojinin kritik yetenekler sunduğu dijital bir stratejiye sahip olduğuma inanıyorum. Buna mobil, sosyal, bulut, IoT, akıllı makineler ve Büyük Veri dahil” dedi.
Heudecker "Büyük Veri" hakkında konuşmaya başlayacağımıza inanıyor, çünkü artık sadece bir veri. İş böyle yapılır. Büyük hacimler ve yüksek veri hızı artık göz korkutucu değil.
Heudecker, "Büyük Veri, bilgi ve analitik tarafından bir kez daha vurgulanıyor, " dedi. “Büyük Veri kategorisi açıkçası farklı değil. Her zaman Büyük Veri pazarının boyutuna soruluyor, ancak bu ne anlama geliyor? Büyük Veri gerçekten bir pazar değil, bir kavram. Bir iş için, Büyük Veri'yi düşünerek Daha önce yaptığınızdan çok daha farklı olan eşsiz ve özel bir şey, bir hataydı. Bu noktada, veriler normaldir. ”