Ev Ai veritabanları: bunlar nelerdir ve işiniz neden önemlidir?

Ai veritabanları: bunlar nelerdir ve işiniz neden önemlidir?

İçindekiler:

Anonim

Veri ve iş zekası (BI) aynı madalyonun iki yüzüdür. Depolama, işleme ve analiz alanındaki gelişmeler, büyük veri setleriyle çalışmak ve içgörü elde etmek için veri tabanı uzmanı veya veri bilimcisi olmanıza gerek olmadığı noktaya verileri demokratikleştirmiştir. Hala bir öğrenme eğrisi var, ancak self servis BI ve veri görselleştirme araçları, işletmelerin topladıkları tüm verileri harekete geçirilebilir analitiklerden yararlanma yöntemini yeniden belirliyor. Bununla birlikte, ileri düzey analitiğe sahip bir BI veya veritabanı şirketi ile eğitim makinesi öğrenmesi (ML) ve derin öğrenme modelleri için amaçlanan bir yapay zeka (AI) veritabanı arasında bir fark vardır.

ML algoritmaları bugünün yazılımlarının çoğunun dokusuna dokunuyor. Tüketici deneyimleri sanal asistanlarla AI ile birleşiyor ve iş yazılımında, şirketin tüm müşteri ilişkileri yönetimi (CRM) portföyünün altında akıllı bir katman olarak davranan Salesforce Einstein gibi örnekler var. Google ve Microsoft da dahil olmak üzere teknoloji devleri, yalnızca araştırmayla değil, aynı zamanda teknolojilerinin AI ile nasıl çalıştığını yeniden yazarak da akıllı geleceğimizi daha da zorluyor.

Eğitim makinesi ve derin öğrenme modelleriyle ilgili zorluklardan biri, örneğin bir görüntü ağı veya doğal dil işleme (NLP) gibi alanlarda karmaşık örüntü tanıma gibi bir sinir ağını eğitmek için ihtiyaç duyduğunuz gerçek veri hacmi ve işleme gücüdür. Bu nedenle, AI öğrenme ve eğitim sürecini işletmeler için optimize etmenin bir yolu olarak AI veritabanları pazarda artmaya başlıyor. Kendi AI AI veritabanını kuran GPU hızlandırmalı ilişkisel veritabanı sağlayıcısı Kinetica ve AI veritabanının ne olduğunu ve geleneksel veritabanlarına kıyasla nasıl çalıştığını PCMag'in yerleşik BI ve veritabanı uzmanı Pam Baker ile konuştuk. Daha da önemlisi, ortaya çıkan bu teknolojinin gerçek işletme değerine sahip olup olmadığını belirlemek için hype ve pazarlama konuşmasını sıralamada yardım etmelerini istedik.

AI Veritabanları Nedir?

AI uzayının hızla değişen doğası, terminoloji kurulmasını zorlaştırabilir. ML, derin öğrenme ve AI gibi terimleri genellikle daha büyük AI şemsiyesi altında hala gelişen teknikler olduğunda birbirlerinin yerine kullanılanlar gibi duyarsınız. Bunun gibi Baker, AI veritabanının kiminle konuştuğuna bağlı olarak ne olduğuna dair iki farklı tanım olduğunu söyledi: biri pratik, diğeri gökyüzündeki daha pratik.

“Endüstride bir AI veri tabanının tamamen doğal bir dil sorgusu dışında çalışan bir veri tabanı olacağı konusunda fikir birliğine varıldı. Kullanıcı arayüzü, bu terimleri bulmak için arama terimlerine ve temel ifadelere güvenmek zorunda kalmayacaktı. ihtiyacınız olan bilgileri kullanıcının NLP ile veri setlerini toplamasına izin vererek, "dedi. “IBM Watson'ın sisteme doğal dil sorguları oluşturabileceği konusunda çok sınırlı bir iddiada bulunabilirsiniz, ancak verilere zaten bağlı olmanız ve verileri kendiniz seçmeniz gerekir. Bu nedenle, şu anda bu tanım çok geniş.”

Daha pratik tanım ve bu açıklayıcının konusu, temel olarak ML model eğitimini hızlandırmak için amaca yönelik bir veritabanı kullanıyor. Bazı teknoloji şirketleri, yeni donanım ürünlerindeki ağır işlem yükünü hafifletmek için özel AI cipsleri geliştirmeye başlamıştır, çünkü tedarikçiler önemli bilgi işlem gücü gerektiren daha fazla AI tabanlı özellik sunar. Veri tarafında, bir AI veritabanı kullanmak, zaman kazanmak ve kaynakları optimize etmek için eğitim ML ve derin öğrenme modelleriyle ilişkili ses düzeyini, hızı ve karmaşık veri yönetişimi ve yönetim zorluklarını daha iyi şekilde azaltmanıza yardımcı olabilir.

Görüntü kredisi: Futurism.com at Todd Jaquith. Tüm infografikleri genişletmek için tıklayın

Baker, “Şu anda birkaç farklı taktikle ML eğitimini hızlandırmak için birçok çaba var” dedi. “Biri, kodlamayı yapan AI araştırmacılarından altyapıyı ayırmak, böylece otomatik fonksiyonlar altyapıyı ele almak ve ML modelini eğitmek. Bu nedenle, üç ay gibi bir şey harcamak yerine, 30 gün veya 30 dakikaya bakıyor olabilirsiniz. "

Kinetica, bu fikri ML ve derin öğrenme modellemesi için optimize edilmiş entegre bir veritabanı platformuna dönüştürür. AI veritabanı, veri depolama, gelişmiş analitik ve görselleştirmeleri bellek içi bir veritabanında birleştirir. Kinetica'nın Gelişmiş Teknoloji Grubu Başkan Yardımcısı ve Baş Yazılım Mühendisi Mate Radalj, bir AI veritabanının aynı anda milisaniye içindeki hızlı hareket eden karmaşık verileri alabilmesi, araştırması, analiz etmesi ve görselleştirmesi gerektiğini açıkladı. Amaç, maliyetleri azaltmak, yeni gelirler elde etmek ve işletmelerin daha verimli, veri odaklı kararlar alabilmesi için ML modellerini entegre etmektir.

Radalj, "Bir AI veritabanı, genel bir veritabanının alt kümesidir, " dedi. “Şu anda, AI veritabanları çok popüler. Ancak birçok çözüm dağıtılmış bileşenleri kullanıyor. Spark, MapReduce ve HDFS, bellekte kullanmak yerine her zaman ileri geri dönüyor. Veritabanımız gibi faktörlerin birleştiğine sahip değiller. Tek bir platform üzerinde sıkı şekilde entegre edilmiş CPU ve GPU'lar ile sıfırdan inşa edilmiştir, bizim için en üst düzeyde yarar, aynı platforma entegre edilmiş hızlı bir geri dönüş ve analitik ile daha hızlı tedarik ve model tabanlı eğitimin daha düşük donanım alanıdır. "

AI Veritabanı Nasıl Çalışır?

Pratikte AI veritabanlarının birkaç örneği vardır. Microsoft Batch AI, derin öğrenme ve Microsoft Azure GPU'larda çalışan ML modellerinin eğitimi için bulut tabanlı bir altyapı sunar. Şirket ayrıca, işletmelerin ve veri bilim adamlarının dağıtık bir mimaride verileri işlemesini ve analiz etmesini kolaylaştırmak için Azure Data Lake ürününe de sahiptir.

Başka bir örnek, Google’ın, ML modellerinin eğitim şeklini temelden yeniden düzenleyen AutoML yaklaşımıdır. Google AutoML, belirli veri kümelerine dayanan yeni sinir ağı mimarileri oluşturmak için ML model tasarımını otomatikleştirir ve ardından daha iyi sistemleri kodlamak için bu binlerce kez test eder ve yineler. Aslında, Google’ın AI'si artık insan araştırmacılardan daha iyi modeller yaratabiliyor.

Baker, "Google AutoML’ye göz atın: ML, ML kodunu yazıyor, böylece insanlara ihtiyacınız bile yok, " “Bu size, tedarikçilerin yaptıklarında ne gibi aşırı bir fark olduğu konusunda bir fikir veriyor. Bazıları, gelişmiş analizleri ML olarak bırakmaya çalışıyor - ve değil. Ve diğerleri de ML’yi en fazla ötesinde ileri düzeyde yapıyor. işletmeler şu anda anlayabilirler. ”

Sonra Kinetica var. Risk sermayesinde (VC) fon sağlamada 63 milyon ABD doları değer kazanan San Francisco merkezli başlangıç, hızlı veri alımı ve analitik için optimize edilmiş yüksek performanslı bir SQL veritabanı sunuyor. Kinetica, Radalj’in kitlesel olarak paralel işlem (MPP) dağıtılmış veritabanı ve her düğümün birlikte hafıza içi veri, CPU ve GPU’ya sahip olduğu hesaplama platformu olarak tanımladığı şeydir.

Bir AI veritabanını geleneksel bir veritabanından farklı kılan Radalj, üç ana unsurdan oluştuğunu söyledi:

  • Hızlandırılmış veri alımı,
  • Bellek içi verilerin birlikte bulunması (veritabanı düğümleri arasında paralel işleme) ve
  • Veri bilimcileri, yazılım mühendisleri ve veritabanı yöneticileri için modelleri daha hızlı yinelemek ve test etmek ve sonuçları doğrudan analitiklere uygulamak için ortak bir platform.

Radalj, bunu okuyan tüm veritabanı dışı ve AI model eğitim uzmanları için, bu üç temel öğenin her birini bozdu ve AI veritabanının somut işletme değerine nasıl bağlandığını açıkladı. Veri kullanılabilirliği ve veri alımı çok önemlidir, çünkü gerçek zamanlı akış verilerini işleme yeteneği işletmelerin AI odaklı görüşlerde hızlı harekete geçmelerini sağlar.

Radalj, "Her beş dakikada bir, mağazada satış oranlarını takip etmek isteyen perakende bir müşterimiz var." Dedi. “Son birkaç saatlik tarihsel verilere dayanarak, envanteri yenilemeleri ve bu işlemi optimize etmeleri gerekip gerekmediğini tahmin etmek için AI kullanmak istedik. Ancak, bu makine odaklı envanter yenileme işleminin saniyede 600-1200 sorguyu desteklemesini istiyoruz. 'bir SQL veritabanı ve bir AI veritabanı olduğu için bu oranda veri alabiliriz. Bu iş görevini yerine getirmemiz, daha fazla yatırım getirisi sağlayan bir uygulama ile sonuçlandı. "

Baker, ML'nin çok miktarda veri gerektirdiği için hızlı bir şekilde yutulması AI veri tabanı için çok önemli olacağını kabul etti. İkinci faktör, “hafıza içi verilerin birlikte yerleşimi” kavramı, biraz daha açıklama gerektirir. Bir bellek içi veritabanı, verileri ayrı bir disk depolama yerine ana bellekte depolar. Bunu, özellikle analitik ve BI veritabanlarında sorguları daha hızlı işlemek için yapar. Ortak yerleşim yeri olarak Radalj, Kinetica'nın CPU ve GPU hesaplama düğümlerini depolama düğümlerine karşı ayırmadığını açıkladı.

Sonuç olarak, AI veritabanı, insan beyninin çoklu uyaranları işleme yeteneğini taklit eden ve aynı zamanda ölçeklenebilir bir veritabanı altyapısına dağıtılmış halde kalan paralel işlemeyi destekler. Bu, Radalj'in "veri gönderimi" olarak adlandırdığı veya farklı veritabanı bileşenleri arasında ileri ve geri veri gönderme ihtiyacından kaynaklanan daha büyük donanım ayakizini önler.

Radalj, "Bazı çözümler, çeşitli bileşenlerde çalışmayı zamanlamak için IBM Symphony gibi bir orkestratör kullanıyor, buna karşın Kinetica, veri gönderimini en aza indirgemek için gelişmiş optimizasyonla birlikte konumlandırılmış kaynaklara karşı işlev gönderimini vurguluyor" dedi. “Bu eş-yerellik, özellikle büyük veri kümelerinde yüksek eş zamanlı sorgulama için üstün performans ve verim elde etmeyi sağlıyor.”

Asıl veri tabanı donanımı açısından, Kinetica, genişleyen bir AI GPU'lar dizisine sahip olan ve Intel ile fırsatları inceleyen Nvidia ile ortaklık kuruyor. Radalj ayrıca, şirketin yükselen AI donanımlarına ve Google'ın Tensor İşleme Birimleri (TPU'lar) gibi bulut tabanlı altyapısına göz kulak olduğunu söyledi.

Son olarak, birleşik bir model eğitim süreci fikri var. Bir AI veritabanı yalnızca hızlı alım ve işlemden yararlananların bir şirketin ML'si ve derin öğrenme çabaları için daha büyük, iş odaklı hedefler sunması durumunda etkilidir. Radalj, Kinetica'nın AI veritabanına, veri bilimine dayalı model barındırma işlemini gerçekleştiren bir "model boru hattı platformu" olarak atıfta bulunur.

Tüm bunlar, daha doğru ML modelleri geliştirmek için daha hızlı test etme ve yineleme yapmayı sağlar. Baker, bu noktada, birleşik bir şekilde işbirliğinin, bir ML veya derin öğrenme modelini eğitmek için çalışan tüm mühendis ve araştırmacıların, eğitim sürecindeki tüm adımların sürekli olarak yeniden icat edilmesinin aksine, neyin işe yaradığını birleştirerek daha hızlı bir yineleme yapmasına yardımcı olabileceğini söyledi. Radalj, hedefin daha hızlı parti alımının, akışının ve sorgulamanın, hemen BI'ye uygulanabilecek model sonuçları ürettiği bir iş akışı yaratmak olduğunu söyledi.

Radalj, "Veri bilimcileri, yazılım mühendisleri ve veritabanı yöneticileri, çalışmaların veri biliminin kendisi, yazılım programı yazma ve SQL veri modelleri ve sorguları hakkında net bir şekilde tanımlanabileceği tek bir platforma sahipler" dedi. “İnsanlar ortak bir platform olduğunda bu çeşitli alanlarda daha temiz bir şekilde çalışıyorlar. ML çalıştırmaktan ve derin öğrenmekten daha sık amaç, analizin sonuçlarıyla birlikte - ortak verimlilik ve değişkenler - sonuçlarını kullanmak istiyorsunuz. ve çıktıları puanlama gibi şeyler için veya faydalı bir şeyi tahmin etmek için kullanın. "

Hype veya Reality?

AI veritabanının en düşük değeri, Kinetica'nın tanımladığı şekilde, hesaplama ve veritabanı kaynaklarını optimize etmektir. Bu da, daha iyi ML ve derin öğrenme modelleri yaratmanıza, onları daha hızlı ve daha verimli bir şekilde eğitmenize ve bu AI'nın işinize nasıl uygulanacağına dair bir yol izlemenizi sağlar.

Radalj filo yönetimi veya kamyon şirketi örneğini verdi. Bu örnekte, bir AI veritabanı, bir araç filosundan büyük miktarda gerçek zamanlı bilgi akışını işleyebilir. Daha sonra, bu coğrafi verileri modelleyerek ve onu analitikle birleştirerek, veritabanı kamyonları dinamik olarak yeniden yönlendirebilir ve rotaları optimize edebilir.

“Hızlı bir şekilde tedarik etmek, prototip yapmak ve test etmek daha kolay.” Modelleme ”kelimesi AI'da atılıyor, ancak hepsi farklı yaklaşımlarla (daha fazla veri, daha iyi - tekrar tekrar çalıştırma, test etme, karşılaştırma ve Radalj, "En iyi modellerle geliyor" dedi. “Sinir ağlarına hayat verildi, çünkü her zamankinden daha fazla veri var. Ve biz bununla hesaplama yapmayı öğreniyoruz.”

Sonuçta, Kinetica'nın yerleşik veritabanı ve model boru hattı platformu, kime sorduğunuza bağlı olarak birçok farklı anlama gelebilecek bir alandaki tek yaklaşımdır. Baker, alıcı için hala gelişen ve deneysel bir pazardaki zorluğun, bir AI veritabanı satıcısının ne attığını tam olarak bulmak olduğunu söyledi.

Baker, "Bir iş kavramı olarak, derin öğrenme, ML ve bunların hepsi sağlam bir kavramdır. Çalıştığımız şey, henüz çözmemiş olsak bile çözülebilir olan teknik konulardır." Dedi. “Bu, olgun bir alan olduğunu söylemek değildir, çünkü kesinlikle öyle değildir.“ Alıcıya dikkat edin ”derim, çünkü ML olarak ayarlanan veya olamayacak bir şey. Bahçe çeşitliliği gelişmiş analitik olabilir.”

Şu anda AI veritabanlarının tümü yutturmaca mı yoksa işlerin gittiği yer için önemli bir eğilimi mi gösterdiklerine gelince, Baker ikisinin de biraz olduğunu söyledi. Big Data, bir pazarlama terimi olarak, şimdi lehine olmadığını söyledi. Baker, şimdi gelişmiş, veriye dayalı analitik ve gerçek ML ve derin öğrenme algoritmaları arasında bir miktar pazar uyuşmazlığı olduğunu söyledi. Ne olursa olsun, ML modellemesi için bir veritabanından mı yoksa pop kültürü tarafından hayal edilen kişisel farkındalık AI'larından mı bahsediyorsanız, her şey verilerle başlar ve biter.

Baker, "Zaman sona erene kadar iş dünyasında kullanılacak; iş yapmanın tam merkezi burası" dedi. “Bilim kurgu açısından konuşurken, AI kendi kendini gerçekleştiren bir zekadır. İşte o zaman dünyayı ele geçiren tekillikler ve robotlar hakkında konuşmaya başladığınızda. Bunun olup olmadığını, bilmiyorum. Ayrılacağım. Bu Stephen Hawking'e. "

Ai veritabanları: bunlar nelerdir ve işiniz neden önemlidir?