IBM startet den Apache Spark Cloud Service

IBM hat seine Unterstützung für Apache Spark klar zurück im Juni auf dem Spark Summit, als es angekündigt, eine 300 Millionen Dollar Engagement für Spark – einschließlich der Widmung von 3500 Forscher und die Einrichtung eines Spark Technology Center in San Francisco. Auf einer eigenen IBM Insight-Veranstaltung in Las Vegas gibt das Unternehmen heute die Verfügbarkeit von IBM Analytics auf Apache Spark bekannt, einem Spark-as-a-Service-Angebot als Teil der IBM Bluemix Cloud.

Mit dem Angebot von Spark in der Bluemix-Umgebung wird IBM es mit seinen anderen Cloud-Daten- und Analytics-Diensten einbinden, darunter das Cloudant NoSQL-Angebot und das dashDB-Cloud-Data-Warehouse-Service. Und weil Bluemix im Wesentlichen eine Anwendungsentwicklungswolke ist, fühlt IBM, dass es in einer guten Position ist, die Punkte von Code zu Datenbank, zu Big Data, zu Analytics zu verbinden. Und in diesem Sinne, IBM Analytics auf Apache Spark wird die Arbeit mit Spark mit Python-basierten Code-Notebooks unterstützen – ein Feature auch auf der Databricks Cloud Spark-Plattform unterstützt.

Und Daten-Feeds: Zusammen mit dem Spark-Angebot enthüllt IBM, was es seine Insight Cloud Services nennt, die “externe Daten über Personen, Ereignisse, Geodaten und Unternehmen aus Quellen wie Twitter und The Weather Company” enthält Pressemitteilung. Es ist klar, dass IBM versucht, eine komplette Analytics-Workbench zur Verfügung zu stellen, mit der Fähigkeit, eigene Daten eines Kunden mit externen Daten-Feeds zu bereichern und Analytics über diese bereicherten Daten mit Spark durchzuführen.

(Nicht) verlieren seine Religion, als ich mit Derek Schoettle, General Manager von IBM Cloud Data Services (CDS) und CEO von Cloudant sprach, bevor dieses Unternehmen von IBM erworben wurde, gab er einige Farbe und Kontext rund um IBM Spark Enthusiasmus. Schoettle erklärte, dass Spark nicht nur eine parallele Big Data-Verarbeitungsplattform sei, sondern auch ein Gerät, das Maschinenlernen, SQL-Zugriff, Graph-Engine-Analyse und Streaming-Datenanalyse (wenn auch über Micro-Batch-Verarbeitung) Umgebung für die Arbeit mit Daten.

Diese Religion ist so stark, dass laut Schoettle IBM rund 15 eigene Handels- und Analytikprodukte auf Spark vervielfältigt hat. Er nahm sein DataWorks-Produkt für ETL / Data Prep auf und reduzierte seine Quellcodezeilenanzahl, sagte er, von 40 Millionen auf 5 Millionen.

Ist IBM Spark IBM Datenplattform Leim? Nein, in der Branche hat niemand die Daten-und Analytik-Oberfläche von IBM. Denken Sie daran, dies ist das Unternehmen, das unter seinem Dach hat DB2, Watson, Netezza, Cognos, TM1, SPSS, DataStage, Informix, Cloudant und die BigInsights Hadoop Distribution. Wenn IBM alle diese Plattformen um Apache Spark föderieren und es in der Cloud tun könnte, wäre dies eine große, durchgängige, konkrete Demonstration von Sparks Macht und Lebensfähigkeit als moderner Datenanalytik-Lifeblood.

IBM hat seine Arbeit ausgeschnitten, obwohl, wie Abziehen solch eine kehrende Neuausrichtung von Jahrzehnten von zu Hause gewachsen und erworben Technologie wird alles andere als sicher oder einfach. Aber wenn IBM kann Traktion in dieser Kampagne zu bekommen, werden sie würdig von jedermanns Aufmerksamkeit.

LinkedIn stellt seine neue Blogging-Plattform vor

Social Data LinkedIn stellt seine neue Blogging-Plattform, Big Data Analytics, ist das Alter von Big OLAP, Big Data Analytics, DataRobot zielt auf die Automatisierung der Low-hanging Obst der Datenwissenschaft, Big Data Analytics, MapR Gründer John Schroeder Schritte, COO zu ersetzen

Ist dies das Alter von Big OLAP?

DataRobot zielt auf die Automatisierung von tiefgreifenden Datenwissenschaften ab

MapR-Gründer John Schroeder geht nach unten, COO zu ersetzen