Consigliato, 2024

Scelta dell'editore

IBM si rivolge agli scienziati dei dati con una nuova piattaforma di sviluppo basata su Apache Spark

Обработка больших данных при помощи Apache Spark ч1 | Технострим

Обработка больших данных при помощи Apache Spark ч1 | Технострим
Anonim

Il senso dei dati può coinvolgere un'ampia varietà di strumenti e IBM spera di rendere la vita dei ricercatori più facile mettendoli tutti in un unico luogo.

La società ha rilasciato martedì quello che chiama Data Science Experience, un nuovo ambiente di sviluppo nel cloud per analisi in tempo reale ad alte prestazioni.

Basato su framework di elaborazione dati Apache Spark, Data Science L'esperienza è progettata per accelerare e semplificare il processo di integrazione dei dati e dell'apprendimento automatico nelle applicazioni cloud. Inclusi nella nuova offerta ci sono strumenti come RStudio e Jupyter Notebooks.

[Ulteriori letture: I migliori servizi di streaming TV]

Gli sviluppatori possono usare Python, R e Scala; possono anche visualizzare notebook di esempio e guardare le esercitazioni mentre codificano. Ulteriori strumenti si concentrano sulla preparazione e pulizia dei dati, visualizzazione, analisi prescrittiva, connessioni dati e lavori di pianificazione. Gli utenti possono collaborare con gli altri e condividere il loro codice.

Data Science Experience è ora disponibile sulla piattaforma IBM Cloud Bluemix.

"L'informatica è diventata mainstream con l'introduzione del PC", ha dichiarato Bob Picciano, vicepresidente senior di IBM Analytics. "Con la scienza dei dati, il roadblock principale sta avendo accesso a grandi set di dati e ha la capacità di lavorare con così tanti dati."

IBM ha investito $ 300 milioni in Apache Spark, incluso il contributo a SparkR, SparkSQL, e Apache SparkML.

Data Science Experience combina il meglio di tre mondi, ha detto Mike Gualtieri, un analista principale di Forrester.

Primo, "è basato sul cloud, quindi sarà facilmente accessibile a tutti gli altri, "Tra cui esperti di dati, scienziati dei dati dei cittadini e sviluppatori di applicazioni, Gualtieri ha detto.

In secondo luogo, la piattaforma offre molteplici strumenti open source, incluso il quaderno di dati scientifici Jupyter, ha aggiunto.

Infine," il potere di Apache Spark è anche dietro a questi ", ha detto Gualtieri, consentendo agli utenti di analizzare i dati con strumenti di apprendimento automatico a velocità di memoria nel cloud.

Le aziende stanno sempre più riconoscendo il potenziale dell'intelligenza artificiale nei software aziendali.

" Aggiunta di intelligenza alle applicazioni, che tu lo chiami AI, apprendimento automatico o calcolo cognitivo, è ora la priorità per le imprese ", ha detto Gualtieri.

Top