[vc_row][vc_column][vc_column_text]
Iws Consulting come partner di Knime lo scorso 3 dicembre ha partecipato alla presentazione in anteprima dell’evoluzione della piattaforma analytics. Il 6 Dicembre 2018, in occasione del Nicholas Day, la casa tedesca rilascerà delle nuove features riguardanti sia la parte analitica che quella server.
di Andrea Macera, Senior Data Engineer and Data Analyst.
Knime è una piattaforma gratuita e open-source il cui utilizzo è orientato principalmente all’analisi, reporting e integrazione dei dati, integrando vari componenti, messi a disposizione dal tool, per machine learning e data mining attraverso il concetto di pipeline di dati modulari. Un’interfaccia grafica e l’uso di JDBC consentono l’assemblaggio di nodi che combinano diverse sorgenti di dati, compresa la pre-elaborazione (ETL: Extraction, Transformation, Loading), per la modellazione, l’analisi e la visualizzazione dei dati senza, o con una programmazione minima.
In questo articolo illustreremo queste nuove funzionalità inserite nelle nuove versioni KNIME Analytics 3.7.0 e KNIME Server 4.8.0.
Iniziamo con la descrizione delle nuove features introdotte dal tool inerenti alla nuova versione Analytics:
Sono stati introdotti nuovi nodi di calcolo statistico, che utilizzando algoritmi machine learning, riescono a fornire dati utili per effettuare analisi predittive con elevate prestazioni. Più nello specifico, l’integrazione con XGBoost é interessante sapere che è disponibile nella nuova versione di KNIME AP. (Fig. 1).
Si intensificano le possibilità di interazione con Tableau: con il nuovo rilascio di KNIME Analytics Platform è stata estesa l’integrazione per aggiungere il supporto per nuovi formati di date e time e sia per supportare il formato Hyper di Tableau. Questo consente di scrivere file in formato Hyper cosí come inviare i file direttamente a Tableau Server. Nella versioni precedenti era disponibile esclusivamente il formato TDE con le stesse funzionalitá di scrittura del file e di invio al Tableau Server (fig. 2).
Da oggi, Knime, consente di acquisire files direttamente da Google Driver. Il nodo predisposto a tale funzione evita le fastidiose operazioni di download/update dei dati, consentendo in maniera rapida e semplice il loro accesso. Ciò facilità la gestione di files, presenti su path condivisi, garantendo la coerenza delle informazioni presenti su essi (fig. 3).
Ti è mai successo che durante lo sviluppo di un job Knime, ti accorgi che ti occorre un particolare script per poter eseguire formule matematiche complesse; oppure che ti occorrono particolari funzionalità e che tali non sono presenti tra i molteplici nodi messi a disposizione dal tool?
Con l’arrivo della versione Analytics 3.7.0, ciò non rappresenta più un problema: l’integrazione con Python, presente da tempo in KNIME Analytics Platform, ma ciò che hanno reso disponibile nell’ultima release é l’integrazione con Jupyter. Infatti ora é possibile importare ed eseguire codice disponibile in Jupyter notebooks (fig. 4).
L’ultima, ma non per importanza, grande novità introdotta in questa nuova versione è l’ampliamento della connettività con il mondo BIG DATA. Ormai l’uso dei big data, sta diventando sempre più indispensabile per le aziende e Knime consente la gestione di essi in modo ottimale, utilizzando connettori che consentono la compatibilità con i più grandi leader mondiali di tool big data (es. Cloudera, Microsoft Azure HDInsight, ecc..). È stata aggiunta la possibilitá di mixare job PySpark con il workflow che lavora su Spark. Inoltre, ulteriore importante supporto é quello con Apache Livy per controllare i job di Spark nell’ambiente big data, cosí come il supporto di Spark 2.4. (fig. 5).
Dopo aver descritto le principali caratteristiche delle nuove features analitiche implementate nella versione KNIME Analytics 3.7.0, passiamo a quelle della versione KNIME Server 4.8.0.
La differenza sostanziale di cui ci rendiamo subito conto è nell’utilizzo di executor distribuiti che danno la possibilitá di scalare con l’esecuzione dei workflow per il KNIME Server. Ciò consente maggiori vantaggi (speed-up e throughput) quando si esegue un elevato numero di operazioni in parallelo (fig. 6).
Con il lancio sul mercato delle 2 nuove versioni, Knime si proietta ad aggiudicarsi un posto accanto ai grandi competitor mondiali. Difatti, rende automatizzabile e in maniera semplice e intuitiva, il ciclo di vita del dato, partendo dall’acquisizione di esso fino all’analisi delle informazioni. Attraverso l’iterazione con varie tecnologie, rende il tool portatile e adatto ad ogni esigenza.[/vc_column_text][/vc_column][/vc_row]