Sandrinho86's Blog

Post in evidenza

Risparmiare su luce e gas: idee utili e suggerimenti

Dopo una lunga assenza torno per trattare di un tema molto caro (non solo in senso metaforico) a molti di noi: le bollette luce e gas.

Quando si parla di mercato dell’energia, gli argomenti analizzati sono essenzialmente due: la fine della tutela (prevista per luglio 2020) e le chiamate estenuanti che subiamo dai call center.

L’attore mai menzionato dai media é, invece, colui che paga di tasca propria: il consumatore finale.

Quando ciò avviene é per preannunciare, attraverso articoli apocalittici, gli aumenti delle tariffe, la canonica “stangata”; una scure impossibile da evitare per chiunque. Ma é proprio così? Assolutamente no!

Esempi di articoli allarmanti sugli aumenti

Gli aumenti di cui parlano i media riguardano solamente i clienti riforniti dal servizio di maggior tutela (denominato ora Servizio Elettrico Nazionale, la vecchia Enel Servizio), ossia il 70% degli utenti del mercato elettrico. Chi, invece, ha scelto un qualsiasi altro operatore del libero mercato, non sarà interessato degli aumenti.

Le aziende che operano nel mercato libero dell’energia elettrica e del gas sono oltre 200, impossibile conoscerle tutte e poterne valutare le proposte. Ma anche riuscissimo in quest’impresa titanica, capire se l’offerta che abbiamo di fronte é più conveniente rispetto a quanto stiamo pagando ora, é davvero complicato.

Le bollette di energia che riceviamo sono composte da 3 parti:

spesa per la materia energia/gas;
spese per trasporto, gestione contatore e oneri sistema;
Imposte e IVA.

La concorrenza é solamente sulla materia energia/gas (che pesa per il 25-30% sull’importo totale delle bollette), mentre le altre due parti (spese trasporto/contatore/oneri e imposta/IVA) sono identiche per TUTTI gli operatori.

Ma come é possibile sapere se sto pagando troppo e/o se ci sono offerte sul mercato migliori?

Un modo veloce ed efficace per saperlo é la schede di confrontabilità. La delibera 366/2018/RCOM dell’Autorità di regolazione per energia (ARERA) obbliga ogni operatore a fornire tale documento al momento della sottoscrizione di una nuova offerta di energia elettrica o gas.

Tale scheda non fa altro che confrontare la spesa dell’offerta che si sta sottoscrivendo (prima colonna – A) e quella che si farebbe essendo riforniti dal servizio di maggior tutela (seconda colonna – B). La terza colonna (C) non é altro che la differenza tra le prime due. In sintesi, se alla colonna C, per il consumo annuo (reperibile in tutte le bollette) avrò un numero negativo, allora RISPARMIERO’, altrimenti pagherò di più, quindi NON devo cambiare.

Esempio di scheda di confrontabilità

Se, invece, ho già sottoscritto da tempo un’offerta e dai documenti contrattuali forniti, noto che l’importo della colonna C é positivo, devo affrettarmi a cambiare nuovamente operatore e cercare tariffe migliori!

Dove trovare le offerte più convenienti? Sul web sicuramente (siti aziende o comparatori), quindi occorre armarsi di pazienza e tempo per scovare “il prezzo giusto”.

Ma una volta completata l’adesione, quando sentirete i media con toni allarmanti parlare del prossimo “caro bollette”, potrete sorridere soddisfatti e pensare:

Riepilogo degli applicativi utilizzati e loro peculiarità

Le ricerche effettuate in precedenza ci hanno spinto all’utilizzo di diversi software e applicativi, ognuno con le sue caratteristiche specifiche. Questo post ci serve quindi da sintesi e precisazione dei software utilizzati finora, delle loro peculiarità e dell’utilizzo ottimale che si dovrebbe fare degli stessi.

MICROSOFT EXCEL

Il primo programma incontrato è stato Excel, quando abbiamo parlato della differenza tra DBMS e fogli di calcolo (o spreadsheet). Excel, programma facente parte del pacchetto Office di Microsoft, rientra in questa seconda categoria. Un foglio di lavoro Excel si presenta diviso in celle, che sono le basi di lavoro di tale programma; in esse, infatti, è possibile inserire dati, numeri e formule. Come indica la sua denominazione, foglio di calcolo, Excel è pensato per compiere semplici funzioni matematiche tra i dati immessi (come Somma, Min, Max, Media…). Un’altra funzionalità interessante è quella dei grafici riguardanti i dati inseriti, molto più intuitivi di una serie infinita di dati che si possono inserire su un foglio di lavoro.

In alcune organizzazioni Excel è anche utilizzato come database, tuttavia, viste le caratteristiche di tale programma applicativo è fortemente sconsigliato per questo tipo di utilizzo per i seguenti motivi:

dimensioni ridotte del foglio di lavoro;
incapacità di operare procedure di normalizzazione;
impossibilità di controllare l’integrità referenziale dei dati inseriti;
difficoltà nel reperire i dati qualora questi siano dislocati su più fogli di lavoro.

Excel, quindi, è uno spreadsheet che va utilizzato per compiere semplici funzioni matematiche, per l’inserimento di tabelle e grafici. Utilizzarlo come software DBMS è fortemente sconsigliato, soprattutto per quelle organizzazioni che producono quantità di dati notevoli.

FOGLIO DI LAVORO EXCEL — ESEMPIO DI TABELLA IN EXCEL

MICROSOFT ACCESS

Il secondo programma utilizzato è stato Access, anch’esso facente parte del pacchetto Office di Microsoft. Access fa parte, invece, della categoria di software pensati appositamente per i database; la peculiarità di tale programma è, infatti, la gestione di database relazionali. Access consente l’inserimento di nuove informazioni non appena queste sono disponibili, il loro aggiornamento, l’ordinamento rapido dei dati per ordine alfabetico o per categorie, il calcolo dei totali, medie e altri valori, la ricerca di una particolare informazione e la stampa dei dati con la possibilità di scegliere tra un’ampia varietà di formati. La gestione relazionale del database permette di organizzare le informazioni contenute in una o più tabelle collegate attraverso l’utilizzo di chiavi primarie ed esterne.

L’archiviazione delle informazioni costituisce, però, soltanto una parte delle operazioni che si possono effettuare con Access; tale applicativo permette, infatti, di visualizzare le informazioni sullo schermo con diversi formati o di effettuare la ricerca di un particolare dato attraverso operazioni di interrogazione del database, dette query, effettuate in linguaggio SQL.

Access è, quindi, un ottimo applicativo per la gestione di database, ma dimostra i suoi limiti per quanto riguarda la veste grafica di visualizzazione di report, tabelle o stampe di dati. Essi, infatti, non sono dotati dell’immediatezza di lettura che sarebbe possibile con l’inserimento di grafici o con l’utilizzo di formattazioni speciali (grassetto, corsivo, evidenziato) per i dati più significativi all’interno di una tabella di dati molto ampia.

ESEMPIO DI DATABASE IN ACCESS — Esempio di database in Access

MICROSOFT POWER POINT

Tra i vari programmi utilizzati, seppur in maniera meno marcato rispetto agli altri, vi è stato anche PowerPoint, del pacchetto Office anch’esso. PowerPoint è un applicativo pensato esclusivamente per le presentazioni e, quindi, per fornire un supporto grafico e visivo all’interno di convegni, lezioni e riunioni. Le funzionalità principali di questo applicativo riguardano principalmente l’impatto visivo di una presentazione; abbiamo la possibilità, infatti, di inserire foto, grafici, tabelle, link e animazione del testo. L’applicativo ha una barra degli strumenti user-friendly ed è quindi, facilmente utilizzabile da chiunque.

ESEMPIO PRESENTAZIONE IN POWER POINT — Esempio di presentazione in Power Point

DATA TIME REPORTING SYSTEM

Data Time, come già detto nei post precedenti, è un software di reportistica open source molto moderno e tra i più potenti della categoria. Consente di creare ogni tipo di layout con possibilità pressoché illimitate di Slice&Dice del cubo multidimensionale dei dati. Permette di creare report dall’impatto visivo immediato, attraverso l’utilizzo di grafici, tabelle e foto ed è possibile anche realizzare delle pagine Web, sia statiche sia interattive. I report web di DataTime garantiscono una ottimale compatibilità con i browser più utilizzati e sono esportabili in fogli di lavoro Excel, in file PDF o pagine HTML.

Come utilizzare al meglio i Key Performance Indicators (KPI)

KPI è una sigla emblematica all’interno del mondo della Business Intelligence ed è l’acronimo di Key Performance Indicators. Essi rappresentano, quindi, degli indici che aiutano a definire e misurare i progressi compiuti per il raggiungimento degli obiettivi di un’organizzazione. Nello svolgimento dell’attività di un’azienda, infatti, vi è la continua necessità di misurare la performance delle azioni compiute, di controllare la coerenza con la missione definita inizialmente e di sorvegliare anche il comportamento dei competitor.

I Key Performance Indicators sono misure quantitative, identificate e definite in anticipo, che riflettono i fattori critici di successo per un’organizzazione. Ovviamente si differenziano da organizzazione ad un’altra, in base anche al settore in cui la stessa opera; ad esempio, una scuola avrà come KPI il tasso di promozione dei suoi studenti, un dipartimento di Customer Service potrebbe avere la percentuale di chiamate da parte di clienti soddisfatti, mentre per un’organizzazione sociale potrebbe essere il numero di clienti assistiti in un anno.

Non è importante quali siano i KPI scelti, ma essi devono riflettere gli obiettivi dell’organizzazione, devono essere, come appunto dice il nome, le chiavi per misurarne il successo e quindi devono essere quantificabili, devono avere un valore. I Key Performance Indicators sono indicatori generalmente di lungo periodo e non cambiano spesso dato che sono legati agli obiettivi di un’organizzazione che, solitamente, non cambia missione continuamente.

Come detto, qualunque KPI deve essere definito e misurato accuratamente, per questo motivo occorre utilizzare come parametri solo dati quantificabili. Ad esempio, “Essere l’azienda più famosa” molto difficilmente può essere utilizzato come KPI perché vi sarebbe non solo la difficoltà di misurare la popolarità di un’azienda, ma, soprattutto, di paragonarla a quelle delle altre. Ulteriore aspetto importante, oltre alla definizione dei KPI, è la coerenza e costanza negli anni degli stessi, cambiarne il significato vorrebbe dire perdere la possibilità di confrontare i dati attuali con quelli degli anni precedenti. Per ognuno di essi va anche definito, di volta in volta, un obiettivo da raggiungere ed il controllo dello stato progressivo permette di cambiare in corsa anche le azioni da compiere in seguito.

Generalmente questi indicatori sono suddivisi in 4 macro-categorie:

indicatori di qualità: finalizzati alla valutazione degli output sulla base di determinati standard;
indicatori generali: finalizzati alla misurazione del volume del lavoro del processo;
indicatori di costo;
indicatori di servizio o di tempo: misurano il tempo di risposta, a partire dall’avvio del processo fino alla sua conclusione.

I KPI una volta definiti devono essere anche correttamente comunicati all’interno di un’organizzazione. L’obiettivo non è quello di creare uno spauracchio o di incutere timore ai membri di un’organizzazione attraverso l’utilizzo di questi misuratori di performance. La vera finalità di questi indicatori è quella di fornire una chiara rappresentazione della missione aziendale, renderne partecipi tutti indicando quali sono i punti e le azioni da fare per raggiungere l’obiettivo prefissato. Comunicare nella maniera corretta un KPI, il suo stato di avanzamento progressivo, potrebbe trasformare un possibile spauracchio ad uno strumento importante di condivisione della mission aziendale ed uno stimolo verso un miglioramento continuo.

DataTime: approfondimento e guida all’utilizzo di questo tool di reportistica

Data Time Reporting System è uno dei software di reportistica più moderni attualmente disponibili sul mercato, sicuramente il migliore tra quelli open source. La piattaforma di riferimento per l’applicativo è il Framework .NET, utilizzato anche da Windows. DataTime può connettersi a qualunque tipo di Database, anche quelli custom made, per il quale sia disponibile il corrispondente provider OleDB, utilizzato dai più importanti software di DBMS (Oracle, SQL Server, Access, DB2, Sybase, MySQL, etc.) o anche a semplici fogli Excel o file di testo delimitato. Il sistema di reportistica è il più flessibile attualmente disponibile sul mercato; DataTime consente, infatti, di creare qualunque tipo di layout (verticale, orizzontale, cross e misto) con possibilità pressoché illimitate di Slice&Dice del cubo multidimensionale dei dati. E’ possibile definire:

sezioni verticali e orizzontali;
interruzioni orizzontali e verticali;
totali su livelli multipli;
drill down / roll up su qualunque livello.

DataTime crea report ad alto impatto visivo, dove tutti gli elementi grafici e stilistici possono essere controllati dall’utente. Un efficace sistema di formattazione condizionale consente di creare Alerts anche complessi e basati su codice utente per qualunque tipo di evento.

Con il programma più avanzato, Data Time Report Portal Open Solution, è possibile anche realizzare report pubblicabili su Web scegliendo tra due soluzioni alternative:

Updatable, in cui i report sono destinati alla sola consultazione;
Interactive, in cui si vuole consentire all’utente di interagire con i report. Tale architettura è basata su ASP.NET e Web Service.

I report web di DataTime garantiscono una compatibilità ottimale con tutti i browser più utilizzati (Explorer, Mozilla, Chrome) e sono esportabili verso Excel o reinderizzabili in file PDF o pagine HTML, grazie all’utilizzo dei miglior standard Web (4.01 strict).

Creazione di un report con “DataTime”

Utilizzando i comandi “Open new project” e “Connection to a database” è possibile caricare il database che ci interessa scegliendo diverse opzioni disponibili: sql server, Oracle, db2, Access, sybase, file di testo o fogli excel. Utilizzando le opzioni “Quick report” e “Reload structure” appariranno una lista di tabelle contenute nel database: visualizzeremo, così, “Select” e“Tabelle”. A questo punto, sarà possibile costruire il nostro Report ad alto livello grafico (aggiungendo tabelle e grafici) ed in cui qualsiasi comando può essere controllato e gestito dall’utente con un po’ di pratica, data l’alta facilità di utilizzo e la grafica user-friendly del programma stesso.

Schermata DataTime — Schermata iniziale all'apertura di DataTime

Il Data mining e la tecnica predittiva del Decision Tree

Il data mining è un processo analitico che viene utilizzato con lo scopo di esplorare grandi quantità di dati alla ricerca di modelli consistenti o relazioni sistematiche tra variabili. L’obiettivo è la predizione (da cui prende il nome il data mining predittivo), ossia il tentativo di validare i risultati applicando i modelli ottenuti a nuovi sottoinsiemi di dati. Il data mining è una materia interdisciplinare che si è sviluppata recentemente e poggia le sue basi su diversi campi di applicazione tra i quali l’intelligenza artificiale, la statistica, le basi di dati e il machine learning.

PROCESSO DI KNOWLEDGE DISCOVERY DATABASE — PROCESSO DI ESTRAZIONE DI DATI DA UN DATABASE

Il processo di data mining vero e proprio consiste nello studio di vari modelli e nella scelta del migliore tra quelli studiati, basandosi soprattutto sulla loro performance predittiva. L’applicazione pratica di tutto questo non è affatto facile, poiché sono presenti un’ampia gamma di tecniche sviluppate per raggiungere questo obiettivo. Molti di queste tecniche si basano su quella che viene chiamata “valutazione competitiva dei modelli”, che consiste nell’applicazione dello stesso dataset a modelli differenti comparando, successivamente, le diverse performance per scegliere il migliore tra questi.

Come abbiamo detto le tecniche di data mining sono molteplici ma si possono dividere in:

predittive, il cui obiettivo è costruire modelli di dati al fine di predire il comportamento di nuovi insiemi di dati;
descrittive, i quali descrivono gli insiemi di dati in maniera concisa e semplificata, presentandone interessanti proprietà generali.

I modelli predittivi sono costruiti utilizzando dati per cui il valore della variabile di risposta è già noto, mentre per le tecniche descrittive, come il clustering, non c’è un risultato già noto che guida l’algoritmo.

Una delle più diffuse tecniche di Data mining esistenti è quella degli alberi di decisione (o Decision Tree), un modello predittivo che può essere rappresentato, appunto, come un albero. Un albero decisionale prende come input un oggetto o una situazione descritti da un insieme di attributi e produce in output una decisione, ossia il valore predetto sull’input inserito. La costruzione di un albero decisionale è molto complicata e si produce in varie parti:

si seleziona un attributo da posizionare al nodo radice e costruire un ramo per ogni possibile valore, con l’obiettivo di dividere il dataset in dataset più piccoli;
ripetere tale processo per ogni ramo, usando solo quelle istanze che nel passaggio corrente raggiungono il ramo;
se tutte le istanze al nodo hanno la stessa classificazione, si blocca lo sviluppo di quella parte dell’albero.

Un albero decisionale raggiunge la sua decisione eseguendo una serie di test; ogni nodo interno all’albero, infatti, corrisponde ad un test del valore di una delle proprietà e i rami provenienti dal nodo sono etichettati con i possibili valori del test. Ogni nodo-foglia nell’albero specifica il valore da ritornare se quella foglia viene raggiunta. Ovviamente quando si ha la disponibilità di un gran numero di ipotesi, bisogna stare attenti a non usare questa vasta scelta per trovare regolarità insignificanti nei dati. Tale problema è chiamato overfitting (sovrastima) ed esistono delle tecniche apposite, dette di sfoltitura, per prevenire tale rischio.

Dopo aver affrontato più nello specifico il data mining e la sua tecnica principale, quella dell’albero decisionale, possiamo ora confrontare brevemente tale metodologia con le tecniche utilizzate nella statistica di base. Infatti, mentre la statistica ha come scopo principale la verifica di specifiche ipotesi di ricerca applicate ai dati appena raccolti (l’analisi primarie dei dati), il data mining può essere considerato come un’operazione da applicare secondariamente ai dati allo scopo di perseguire altri obiettivi (analisi secondaria dei dati). Inoltre i dati possono essere di tipo sperimentale oppure di tipo osservazionale ed è in quest’ultimo caso che è possibile utilizzare delle tecniche di data mining.

Diversi metodologie di rappresentazione di un report

I dati grezzi contenuti ed archiviati correttamente da un’azienda danno vita a degli output (attraverso degli appositi software) chiamati report. Il report, come detto nei precedenti post, è una relazione aziendale, un testo informativo di facile lettura, all’interno del quale sono presenti una serie di indicazioni tecniche o dati statistici. Tali informazioni sono utili per avere una visione aggiornata e continua di un’organizzazione, per dare continuità nella gestione in caso di cambiamenti manageriali e per intervenire su eventuali criticità riscontrate nella lettura dello stesso.

Non vi è una metodologia unica per la redazione di un report, ma esistono delle piccole accortezze da utilizzare nella scrittura o impostazione dello stesso:

adottare un linguaggio semplice ed efficace;
adottare un carattere che faciliti la lettura, evitando grandezze inferiori a 12;
utilizzare la formattazione speciale (grassetto, corsivo e sottolineato) solo quando strettamente necessario (parole chiave, parti o frasi rilevanti);
qualora fossero previste tabelle, presentarle in maniera chiara e di facile lettura;
qualora fossero presenti grafici, renderli immediatamente leggibili, rendendo palese quanto rilevato ed esplicitando in maniera logica il collegamento alla tabella da cui è stato estratto.

Queste accortezze variano, ovviamente, anche in base al settore in cui opera l’organizzazione stessa ed anche alle abitudini interne. E’ ovvio, infatti, che un’azienda di piccole dimensioni, che opera all’interno di un mercato stabile, abituata a compiere riunioni rilevanti solo un paio di volte l’anno, non ha bisogno di un tool di reportistica. In questi casi è consigliabile adottare semplici tabelle in Excel con i risultati operativi raggiunti (ricordando le accortezze di chiarezza e leggibilità dette sopra); qualora si volesse intervallare alle tabelle, anche un commento da parte dei manager, accompagnando il tutto visivamente con alcuni concetti-chiave, allora è auspicabile utilizzare una presentazione Power Point.

I software di reportistica più avanzati (come Business Object, Microstrategy, Cognos e Datatime) sono, invece, più adatti a quelle aziende di grandi dimensioni che agiscono in contesti instabili e che devono monitorare costantemente sia la loro azienda che il mercato circostante. Per questo, dopo aver dato una struttura predefinita ai dati, occorre avere dei programmi specifici e più immediati in grado di estrarli e presentarli in maniera veloce, chiara e leggibile ai manager che dovranno visionarli. Qualora fossimo in presenza, invece, di aziende dotate di obblighi di trasparenza oppure che avvertano l’esigenza di informare gli stakeholders ed i propri clienti del loro operato, troviamo un sito web apposito. In questi spazi è possibile trovare un insieme di output prodotti dall’organizzazione per vederne lo “stato di salute” e liberamente consultabili da chiunque. Ne sono un chiaro esempio i bilanci interattivi online che un numero sempre maggiore di aziende, negli ultimi anni, sta creando, inserendo appositi link anche nelle homepage dei siti istituzionali.

BILANCIO INTERATTIVO ERG — ESEMPIO DI SITO WEB CON BILANCIO INTERATTIVO

Primo utilizzo di Microsoft Access e approccio con tabelle relazionali

Come abbiamo visto le aziende durante lo svolgimento delle loro attività, si trovano a dover gestire una quantità rilevante di informazioni. Molto spesso un’organizzazione ha al suo interno dei dati che potrebbero esserle utili, ma proprio per la cattiva gestione che ne è stata fatta o ne ignora l’esistenza o non riesce ad estrarre ciò che realmente vorrebbe.

Utilizzare un sistema di archiviazione dati, che sia un foglio di calcolo o un DBMS, è un dovere per quelle aziende che vogliono gestire al meglio tutte le informazioni che derivano dallo svolgimento della loro attività. Un altro aspetto da non sottovalutare è quello dell’utilizzo da parte di più strutture di uno stesso archivio. Un’organizzazione, pubblica o privata che sia, ha al suo interno diversi uffici ognuno dei quali genera differenti dati; questo utilizzo contemporaneo non deve, però, intaccare né la struttura dell’archivio né essere isolata rispetto alle altre.

Quest’ultimo aspetto ci permette di introdurre il concetto di tabelle relazionali, operazione che è possibile effettuare solo con un sistema DBMS mentre è impossibile con uno spreadsheet. Tali relazioni sono corrispondenze tra tabelle diverse attraverso l’utilizzo di campi in comune definiti “chiavi” e consentono:

di inserire le informazioni attraverso una struttura logica prestabilita;
di compiere una normalizzazione, ossia di evitare l’inserimento di termini ripetuti nelle tabelle;
di garantire l’integrità referenziale delle informazioni stesse.

I sistemi DBMS moderni sono complessi e strutturati ad “oggetti” tutti finalizzati alla gestione ottimale di informazioni. Questa modalità di archiviazione rende i moderni database strumenti di elaborazione dati potenti ed efficaci, per alcuni versi facili da utilizzare ma, al tempo stesso, richiedono competenze specifiche.

Utilizzare uno spreadsheet per compiere le stesse relazioni è un’operazione azzardata e sbagliata da compiere per diversi motivi:

nessun controllo sulla ripetizione dei dati inseriti;
perdita di tempo;
utilizzo elevato di memoria;
possibili errori di scrittura;
difficoltà nella ricerca dei dati in una fase successiva.

In aula è stato utilizzato il database di esempio Northwind, di Microsoft Access, per prendere maggiore confidenza con un sistema DBMS e per scoprirne le potenzialità, ma anche le difficoltà di gestione attraverso l’inserimento di chiavi primarie ed esterne. Abbiamo scoperte delle analogie di alcuni concetti base di statistica come unità statistica, caratteri, modalità e determinazione con alcune parole chiave che vengono utilizzate in Access. Le righe di una tabella vengono definite record, le colonne campi o attributi, la chiave primaria identifica in modo univoco un record, mentre la chiave esterna permette di compiere quelle correlazioni essenziali per relazionare le diverse tabelle.

DATABASE SORGENTE — Esercitazione in aula - Database Immatricolazioni

Differenze tra tabelle statistiche e report. Esempi di report creati con Datatime in aula

Le tecniche di produzione di un report, all’interno di un’azienda, sono state spesso mutuate dalla statistica. Questa tendenza deriva dal fatto che nella statistica, come in azienda, si ha sempre a che fare con quantità enormi di dati, per comunicare all’esterno i risultati di una ricerca, inoltre, è necessario fare un grande lavoro di sintesi. Tale lavoro non deve, però, nè intaccare i dati originari nè far scendere la qualità della ricerca e, di conseguenza, le infomazioni che vogliamo comunicare all’esterno. Allo stesso modo le imprese sono abituate a raccogliere una grandissima mole di dati, sia che utilizzino sistemi più evoluti come i DBMS, sia che utilizzino un semplice foglio di calcolo come Excel. La difficoltà maggiore si incontra al momento della redazione del documento di report, poichè non è facile trarre da una serie di dati, molto spesso disaggregati tra loro, un documento che sia chiaro, diretto, comprensibile e, quindi, utile in una logica di supporto alle decisioni finale del management di un’azienda.

La tecnica maggiormente utilizzata è quella delle tavole di contingenza, che sono delle tabelle nelle quali vengono riportate le frequenze congiunte di una o più variabili che decidiamo di incrociare e analizzare. Vengono anche chiamate tabelle a doppia entrata, con etichette di riga e di colonna, e sono uno strumento comunemente utilizzato in statistica. Il caso emblematico di questo tipo di tabella è quello che si utilizza con il comando “Tabella pivot” in Excel, nelle quali è possibile, inoltre, poter effettuare non solo frequenza ma anche medie e altri conteggi.

Come detto anche nei precedenti articoli, la reportistica delle aziende solitamente si limita solo a questi aspetti, dato che è poco diffusa la pratica di tenere un DBMS aziendale e, ancor meno, quella di avere un tool di reportistica in grado di creare dei report migliori.

La peculiarità dei tool di reportistica rispetto alle tabelle pivot di Excel è innanzitutto la chiarezza; infatti, tali report devono essere presentati a dirigenti che, molto spesso, non hanno la conoscenza specifica di ogni settore e non possono decifrare i dati della tabella che viene loro presentata. Ecco che allora, attraverso i software di reportistica, alla tabella viene affiancato un grafico in cui si esaltano maggiormente i dati più rilevanti. Un’altra facilità d’uso deriva dalla possibilità di inserire funzioni di aggregazioni in maniera più facile rispetto a quanto fatto su Excel.

Attraverso le funzioni di aggregazione è possibile determinare diverse statistiche di insiemi di valori. È possibile utilizzare tali funzioni in una query e aggregare i diversi valori contenuti in diverse tabelle. Le principali funzioni utilizzate in questo ambito sono:

Funzione media;
Funzione conteggio;
Funzione primo, ultimo;
Funzione min, max;
Funzione DevSt, StDevP;
Funzione somma;
Funzione Var, Varp.

Per meglio comprendere le potenzialità dei tool di reportistica, a lezione abbiamo utilizzato il software gratuito Datatima anche per vedere le differenze con Excel e per notare le differenze delle diverse funzioni di aggregazione. Nell’esempio qui sotto verranno inserite due schermate delle pagine fatte a lezione, la prima in cui la funzione di aggregazione è la media, la seconda in cui la funzione di aggregazione è la somma. Il database da cui sono stati tratti questi dati è Northwind, mentre le dimensioni e le misure prese per la tabella sono state rispettivamente “Ship country” e “Freight”.

Datatime - Funzione di aggregazione Media — Esempio di report Datatime - Funzione di aggregazione: Media

Datatime - Funzione di aggregazione Somma — Esempio di report Datatime - Funzione di aggregazione: Somma

Differenze tra data mining e report ed esempi di tool per la reportistica

Il data mining è quel processo che permette l’individuazione di informazioni utilizzabili prelevandole da grandi quantità di dati ed utilizzando l’analisi matematica per dedurre schemi e tendenze esistenti nei dati. In genere, questi schemi non possono essere individuati tramite procedure di query tradizionali ai database, poichè le relazioni sono troppo complesse oppure la mole di dati presenti è troppo ampia. Gli schemi e le tendenze possono, quindi, essere raccolti e definiti in un modello di data mining, applicabili a diversi scenari aziendali ed ai settori di mercato più diversi.

La creazione di un modello di data mining rientra in un processo più ampio che include tutte le fasi necessarie, dalla formulazione di domande sui dati e dalla creazione di un modello per rispondere a tali domande, alla distribuzione del modello in un ambiente di lavoro. È possibile definire tale processo suddividendolo in sei passaggi fondamentali:

Definizione del problema;
Preparazione dei dati;
Creazione dei modelli;
Esplorazione e convalida dei modelli;
Distribuzione e aggiornamento dei modelli.

Gli algoritmi più comuni in uso attualmente per il calcolo dei Data Mining possono essere suddivisi principalmente in due classi:

Tecniche classiche: le statistiche, i quartieri e Clustering;
Tecniche di “Next Generation”: alberi, le reti e le regole

C’è da chiarire una situazione che è riferita alle metodiche classiche, ossia alla statistica; per rigorosa definizione, infatti, questa disciplina e le tecniche statistiche non sono specifiche per il Data Mining. Nel lavoro quotidiano svolto dagli utenti, si possono trovare le problematiche più diverse; in alcune di esse è necessario utilizzare tecniche di “data mining”, in altre, invece, è preferibile utilizzare strumenti statistici. Per questo motivo è importante avere una panoramica completa di come le tecniche statistiche funzionano e di come queste possano essere applicate all’interno dell’azienda in cui lavoriamo.

Al contrario un sistema di reportistica ha l’obettivo di fornire documentazione analitica sulle attività aziendali di rilievo in ambiti complessi. Con l’accumularsi dei dati a disposizione di un’organizzazione, infatti, un’elaborazione centralizzata degli stessi porta dei vantaggi sia in termini di tempo di elaborazione, sia per una maggiore omogeneità di risultati. La standardizzazione di questi documenti permette, inoltre, una distribuzione migliore delle informazioni ed una visione complessiva delle attività sempre aggiornata, secondo la disponibilità di dati, fra i diversi ruoli funzionali dell’organizzazione. Tutto questa sistema genera un documento riassuntivo, che permette di avere gli elementi che aiuteranno i dirigenti di un’organizzazione a prendere decisioni migliori, fornendo loro le informazioni necessarie in maniera chiara, veloce e comprensibile. Questo prodotto è chiamato report e si presenta come una combinazione sinottica di tabelle e grafici che presentano le misure di rilievo per i vari fenomeni analizzati, disaggregate e destrutturate secondo le esigenze del caso che stiamo trattando.

Esistono nel mercato dei software appositi in grado di generare questi report, attraverso dei programmi facili da usare e che permettono, inoltre, una facile comprensione da parte dei dirigenti che visioneranno i documenti. Tra questi software i più utilizzati sono:

Actuate;
Business Objects (recentemente acquisito da SAP);
Cognos (di proprietà IBM);
Data Time;
Microstrategy;
Oracle.

In aula, per prendere maggiore dimestichezza con questi tool di reportistica, abbiamo utilizzato una versione di prova del software DataTime, utilizzando Northwind come nostro database di prova per il report da generare.

Approfondimento dei sistemi di DSS ed utilizzo di software Dashboard user-friendly per una reportistica migliore

Come già accennato nel precedente post, i DSS (Decision Support System) sono dei sistemi che aiutano i manager delle aziende a prendere decisioni dopo un’attenta valutazione di tutti i dati a disposizione. Questo è possibile grazie, soprattutto, allo sfruttamento di un sistema DBMS preesistente che di per sè non fornisce, però, alcuna informazione utile per i vertici aziendali. Ecco che subentra, allora, un sistema DDS che permette di estrarre, in tempi brevi e in modo felssibile da una gran mole di dati, le informazioni che servono a supportare e migliorare in termini di efficacia il processo decisionale.
Nello specifico gli obiettivi e le azioni per compiere un buon sistema di DSS sono:

supportare decisioni difficili, non specificate e non strutturate;
supportare la decisione a tutti i livelli di organizzazione e integrare i livelli;
facilitare la comunicazione fra coloro che devono decidere;
controllare tutte le fasi del processo decisionale e facilitare l’interazione:
sostenere una varietà di processi decisionali senza dipendere in particolare da nessuno di essi;
essere semplici da usare e modificare in relazione ai cambiamenti dell’utente, del lavoro o dell’ambiente.

Le reti di DSS sono, forse, l’approccio più adattabile alla integrazione di componenti, in cui le varie parti non sono localizzate in un unico computer o sistema informatico, ma in una rete di sistemi. Il problema, in questo caso, è la necessità di creare interfacce fra i vari componenti che siano pratiche ed allo stesso tempo facilmente utilizzabili (user-friendly). Indubbiamente i vantaggi che derivano dal creare un sistema DSS sono molteplici: innanzitutto una maggiore flessibilità, la possibilità di aggiornare le varie parti senza dover lavorare sull’intero DSS ed, infine, la possibilità di creare componenti di dialogo multiple per evitare un’inflazione delle performance del sistema dovute, principalmente, alla conflittualità, ma, soprattutto, all’accodamento dei flussi dati all’interno del sistema.

Il bisogno fondamentale da parte di un’azienda di avere un’efficace sistema di DSS unito alle necessità che tali sistemi non siano di utilizzo troppo complicato, ma il più user-friendly e accessibile a tutti, ha fatto nascere il mercato dei software definiti Dashboard (o Cruscotto). Il Dashboard costituisce un punto d’accesso unico ed integrato ai servizi di analisi e supporto alle decisioni che, sulla base dei dati raccolti e dei modelli di analisi sviluppati, mette progressivamente a disposizione degli operatori istituzionali informazioni facilmente consultabili.

Più precisamente tali software permettono di:

consultare una serie di indicatori predefiniti tramite interrogazioni con filtri dinamici definiti di volta in volta dall’utente;
effettuare il download di subset predefiniti di dati (chiamati datamart) presenti nel datawarehouse in un formato leggibile da applicazioni esterne (Excel, SAP, SAS…..);
monitorare lo stato degli invii/caricamenti;
consultare la reportistica tecnica per verificare errori ed anomalie ed infine proporre azioni per migliorare la qualità del dato.

Viene definito chiamato cruscotto poichè si presenta graficamente come un pannello su cui è disposta la gran parte della strumentazione relativa agli organi di comando e di controllo, un po’ appunto come la strumentazione delle automobili. Il Dashboard rappresenta, quindi, uno strumento di ausilio fondamentale per la costruzione e la successiva monitorazione delle decisioni strategiche aziendali e permette, quindi, di visualizzare gli indicatori come distribuzione, mappa oppure come un albero strutturato.

Tra le imprese produttrici di questo tipo di software, l’industra leader è indubbiamente la Dundas Software, che fornisce il servizio Dundas Chart, che rappresenta uno degli esempi più interessanti per la realizzazione di grafici che permettono grandi potenzialità di reportistica all’utente, il quale può predisporre report personalizzati ed effettuare statistiche su un insieme di parametri di proprio interesse. Un altro esempio di casa prodruttrice di questo tipo di software è la Digimoto che fornisce però questo tipo di servizio principalmente per il settore automotive.