Milioni di righe bastano per avere analisi statistiche utili all’azienda?

Una delle percezioni più diffuse fra titolari, imprenditori, dirigenti ha a che fare con questa situazione: ho molti dati aziendali, intesi come numero di righe dei fogli di calcolo (anche su più file), sicuramente uno statistico saprà valorizzare questi dati. L’attaccamento a questa aspettativa può facilmente portare a dolore perché in dei casi la quantità non fa la qualità. 

 

Ecco un caso tremendamente simile 

Stiamo cercando un esperto di Machine Learning per sviluppare un motore di raccomandazione di prodotti all’avanguardia per le nostre campagne di email marketing.

 

Ecco la sfida:

Abbiamo un enorme database di 4 milioni di iscritti alle e-mail. Per ogni iscritto abbiamo una grande quantità di dati, tra cui:

– Data di iscrizione: Quando si sono iscritti alla nostra lista di e-mail

– Dati di coinvolgimento: Hanno aperto o cliccato sulle nostre e-mail? Con quali contenuti hanno interagito?

– Dati di acquisto: Quali prodotti hanno acquistato da noi?

 

Abbiamo subito l’influenza, proveniente da vari settori, dove di più = meglio. In questo caso inteso come quantità di dati. Nell’apprendimento automatico si dice infatti che la quantità di righe fa la qualità del modello, e i modelli sofisticati vengono battuti da modelli più semplici ma addestrati con molti più dati, se ad esempio vogliamo spiegare un fenomeno di interesse aziendale. 

 

Riguardo il caso di sopra, le 3 colonne che cita rientrano nei cosiddetti dati “interni”. Dati di solito facilmente ottenibili ma con una utilità limitata. Ad esempio quando scarichiamo le fatture dal sito della agenzia delle entrate, abbiamo parecchie colonne inutili, ad esempio Tipo fattura (quella che specifica “fra privati”), Tipo documento, Numero fattura / Documento, etc. La colonna più utile viene da PIVA cliente, perché si tratta di un dato univoco, mentre invece il nome cliente no. Infatti dalla partita IVA possiamo fare arricchimento, o creare altre colonne, ad esempio trovando il codice ATECO, la regione, etc. Questo ci dà informazioni sul nostro cliente ideale. In altre parole, bastano righe e colonne informative o di qualità, per usare un termine più abusato. 

 

Esistono varie automazioni per trovare nuove colonne di dati da colonne esistenti, che possono anche coinvolgere servizi di terzi. Esistono però dei venditori o commerciali molto meticolosi che scrivono note per ogni potenziale cliente o cliente, che talvolta diventano oro. 

 

Alcune fonti di dati particolarmente ricche di dati interni, ad esempio la base di dati specifica per potenziale clienti o clienti (CRM), in alcuni casi ti permettono di creare nuove colonne a partire da colonne già esistenti o arricchire delle colonne in maniera automatica (anche pagando). 

 

Hai migliaia e migliaia di righe di dati e non ti senti sicuro che li stai utilizzando a sufficienza? Discutiamone in una chiamata gratuita. 

Privacy Policy
it_ITItalian