Big Data, Thick Data e l’etica dell’analisi

Nel panorama dell’era digitale i dati rappresentano una risorsa fondamentale per interpretare e trasformare la realtà.

Termini come big data e thick data sono diventati parte integrante del linguaggio comune nelle discussioni legate alla tecnologia, al business e alla società, rivelando sfumature cruciali nel modo in cui raccogliamo e utilizziamo le informazioni.

I big data si riferiscono a enormi quantità d’informazioni raccolte, elaborate e analizzate grazie a tecnologie avanzate. Questi dati sono spesso generati in tempo reale, provenienti da fonti eterogenee come social media, sensori IoT, transazioni finanziarie e sistemi aziendali. La loro grandezza e complessità richiedono infrastrutture robuste e algoritmi sofisticati per trarne significato.

Tuttavia, il focus sui big data spesso si concentra su modelli e correlazioni, lasciando in ombra il contesto culturale, umano e sociale che li genera.

Qui entrano in gioco i thick data, ossia dati che derivano da metodi di ricerca come l’etnografia, le interviste e l’osservazione sul campo.

Il termine è stato coniato da Tricia Wang, etnografa e sociologa, per descrivere e sottolineare il valore dei dati qualitativi che forniscono una comprensione profonda dei comportamenti, delle emozioni e delle motivazioni umane in un’era dominata dai big data, dove l’enfasi è spesso posta su quantità e velocità a scapito del contesto umano.

Durante i suoi studi sul comportamento degli utenti di tecnologia, nei mercati emergenti, la Wang notò come le interpretazioni puramente quantitative dei dati spesso mancassero di insight fondamentali, trascurando il valore delle informazioni più “spesse” e contestuali che potevano emergere dall’osservazione diretta delle persone.

Così alcune aziende sottovalutarono la crescente popolarità degli smartphone tra i consumatori con reddito basso. Le intuizioni qualitative raccolte tramite interviste e osservazioni dimostrarono, invece, che i consumatori erano disposti a spendere una parte significativa del loro reddito per uno smartphone, contro ogni previsione basata sui big data.

Un caso emblematico è quello di Nokia, che all’apice del suo successo, trascurò i segnali qualitativi che indicavano un cambiamento nelle preferenze dei consumatori verso smartphone più intuitivi e connessi. Nonostante i big data suggerissero un mercato stabile, l’osservazione attenta dei thick data avrebbero potuto rivelare un cambiamento culturale e tecnologico imminente, portando l’azienda a prepararsi meglio per la rivoluzione che è stata poi guidata da Apple.

I thick data offrono un complemento indispensabile ai big data, fornendo insight sui motivi e sui comportamenti che si celano dietro le cifre.

Mentre i big data possono rivelare che un determinato fenomeno accade, i thick data aiutano a comprendere il perché.

Ad esempio, un’analisi di big data potrebbe mostrare un aumento nelle vendite di un prodotto durante una determinata stagione, ma solo un’indagine qualitativa potrebbe rivelare che questo è dovuto a particolari tradizioni culturali o a fattori psicologici specifici.

La combinazione di big data e thick data è fondamentale per ridurre il rischio di data bias, ovvero i pregiudizi e le distorsioni che possono emergere durante la raccolta, l’analisi e l’interpretazione dei dati, influenzando la validità delle conclusioni e delle decisioni basate su di essi.

I bias possono avere origine da molteplici fonti, come la rappresentatività del campione che non rappresenta adeguatamente l’intera popolazione o fenomeno, ad esempio un sondaggio politico che viene fatto solo tra utenti di social media, non includerà persone non connesse digitalmente.

Oppure possono essere bias di etichettature o culturali, gli errori o pregiudizi nell’annotazione o classificazione dei dati introducono distorsioni e stereotipi.

O, ancora, si può trattare di bias algoritmico, che amplifica o introduce nuovi bias basandosi sui dati di addestramento distorti, ad esempio un motore di raccomandazione che suggerisce solo contenuti simili a quelli già consumati dall’utente, creando una “bolla informativa”.

Tutti questi errori possono portare a decisioni distorte o ingiuste.

Politiche pubbliche, strategie aziendali o interventi sociali basati su dati distorti possono fallire o avere effetti negativi.

Bias nei dati possono perpetuare o amplificare disuguaglianze sociali, etniche, di genere o ledere l’immagine di un’istituzione o azienda.

L’integrazione di big data e thick data non è solo un esercizio intellettuale, ma una necessità per creare soluzioni realmente inclusive e sostenibili. Questa sinergia consente di affrontare le sfide legate ai data bias, migliorando l’affidabilità e l’etica delle analisi.

In un mondo sempre più interconnesso e dominato dall’intelligenza artificiale, è essenziale adottare un approccio che riconosca la complessità umana e sociale dietro i numeri, trasformando i dati in strumenti di progresso e comprensione.

La tensione e il dialogo tra big data e thick data rappresenta uno dei temi più affascinanti e cruciali dell’era digitale.

Solo bilanciando quantità e qualità, modelli e contesti, potremo superare le insidie del data bias e utilizzare i dati come veri strumenti di trasformazione sociale.

Linkografia

Tricia Wang

Condividi / Share