Approfondimenti sulla Scienza dei Dati Basics on Data Bases and Data Quality Data & Knowledge models and techniques/ Dgital knowledgeware/From data to insights/Business analytics

Testi di approfondimento sui temi della scienza dei dati

Per approfondire

In questa sezione sono citati diversi testi che possono essere letti per approfondire i temi della Data Science. In questa sezione si trovano I riferimenti a un vasto insieme di testi di approfondimento sui temi della scienza dei dati; una disciplina che copre contenuti sia tecnici che sull’impatto economico e sociale che è necessario conoscere per affrontare in maniera matura i fenomeni indotti dalla sempre più vasta diffusione dei dati digitali nelle azienze e nella vita di ogni giorno. 

A. Baricco – The game, Einaudi Stile Libero, 2018. 

Da una delle presentazioni del libro “Quella che stiamo vivendo non è solo una rivoluzione tecnologica fatta di nuovi oggetti, ma il risultato di un’insurrezione mentale. Chi l’ha innescata – dai pionieri di Internet all’inventore dell’iPhone – non aveva in mente un progetto preciso se non questo, affascinante e selvaggio: rendere impossibile la ripetizione di una tragedia come quella del Novecento. Niente più confini, niente più élite, niente più caste sacerdotali, politiche, intellettuali. Uno dei concetti più cari all’uomo analogico, la verità, diventa improvvisamente sfocato, mobile, instabile. I problemi sono tradotti in partite da vincere in un gioco per adulti-bambini.”

C. Batini, S. Ceri, S. Navathe – Conceptual Database Design – Benjamin and Cummings, 1992

Sistematizza tutto ciò che c’era da dire sulla progettazione di basi di dati, concentrandosi di più sulla parte concettuale. Vi sono tanti esempi ed esercizi. 

C. Batini, M: Scannapieco – Data and Information Quality: Dimensions, Principles and Techniques, Springer Verlag 2016.

Questo libro attesta anche attraverso il numero di riferimenti (oltre 700) il grande sforzo fatto con Monica Scannapieco per sistematizzare il tema vastissimo della qualità dei dati, per i dati costituiti da relazioni, e per altre tipologie di dati quali ad esempio immagini, mappe, linked open data, testi, leggi.

C. Batini – Data Base Modeling and Design. Creative Commons licence, 2016

Libro e sui modelli per basi di dati e sulla progettazione di basi di dati, consiste nelle trascrizioni delle lezioni del corrispondente corso on line accessibile alla pagina http://elearning.unimib.it/course/view.php?id=17573

Il libro è liberamente scaricabile dalla pagina http://hdl.handle.net/10281/97114

Batini, C., Castelli, M., Comerio, M., Cremaschi, M., Iaquinta, L., Torsello, A., et al. (2015) – The Smart Methodology for the Life Cycle of Services. Creative commons Licence.

Rivisitazione del ciclo di vita dei servizi rispetto al libro Springer del 2010 (vedi più avanti), liberamente scaricabile dalla pagina http://hdl.handle.net/10281/98632

Batini, C. Le Basi dell’Informatica: concetti e metodi per usare bene i calcolatori. Roma, Editori Riuniti 1984. Fuori catalogo.

Scritto 35 anni fa, guarda ai concetti dell’Informatica, non alle tecnologie, per cui è ancora attuale. Scaricabile all’indirizzo http://hdl.handle.net/10281/ 97703

C. Batini, G. Viscusi, M. Mecella – Information Systems for eGovernment, a Quality of Service perspective –  Springer, 2010.

Centrato sul concetto di servizio, fornisce un metodo per progettare servizi digitali di qualità nella PA utilizzando le tecnologie ICT.

C. Batini – Abstractions in Computer Science and surroundingsTutorial alla Entity Relationship Conference, Haiku, Japan, 2016, accessibili alla pagina https://boa.unimib.it /preview-item/187839?queryId=mysubmissions&

Chi fosse interessato a immergersi in circa 400 astrazioni covate  nelle discipline più disparate, dal conceptual modeling, alle visualizzazioni, i sistemi formali, i modelli per processi, le mappe, i grafi, senza naufragare, è invitato a percorrere un viaggio che ho trovato straordinario.

C. Batini – Corso online su “Le basi della scienza dei dati” Federica Web Learning, 2019

Liberamente Accessibile alla pagina https://www.federica.eu:443/c/le_basi_della_scienza_dei_dati/

Chi vuole avere una panoramica generale sulla scienza dei dati, può essere interessato a frequentare questo corso on line. 

E. Bencivegna – La scomparsa del pensiero, perché non possiamo rinunciare a ragionare con la nostra testa, Feltrinelli 2017

Dalla presentazione: “un saggio schietto e tagliente che ci mette in guardia rispetto alle insidie di una mutazione antropologica che sottrae alla nostra specie la sua risorsa più preziosa: il ragionamento.”

J. Bertin – Semilogy of Graphics – Diagrams, Networks, Maps–  Esri Press 1993. 

Una vertiginosa sequenza di simbolismi usati per rappresentare la Terra e, in particolare, la Francia. La tesi di fondo del libro è: l’elaborazione dei dati comporta la menibilità, la comunicazione richiede semplificazione.

M. Boisot – Information Space, a Framework for learning in organizations, institution and culture, Rutledge 1995

Libro difficile, molto più difficile e direi dispersivo rispetto ad altri lavori in cui Boisot ha affascinato con il suo I-Space, lo spazio della informazione, le cui coordinate sono l’astrazione, la codifica, la scarsità, dimensioni che definiscono lo scambio di artefatti tra organizzazioni e quindi le basi della economia di mercato. La intuizione che la astrazione possa essere una fondamentale dimensione economica, con la sua capacità di far comunicare efficientemente gli umani negli scambi economici mi ha profondamente colpito. 

P. Domingos – The Master Algorithm, how the quest for the ultimate learning machine will remake our world  – Basic Books, 2018.

Un libro ricchissimo di esempi di tecniche di machine learning (“if the data-ism is today’s philosophy, this book will be its bible”). Il libro compie un viaggio partendo dal principio di induzione, commentando la regola di Bayes, e discutendo la rivoluzione insita negli algortimi che si costruiscono da soli. Avendo come obiettivo ultimo il Master Algorithm, capace di scoprire ogni forma di conoscenza dai dati, e di scoprire dai dati ogni cosa ancor prima che noi la chiediamo. 

G. da Empoli – Gli ingegneri del caos, teoria e tecnica dell’internazionale populista, Marsilio Nodi, 2019 

Analizza il nuovo populismo alla luce dei cambiamenti che l’analisi dei Big Data ha provocato nel messaggio politico, e il ruolo che gli ingegneri e gli spin doctors stanno svolgendo per spingere questo cambamento. 

W. Davies – Stati Nervosi – Come l’emotività ha conquistato il mondo, Einaudi, 2019

Libro molto interessante, con una a traduzione approssimativa che talvolta infastidisce, sugli strumenti culturali e il pensiero che nella storia hanno influito sulla pace e sulla guerra, sulla relazione tra elite e popolo, tra esperienza e ignoranza, tra razionalità ed emotività, con alcune idee che ho trovato nuove sul declino dei numeri e della statistica a favore degli elementi soggettivi ed emotivi nella formazione del consenso.

B. Duffy – I rischi della percezione: perché ci sbagliamo su quasi tutto, Einaudi 2019. 

Dalla presentazione: “Bobby Duffy, basandosi su una ricerca esclusiva condotta da Ipsos su quaranta Paesi, ci spiega perché non conosciamo i fatti fondamentali relativi al mondo che ci circonda. Il ventaglio di temi trattati è eccezionalmente ampio e restituisce una panoramica unica sulle aspettative che la popolazione del mondo ha della realtà statistica. L’esito, lampante e sconvolgente, è che a prescindere da età, livello di istruzione e ceto sociale sviluppiamo tutti una visione distorta di pressoché ogni aspetto della realtà. Duffy si chiede perché e, svincolando il concetto di «ignoranza» dalla sua accezione negativa, esamina come pensiamo e cosa ci viene detto per produrre questi risultati fittizi.”

U. Eco – Sulle spalle dei giganti – La nave di Teseo, 2017. 

Sono le conferenze che Eco teneva alla Milanesiana, segnalato qui per il saggio su “Dire il falso, mentire, falsificare” che ricorda la dedica a Eco di A.M. Lorusso nel libro La postverità: Per Umberto, che mi ha insegnato a ragionare sul falso molto più che a credere il vero.

V. Eubanks – Automating inequality – How High Tech tools profile, police, and punish the poor – St Martin’s Press 2017. 

Virginia Eubanks si basa su studi di caso, nei quali riscopre la tesi di fondo alla base del libro: l’automazione aumenta le differenze tra ricchi e poveri, e lo fa in modo opaco e quindi molto più difficilmente opponibile.

M. Ferraris – Postverità e altri enigmi, Il Mulino, 2017

Dalla presentazione “L’ideologia che anima la postverità è l’atomismo di milioni di persone convinte di avere ragione non insieme (come credevano, sbagliando, le chiese ideologiche del secolo scorso) ma da sole. 

L. Floridi – La quarta rivoluzione. Come l’infosfera sta trasformando il mondo, Raffaello Cortina, 2017.

Dalla presentazione del libro “Luciano Floridi sostiene che gli sviluppi nel campo delle tecnologie dell’informazione e della comunicazione stiano modificando le risposte a domande così fondamentali. I confini tra la vita online e quella offline tendono a sparire e siamo ormai connessi gli uni con gli altri senza soluzione di continuità, diventando progressivamente parte integrante di un’ “infosfera” globale. In ogni campo della vita, le tecnologie della comunica-zione sono diventate forze che strutturano l’ambiente in cui viviamo, creando e trasformando la realtà. Saremo in grado di raccoglierne i frutti? Quali, invece, i rischi impliciti? Floridi suggerisce che dovremmo sviluppare un approccio in grado di rendere conto sia delle realtà naturali sia di quelle artificiali, in modo da affrontare con successo le sfide poste dalle tecnologie correnti e dalle attuali società dell’informazione.”

C. Guzzanti – Aborigeno, vedi https://www.youtube.com/watch?v=l-qD_3o_obg

Guzzanti sintetizza problematiche complesse con un monologo di 15 secondi; un genio.

Y. N. Harari – 21 Lezioni per il XXI secolo – Saggi Bompiani 2018 

Libro definibile come tecno ottimista, in cui si affrontano in maniera eccentrica e originale e con scrittura molto scorrevole un vasto insieme di questioni, dai migranti, alle fake news, ai cambiamenti climatici, al terrorismo, al ruolo dei modelli predittivi, ecc. Nella seconda di copertina, e all’inizio del libro si afferma che in un mondo inondato da informazioni irrilevanti, la lucidità è potere. E conclude: se questo libro servirà ad aggiungere al dibattito sul futuro della nostra specie anche solo un numero ristretto di persone, allora avrà raggiunto il suo scopo. 

Peccato che un sito russo, the Insider, abbia scoperto che nell’edizione russa di 21 lezioni per il XXI secolo, alcune parti siano state cambiate per sostituire o rimuovere i passaggi critici verso il governo del presidente Vladimir Putin. In un passaggio della versione inglese e internazionale, Harari parla di post-verità facendo riferimento alla propaganda russa sull’Ucraina, e scrivendo che quando Putin smentiva che ci fossero truppe russe in Ucraina, definendole formazioni filorusse autonome, «sapeva perfettamente di mentire». Nella versione russa, per parlare del tema Harari cita invece il presidente statunitense Donald Trump, citando un conteggio delle sue bugie fatto dal Washington Post. I rappresentanti di Harari hanno risposto con una lettera a Newsweek in cui hanno spiegato che la preoccupazione principale dell’autore è «permettere che le idee centrali del libro, sulle minacce rappresentate dalle dittature, dagli estremismi e dall’intolleranza, raggiungano pubblici diversi». “Alla faccia” del numero ristretto di persone.

J. Haskel e S. Westlake – Capitalismo senza capitale, l’ascesa dell’economia intangibile, Franco Angeli 2018. 

Libro dedicato alla economia intangibile, quella dei servizi basati sui dati digitali, sulle sue leggi originali rispetto alla economia classica, e sulle possibili conseguenze in termini di distribuzione della ricchezza e diseguaglianze sociali. 

M. Karutani – La Morte della Verità, la menzogna nell’era di  Trump, Solferino 2018 

Riflessioni sul concetto di verità e post-verità della critica letteraria del New York Times. Con un percorso di analisi storica che include il relativismo, il decostruzionismo, il culto narcisistico del sé, la riscrittura narcisistica della storia, il discredito della scienza.

 J. Posetti and Alice Matthews – A short guide to the history of ’fake news’ and disinformation,  International Center for Journalism, https://www.icfj.org/news/short-guide-history-fake-news-and-disinformation-new-icfj-learning-module , 2018.

J. Lanier – Ten Arguments for Deleting your Social Media Accounts Right Now, The Bodely Head, London 2018.

La tesi del libro è che se vogliamo una vita più felice, un mondo più pacifico e meno nervoso o semplicemente la possibilità di ragionare da soli senza essere influenzati dalle corporazioni più ricche della storia umana, allora la cosa migliore che possiamo fare è cancellare il nostro account dalle reti sociali. 

A.M. Lorusso – Postverità – Edizioni Laterza, 2018

Il libro e’ una analisi nell’ambito della filosofia del linguaggio del concetto di postverità. Oggi “realtà e finzione si sono intrecciate in una logica culturale che premia le emozioni e le identificazioni, non la messa alla prova e le competenze. “

V. Mayer-Schonberger e K. Cukier – Big Data, a Revolution that will transform how we Live, Work and Think – John Murray 2013. 

Bellissimo libro sui Big Data e sulle conseguenze del proliferare dei dati digitali sulle scienze, sulle tecnologie e sulla nostra vita: intelligente e informativo.

V. Mayer-Schonberger e T. Ramge – Reinventing capitalism in the Age of Big Data – Basic Books, 2018.

E’ il manifesto del data capitalism. Mentre il capitalismo classico usa i prezzi come espressione del valore d’uso di beni e servizi, i dati che noi generiamo e che sono utilizzati dai fornitori per capire e condizionare le nostre intenzioni di acquisto permettono di collegare acquirenti e venditori in modo più efficiente, riducono i costi di ingresso nella creazione della impresa, e allo stesso tempo aumentano i rischi di monopolio, in ogni caso cambiano radicalmente la economia.

M. Monmonnier – How to Lie with Maps, The Uiversity of Chicago Press – 1991 

Questo saggio piacevole da leggere sull’uso e l’abuso delle mappe ci insegna come consi-derare criticamente le mappe e promuove un sano scetticismo su questi modelli della realtà così facili da manipolare. 

K. Murphy – Machiine Learning: a probabilistic perspective – The MIT Press, 2012. 

Con le sue oltre mille pagine e I suoi circa milleduecento riferimenti è la Bibbia del Machine learning. Libro difficile, per esperti. 

T. Munzner – Visualization Analysis & Design, CRC Press, 2015

Il  libro più completo e chiaro su tutti I temi della visualizzazione.

D. Norman – La Caffettiera del Masochista – il Design degli oggetti quotidiani – Giunti 2014. 

L’interfaccia uomo macchina è componente fondamentale della rivoluzione digitale, perché per poter usare le macchine dobbiamo essere in grado di comunicare con loro. Quante volte ci arrendiamo difronte a oggetti che non siamo in grado di maneggiare, oppure di fronte a un messaggio inviatoci da una app? La visione di Norman è che spesso ci troviamo di fronte a interfacce mal progettate. 

T. Nichols – The Death of Expertise, the Capaign against Esta blished Knowledge and Why it Matters, Oxford University Press 2017.

Grazie alla innovazione tecnologica e allo sviluppo del Web e dei motori di ricerca, oggi ognuno di noi conosce, o crede di conoscere, ogni aspetto della realtà e della scienza. Tutte le opinioni, anche le più ridicole, hanno pari dignità sul Web, e ogni tentativo di riflessione è bollato come elitismo antidemocratico. Tom Nichols analizza il fenomeno della morte della competenza.

C. O’Neill – Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy

Libro provocatorio e ripetitivo, ma con punti di vista molto originali sul tema della diseguaglianza indotta dal fenomeno dei big data digitali. Una per tutte, l’affermazione per cui in un mondo massificato dalle procedure automatizzate, gli unici che continueranno a interagire con quella risorsa preziosa che sono i formatori umani saranno i figli dei ricchi. 

J. Pearl e D. Mc Kenzie – The book of Why, the new Scence of Cause and Effect, Allen Lane 2018.

Libro fondamentale, per comprendere il grande salto di paradigma tra le vecchie tecniche per l’analisi dei dati e l’innovazione introdotta dal machine learning, per comprendere i limiti intrinseci che riguardano l’osservare i dati, cioè il passato, rispetto alle tecniche che realmente possono portare le macchine a diventare autonome, e il grande salto che interviene nel passare dal cosa al perché. L’ultimo capitolo e’ quanto di più profondo ci sia sul libero arbitrio, sull’etica e sulla posibilità per le macchie di imitare il pensiero umano.

N. Polson and J. Scott – AIQ: How Artificial Intelligence works and how we can harness its power for a better world.  Penguin Random House, 2018.

Bellissimo libro, che parte con una premessa: se vogliamo comprendere il mondo moderno e dove ci sta portando, dobbiamo conoscere un po’ del linguaggio matematico “parlato” dalle macchine intelligenti. Questo linguaggio è raccontato nel libro attraverso storie piuttosto che attraverso formalismi. Da Isacco Newton a Florence Nightingale queste storie parlano di dati, probabilità e migliori strumenti per ragionare, che nella nostra epoca vengono ora rivisitati e applicati ai big data e alle macchine intelligenti.  Il lettore è portato per mano, avvertito e incoraggiato nei momenti impervi, premiato quando si raggiunge la meta. 

S. Quintarelli – Capitalismo immateriale, le tecnologie digitali e il nuovo conflitto sociale, Bollati Boringhieri, 2019.

Siamo pronti a gestire le conseguenze dell’immane scossone che la Rivoluzione Digitale sta provocando? Il libro aiuta a capire il nuovo ambente digitale (quello che Baricco chiama l’oltremondo e Floridi la infosfera) in cui stiamo vivendo, secondo la nuova prospettiva economica dei beni immateriali, occupata ormai sena confini e limiti dai dati digitali.

J. Rifkin – The zero marginal cost society, Palgrave MacMillan 2014.

Rifkin analizza la grande trasformazione che le tecnologie digitali e l’Internet delle cose stanno apportando alla società e alla economia, riducendo i costi di produzione e di distribuzione che per i dati digitali e i servizi ad essi collegati sono “zero-marginal cost”. L’economia si sta trasformando in un mercato ibrido che vede convivere il mercato capitalistico con una nuova economia dei beni comuni.

H. Rosling – Factfullness, the Reasons we’re wrong sbout the world – snf Why Things sre better than you think. 

Il progresso umano è osservato con ottimismo da Rosling, e i suoi occhiali per vedere e analizzare in maniera chiara la realtà è la statistica descrittiva, usando la quale combatte molte idee preconcette e pessimistiche sul mondo.

A. Rusbridger – Breaking News: The Remaking of Journalism and Why It Matters Now, Casnongate 2018.

La storia del Guardian raccontata da un suo Direttore, dai tempi in cui per fare una edizione, il giornale doveva passare per 30 mani, all’epoca di Twitter e delle fake news, che sono molto più economiche da pubblicare di una notizia verificata, con alcune proposte per non far morire i giornali. Un libro splendido.

D. Rushkoff – Team human, W. Norton & Company, 2019 

Il libro analizza con enfasi e talvolta moralismo il ruolo degli esseri umani come creature sociali, in contrasto alla atomizzazione  e radicalizzazione che il Web provoca nelle relazioni sociali

E. Sadin – La siliconizzazione del mondo, l’irresistibile espansione del liberismo digitale, Einaudi 2018. 

L. Saitta e J.D Zucker – Abstraction in Artificial Intelligence and Complex Systems, Springer Verlag 2015

Dalla presentazione: “Abstraction is a fundamental mechanism underlying both human and artificial perception, representation of knowledge, reasoning and learning. This mechanism plays a crucial role in many disciplines, notably Computer Programming, Natural and Artificial Vision, Complex Systems, Artificial Intelligence and Machine Learning, Art, and Cognitive Sciences. This book first provides the reader with an overview of the notions of abstraction proposed in various disciplines by comparing both commonalities and differences. After discussing the characterizing properties of abstraction, a formal model, the KRA model, is presented to capture them.”

C. Shapiro e H. Varian – Information Rules, a Strategic Guide to Network Economy, Harvard Business review Press, 1999.

Dalla presentazione: “la Sylicon Valley è oggi il luogo di una frenesia innovatrice che intende ridefinire ogn iaspetto della nostra esistenza per fini privti, diciharando tutta via di agire per il bene della umanità. Ma la Sylicon Valley non è solo un territorio; è oggi soprattutto una mentalità, che sta muovendosi per colonizzare il mondo.”

Una guida alle leggi della economia digitale, scritta da due professori che hanno fatto ricerca e consulenza sull’argomento da tempo; tratta su come investire negli information asset nell’epoca delle reti. 

R. Staglianò – Lavoretti, così la Sharing Economy ci rende tutti più poveri, Einaudi 2018

Scritto con stile giornalistico, si legge bene; con una miriade di esempi fa vedere come l’economia della condivisione creata dalla diffusione di reti di dati digitali e servizi tenda a far scomparire molti lavori, creandone altri che spesso sono però molto più parcellizzati e sottopagati, concentrando immensi capitali nelle mani di pochi come mai si era visto nel passato.

M. Thompson – What’s gone wrong with the language of politics? – St. Martin’s Press, 2016. 

Il linguaggio politico è profondamente cambiato, e non solo per twitter e you tube. Il messaggio svalutativo di Sarah Palin sul “Death Panel” che sarebbe stato contenuto nella riforma della sanità di Obama, fu diffuso attraverso la televisione. La tesi dell’autore è che la crisi della politica è soprattutto una crisi d linguaggio. 

E. Tufte – The Visual Display of Quantitative information, Graphic Press, 2001.

Straordinaria sequenza di visualizzazioni efficaci e banali, veriteire e mentitrici, con una teoria dei grafici sui dati che parte dall’inchiostro e arriva alla estetica nel disegno dei grafi. 

S. Vaidhyanathan – Anti-social media, How Facebook Disconnects Us and Undermines Democracy, Oxdord University Press, 2018.

Critica feroce a Facebook, analizza come la rete sociale è evoluta da un innocente sito sociale creato da student di Harvard in una froza che, se può rendere la vita personale più piacevole, rende la salute della democrazia più incerta e sfidante da mantenere.  

J. Wajcman – Pressed for Time, the acceleration of time in digital capitalism, the University of Chicago Press, 2015. 

E’ una approfondita analisi sul ruolo del tempo, della accelerazione del tempo che stiamo vivendo nella era digitale, del paradosso per cui più usiamo efficientemente il tempo, e più il tempo ci manca.

M. Wolfe – Reader, Come Home – Harper Collins, 2018 

Il libro parla di scienze cognitive applicate alla lettura dei libri, nell’epoca del libro virtuale e dell’ eBook. Nell’epoca della nostra immersione totale nel Web e del nostro affidarsi orami totale agli strumenti digitali, il nostro modo di elaborare il linguaggio scritto sta cambiando radicalmente. Il libro cerca di rispondere ad alcune domande cruciali: riusciremo in futuro a sviluppare processi cognitivi sul pensiero critico, la riflessione, l’empatia? La domanda di at-tenzione continua insita negli apparati digitali, e l’accesso a immense quantità di informazione avrà impatto sulla nostra capacità di fare analogie, costruire inferenze, arrivare a valutazioni indipendenti? Diventeremo più sensibili e autonomi nell’affrontare la minaccia delle fake news e della demagogia, e, in questo senso, che ne sarà della democrazia?