Giuffré Editore

L’atto notarile ed i big data: il valore dell’informazione dalla pubblica fede, ai dati statistici fino agli “oracoli” per gli smart contract


di Gea Arcella

Notaio in Tavagnacco


Quotidianamente siamo immersi un mare di informazioni e noi stessi ne produciamo continuamente, il nostro essere interconnessi, l’utilizzo continuo degli strumenti informatici ha reso tutto questo materiale sempre più trattabile per i fini più disparati e noi stessi non sempre governiamo la mole di dati che vengono estratti dalle nostre interazioni informatiche.

Le foto, i post, le email, la musica che ascoltiamo, i nostri commenti, uniti a dati di geolocalizzazione, le nostre ricerche sono diventate il nuovo petrolio del terzo millennio: dati che analizzati produco altri dati e consentono profilazioni dei comportamenti ed analisi di mercato sempre più penetranti: in una parola “i big data”.


I big data[1]: cosa sono 

Big data è il termine usato per descrivere una raccolta di dati così estesa in termini di volume, velocità e varietà da richiedere tecnologie e metodi analitici specifici per l'estrazione da essi di valore in termini informativi.

Il progressivo aumento della dimensione dei dataset è legato alla necessità di analizzare un unico insieme di dati, al fine di ricavarne informazioni aggiuntive rispetto a quelle che si potrebbero ottenere analizzando dei data base parziali e separati, anche se cumulativamente contenenti la stessa quantità totale di dati. 

Un esempio possono essere le analisi per sondare gli "umori" dei mercati e del commercio, che richiedono l’individuazione delle tendenze della società in un determinato momento storico, le quali possono essere enucleate attraverso l’analisi e l’incrocio delle informazioni più disparate che viaggiano e transitano attraverso Internet: come quelle ricavate dai social network, dagli acquisti on line, dalla visita ai siti internet, dai download effettuati o dai video visualizzati, oltre che da quelle presenti nelle banche dati accessibili al pubblico o fornite a pagamento.

I big data rappresentano l'interrelazione di dati provenienti potenzialmente da fonti eterogenee: non soltanto, quindi, dati strutturati secondo schemi e tabelle rigide[2], ma anche non strutturati, conservati senza alcuno schema[3], come immagini, email, file multimediali, dati di geolocalizzazione o geo-referenziati informazioni prese dai social network ecc.[4] 

La mole delle informazioni costituenti i big data è dell'ordine degli Zettabyte, ovvero miliardi di Terabyte: pertanto per la loro analisi è necessaria una potenza di calcolo parallelo e massivo enorme, sviluppata con strumenti dedicati che vanno “eseguiti” su decine, centinaia o anche migliaia di server contemporaneamente.


Caratteristiche

Le principali caratteristiche dei big data sono le seguenti:

Volume: rappresenta la dimensione effettiva del dataset; astrattamente la quantità di dati che è possibile raccogliere potrebbe apparentemente rappresentare un problema: in realtà il cloud e virtualizzazione delle apparecchiature consentono la gestione della grande quantità di dati disponibili, semplificando i loro processi di raccolta, immagazzinamento e accesso.

Velocità: si riferisce alla velocità con cui vengono generati ed analizzati i dati; infatti le analisi dei dati vengono effettuate in tempo reale o quasi affinché risultino tempestive.

Varietà: concerne le varie tipologie di dati, provenienti da fonti diverse (strutturate e non).

Veridicità: fa riferimento all'attendibilità dell'informazione.


Modalità di analisi e differenze dalla business intelligence:

L’aver individuato delle caratteristiche distintive autonome dei big data, oltre a far emergere una definizione autonoma degli stessi, consente di differenziarli dalla business intelligence[5] sia in relazione alla loro tipologia che alle modalità di analisi:

  • la business intelligence utilizza la statistica descrittiva applicata a dati ad alta densità di informazione per misurare cose, rilevare tendenze, ecc., cioè utilizza dataset limitati, dati puliti, omogenei e modelli semplici;
  • l’analisi dei big data utilizza la statistica inferenziale e concetti di identificazione di sistemi non lineari, per dedurre leggi (regressioni, relazioni non lineari, ed effetti causali) da grandi insiemi di dati e per rivelare i rapporti, le dipendenze, e effettuare previsioni di risultati e comportamenti, utilizza dataset eterogenei (non correlati tra loro), dati raw (grezzi, privi di metadati, come quelli provenienti da download non completati) e modelli predittivi complessi. 


Differenze dagli open data

Totalmente differente la definizione di open data: «un contenuto o un dato si definisce aperto se chiunque è in grado di utilizzarlo, ri-utilizzarlo e ridistribuirlo, soggetto, al massimo, alla richiesta di attribuzione e condivisione allo stesso modo».

Il concetto di open data nasce nell’ambito delle teorie statunitensi sull’Open Government, quale mezzo per assicurare trasparenza, conoscibilità ed controllo da parte dei cittadini sull’agire amministrativo.

La partecipazione, infatti, ha come presupposto necessario la conoscenza e questa può essere assicurata attraverso gli open data.

In concreto gli open data vengono individuati nelle seguenti tipologie: dati cartografici, genetici, chimici, matematici e scientifici (incluse le relative formule), dati medici e delle bioscienze, dati anagrafici, dati governativi, ecc.

Anch’essi hanno alcune caratteristiche distintive che ne consentono la loro individuazione sotto i seguenti profili:

Fonte: dati e informazioni della pubblica amministrazione utilizzati per la gestione dei processi relativi all’assolvimento dei suoi compiti istituzionali e di servizio.

Valore: mettere il cittadino nelle condizioni di disporre degli strumenti conoscitivi indispensabili per poter prendere decisioni o comunque valutare le decisioni prese dall’Amministrazione.

Veridicità: informazioni attendibili perché validate in ambito pubblico.

Utilizzabilità: i dati devono essere forniti a condizioni tali da permetterne il riutilizzo e la ridistribuzione; ciò comprende la possibilità di combinarli con altre basi di dati; tutti devono essere in grado di usare, riutilizzare e ridistribuire i dati, nessuna restrizione né commerciale né legata a fini determinati è ammessa.

Sicuramente gli open data sono un sotto-insieme dei big data, ma profondamente diverse sono le finalità e gli utilizzi che caratterizzano queste due grandi categorizzazioni dei dati:

  • i big data vengono raccolti anche l’insaputa dell’interessato a fini di profilatura dei gusti e delle tendenze dei cittadini e vengono utilizzati a fini privatistici e di analisi del mercato, non vengono condivisi
  • gli open data sono dati pubblici, raccolti nell’ambito dell’azione delle P.A., o sono comunque patrimonio comune in quanto provenienti dalle scienze, essi devono essere disponibili, riutilizzabili, e vengono messi a disposizione della comunità per incentivare la partecipazione alla gestione della cosa pubblica. 


Il valore dell’informazione pubblica

Continuamente, attraverso il big data, cediamo pezzi della nostra personalità consentendo alle aziende di capire le nostre tendenze i nostri gusti semplicemente navigando in Internet o utilizzando gli strumenti social senza troppa consapevolezza.

La pervasività di queste analisi ha portato l’Agcom, l’Antitrust e il Garante privacy a dare il via via a un'indagine congiunta sui big data[6]

Concorrenza, libertà di informazione e protezione della vita privata sono i grandi temi sotto la lente delle tre Autorità di garanzia.

Eppure come singoli spesso viviamo dei paradossi: il miraggio di qualcosa di gratuito ci porta a consentire continue invasioni nella nostra sfera privata, mentre siamo talvolta insofferenti verso l'informazione pubblica, intesa come quel complesso di informazioni presenti nei registri di pubblicità legale.

Recentemente della Corte di giustizia dell’Unione europea, con la sentenza del 9 marzo 2017, relativa alla causa C-398/15, ha ribadito il valore dell’informazione pubblica in relazione alla richiesta di un soggetto che chiedeva l'oscuramento di alcuni suoi dati personali collegati al fallimento di una società (tecnicamente chiedeva il diritto all’oblio) affermando che la pubblicità del Registro delle imprese ricopre una funzione pubblica essenziale, in quanto garantisce la certezza del diritto nelle relazioni tra le società e i terzi e tutela gli interessi di questi ultimi rispetto alle società di capitali, dal momento che queste offrono come unica garanzia per i terzi il proprio patrimonio sociale; per garantire il soddisfacimento di tali finalità, la pubblicità legale deve consentire ai terzi di conoscere: a) gli atti essenziali della società interessata, b) determinate informazioni che la concernono e c) le generalità delle persone che hanno il potere di obbligarla.

Il principio di diritto espresso dalla Corte europea è particolarmente importante per la salvaguardia della completezza ed esaustività dei pubblici registri: l’aver ribadito che esistono delle esigenze superiori rispetto agli interessi dei singoli, che permangono nonostante il decorso del tempo, significa che la pubblica fede, connessa a prerogative statuali, è riconosciuta come un valore preminente anche sul diritto alla riservatezza. La sentenza nella causa C-398/15 costituisce un argine anche a tutte quelle richieste, rivolte al Garante italiano, finalizzate all’oscuramento di taluni dati nei Registri immobiliari solo perché connessi a trascrizioni pregiudizievoli, poi cancellate[7].

Giustamente diverso l’approccio della Corte di giustizia - con la nota sentenza c.d. Google Spain - rispetto ai grandi provider privati che dei dati personali fanno commercio anche con finalità non del tutto trasparenti e qualche volta lesive dell’identità personale, che non giustificano la permanenza dell’informazione senza limiti di tempo; da questo punto di vista è molto significativa l’affermazione della Corte, contenuta al punto 31 della sentenza citata, che precisa come il procedimento principale e le questioni pregiudiziali si riferiscono al trattamento dei dati effettuato in ambito pubblico (per l'esattezza dal Registro del imprese) e non a quello effettuato dalle società di rating di cui al punto 25 della sentenza, facendo così intendere come resti nettamente distinto il ruolo del registro pubblico da quello dell’operatore privato, che pure di quelle informazioni si avvale. 


I dati statistici del Notariato

Il valore dell'informazione pubblica è legato strettamente ai soggetti che possono fornirla ed elaborala. Lo stesso concetto di registro pubblico richiama la necessità che l’immissione del dato sia appannaggio di soggetti qualificati che assumo la responsabilità della loro consistenza e veridicità.

Nei sistemi di civil law questo ruolo è affidato prevalentemente ai notai ed ai giudici e l’atto autentico, come la sentenza, sono il veicolo privilegiato per l'immissione dei dati nel registro.

Il Notariato è quindi un grandissimo fornitore di open data: tutti i principali registri pubblici, che riguardano le attività private (da quelli immobiliari a quelli delle imprese, dal Registro delle successioni al Registro generale testamenti, dall’anagrafe allo Stato civile) sono alimentati dagli atti notarili.

Fin ora, però, il Notariato non ha hai interrogato se stesso né ha usato questi dati per conoscersi e far conoscere meglio chi utilizza il ministero notarile. Per la prima volta, proprio a partire dalle informazioni che quotidianamente forniamo alla P.A., in formato strutturato ed aperto (xml) è stato costruito un data base per raccontare il lavoro dei notai e le storie degli italiani, rispettoso della privacy degli operatori e dei cittadini perché totalmente anonimo: sono stati così analizzati l’acquisto della casa, i mutui, le donazioni, la costituzione e lo scioglimento dell’impresa individuale e di quella collettiva, i valori economici delle transazioni che passano negli studi notarli.

Una fotografia originale che parte dalle transazioni dei privati per descrivere il Paese, non solo dal punto di vista economico ma anche da quello sociologico, con correttezza e veridicità.


Gli smart contract e gli oracoli

Se l'informazione pubblica è un valore in se, se chiunque analizzi e raccolga dati si pone il problema della veridicità degli stessi, anche quando si tratta di profilare i gusti delle persone, il dato pubblico o meglio validato da un notaio può avere un ulteriore utilizzo rispetto a quello pubblicistico.

Quando parliamo di smart contract spesso siamo tratti in inganno: diversamente da quanto si pensa, non bisogna confonderli con i contratti standardizzati o con i modelli compilabili, anche mediante operazioni semi automatiche, che non sono altro che l’evoluzione moderna dei moduli e formulari da sempre utilizzati nella contrattazione privata; la nozione di smart contract è al contempo molto più complessa ma anche attualmente molto più semplice[8].

Essi sono contratti tradotti in codice[9] che si auto-eseguono e applicano in automatico le proprie clausole, cioè sono contratti in grado di entrare in esecuzione e fare rispettare le proprie pattuizioni senza alcun intervento esterno ma, a differenza dei contratti tradizionali, sono scritti in un linguaggio eseguibile da un computer.

Poiché l’esecuzione di un programma per computer è deterministica, una volta che un contratto è diventato uno smart contract e i contraenti concordano nell’accettarne le clausole, gli effetti non sono più legati alla loro volontà.

Affinché il tutto funzioni, sono necessarie delle garanzie: che il codice non venga modificato, che i messaggi provengano da chi deve inviarli (per esempio, la banca che non ha ricevuto il pagamento della rata dell’auto), che l’esecuzione non venga disabilitata. In altri termini deve esistere un meccanismo che garantisca la fiducia che i contraenti pongono nello smart contract.

Tradizionalmente la fiducia nell’efficacia di un contratto viene garantita da una terza parte, da un intermediario che si pone tra i contraenti e che naturalmente viene retribuito per i suoi servizi. Anche lo smart contract ha bisogno di una tale intervento fiduciario, in particolare, come vedremo, in relazione all’affidabilità delle informazioni sulle quali l’esecuzione deterministica dello stesso si fonda.

Gli smart contract, nonostante ciò che si potrebbe pensare, attualmente sono molto poco “smart[10] possono solo fare calcoli di base, come addizione, sottrazione e divisione, non sono capaci di processare grandi quantità di informazioni, veicolano, pertanto, solo informazioni essenziali e di fatto vengo utilizzati per spostare le criptovalute da un contraente all’altro al verificarsi di determinate condizioni.

Gli smart contract non dicono nulla del rapporto sottostante: sono acausali; non attestano né la validità/efficacia di tale rapporto, la titolarità del diritto, o la legittimazione a disporne né, infine, le regole del rapporto causale; tutto ciò unito alla loro deterministica esecuzione li fa molto assomigliare ad un titolo di credito.

Difatti, le analogie tra uno smart contract ed un titolo di credito “in senso stretto” sono molte.

I titoli di credito sono «documenti destinati alla circolazione che attribuiscono ad un determinato soggetto il diritto ad una certa prestazione, che può consistere nel pagamento di una somma di denaro o nella consegna di beni determinati»: il documento incorpora il diritto alla prestazione indicata nel titolo stesso, cui è associato l'ordine di eseguire tale prestazione (per l'assegno «la promessa incondizionata della banca emittente di pagare a vista una somma determinata»).

Se torniamo alla definizione sopra riportata di smart contract, cioè «protocolli informatici che sono in grado di entrare in esecuzione e fare rispettare le proprie clausole senza alcun intervento esterno» e coniughiamo i termini giuridici con quelli informatici, troviamo che le due definizioni non sono molto diverse tra loro.

Dal 1991 ed ancor più dal 2006, i mezzi di pagamento sono indissolubilmente collegati all'atto notarile: ormai è rarissimo il caso in cui (tra normativa fiscale e/o antiriciclaggio) non si faccia menzione del mezzo di pagamento quale modalità di adempimento delle obbligazioni pecuniarie oggetto delle convenzioni riportate nel rogito.

Ovviamente, dal solo titolo di credito non si possono avere informazioni:

- sulla connessione che generalmente vi è tra il rapporto causale dal quale nasce l'obbligazione da adempiere e il diritto incorporato nel titolo a vedere tale obbligazione adempiuta: dall'assegno non rilevabile se alla base dello spostamento patrimoniale vi sia un mutuo, una compravendita, una donazione o la ripetizione di un indebito;

- sulla validità/efficacia di tale rapporto: il rapporto causale di cui sopra potrebbe essere integralmente viziato, come potrebbe essere viziata anche una sola clausola di tale rapporto, senza ripercussioni sulla validità del rapporto stesso;

- sugli eventuali problemi legati al collegamento esistente tra chi ha la titolarità del diritto, che spetta al proprietario del titolo, e chi è legittimato al suo esercizio ossia il possessore del titolo che lo ha ottenuto mediante le forme di circolazione previste dai diversi tipi di titolo di credito: normalmente le due figure coincidono, ma può anche capitare una loro dissociazione (anche non patologica, come per le girate in garanzia);

- sulla eventuale complessità delle regole di tale rapporto causale (si pensi alle spesso articolate clausole di garanzia di un contratto), che ben possono far riferimento a dati esterni al rapporto stesso e gestiti da terze parti, quale ad esempio la cancellazione di un gravame ipotecario.

Attualmente uno smart contract può trovare gli stessi limiti:

- come precisato sopra, un contratto medio notarile contiene una serie di informazioni di gran lunga superiore ai metadati gestibili da uno smart contract, per cui le informazioni trasmissibili sono minime (di certo non superiori a quelle riportate da un banalissimo assegno); inoltre, come abbiamo sopra ricordato, gli smart contract possono solo fare calcoli elementari e non sono attualmente capaci di eseguire complesse analisi di dati; 

- uno smart contract deve essere autoeseguibile, cioè essere in grado di entrare in esecuzione e fare rispettare le proprie clausole senza alcun intervento esterno: se le sue regole non fossero conformi all'ordinamento giuridico (si pensi all'invalidità anche di una sola clausola, se non di tutto il contratto), queste devono comunque permettere l'eseguibilità della prestazione, al pari di come potrebbe benissimo essere incassato un assegno a pagamento di una compravendita “nulla” o “simulata”! È anche vero che si possono prevedere interventi esterni, ma uno smart contract normalmente è completamente isolato, non ha accesso alla rete, ai file di sistema o altri processi, ha accesso limitato anche agli altri smart contract; inoltre inserire elementi di controllo esterni renderebbe uno “smart contract” di certo più sicuro, ma meno “smart” (intelligente) e molto più “dumb” (stupido) ovvero meno efficiente e performante;

- infine, come per tutti i meccanismi informatici problema fondamentale di qualsiasi smart contract è la prevenzione di un eventuale bug che ne mini il funzionamento una volta diffuso: non siamo molto lontani dalle problematiche connesse alla falsificazione degli assegni nel mondo cartaceo.

Ovviamente l'analisi ben potrebbe continuare su altre analogie, ma ad oggi la tecnologia disponibile sembra proprio limitare l'uso degli smart contract in ambito notarile ad un campo non molto dissimile da quello ad oggi riservato ai titoli di credito “in senso stretto”, di certo usufruibili nella struttura negoziale di un contratto notarile, ma con tutti i limiti e le necessarie cautele sopra evidenziate: di conseguenza uno smart contract non può sostituire l'atto notarile, può invece ben integrarlo in fase di pagamento/adempimento, soprattutto se agganciato al sistema Sepa.

Inoltre l’essere lo smart contract memorizzato in un data base – sia pure distribuito sul modello blockchain – ne impedisce la duplicazione rendendolo unico anche se dematerializzato, risolvendo in radice il problema della digitalizzazione di un titolo di credito come l’assegno che, senza una sua registrazione in una base dati, ne comporterebbe la duplicabilità all’infinito, con la spiacevole conseguenza di veder duplicata all’infinito ed in maniera del tutto indebita, anche l’obbligazione pecuniaria da esso rappresentata[11].

Se questi sono i possibili utilizzi di uno smart contract, può essere interessante un ribaltamento della prospettiva di analisi sugli stessi. Essi, infatti, necessitano per eseguire le loro operazioni automatiche di dati certi ed inoppugnabili su cui basare le loro “decisioni”. Ad esempio uno smart contract che svolga funzioni di assicurazione contro i ritardi nei voli ha bisogno di sapere con certezza se e di quanto un determinato volo ha ritardato per rilasciare eventualmente il pagamento. Tali dati vengono forniti ad oggi da soggetti “terzi ed imparziali” denominati “Oracoli”. 

Si apre quindi un’opportunità per il Notariato, soggetto terzo ed imparziale per definizione, e creatore di certezza e di dati certi, di essere almeno per determinate transazioni “oracolo” predefinito di smart contract.

I dati potrebbero essere eventualmente anche “letti automaticamente” dagli attuali adempimenti strutturati, oppure, in prospettiva, dai rogiti notarili, a patto di rendere gli stessi automaticamente interpretabili: in quest’ultimo caso va ricercato un punto di equilibrio tra complessità redazionale e facilità di interpretazione automatica, che inevitabilmente comporta una maggiore rigidità nella struttura contrattuale.

In ogni caso la pubblica fede non si esaurisce nel registro pubblico e l’esigenza di veridicità ed affidabilità va oltre il singolo strumento utilizzato.

[1] Fonte Wikipedia, consultabile a link: https://it.wikipedia.org/wiki/Big_data.

[2] I quali vengono analizzati secondo un modello di gestione relazionale delle informazioni.

[3] In questo caso, i sistemi di gestione di dati utilizzabili sono quelli basati sul modello dell’information retrieval.

[4] A metà tra i dati strutturati e quelli non strutturati si pongono i dati semi-strutturati: in essi si riscontrano alcune delle caratteristiche degli uni e degli altri. Un esempio di questa tipologia di organizzazione di informazioni è il file compilato con sintassi XML. Nonostante non vi siano limiti all’inserimento dei dati, le informazioni vengono, comunque, organizzate secondo logiche strutturate e interoperabili; in questo caso, i sistemi di gestione dei dati possono organizzare i documenti sia attraverso i modelli relazionali, sia attraverso modelli di information retrieval.

[5] L’espressione è stata coniata nel 1958 da Hans Peter Luhn, ricercatore e inventore tedesco, mentre stava lavorando per IBM. Essa può riferirsi ad:

  • un insieme di processi aziendali per raccogliere dati ed analizzare informazioni strategiche;
  • la tecnologia utilizzata per realizzare questi processi;
  • le informazioni ottenute come risultato di questi processi.

Costituisce un ramo della cosiddetta informatica aziendale.


[6] L’importanza dell'iniziativa risulta evidente dalle premesse alla delibera N. 217/17/CONS dell'Autorità per le garanzie nelle comunicazioni che ha dato il via all’indagine conoscitiva.

[7] Su questo argomento si veda il Provvedimento del 16 novembre 2016, consultabile sul sito del Garante Privacy al seguente indirizzo http://www.garanteprivacy.it/web/guest/home/docweb/-/docweb-display/docweb/5906795.

[8] Secondo la definizione di wikipedia gli smart contract sono «sono protocolli informatici che facilitano, verificano, o fanno rispettare, la negoziazione o l'esecuzione di un contratto, permettendo talvolta la parziale o la totale esclusione di una clausola contrattuale».

[9] Il codice, detto anche codice sorgente, o semplicemente sorgente o codice o listato, in informatica, è il testo di un algoritmo di un programma scritto in un linguaggio di programmazione, compreso all'interno di un file sorgente. Esso definisce dunque il flusso di esecuzione del programma stesso. Per estensione, l'espressione "codice sorgente" viene utilizzata anche per riferirsi a testo scritto in linguaggi informatici non di programmazione, come i linguaggi di markup (HTML, XML e via dicendo) o i linguaggi di database (es. SQL).

[10] Smart in inglese significa intelligente e spesso riferito alle cose indica la capacità che le stesse, attraverso l’informatica, incorporino facoltà di registrazione ed analisi dei dati come nel campo della Iot (Internet of things).

[11] Sia consentito su tale tematica rinviare a quanto riportato in G. ARCELLA, Copie estratti e certificati, le allegazioni all'atto notarile e la certificazione di conformità all'originale delle copie dopo il d.lgs. n. 110 del 2010, atti dei Convegni di Studio "Introduzione all'atto notarile informatico: profili sostanziali e aspetti operativi" (Milano, 28 maggio 2010) e “L'atto notarile informatico: prime riflessioni sul d.lgs. n. 110 del 2010” (Firenze, 29 ottobre 2010), 98 ss., in Quaderni della fondazione italiana del Notariato, 2011.