4° Contenuto riservato: Il knowledge graph dello Studio: oltre il RAG, verso l’ontologia della conoscenza professionale

PROFESSIONISTI E PROFESSIONE

DI GIACOMO GRECI | 10 GIUGNO 2026

Costruire un sistema RAG per interrogare l’archivio dello studio e installare modelli linguistici in locale per garantire riservatezza e indipendenza è il primo passo verso la costruzione della propria base di conoscenza. Esiste un livello successivo, ancora poco esplorato nel contesto professionale italiano, che non si limita a cercare documenti ma modella le relazioni tra le entità del mondo dello studio: clienti, società, operazioni, norme e professionisti. Si chiama knowledge graph. Questo articolo spiega di che si tratta, perché è diverso dal RAG, cosa permette di fare concretamente e come muovere i primi passi.

Il limite del RAG: trovare documenti non è comprendere relazioni

Chi ha costruito un sistema RAG sull’archivio del proprio studio (o ha iniziato a sperimentare in questa direzione) conosce bene la soddisfazione di poter porre una domanda in linguaggio naturale e ricevere una risposta fondata sui propri documenti. È un salto di produttività reale. Ma è un salto che, con l’uso, rivela i propri confini.

Il sistema RAG, per la sua natura, fa una cosa sola: cerca i frammenti di testo più pertinenti alla domanda e li presenta al modello linguistico perché ne produca una sintesi. Funziona bene quando la risposta è contenuta in uno o più documenti specifici. Funziona meno bene (e talvolta non funziona affatto) quando la risposta richiede di attraversare relazioni. Quando cioè la risposta non sta in un documento, ma nella connessione tra più documenti, più soggetti, più eventi distribuiti nel tempo.

Un esempio renderà immediato il concetto.

Si supponga di voler sapere: “Quali dei miei clienti con fatturato superiore a cinque milioni di euro hanno rapporti commerciali con società attualmente oggetto di verifica fiscale?”. In un sistema RAG, questa domanda non ha risposta, perché nessun documento singolo contiene tutte le informazioni necessarie. L’elenco dei clienti è in un posto, i fatturati sono in un altro, i rapporti commerciali sono sparsi in decine di contratti, la notizia della verifica fiscale è in una comunicazione ricevuta mesi fa.

Il RAG può trovare ciascun frammento, ma non sa collegarli. Gli manca la mappa.

Cos’è un knowledge graph: l’analogia della mappa

L’analogia più efficace per spiegare un knowledge graph è quella della cartina geografica. Si immagini di avere davanti una mappa dell’Italia. Ogni città è un punto. Tra le città corrono linee che rappresentano strade, ferrovie, rotte aeree. Ogni linea ha delle proprietà: la distanza, il tempo di percorrenza, il tipo di collegamento. La mappa non contiene i testi delle guide turistiche, per quelli serve una biblioteca. Ma permette di fare qualcosa che la biblioteca non permette: vedere le connessioni, calcolare i percorsi, individuare i nodi critici.

Un knowledge graph dello studio funziona allo stesso modo. I punti sulla mappa non sono città ma entità professionali: clienti, società, amministratori, revisori, operazioni, norme, scadenze, verbali, contratti. Le linee che li collegano non sono strade ma relazioni: il cliente Rossi è socio della società Alfa, la società Alfa è controllata dalla holding Beta, la holding Beta ha conferito un ramo d’azienda alla società Gamma nel 2023, l’operazione di conferimento è stata assistita dal notaio Rossi, sulla società Gamma pende una verifica fiscale dal 2025.

Questa rete di connessioni, una volta costruita, consente di rispondere a domande che nessun sistema documentale (per quanto sofisticato) è in grado di affrontare. Non perché l’informazione non esista, ma perché l’informazione è distribuita tra entità diverse e la risposta emerge solo dalla loro connessione.

Come funziona: nodi, relazioni, proprietà

La struttura di un knowledge graph è composta da tre elementi fondamentali che conviene fissare con precisione, perché ricorreranno in tutto il resto dell’articolo.

nodi rappresentano le entità: una persona fisica, una società, un contratto, una norma, una scadenza, un fascicolo di revisione. Ciascun nodo ha un tipo (nel gergo tecnico si chiama label): Cliente, Società, Operazione, Norma, Documento, Professionista. Il tipo determina quali proprietà il nodo possiede.

Le relazioni rappresentano i legami tra nodi: È_SOCIO_DI, CONTROLLA, HA_CONFERITO, È_ASSISTITA_DA, È_SOGGETTA_A, HA_PRODOTTO. Ogni relazione ha una direzione (da chi a chi) e può avere proprietà proprie: la data di inizio, la quota percentuale, l’importo, lo stato.

Le proprietà sono gli attributi di nodi e relazioni: il codice fiscale di un cliente, il fatturato di una società, la data di stipula di un contratto, la percentuale di una partecipazione. Sono i dati concreti che danno sostanza alla struttura.

Esempio concreto di tripletta:
Il knowledge graph dello studio potrebbe contenere la seguente catena di relazioni: [Mario Rossi] – È_SOCIO_DI → [Alfa s.r.l.] – CONTROLLATA_DA → [Beta Holding S.p.A.] – HA_CONFERITO → [Ramo aziendale produzione] – A_FAVORE_DI → [Gamma s.r.l.] – SOGGETTA_A → [Verifica fiscale 2025]. Nessun singolo documento contiene questa catena completa. Ma il knowledge graph la rende visibile e interrogabile in una sola query.

Cosa vede il knowledge graph che il RAG non vede

Per apprezzare pienamente la differenza, è utile mettere a confronto i due sistemi sulla stessa domanda.

Domanda: “Il cliente Rossi ha rapporti societari, diretti o indiretti, con società attualmente oggetto di contenzioso tributario?”

Cosa fa il RAG: cerca nell’archivio i documenti che contengono il nome “Rossi” e quelli che contengono la parola “contenzioso”. Se in qualche documento questi due concetti compaiono nella stessa pagina, il modello potrebbe riuscire a costruire una risposta. Ma se Rossi è socio di Alfa, Alfa controlla Beta, e Beta è in contenzioso, con ciascuna informazione in un documento diverso, il RAG non è in grado di seguire la catena.

Cosa fa il knowledge graph: parte dal nodo Rossi, percorre tutte le relazioni societarie in uscita (dirette e indirette, attraverso catene di controllo), verifica per ciascuna società raggiunta se esiste una relazione SOGGETTA_A con un nodo di tipo Contenzioso. La risposta arriva in millisecondi, è completa e tracciabile: Rossi → Alfa → Beta → Contenzioso tributario n. XY/2025. Ogni passaggio è documentato.

Questo esempio non è accademico. Nella pratica dello studio, le domande che richiedono di attraversare relazioni sono più frequenti di quanto si pensi: conflitti di interesse tra clienti, esposizioni incrociate in gruppi societari, ricorrenza di un medesimo consulente legale o notaio su operazioni diverse, concentrazione di rischio su un medesimo fornitore, catene di partecipazione rilevanti ai fini del consolidamento o della normativa antiriciclaggio.

RAG e knowledge graph a confronto: una tabella

Per fissare con chiarezza le differenze operative, è utile un confronto sistematico.

DimensioneSistema RAGKnowledge graphRAG + Knowledge graph
Tipo di domandaDomande il cui contenuto è in uno o più documentiDomande che richiedono di attraversare relazioni tra entitàEntrambe le tipologie
Fonte della rispostaFrammenti testuali recuperatiPercorsi nel grafo delle relazioniGrafo per la struttura, documenti per il dettaglio
Gestione catene di relazioneAssente o limitataNativa e illimitata in profonditàOttimale
Rilevamento conflitti di interesseSolo se esplicitati in un documentoAutomatico, per attraversamentoAutomatico con evidenza documentale
Complessità di costruzioneMedia (indicizzazione documenti)Elevata (modellazione entità e relazioni)Elevata
ManutenzioneAggiornamento documentiAggiornamento entità e relazioniDoppio aggiornamento coordinato
Valore nel tempoCresce con i documenti indicizzatiCresce con le relazioni modellateMassimo: effetto rete tra fonti e struttura

Nota importante: RAG e knowledge graph non sono alternativi. Sono complementari. Il RAG risponde alle domande il cui contenuto è nei documenti. Il knowledge graph risponde alle domande la cui risposta emerge dalle relazioni. Il sistema più potente per uno studio è la combinazione dei due: il grafo individua i nodi e le relazioni pertinenti, il RAG recupera i documenti di dettaglio associati a ciascun nodo, il modello linguistico produce la risposta finale integrando struttura e contenuto. Nel gergo tecnico, questa combinazione viene chiamata GraphRAG.

Cinque scenari operativi nello studio

Per rendere tangibile il valore del knowledge graph, si illustrano cinque scenari tratti dalla pratica professionale, ciascuno con un esempio di interrogazione che dimostra la differenza rispetto a un sistema puramente documentale.

Scenario 1 – Mappatura dei gruppi societari e delle catene di controllo

Ogni studio che segue clienti con strutture societarie articolate affronta periodicamente l’esigenza di ricostruire la catena di partecipazione: chi controlla chi, con quale quota, da quale data, attraverso quali veicoli. In un sistema tradizionale, questa ricostruzione richiede l’apertura di molteplici fascicoli, visure camerali, atti costitutivi, verbali. Nel knowledge graph, la struttura è già modellata e interrogabile.

Esempio di interrogazione – Catena di controllo
“Mostra la catena completa di partecipazioni dirette e indirette del cliente Mario Rossi, includendo per ciascun collegamento: società partecipata, quota percentuale, data di acquisizione, ruolo eventuale del cliente nell’organo amministrativo. Evidenzia le società in cui la partecipazione complessiva (diretta + indiretta) supera il 25 per cento, soglia rilevante ai fini della normativa antiriciclaggio.”

Scenario 2 – Rilevamento automatico dei conflitti di interesse

Uno studio che segue numerosi clienti può trovarsi, senza saperlo, ad assistere soggetti con interessi contrapposti: un fornitore e il suo debitore, due società in contenzioso tra loro, un acquirente e il venditore della medesima azienda. Il knowledge graph, modellando le relazioni tra tutti i soggetti, consente di rilevare automaticamente queste sovrapposizioni prima che diventino un problema deontologico.

Esempio di interrogazione – Conflitti di interesse
“Verifica se tra i clienti attualmente in carico allo studio esistono relazioni di: (1) controparte contrattuale diretta, (2) contenzioso pendente reciproco, (3) rapporto debitorio/creditorio superiore a 100.000 euro, (4) concorrenza diretta nel medesimo mercato di riferimento. Per ciascun caso individuato, restituisci: i due soggetti coinvolti, la natura della relazione, il professionista dello studio responsabile di ciascuno dei due fascicoli e la data in cui la relazione è stata rilevata per la prima volta.”

Scenario 3 – Antiriciclaggio: adeguata verifica rafforzata

La normativa antiriciclaggio richiede al professionista di identificare il titolare effettivo e di valutare il profilo di rischio del cliente, tenendo conto delle strutture societarie, delle operazioni sospette, dei Paesi coinvolti. Queste informazioni sono tipicamente distribuite in fascicoli diversi, comunicazioni ricevute in tempi diversi, visure aggiornate con frequenze diverse. Il knowledge graph le riunisce in una struttura navigabile.

Esempio di interrogazione – Profilo antiriciclaggio
“Per il cliente [NOME], ricostruisci il profilo antiriciclaggio completo: (1) titolare effettivo secondo la catena di controllo modellata nel grafo, (2) Paesi di residenza di tutti i soggetti nella catena, (3) operazioni registrate negli ultimi 24 mesi classificate come ad alto rischio o inusuali, (4) eventuali PEP (persone politicamente esposte) nella catena di relazioni. Segnala i casi in cui la soglia del 25 per cento di titolarità effettiva potrebbe essere raggiunta per somma di partecipazioni indirette non immediatamente visibili.”

Scenario 4 – Analisi di rischio nel portafoglio clienti di revisione

Per il revisore legale, il knowledge graph consente una visione trasversale del portafoglio di incarichi che nessun fascicolo individuale può offrire. Identificare le concentrazioni di rischio, clienti esposti allo stesso settore, allo stesso fornitore critico, alla stessa banca finanziatrice, diventa un’operazione nativa del sistema, non un’analisi manuale da ripetere periodicamente.

Esempio di interrogazione – Concentrazioni di rischio nel portafoglio
“Analizza il portafoglio dei clienti di revisione attualmente in carico e identifica: (1) coppie o gruppi di clienti che condividono lo stesso fornitore critico (oltre il 20 per cento degli acquisti), (2) clienti con esposizione bancaria concentrata sullo stesso istituto oltre il 60 per cento del totale finanziamenti, (3) clienti operanti nello stesso settore ATECO a due cifre con andamento di fatturato divergente superiore al 15 per cento, segnale potenziale di anomalia settoriale. Per ciascun caso, indica il livello di rischio aggregato e suggerisci le procedure di revisione aggiuntive.”

Scenario 5 – Memoria istituzionale e passaggio generazionale

In uno studio con più professionisti e con una storia pluridecennale, la conoscenza delle relazioni tra clienti, operazioni passate e professionisti coinvolti risiede spesso nella memoria individuale dei soci più anziani. Il knowledge graph codifica questa conoscenza in una struttura permanente, indipendente dalle persone fisiche. In caso di cessazione di un socio, di passaggio generazionale, di cessione dello studio, la mappa delle relazioni, che costituisce una parte fondamentale del valore dell’avviamento, resta integra e consultabile.

Esempio di interrogazione – Storico relazionale di un cliente
“Ricostruisci la storia completa del rapporto dello studio con il cliente [NOME] dalla data di primo incarico ad oggi. Includi: (1) tutti gli incarichi conferiti, con date e professionista responsabile, (2) le operazioni straordinarie assistite, con indicazione delle controparti, (3) i soggetti terzi coinvolti ricorrenti (notai, avvocati, periti), (4) le variazioni nella struttura societaria del cliente nel tempo, (5) eventuali contenziosi o vertenze in cui lo studio ha prestato assistenza. Presenta il risultato come timeline cronologica.”

Gli strumenti disponibili oggi

Il panorama degli strumenti per la costruzione di knowledge graph è maturo e accessibile, sebbene meno conosciuto nel mondo professionale rispetto agli strumenti per il RAG. Si segnalano le categorie principali.

Database a grafo: Neo4j è il riferimento di mercato, disponibile sia in versione cloud sia in versione installabile in locale (Community Edition gratuita, Enterprise a pagamento). Offre il linguaggio di interrogazione Cypher, intuitivo e potente.
Alternative valide: Memgraph (ottimizzato per le prestazioni in tempo reale), Amazon Neptune (cloud AWS), ArangoDB (multi-modello: grafo + documenti + chiave-valore).

Linguaggi di interrogazione: Cypher (nativo di Neo4j, in via di standardizzazione come GQL ISO) è il più diffuso e il più accessibile per chi non ha formazione informatica. La sua sintassi è quasi leggibile in inglese: MATCH (c:Cliente)-[:SOCIO_DI]->(s:Società) WHERE s.fatturato > 5000000 RETURN c.nome, s.denominazione.
SPARQL è l’alternativa per chi opera in contesti con standard RDF e ontologie formali.

Strumenti di integrazione con LLM: LangChain e LlamaIndex, già citati negli articoli precedenti per il RAG, offrono moduli specifici per l’integrazione con database a grafo. L’architettura GraphRAG, che combina ricerca su grafo e recupero documentale, è supportata nativamente da entrambi i framework. Microsoft ha rilasciato nel 2024 il progetto open source GraphRAG, un’implementazione di riferimento che costruisce automaticamente un knowledge graph a partire da un corpus testuale.

Strumenti di visualizzazione: Neo4j Browser e Neo4j Bloom consentono di esplorare visivamente il grafo, navigando le relazioni con un’interfaccia interattiva. La visualizzazione è uno strumento di lavoro, non un ornamento: vedere la mappa delle relazioni tra i propri clienti produce intuizioni che nessuna tabella può offrire.

Nota sulla curva di apprendimento: Cypher, il linguaggio di interrogazione di Neo4j, è significativamente più accessibile di quanto si potrebbe temere. Un professionista con familiarità con i fogli di calcolo può apprendere le interrogazioni di base in una giornata di studio. Le interrogazioni avanzate, che attraversano catene di relazioni multiple e applicano filtri complessi, richiedono alcune settimane di pratica. In alternativa, i modelli linguistici possono tradurre domande in linguaggio naturale in query Cypher, fungendo da interfaccia conversazionale verso il grafo.

Un percorso di costruzione realistico

La costruzione di un knowledge graph dello studio è un progetto più impegnativo della costruzione di un sistema RAG, perché richiede un’attività di modellazione che precede qualsiasi installazione tecnica. Occorre decidere quali entità modellare, quali relazioni tracciare, quali proprietà registrare. Si tratta, in sostanza, di formalizzare la mappa concettuale che il professionista ha già nella propria testa.

Fase uno → Definizione dell’ontologia. Si identificano le categorie di nodi rilevanti per lo studio. Un punto di partenza ragionevole per uno studio commercialista comprende: Cliente (persona fisica), Società, Partecipazione, Organo amministrativo, Incarico professionale, Operazione straordinaria, Contenzioso, Contratto, Norma/Prassi, Scadenza. Per ciascuna categoria si definiscono le proprietà essenziali e le relazioni possibili con le altre categorie. Questa fase è intellettuale, non tecnica: richiede la conoscenza del mestiere, non la conoscenza del software.

Fase due → Popolamento iniziale. Si alimenta il grafo con i dati esistenti. Le fonti principali sono: l’anagrafica clienti del gestionale, le visure camerali, i fascicoli delle operazioni straordinarie, gli incarichi di revisione. Il popolamento può essere parzialmente automatizzato (le anagrafiche e le partecipazioni si importano da file strutturati) e parzialmente manuale, per le relazioni che richiedono giudizio professionale (la natura di un rapporto, la classificazione di un’operazione). Si consiglia di partire da un nucleo di 20-30 clienti e di espandere progressivamente.

Fase tre → Integrazione con il RAG e il modello linguistico. Una volta che il grafo contiene una massa critica di dati, lo si collega al sistema RAG e al modello linguistico già in uso nello studio. L’architettura GraphRAG prevede che, di fronte a una domanda dell’utente, il sistema prima interroghi il grafo per individuare le entità e le relazioni pertinenti, poi recuperi i documenti associati a tali entità dall’archivio indicizzato e infine presenti il tutto al modello per la generazione della risposta. Il risultato è una risposta che tiene conto sia della struttura relazionale sia del contenuto documentale.

Fase quattro → Manutenzione e crescita. Il knowledge graph è un organismo vivente, non un progetto a termine. Ogni nuova operazione, ogni nuovo cliente, ogni variazione nella struttura societaria di un cliente esistente deve essere registrata nel grafo. L’ideale è integrare l’aggiornamento del grafo nei processi operativi dello studio: quando si apre un nuovo fascicolo, si creano i nodi e le relazioni corrispondenti. Quando si chiude un’operazione, si aggiorna lo stato. Nel tempo, il grafo diventa la memoria strutturale permanente dello studio.

I limiti attuali che vanno conosciuti

Come per ogni tecnologia descritta in questa serie, è doveroso indicare i limiti che il professionista deve valutare prima di intraprendere il percorso.

L’investimento di modellazione è reale. Definire l’ontologia dello studio richiede tempo e competenza professionale. Non è un’attività delegabile a un tecnico informatico, perché la struttura delle relazioni riflette la logica del mestiere. Il professionista deve essere coinvolto direttamente nella fase di modellazione, e questo richiede ore che, nel breve periodo, vengono sottratte all’attività produttiva.

Il popolamento iniziale è oneroso. Caricare nel grafo le relazioni esistenti tra clienti, società, operazioni e documenti è un’attività che, per uno studio di medie dimensioni, richiede settimane di lavoro. L’automazione aiuta per i dati strutturati (anagrafiche, partecipazioni), ma le relazioni qualitative richiedono intervento manuale. È il costo di ingresso più significativo.

La qualità decade senza manutenzione. Un knowledge graph non aggiornato è peggio di un knowledge graph assente, perché produce risposte apparentemente autorevoli ma fondate su dati obsoleti. La disciplina nell’aggiornamento deve essere incorporata nei processi operativi dello studio, non lasciata alla buona volontà individuale.

Le competenze tecniche richieste sono superiori al RAG. Installare e gestire un database a grafo, scrivere query in Cypher, integrare il grafo con il sistema RAG e il modello linguistico: sono attività che richiedono o la presenza di una figura tecnica nello studio o l’affiancamento di un consulente esterno specializzato. Non è un percorso da intraprendere senza supporto.

La visione: dallo studio che cerca allo studio che sa

Non più cercare informazioni, ma modellare la conoscenza. La differenza è profonda e ha implicazioni che vanno oltre l’efficienza operativa. Uno studio che dispone di un knowledge graph conosce la propria base clienti in un modo che nessun singolo professionista, per quanto esperto e dotato di memoria, può eguagliare. Vede connessioni che l’occhio umano non coglie perché sono distribuite su troppi fascicoli, troppi anni, troppi professionisti. Anticipa i rischi prima che si manifestino. Preserva la propria conoscenza istituzionale indipendentemente dalle persone fisiche che la detengono.

È, in ultima analisi, la traduzione digitale di ciò che uno studio professionale di eccellenza ha sempre cercato di essere: un luogo dove la conoscenza individuale diventa conoscenza collettiva, dove l’esperienza si accumula e si struttura, dove la complessità viene governata e non subita. Cambiano gli strumenti. La vocazione resta la stessa.

Il contenuto di questa newsletter è strettamente riservato e destinato esclusivamente ai destinatari autorizzati.
È espressamente vietata la condivisione totale o parziale di questa comunicazione su qualsiasi piattaforma pubblica o privata, inclusi (ma non limitati a):
• Gruppi e canali Telegram
• Chat di gruppo o broadcast su WhatsApp
• Post o storie su Facebook, Instagram, X (Twitter), LinkedIn, o altri social network.

Ogni violazione di questa norma potrà comportare l’esclusione immediata dalla lista dei destinatari e, nei casi più gravi, azioni legali.

Grazie per il rispetto delle regole e per contribuire a mantenere la riservatezza delle informazioni condivise.