4° Contenuto riservato: Il commercialista come architetto digitale: perché il futuro non passa da ChatGPT, ma dal proprio archivio

Giugno 8, 2026

CONDIVIDI SUI SOCIAL

PROFESSIONISTI E PROFESSIONE

DI GIACOMO GRECI | 8 GIUGNO 2026

Il dibattito sull’intelligenza artificiale negli studi professionali si è concentrato finora sul chatbot generalista (ChatGPT, Gemini, Claude) trascurando una direzione tecnologica che rappresenta il vero salto di produttività dei prossimi anni: la costruzione di sistemi RAG (Retrieval-Augmented Generation) alimentati dall’archivio dello studio. Questo articolo spiega che cos’è un sistema di questo tipo, come funziona tecnicamente, in quali scenari operativi produce valore concreto, quali strumenti utilizzare oggi per cominciare e quali limiti vanno conosciuti prima di muoversi.

Il limite strutturale del chatbot generalista

La discussione pubblica sull’intelligenza artificiale applicata alla professione contabile ha avuto, negli ultimi due anni, un protagonista quasi esclusivo: il chatbot generalista. ChatGPT, Gemini, Claude e i loro concorrenti hanno occupato la scena dei convegni, delle riviste di categoria e delle conversazioni informali tra colleghi. Sono strumenti impressionanti, capaci di redigere testi articolati, sintetizzare normative, suggerire impostazioni di lavoro. Eppure, dietro l’entusiasmo del primo utilizzo, molti professionisti hanno cominciato a percepire un limite strutturale che non viene risolto da prompt più sofisticati o da abbonamenti premium.

Il limite è semplice da enunciare: il chatbot generalista non conosce lo studio. Non ha mai letto un parere redatto dal professionista, non sa quali clienti vengano seguiti, ignora le carte di lavoro accumulate, non ha accesso ai contratti rielaborati decine di volte negli anni. Conosce il mondo, ma non conosce la professione esercitata in concreto. E poiché il valore aggiunto dello studio risiede precisamente in quel patrimonio documentale, l’utilità del chatbot generalista resta confinata ad attività periferiche: la redazione di una bozza di lettera, la sintesi di una sentenza pubblica, la rielaborazione stilistica di un testo. Operazioni utili, certo, ma non strategiche.

Esiste una direzione tecnologica diversa, ancora poco frequentata in Italia dalla comunità professionale, che rappresenta il vero salto di posizionamento competitivo per gli studi nei prossimi anni. Nel gergo tecnico viene indicata con l’acronimo RAG, che sta per Retrieval-Augmented Generation: generazione di testo arricchita dal recupero documentale. L’espressione tecnica non deve scoraggiare: la sostanza operativa è accessibile a chiunque sappia ragionare in termini di organizzazione della conoscenza professionale.

Cos’è un sistema RAG: l’analogia dell’archivista e del redattore

Conviene partire da un’immagine concreta. Si immagini di aver assunto un giovane collaboratore particolarmente promettente: ha studiato sui manuali migliori, possiede una scrittura elegante, sa argomentare in modo strutturato. Tuttavia, essendo arrivato da poco, non conosce ancora un solo fascicolo dello studio. Ogni volta che gli si rivolge una domanda specifica su un cliente, la sua preparazione generale risulta inutile.

Si supponga ora di affiancargli una seconda figura, di natura complementare: un archivista dalla memoria prodigiosa, che ha familiarità con ogni documento conservato dallo studio, sa esattamente dove trovare il verbale assembleare prodotto per il cliente Bianchi nel 2019, ricorda il contenuto della consulenza inviata al notaio tre settimane prima, conosce la struttura della cartella di revisione di ciascun cliente.

Un sistema RAG è, sostanzialmente, l’ambiente di lavoro in cui queste due figure operano in modo coordinato. Quando il professionista pone una domanda, l’archivista digitale individua i documenti pertinenti nell’archivio, li trasmette al redattore digitale e quest’ultimo elabora una risposta fondata su quei materiali specifici, non sul sapere generico appreso dai manuali. La differenza, per la nostra professione, è sostanziale: il sistema cita le fonti, vincola la risposta ai documenti effettivamente presenti, riduce drasticamente il rischio di affermazioni inventate.

Come funziona tecnicamente: indicizzazione, recupero, generazione

Per chi voglia comprendere il meccanismo sottostante senza addentrarsi nei dettagli implementativi, è utile descrivere i tre passaggi che compongono ogni sistema RAG. La consapevolezza di queste fasi consente di valutare con cognizione di causa le offerte commerciali e di dialogare con un consulente tecnico senza subirne il linguaggio.

Fase uno: Indicizzazione. I documenti dello studio (pareri, contratti, carte di lavoro, normativa di settore) vengono suddivisi in porzioni di dimensione gestibile, tipicamente di alcune centinaia di parole. Nel gergo questa operazione si chiama chunking, ossia frammentazione. Ciascun frammento viene quindi trasformato in una rappresentazione numerica (tecnicamente un vettore di alcune centinaia di numeri) che ne codifica il significato. L’operazione si chiama embedding e viene eseguita da modelli specializzati come nomic-embed, BGE-M3 o text-embedding-3 di OpenAI. I vettori così ottenuti vengono memorizzati in un database vettoriale (vector database), categoria di strumenti rappresentata da soluzioni come ChromaDB, Qdrant, Weaviate o Pinecone. Tutto questo lavoro viene fatto una volta sola, all’avvio del sistema, e successivamente aggiornato in modo incrementale ogni volta che nuovi documenti entrano nell’archivio.

Fase due: Recupero. Quando il professionista pone una domanda, anche quella viene trasformata in vettore con il medesimo modello di embedding. Il database vettoriale calcola quali frammenti dell’archivio sono semanticamente più vicini alla domanda. Non si tratta di ricerca per parole chiave: il sistema riconosce che “fusione con avanzo da concambio” e “operazione straordinaria con plusvalore da rapporto di cambio” trattano la medesima materia, anche se le parole differiscono. I frammenti più pertinenti, generalmente tra cinque e venti, vengono selezionati. Un eventuale secondo passaggio, chiamato reranking, raffina ulteriormente l’ordinamento sulla base di criteri qualitativi.

Fase tre: Generazione. I frammenti recuperati vengono trasmessi al modello linguistico vero e proprio (Claude, GPT, Llama, Mistral) insieme alla domanda originale e a istruzioni operative sul comportamento atteso. Il modello formula la risposta basandosi prevalentemente sui frammenti ricevuti, citandone l’origine e segnalando esplicitamente quando l’informazione richiesta non è presente nei documenti. Questa fase finale è quella che restituisce al professionista un testo leggibile, strutturato e tracciabile alla fonte.

Cinque scenari operativi nello studio professionale

Per misurare la portata della tecnologia, è opportuno illustrare alcuni scenari concreti tratti dall’esperienza ordinaria di uno studio commercialista di medie dimensioni. Per ciascuno scenario viene fornito un esempio di prompt operativo, da intendersi come modello di riferimento da personalizzare sulla base delle specifiche dello studio.

Scenario 1 – Recupero della memoria storica

Un cliente contatta lo studio chiedendo se in un esercizio passato fosse stata concordata una determinata impostazione fiscale, ad esempio la scelta tra metodo storico e previsionale per il calcolo degli acconti d’imposta. Con il sistema tradizionale, l’evasione della richiesta comporta la consultazione di vecchie comunicazioni, la riapertura di cartelle archiviate, il coinvolgimento del collaboratore che si era occupato della pratica. Un sistema RAG consente di ottenere la risposta in pochi istanti.

Esempio di prompt operativo – Recupero memoria storica
“Sei l’assistente documentale del mio studio. Cerca nell’archivio dei pareri e delle comunicazioni 2019-2025 ogni documento riferito al cliente [NOME CLIENTE] in materia di acconti d’imposta. Per ciascun documento rilevante restituisci: (1) data del documento, (2) oggetto, (3) sintesi della posizione tecnica adottata in tre frasi al massimo, (4) riferimento al file di origine. Se rilevi posizioni tra loro incoerenti nel tempo, segnalalo esplicitamente in una sezione finale. Se l’informazione richiesta non è presente nei documenti, dichiaralo invece di formulare ipotesi.”

Scenario 2 – Ricerca di precedenti interni su operazioni straordinarie

Nella redazione di un parere su un’operazione di natura complessa, è frequente l’esigenza di verificare se lo studio abbia già affrontato situazioni analoghe. La ricerca tradizionale per parole chiave si rivela spesso inefficiente, perché due documenti possono trattare la medesima questione utilizzando termini differenti. Un sistema RAG ragiona per concetti, non per stringhe testuali.

Esempio di prompt operativo – Ricerca precedenti interni
“Cerca nell’archivio dello studio tutti i precedenti relativi a operazioni di fusione con avanzo da concambio realizzate negli ultimi dieci anni. Per ciascun caso restituisci: (1) denominazione delle società coinvolte (oscurata se necessario), (2) trattamento contabile adottato per l’avanzo, (3) impostazione fiscale, (4) eventuali criticità rilevate dal collegio sindacale o dal revisore. Distingui i casi relativi a società immobiliari da quelli di società operative. Produci una tabella di sintesi finale con una colonna per ciascuno degli elementi richiesti.”

Scenario 3 – Formazione e onboarding del personale

L’inserimento di nuove risorse comporta una fase di apprendimento delle prassi interne che assorbe tempo dei professionisti senior. Mettere a disposizione dei collaboratori uno strumento in grado di rispondere ai loro quesiti operativi attingendo direttamente all’archivio dello studio consente di accelerare l’autonomia delle risorse junior e di preservare la coerenza metodologica nel tempo.

Esempio di prompt operativo – Assistente formativo per collaboratori junior
“Sei l’assistente formativo dei collaboratori dello studio. Quando un collaboratore ti rivolge una domanda operativa, cerca esclusivamente nei manuali interni, nelle circolari di studio e nelle carte di lavoro di esempio già archiviate. Rispondi sempre citando il documento di riferimento e indicando se si tratta di prassi consolidata, indicazione del socio o caso specifico. Non inventare procedure: se l’informazione non è presente nei materiali, dichiaralo esplicitamente e suggerisci di rivolgersi al socio responsabile della materia.”

Scenario 4 – Gestione documentale in revisione legale

Le carte di lavoro accumulate negli anni costituiscono un patrimonio metodologico spesso sotto-utilizzato. Un sistema dedicato al ciclo della revisione consente al team di interrogare l’archivio per identificare i test eseguiti in situazioni analoghe, le procedure di campionamento adottate, le risposte fornite a rilievi specifici. La standardizzazione qualitativa che ne deriva ha effetti diretti sulla difendibilità del lavoro in caso di ispezione MEF.

Esempio di prompt operativo – Analisi delle prassi di revisione
“Cerca nelle carte di lavoro dei cicli di revisione conclusi nell’ultimo triennio i test di cut-off vendite eseguiti su clienti del settore manifatturiero con fatturato compreso tra 10 e 50 milioni di euro. Per ciascun caso restituisci: (1) dimensione campionaria adottata, (2) criterio di selezione del campione, (3) eccezioni rilevate, (4) procedure di risposta in caso di anomalia, (5) eventuale impatto sul giudizio finale. Costruisci una tabella di sintesi che evidenzi le prassi ricorrenti dello studio e i casi che si discostano dalla prassi maggioritaria.”

Scenario 5 – Presidio normativo specialistico

Ogni studio sviluppa nel tempo competenze verticali su settori, materie o tipologie di operazioni. Un sistema costruito sulla normativa di settore, sui documenti di prassi dell’Agenzia delle Entrate, sulla giurisprudenza pertinente e sui pareri interni costituisce uno strumento di consultazione che riduce drasticamente i tempi di ricerca e accresce il livello di affidabilità delle risposte fornite ai clienti.

Esempio di prompt operativo – Consulenza su transfer pricing
“Cerca nell’archivio normativo specializzato sul transfer pricing tutti i documenti rilevanti per il seguente caso: trasferimento di funzioni produttive infragruppo da una controllante italiana a una controllata di nuova costituzione in Spagna, con conseguente riduzione del margine operativo italiano stimata nel 15 per cento. Includi: (1) le linee guida OCSE pertinenti, (2) la prassi dell’Agenzia delle Entrate in materia, (3) eventuali precedenti dello studio su operazioni analoghe, (4) la giurisprudenza nazionale più recente. Suggerisci la metodologia di transfer pricing più coerente, indicando i passaggi argomentativi e segnalando esplicitamente i rischi residuali.”

RAG, chatbot generalista, ricerca tradizionale: una tabella di confronto

Per orientare la scelta, può essere utile un confronto strutturato tra le tre modalità di interrogazione documentale oggi disponibili nello studio.

Caratteristica	Ricerca tradizionale	Chatbot generalista	Sistema RAG
Accesso ai documento dello studio	Sì, solo stringhe testuali	No	Sì, semantico
Ragionamento per concetti	No	Sì, su conoscenza generica	Sì, vincolato ai propri documenti
Citazione delle fonti	Indiretta (apre il file)	Inesistente o inaffidabile	Diretta e tracciabile
Rischio risposte inventate	Nullo	Significativo	Sensibilmente ridotto
Riservatezza dei dati	Massima	Bassa (trasf. a terzi)	Massima se interno
Tempo per risposta complessa	Da minuti a ore	Secondi	Secondi
Costo di setup iniziale	Nullo	Nullo o abbonamento	Da contenuto a significativo
Costo ricorrente	Nullo	Abbonamento mensile	Variabile

Il fattore riservatezza: un argomento sottovalutato

Esiste un profilo che, a giudizio di chi scrive, non riceve nella discussione corrente l’attenzione che meriterebbe. Riguarda il trattamento dei dati dei clienti e il rispetto degli obblighi di riservatezza propri della professione.

Quando un documento contenente informazioni riservate (una consulenza, un bilancio non ancora pubblico, un atto difensivo) viene inserito in un chatbot pubblico per ottenerne una rielaborazione, quel documento viene trasferito a un soggetto terzo, generalmente con sede extra-europea, le cui politiche di trattamento sono regolate da termini contrattuali che pochi professionisti hanno realmente esaminato. Il segreto professionale tutelato dall’art. 622 c.p., gli obblighi derivanti dal GDPR, la deontologia di categoria e, in prospettiva, gli adempimenti previsti dall’AI Act europeo impongono una riflessione che fino a oggi è stata troppo spesso accantonata in nome dell’entusiasmo per le potenzialità dello strumento.

Un sistema RAG costruito sui documenti dello studio, ospitato su infrastrutture controllate direttamente dal professionista (siano esse server interni, ambienti cloud privati o macchine locali) risolve il problema all’origine. I dati dei clienti non lasciano il perimetro dello studio. Le elaborazioni avvengono in un ambiente di cui il titolare ha piena conoscenza e controllo. La conformità alle norme professionali e privacy diventa documentabile, non semplicemente affermata.

Le tre vie per cominciare: piattaforma, ibrida, interna

L’osservazione più frequente che si ricava dal confronto con i colleghi è la seguente: per realizzare quanto descritto, occorre forse trasformarsi in informatici? La risposta è negativa, ma alcune scelte iniziali devono essere assunte con consapevolezza. Si possono individuare oggi tre soluzioni di riferimento, ciascuna con un proprio profilo di costo, controllo e personalizzazione.

Soluzione	Strumenti	Competenza tecnica	Controllo dati	Costo orientativo
Piattaforma pronta	NotebookLM, Claude Projects, M365 Copilot	Nessuna	Limitato	Abbonamento mensile
Ibrida personalizzata	Ollama + LangChain + ChromaDB	Coordinamento fornitore	Elevato	5.000 – 25.000 € setup
Interamente interna	Sviluppo proprio su server studio	Significativa	Totale	Variabile

La prima scelta riguarda inoltre la perimetrazione del progetto. L’intero archivio digitale dello studio rappresenta un punto di partenza eccessivamente ampio. È preferibile circoscrivere l’iniziativa a un’area specifica: la cartella dei pareri, la documentazione di un ciclo di revisione, l’archivio normativo di una materia di specializzazione. Si parte da un nucleo gestibile e si allarga progressivamente, man mano che si acquisisce dimestichezza con lo strumento e si affina la qualità dei dati indicizzati.

Strumenti e tecnologie disponibili oggi

Per completezza, si segnalano i principali strumenti su cui orientarsi nella valutazione, distinti per categoria. Si tratta di una mappa di riferimento, non esaustiva, utile a chi voglia approfondire o dialogare con un consulente tecnico.

Modelli linguistici proprietari accessibili via abbonamento: Claude (Anthropic), GPT (OpenAI), Gemini (Google). Offrono prestazioni elevate ma comportano trasferimento di dati al fornitore.

Modelli open weight installabili in locale: Llama 4 (Meta), Mistral e Mixtral (Mistral AI), Qwen (Alibaba), Gemma (Google). Possono funzionare interamente su hardware dello studio.

Strumenti per la gestione di modelli locali: Ollama e LM Studio sono le due soluzioni più diffuse, entrambe utilizzabili senza competenze di programmazione, con interfacce simili a quelle dei servizi commerciali ma operative su macchina locale.

Database vettoriali: ChromaDB e Qdrant sono le opzioni più diffuse per installazioni interne; Pinecone e Weaviate sono alternative gestite in cloud.

Framework di orchestrazione: LangChain e LlamaIndex sono le due librerie open source che consentono di costruire l’intera architettura RAG senza partire da zero.

Modelli di embedding: nomic-embed-text e BGE-M3 sono opzioni open source di qualità elevata e supporto multilingua; text-embedding-3 di OpenAI è l’alternativa commerciale di riferimento.

Piattaforme pronte all’uso con funzionalità RAG integrate: NotebookLM di Google consente di caricare fino a centinaia di documenti e interrogarli in linguaggio naturale; Claude Projects di Anthropic offre funzionalità analoghe con un’ottima qualità di sintesi; Microsoft 365 Copilot integra capacità RAG sull’archivio aziendale di chi adotta l’ecosistema Microsoft.

I limiti attuali che vanno conosciuti

Sarebbe scorretto presentare il sistema RAG come una soluzione priva di criticità. Esistono limitazioni di cui il professionista deve essere consapevole prima di muoversi in questa direzione.

Le allucinazioni residue. Un sistema RAG ben costruito riduce drasticamente, ma non azzera, il rischio di affermazioni inventate dal modello linguistico. Quando i frammenti recuperati sono ambigui, incompleti o contraddittori, il modello può talvolta colmare le lacune con contenuti non supportati. Ogni output deve essere trattato come bozza professionale soggetta a verifica, non come risultato definitivo.

La qualità dipende dai documenti. Un sistema RAG eredita la qualità del materiale che gli viene fornito. Un archivio disordinato, con documenti duplicati, versioni non aggiornate o file scansionati senza riconoscimento ottico dei caratteri produce risultati di qualità modesta. L’investimento più rilevante non è di natura tecnologica ma di natura organizzativa: si tratta di mettere in ordine la propria conoscenza prima ancora di indicizzarla.

La manutenzione è continua. Un sistema RAG non è un progetto a termine ma un’infrastruttura permanente, che richiede aggiornamento periodico dei documenti indicizzati, monitoraggio della qualità delle risposte, eventuale affinamento dei parametri tecnici. Va prevista una figura di riferimento, interna o esterna allo studio, che ne assicuri la cura nel tempo.

La curva di apprendimento sui prompt. I primi tentativi di interrogazione raramente producono risultati ottimali. La capacità di formulare prompt efficaci (la cosiddetta prompt engineering) si acquisisce con la pratica, e richiede al professionista una fase iniziale di sperimentazione. Si tratta di un investimento di tempo, non particolarmente oneroso, ma reale.

Una considerazione conclusiva

Lo studio commercialista del prossimo decennio non sarà quello che utilizza più estesamente gli strumenti di intelligenza artificiale pubblici. Sarà quello che avrà saputo costruire, con pazienza metodologica e visione di lungo periodo, una propria infrastruttura digitale di conoscenza professionale, alimentata dal proprio lavoro accumulato, organizzata secondo le proprie categorie operative, governata secondo le proprie politiche di riservatezza.

Si tratta, in fondo, dell’attività che la professione ha sempre svolto: ordinare la conoscenza, valorizzare l’esperienza, custodire la memoria del rapporto con i clienti. Cambiano gli strumenti, non la sostanza del mestiere. Ma proprio per questo, l’investimento in tale direzione non rappresenta una scommessa tecnologica, bensì la naturale evoluzione di quella cura della documentazione che da sempre distingue lo studio professionale di qualità.

Il consiglio operativo, per chi voglia trarre indicazioni concrete da queste righe, è di non posticipare ulteriormente. Un sistema RAG manifesta il proprio valore dopo un periodo di affinamento progressivo, di sistemazione dei documenti, di adattamento ai casi d’uso reali dello studio. Chi inizia oggi disporrà tra ventiquattro mesi di uno strumento maturo. Chi inizierà tra ventiquattro mesi disporrà, allora, di uno strumento appena inaugurato. La distanza competitiva si costruisce nei tempi intermedi, non nei momenti di rottura.

Il contenuto di questa newsletter è strettamente riservato e destinato esclusivamente ai destinatari autorizzati.
È espressamente vietata la condivisione totale o parziale di questa comunicazione su qualsiasi piattaforma pubblica o privata, inclusi (ma non limitati a):
• Gruppi e canali Telegram
• Chat di gruppo o broadcast su WhatsApp
• Post o storie su Facebook, Instagram, X (Twitter), LinkedIn, o altri social network.

Ogni violazione di questa norma potrà comportare l’esclusione immediata dalla lista dei destinatari e, nei casi più gravi, azioni legali.

Grazie per il rispetto delle regole e per contribuire a mantenere la riservatezza delle informazioni condivise.