RAG Enterprise: interroga i tuoi documenti con l'AI senza mandarli sul cloud
I3K RAG Enterprise è la piattaforma RAG self-hosted e open-source per interrogare documenti aziendali con l'AI. 100% on-premise, sovranità UE, air-gapped.

Immagina di poter fare una domanda complessa a tutti i tuoi documenti aziendali — contratti, manuali, email archiviate, report — e ricevere una risposta precisa con le citazioni delle fonti. Non è fantascienza: è quello che fa il RAG (Retrieval-Augmented Generation). Il problema è che quasi tutte le soluzioni disponibili richiedono di inviare quei documenti a server americani. I3K RAG Enterprise parte dal presupposto opposto.
Il paradosso dell'AI aziendale
Le organizzazioni che più avrebbero bisogno dell'AI per gestire grandi volumi di documenti sono spesso quelle che non possono usarla: studi legali con dossier riservati, strutture sanitarie con cartelle cliniche, uffici pubblici con dati sensibili dei cittadini, aziende con segreti industriali. Le soluzioni SaaS presuppongono che i documenti vadano sul cloud. I3K RAG Enterprise presuppone l'esatto contrario.
La piattaforma è disponibile in due versioni con caratteristiche molto diverse tra loro — ed è importante non confonderle.
Community edition: open source su GitHub
La versione Community è rilasciata sotto licenza AGPL-3.0 e disponibile liberamente su GitHub. Si installa con un singolo comando su Ubuntu 20.04 o versioni successive e può funzionare completamente air-gapped — isolata dalla rete, senza alcuna chiamata verso API di terze parti.
Include la pipeline RAG completa, l'interfaccia web, le API, il supporto multilingue su 29 lingue e il sistema di backup. È il punto di partenza per chi vuole valutare la soluzione o per organizzazioni con team tecnico interno capace di gestire l'installazione e la manutenzione.
Pro edition: le funzionalità che fanno la differenza
La versione Pro, disponibile su rag-enterprise.com, aggiunge capacità che la Community non ha e che per molte organizzazioni enterprise sono indispensabili.
La più rilevante è l'estrazione SQL: il sistema è in grado di interrogare database strutturati con linguaggio naturale, non solo documenti. Puoi chiedere "quante fatture superiori a 10.000 euro sono state emesse nel primo trimestre" e ottenere la risposta senza scrivere una riga di SQL. Questa funzionalità non esiste nella versione open source.
La Pro aggiunge anche SSO aziendale (integrazione con Active Directory, SAML, OIDC), audit log avanzati conformi alle esigenze di compliance enterprise e SLA di supporto dedicato.
Come funziona la pipeline RAG
Indipendentemente dall'edizione, la pipeline RAG si articola in quattro fasi:
Ingest: carichi i documenti tramite interfaccia web o API. Il sistema usa Apache Tika e Tesseract per estrarre testo da PDF, DOCX, PPTX, XLSX, ODT, RTF, HTML, XML e documenti scansionati via OCR.
Embed & store: i documenti vengono suddivisi in chunk semantici e trasformati in vettori usando BAAI/bge-m3 (29 lingue, nessun fine-tuning per lingua). I vettori vengono salvati in Qdrant con metadati per il filtraggio RBAC.
Retrieve: la domanda viene confrontata semanticamente con i vettori. Non è una ricerca per parole chiave — il sistema capisce il significato. Soglia di rilevanza, top-K e filtraggio per ruolo sono tutti configurabili.
Generate: i chunk rilevanti vengono passati al modello LLM — di default EuLLM con Qwen3:14b o Mistral 7B Q4 — che genera una risposta ancorata ai documenti. Tutto in locale, zero chiamate esterne.
Hardware, backup e conformità
La piattaforma gira sull'hardware già disponibile in azienda: NVIDIA CUDA, AMD ROCm o solo CPU. Ogni nodo gestisce oltre 10.000 documenti. Il backup integrato via rclone supporta oltre 70 provider (S3, MEGA, Google Drive, OneDrive, Dropbox, Nextcloud, Backblaze B2 e altri) con scheduling cron e zero-downtime.
Autenticazione JWT, RBAC a tre ruoli e audit log garantiscono la tracciabilità richiesta da GDPR e EU AI Act. Il codice sorgente della versione Community è auditabile end-to-end.
A chi serve
Se la tua organizzazione deve interrogare documenti riservati con l'AI e non può permettersi di mandarli su cloud americani, RAG Enterprise è probabilmente la risposta più completa disponibile oggi in Europa. Per partire con la versione open source: github.com/I3K-IT/RAG-Enterprise. Per le funzionalità enterprise inclusa l'estrazione SQL: rag-enterprise.com.
← Tutti gli articoli
