AI on-premise pentru afaceri din Moldova

DIFERENȚA

De ce contează „on-premise" pentru tine.

Când folosești ChatGPT pe documente medicale sau date financiare, copia merge la OpenAI. Asta înseamnă: scurgere de date sensibile, risc legal (GDPR), pierderea controlului asupra informației tale.

Datele tale nu părăsesc serverul

Modelul AI rulează fizic pe GPU-ul din infrastructura NodeX, în Chișinău. Întrebarea ta intră, răspunsul iese — fără ca textul să fie trimis vreodată la o terță parte.

Pentru documente medicale, date financiare sau orice informație confidențială a clienților tăi, asta nu e un detaliu tehnic — e singura cale legală de a folosi AI în 2026.

0

Date trimise la OpenAI/Anthropic

24GB

VRAM GPU dedicat — Tesla P40

~17

Token/secundă pe model 14B

100%

Conformitate GDPR pe date sensibile

CE POATE FACE

Aplicații concrete, nu „transformare digitală"

AI util e cel care economisește ore pe săptămână pe sarcini repetitive. Iată ce facem în practică pentru clienții noștri.

💬 Q&A PE DATELE TALE

Întrebări în limbaj natural

„Câți pacienți cu diabet au venit luna trecută?" „Care e cifra de afaceri pe clientul X în trimestrul 2?" Întrebi în română, AI-ul interoghează baza ta de date și răspunde direct.

Conectat la baza ta PostgreSQL sau Excel-uri
Răspunsuri cu sursă (de unde a luat datele)
Funcționează pe documente PDF, contracte, fișe pacient

🎙 TRANSCRIERE & SUMARIZARE

Audio → text → fișă

Înregistrezi consultația sau ședința cu clientul; AI-ul transcrie automat, extrage punctele cheie și completează fișa. Economisești 15-20 minute per consultație din scris manual.

Whisper local — model state-of-the-art pe transcriere
Recunoaște română, rusă, engleză
Sumarizare structurată: diagnostic, plan, observații

📊 RAPOARTE AUTOMATE

Generare documente periodice

Raportul lunar către management, sumar trimestrial pentru clienții contabili, statistici medicale — generate automat din datele tale, în formatul tău.

Template configurabil, semnătură electronică opțional
Programare automată (1 a lunii, etc.)
Export PDF / DOCX, livrare email automată

🔍 CLASIFICARE & EXTRAGERE

Procesare documente la scară

Sute de facturi, contracte sau fișe scanate — AI-ul le clasifică, extrage câmpurile cheie (CIF, sumă, dată) și le bagă în baza ta de date. Fără introducere manuală.

OCR + extragere structurată în format JSON
Învață din corecțiile tale (fine-tuning incremental)
Validare manuală doar pe cazurile incerte

SPEC TEHNIC

Hardware și modele

Infrastructura AI reală, nu „cloud" abstract. Datele tale rulează exact pe acest hardware, în Chișinău.

Component	Specificație
GPU	`NVIDIA Tesla P40` — 24 GB VRAM, Pascal, server-grade
Modele LLM disponibile	Llama 3.1 (8B/70B), Qwen 2.5 (14B), Mistral, modele custom
Transcriere audio	`Whisper` (OpenAI open-source, rulat local)
Runtime	`Ollama` — orchestrare modele, hot-swap
API	OpenAI-compatible, pe subdomeniul tău (ex. `ai.firma-ta.nodex.md`)
Throughput	~17 tokens/secundă pe model 14B quantizat
Limbaj suportat	Română, rusă, engleză (modelele moderne)
Date trimise extern	ZERO — modelul rulează local, fără upstream calls
Fine-tuning	Opțional, pe datele tale, modelul rămâne al tău
Locație fizică	Chișinău, Republica Moldova

ÎNTREBĂRI FRECVENTE

Ce ne întreabă alți clienți

Modelul vostru e la fel de bun ca ChatGPT?

Pentru sarcini de business specifice — Q&A pe documente, sumarizare, clasificare, extragere — modelele open-source moderne (Llama 3.1 70B, Qwen 2.5) sunt comparabile cu GPT-4 din 2023-2024. Pentru creativitate liberă sau cod complex, ChatGPT/Claude rămân în față. Diferența cheie: ale tale rămân private, ale lor nu.

Cât de greu e să-l integrez cu sistemele mele existente?

API-ul nostru e compatibil OpenAI — adică orice cod sau plugin care funcționează cu ChatGPT funcționează direct cu noi, schimbând doar URL-ul. Pentru aplicații noi sau integrări custom, vine în pachetul Software la comandă.

Ce se întâmplă dacă crește volumul și GPU-ul nu mai face față?

Scalăm hardware-ul (al doilea GPU, GPU mai puternic) și transparent migrăm — fără downtime perceptibil pentru tine. Costul scalării e discutat înainte, nu „surpriză pe factură" lunar.

Datele de antrenament sunt sigure? Modelul „învață" din ele?

Modelul folosit nu „învață" din datele tale în uz curent (inference) — el doar răspunde. Dacă alegi fine-tuning (antrenament suplimentar pe datele tale), modelul rezultat rămâne al tău, izolat, nu se contaminează cu date ale altor clienți. Diferență fundamentală față de modelele cloud care învață implicit din tot ce le trimiți.

Cât costă vs ChatGPT Plus / API OpenAI?

La volum mic, ChatGPT API e mai ieftin per call. La volum mediu-mare și pe cazuri de business cu date sensibile, noi devenim mai ieftini după 3-6 luni, plus elimini riscul legal GDPR. Pentru clinici și contabili, costul evitării unei amenzi GDPR (până la 4% din cifra de afaceri) face calculul ușor.

Pot vedea ce face AI-ul în spate? E o cutie neagră?

Log complet pe toate interogările (cine, când, ce a întrebat, ce a răspuns). Sursele citate la fiecare răspuns Q&A. Versiunea exactă a modelului folosit, configurația. Transparență totală — opusul a ceea ce oferă OpenAI.

AI care rulează pe GPU-ul nostru,
nu pe servere OpenAI.

De ce contează „on-premise" pentru tine.

Datele tale nu părăsesc serverul

Aplicații concrete, nu „transformare digitală"

Întrebări în limbaj natural

Audio → text → fișă

Generare documente periodice

Procesare documente la scară

Hardware și modele

Ce ne întreabă alți clienți

Vrei să încerci AI pe datele tale fără risc?

AI care rulează pe GPU-ul nostru, nu pe servere OpenAI.

De ce contează „on-premise" pentru tine.

Datele tale nu părăsesc serverul

Aplicații concrete, nu „transformare digitală"

Întrebări în limbaj natural

Audio → text → fișă

Generare documente periodice

Procesare documente la scară

Hardware și modele

Ce ne întreabă alți clienți

Vrei să încerci AI pe datele tale fără risc?

AI care rulează pe GPU-ul nostru,
nu pe servere OpenAI.