Acasă/AI on-premise
SERVICIU 03 · AI ON-PREMISE

AI care rulează pe GPU-ul nostru,
nu pe servere OpenAI.

Modele de limbaj operate local pe infrastructura din Moldova. Întrebări în limbaj natural pe datele tale, transcriere, rapoarte automate — fără ca informația sensibilă să iasă vreodată din clinica sau firma ta.

DIFERENȚA

De ce contează „on-premise" pentru tine.

Când folosești ChatGPT pe documente medicale sau date financiare, copia merge la OpenAI. Asta înseamnă: scurgere de date sensibile, risc legal (GDPR), pierderea controlului asupra informației tale.

Datele tale nu părăsesc serverul

Modelul AI rulează fizic pe GPU-ul din infrastructura NodeX, în Chișinău. Întrebarea ta intră, răspunsul iese — fără ca textul să fie trimis vreodată la o terță parte.

Pentru documente medicale, date financiare sau orice informație confidențială a clienților tăi, asta nu e un detaliu tehnic — e singura cale legală de a folosi AI în 2026.

0
Date trimise la OpenAI/Anthropic
24GB
VRAM GPU dedicat — Tesla P40
~17
Token/secundă pe model 14B
100%
Conformitate GDPR pe date sensibile
CE POATE FACE

Aplicații concrete, nu „transformare digitală"

AI util e cel care economisește ore pe săptămână pe sarcini repetitive. Iată ce facem în practică pentru clienții noștri.

💬 Q&A PE DATELE TALE

Întrebări în limbaj natural

„Câți pacienți cu diabet au venit luna trecută?" „Care e cifra de afaceri pe clientul X în trimestrul 2?" Întrebi în română, AI-ul interoghează baza ta de date și răspunde direct.

  • Conectat la baza ta PostgreSQL sau Excel-uri
  • Răspunsuri cu sursă (de unde a luat datele)
  • Funcționează pe documente PDF, contracte, fișe pacient
🎙 TRANSCRIERE & SUMARIZARE

Audio → text → fișă

Înregistrezi consultația sau ședința cu clientul; AI-ul transcrie automat, extrage punctele cheie și completează fișa. Economisești 15-20 minute per consultație din scris manual.

  • Whisper local — model state-of-the-art pe transcriere
  • Recunoaște română, rusă, engleză
  • Sumarizare structurată: diagnostic, plan, observații
📊 RAPOARTE AUTOMATE

Generare documente periodice

Raportul lunar către management, sumar trimestrial pentru clienții contabili, statistici medicale — generate automat din datele tale, în formatul tău.

  • Template configurabil, semnătură electronică opțional
  • Programare automată (1 a lunii, etc.)
  • Export PDF / DOCX, livrare email automată
🔍 CLASIFICARE & EXTRAGERE

Procesare documente la scară

Sute de facturi, contracte sau fișe scanate — AI-ul le clasifică, extrage câmpurile cheie (CIF, sumă, dată) și le bagă în baza ta de date. Fără introducere manuală.

  • OCR + extragere structurată în format JSON
  • Învață din corecțiile tale (fine-tuning incremental)
  • Validare manuală doar pe cazurile incerte
SPEC TEHNIC

Hardware și modele

Infrastructura AI reală, nu „cloud" abstract. Datele tale rulează exact pe acest hardware, în Chișinău.

ComponentSpecificație
GPUNVIDIA Tesla P40 — 24 GB VRAM, Pascal, server-grade
Modele LLM disponibileLlama 3.1 (8B/70B), Qwen 2.5 (14B), Mistral, modele custom
Transcriere audioWhisper (OpenAI open-source, rulat local)
RuntimeOllama — orchestrare modele, hot-swap
APIOpenAI-compatible, pe subdomeniul tău (ex. ai.firma-ta.nodex.md)
Throughput~17 tokens/secundă pe model 14B quantizat
Limbaj suportatRomână, rusă, engleză (modelele moderne)
Date trimise externZERO — modelul rulează local, fără upstream calls
Fine-tuningOpțional, pe datele tale, modelul rămâne al tău
Locație fizicăChișinău, Republica Moldova
ÎNTREBĂRI FRECVENTE

Ce ne întreabă alți clienți

Modelul vostru e la fel de bun ca ChatGPT?

Pentru sarcini de business specifice — Q&A pe documente, sumarizare, clasificare, extragere — modelele open-source moderne (Llama 3.1 70B, Qwen 2.5) sunt comparabile cu GPT-4 din 2023-2024. Pentru creativitate liberă sau cod complex, ChatGPT/Claude rămân în față. Diferența cheie: ale tale rămân private, ale lor nu.

Cât de greu e să-l integrez cu sistemele mele existente?

API-ul nostru e compatibil OpenAI — adică orice cod sau plugin care funcționează cu ChatGPT funcționează direct cu noi, schimbând doar URL-ul. Pentru aplicații noi sau integrări custom, vine în pachetul Software la comandă.

Ce se întâmplă dacă crește volumul și GPU-ul nu mai face față?

Scalăm hardware-ul (al doilea GPU, GPU mai puternic) și transparent migrăm — fără downtime perceptibil pentru tine. Costul scalării e discutat înainte, nu „surpriză pe factură" lunar.

Datele de antrenament sunt sigure? Modelul „învață" din ele?

Modelul folosit nu „învață" din datele tale în uz curent (inference) — el doar răspunde. Dacă alegi fine-tuning (antrenament suplimentar pe datele tale), modelul rezultat rămâne al tău, izolat, nu se contaminează cu date ale altor clienți. Diferență fundamentală față de modelele cloud care învață implicit din tot ce le trimiți.

Cât costă vs ChatGPT Plus / API OpenAI?

La volum mic, ChatGPT API e mai ieftin per call. La volum mediu-mare și pe cazuri de business cu date sensibile, noi devenim mai ieftini după 3-6 luni, plus elimini riscul legal GDPR. Pentru clinici și contabili, costul evitării unei amenzi GDPR (până la 4% din cifra de afaceri) face calculul ușor.

Pot vedea ce face AI-ul în spate? E o cutie neagră?

Log complet pe toate interogările (cine, când, ce a întrebat, ce a răspuns). Sursele citate la fiecare răspuns Q&A. Versiunea exactă a modelului folosit, configurația. Transparență totală — opusul a ceea ce oferă OpenAI.

Vrei să încerci AI pe datele tale fără risc?

Demo live pe un set mic din documentele tale, fără upload nicăieri. Vezi ce poate face, decizi după.

Programează demo AI