SPEC TEHNIC
Hardware și modele
Infrastructura AI reală, nu „cloud" abstract. Datele tale rulează exact
pe acest hardware, în Chișinău.
| Component | Specificație |
| GPU | NVIDIA Tesla P40 — 24 GB VRAM, Pascal, server-grade |
| Modele LLM disponibile | Llama 3.1 (8B/70B), Qwen 2.5 (14B), Mistral, modele custom |
| Transcriere audio | Whisper (OpenAI open-source, rulat local) |
| Runtime | Ollama — orchestrare modele, hot-swap |
| API | OpenAI-compatible, pe subdomeniul tău (ex. ai.firma-ta.nodex.md) |
| Throughput | ~17 tokens/secundă pe model 14B quantizat |
| Limbaj suportat | Română, rusă, engleză (modelele moderne) |
| Date trimise extern | ZERO — modelul rulează local, fără upstream calls |
| Fine-tuning | Opțional, pe datele tale, modelul rămâne al tău |
| Locație fizică | Chișinău, Republica Moldova |