Glosar AI
ro / enTermenii platformei și ai ecosistemului AI explicați într-o frază — cu echivalentul în engleză, pentru când îi întâlnești în documentație sau pe Twitter.
agent
(en) AI agentUn program AI care nu doar răspunde, ci poate să acționeze autonom — citește fișiere, rulează comenzi, apelează instrumente, planifică mai mulți pași. Claude Code este un agent; Claude.ai chat nu este.
context
(en) context windowTot ce „știe" modelul într-o conversație — mesajele tale, răspunsurile lui, fișierele citite, rezultatele instrumentelor. Are o limită în tokens; când se umple, modelul începe să uite sau produce erori.
embedding
(en) embedding / vectorUn număr de obicei cu 1024+ dimensiuni care reprezintă sensul unui fragment de text. Vectorii similari sunt apropiați geometric. Stați la baza sistemelor RAG și a căutării semantice.
fine-tuning
(en) fine-tuningReantrenarea unui model existent pe un set mic de date specific domeniului tău. Schimbă permanent comportamentul modelului, spre deosebire de prompting care e temporar.
guardrail
(en) guardrail / safety filterMecanism care blochează sau moderează ieșirile unui model — conținut dăunător, informații false, date private. Poate fi intern modelului sau extern (proxy, post-procesare).
harness
(en) agent harnessInfrastructura care rulează un agent în buclă: pasează rezultatele instrumentelor înapoi la model, gestionează memoria, aplică skiluri, controlează bugetul de tokeni. Claude Code include propriul harness.
inferență
(en) inferenceRularea efectivă a unui model pentru a genera text — spre deosebire de antrenament. Când trimiți un mesaj la Claude, faci o cerere de inferență. Costul principal al AI productiv.
llamacpp
(en) llama.cppServer open-source pentru inferență locală a modelelor LLM (Llama, Mistral, Gemma etc.). Rulează pe CPU sau GPU, fără cloud. Alternativă la vLLM pentru hardware modest.
loopmaxing
(en) loopmaxingExtinderea agresivă a buclei unui agent: mai mulți pași autonomi, mai multă memorie utilizată, raționament mai profund înainte de a cere confirmarea utilizatorului. Costă mai mulți tokeni, dar rezolvă sarcini mai complexe.
looping
(en) looping / agentic loopBucla internă a unui agent: model → instrumente → rezultate → model → instrumente → … Fiecare iterație consumă tokeni din context. Agentul iese din buclă când termină sau când depășește un budget.
MCP
(en) Model Context ProtocolStandard deschis pentru conectarea modelelor la aplicații externe — calendare, baze de date, API-uri, sisteme de fișiere. Un server MCP expune instrumente; un client MCP (ex. Claude Code) le apelează.
model
(en) language model / LLMRețeaua neuronală antrenată care generează text. Claude, GPT-4o, Gemini 2.0 sunt modele. Diferă prin dimensiune (parametri), capacitate și cost per token.
prompt
(en) promptIntrarea text pe care o dai modelului — întrebare, instrucțiune sau context. Calitatea promptului determină în mare măsură calitatea răspunsului.
RAG
(en) Retrieval-Augmented GenerationTehnică prin care modelul primește, înainte de generare, fragmente relevante extrase dintr-o bază de cunoștințe (vectori + căutare). Reduce halucinațiile pe date noi sau private.
RLHF
(en) Reinforcement Learning from Human FeedbackMetoda prin care modelele sunt ajustate după antrenamentul inițial folosind feedback uman (oameni care aleg răspunsul mai bun). Claude și GPT-4 folosesc variante ale RLHF.
sandbox
(en) sandboxMediu izolat (folder, container, VM) în care agentul poate acționa fără să afecteze sistemele de producție sau fișierele importante. Esențial pentru experimente cu agenți autonomi.
skill
(en) skill / slash commandSet de instrucțiuni preîncărcate pentru un domeniu specific — cum să citești .docx, cum să lucrezi cu PDF, cum să trimiți notificări. Claude Code le activează la nevoie din fișiere Markdown.
token
(en) tokenUnitate de procesare a textului — aproximativ 4 caractere sau ¾ de cuvânt în engleză. Prețul API-urilor AI este per token (input + output). „Bună ziua!" ≈ 5 tokens.
token maxxing
(en) token maxxingMaximizarea calității output-ului prin umplerea deliberată a contextului cu informații utile — documente de referință, exemple, memorie externă — înainte de a trimite cererea modelului.
tool use
(en) tool use / function callingCapacitatea modelului de a apela funcții definite extern — căutare web, citire fișiere, executare cod, interogare API. Modelul decide când să folosească un instrument și ce argumente să trimită.
vLLM
(en) vLLMServer open-source de înaltă performanță pentru inferență LLM pe GPU. Folosit în producție pentru throughput mare. Alternativa enterprise la llama.cpp.
Lipsește un termen? Scrie-mi — glosarul se actualizează trimestrial.