PLATFORM GLOSSARY

Glosar AI

ro / en

Termenii platformei și ai ecosistemului AI explicați într-o frază — cu echivalentul în engleză, pentru când îi întâlnești în documentație sau pe Twitter.

🔍

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

agent

(en) AI agent

Un program AI care nu doar răspunde, ci poate să acționeze autonom — citește fișiere, rulează comenzi, apelează instrumente, planifică mai mulți pași. Claude Code este un agent; Claude.ai chat nu este.

context

(en) context window

Tot ce „știe" modelul într-o conversație — mesajele tale, răspunsurile lui, fișierele citite, rezultatele instrumentelor. Are o limită în tokens; când se umple, modelul începe să uite sau produce erori.

embedding

(en) embedding / vector

Un număr de obicei cu 1024+ dimensiuni care reprezintă sensul unui fragment de text. Vectorii similari sunt apropiați geometric. Stați la baza sistemelor RAG și a căutării semantice.

fine-tuning

(en) fine-tuning

Reantrenarea unui model existent pe un set mic de date specific domeniului tău. Schimbă permanent comportamentul modelului, spre deosebire de prompting care e temporar.

guardrail

(en) guardrail / safety filter

Mecanism care blochează sau moderează ieșirile unui model — conținut dăunător, informații false, date private. Poate fi intern modelului sau extern (proxy, post-procesare).

harness

(en) agent harness

Infrastructura care rulează un agent în buclă: pasează rezultatele instrumentelor înapoi la model, gestionează memoria, aplică skiluri, controlează bugetul de tokeni. Claude Code include propriul harness.

inferență

(en) inference

Rularea efectivă a unui model pentru a genera text — spre deosebire de antrenament. Când trimiți un mesaj la Claude, faci o cerere de inferență. Costul principal al AI productiv.

llamacpp

(en) llama.cpp

Server open-source pentru inferență locală a modelelor LLM (Llama, Mistral, Gemma etc.). Rulează pe CPU sau GPU, fără cloud. Alternativă la vLLM pentru hardware modest.

loopmaxing

(en) loopmaxing

Extinderea agresivă a buclei unui agent: mai mulți pași autonomi, mai multă memorie utilizată, raționament mai profund înainte de a cere confirmarea utilizatorului. Costă mai mulți tokeni, dar rezolvă sarcini mai complexe.

looping

(en) looping / agentic loop

Bucla internă a unui agent: model → instrumente → rezultate → model → instrumente → … Fiecare iterație consumă tokeni din context. Agentul iese din buclă când termină sau când depășește un budget.

MCP

(en) Model Context Protocol

Standard deschis pentru conectarea modelelor la aplicații externe — calendare, baze de date, API-uri, sisteme de fișiere. Un server MCP expune instrumente; un client MCP (ex. Claude Code) le apelează.

model

(en) language model / LLM

Rețeaua neuronală antrenată care generează text. Claude, GPT-4o, Gemini 2.0 sunt modele. Diferă prin dimensiune (parametri), capacitate și cost per token.

prompt

(en) prompt

Intrarea text pe care o dai modelului — întrebare, instrucțiune sau context. Calitatea promptului determină în mare măsură calitatea răspunsului.

RAG

(en) Retrieval-Augmented Generation

Tehnică prin care modelul primește, înainte de generare, fragmente relevante extrase dintr-o bază de cunoștințe (vectori + căutare). Reduce halucinațiile pe date noi sau private.

RLHF

(en) Reinforcement Learning from Human Feedback

Metoda prin care modelele sunt ajustate după antrenamentul inițial folosind feedback uman (oameni care aleg răspunsul mai bun). Claude și GPT-4 folosesc variante ale RLHF.

sandbox

(en) sandbox

Mediu izolat (folder, container, VM) în care agentul poate acționa fără să afecteze sistemele de producție sau fișierele importante. Esențial pentru experimente cu agenți autonomi.

skill

(en) skill / slash command

Set de instrucțiuni preîncărcate pentru un domeniu specific — cum să citești .docx, cum să lucrezi cu PDF, cum să trimiți notificări. Claude Code le activează la nevoie din fișiere Markdown.

token

(en) token

Unitate de procesare a textului — aproximativ 4 caractere sau ¾ de cuvânt în engleză. Prețul API-urilor AI este per token (input + output). „Bună ziua!" ≈ 5 tokens.

token maxxing

(en) token maxxing

Maximizarea calității output-ului prin umplerea deliberată a contextului cu informații utile — documente de referință, exemple, memorie externă — înainte de a trimite cererea modelului.

tool use

(en) tool use / function calling

Capacitatea modelului de a apela funcții definite extern — căutare web, citire fișiere, executare cod, interogare API. Modelul decide când să folosească un instrument și ce argumente să trimită.

vLLM

(en) vLLM

Server open-source de înaltă performanță pentru inferență LLM pe GPU. Folosit în producție pentru throughput mare. Alternativa enterprise la llama.cpp.

Lipsește un termen? Scrie-mi — glosarul se actualizează trimestrial.