AI ügynökök alapjai: ReAct, tool use és multi-agent rendszerek

A chatbot kérdésekre válaszol, az agent célokat hajt végre. ReAct ciklus, tool use, MCP, multi-agent — gyakorlati alapok 2026-ra, LangGraph, OpenAI Agents SDK és CrewAI hands-on.

10 perc olvasásÍrtaBoncz Bálint

Mi az a chatbot, és mi a valódi AI agent?

Amikor ChatGPT-vel beszélgetsz, egy chatbot-tal kommunikálsz. Egyirányú interakció: kérdezel, válaszol. A modell a kontextusablakán belül dolgozik, nem nyúl ki a külvilágba, és nem hajt végre önálló műveleteket.

Egy AI agent alapvetően más. Az agent:

  • Célokat kap, nem csak kérdéseket
  • Gondolkodik a feladatról (reasoning)
  • Eszközöket használ: keres, adatbázist kérdez, API-t hív, kódot futtat
  • Iterál: kiértékeli a saját eredményeit és újrapróbálkozik
  • Döntéseket hoz: maga határozza meg, milyen sorrendben dolgozik

Egyszerű analógia: a chatbot egy ügyfélszolgálatos, aki a fejében lévő információkból válaszol. Az agent egy junior fejlesztő, aki kap egy feladatot, kutat, próbálkozik, hibákat javít, és visszaadja az eredményt.

A ReAct pattern: gondolkodás + cselekvés

Az AI agentek alapja a ReAct (Reason + Act) pattern, amelyet Yao és munkatársai 2022-ben publikáltak. Az ötlet egyszerű: ahelyett, hogy az LLM egyetlen válaszban próbálna mindent megoldani, ciklusban gondolkodik és cselekszik.

A ReAct ciklus

  1. Gondolkodás (Thought).„A felhasználó a Tesla tegnapi árfolyamát kérdezi. Ezt nem tudom fejből — keresnem kell.”
  2. Cselekvés (Action). search_web("Tesla stock price yesterday")
  3. Megfigyelés (Observation).„A Tesla záróárfolyama $248,50 volt.”
  4. Gondolkodás.„Megvan az adat. Most meg tudom válaszolni.”
  5. Végső válasz.„A Tesla záróárfolyama tegnap $248,50 volt.”

A lényeg: az LLM explicit módon gondolkodik minden lépés előtt, és a gondolkodás eredménye határozza meg a cselekvést. Ez:

  • Csökkenti a hallucinációt — ahelyett, hogy kitalálná a választ, az agent keres
  • Auditálható — a gondolkodási lépések visszanézhetők
  • Komplex feladatokra alkalmas — többlépcsős problémákat részfeladatokra bont

Tool use: az agent keze

Az agent önmagában csak gondolkodik. Az eszközök (tools) adják a kezét, amivel a külvilággal interaktál. A tool use a modern LLM-ek egyik legfontosabb képessége — a Claude Opus 4.6, a GPT-5.2 és a Gemini 3 Pro mind natívan támogatja.

Hogyan működik a tool use?

  1. Tool definíció. Megadod az elérhető eszközök listáját (név, leírás, paraméterek)
  2. LLM döntés. A modell a kontextus alapján eldönti, melyiket hívja meg és milyen paraméterekkel
  3. Végrehajtás. A rendszered futtatja az eszközhívást
  4. Eredmény visszaadás. Az eszköz outputját visszaadod az LLM-nek
  5. Következő lépés. Az LLM az eredmény alapján dönt — újabb hívás, vagy végső válasz

Tipikus eszközök

  • Web keresés: Google/Bing API, vagy saját keresőindex
  • Adatbázis lekérdezés: SQL query, vektor keresés
  • Kód futtatás: Python interpreter, sandboxed JavaScript
  • Fájlműveletek: olvasás, írás, fájlrendszer navigáció
  • API hívások: bármilyen REST/GraphQL endpoint
  • Számológép: pontos matematika (az LLM-ek nem jók számolásban)

Agent memória: rövid- és hosszútávú

Egy komolyabb agentnek memóriára van szüksége. Az LLM kontextusablaka korlátozott (még ha 200K token is), és a korábbi beszélgetések elvesznek perzisztencia nélkül.

Rövidtávú memória (Working Memory)

A kontextusablakban tartott információk: a jelenlegi feladat, az eddigi lépések, a tool use eredmények. Ez a munkamemória, ami a futás során elérhető.

Megvalósítás: egyszerű message-lista a korábbi üzenetekről, amit minden LLM hívásnál átadsz.

Hosszútávú memória (Long-term Memory)

Korábbi interakciók, tanulságok, felhasználói preferenciák — futások között megőrzött információk.

Megvalósítás: vektor adatbázis (ChromaDB, Pinecone, Qdrant), ahova az agent a fontos információkat menti, és a következő futásnál visszakeresi a releváns kontextust.

Epizodikus memória

Konkrét helyzetek és megoldásuk: „amikor legutóbb ilyen feladatot kaptam, ez a megközelítés működött.” A legkevésbé kiforrott, de aktívan kutatott terület.

Planning agentek: a feladatot felbontó ügynök

Az egyszerű ReAct agent lépésenként gondolkodik. A planning agent előbb megtervezi az egész megközelítést, majd végrehajtja a tervet.

ReWOO pattern (Reasoning Without Observation)

A ReAct-tal ellentétben a ReWOO előre megtervezi az összes lépést, mielőtt bármit végrehajtana. Hatékonyabb, mert kevesebb LLM hívás kell (egy tervezés + végrehajtás vs. lépésenkénti gondolkodás).

  1. Tervezés. „Lépés 1: keresni a tudásbázisban. Lépés 2: az eredmény alapján lekérdezni a CRM-et. Lépés 3: összegzést készíteni.”
  2. Végrehajtás. Lépés 1 → Lépés 2 → Lépés 3.
  3. Végső válasz.

Multi-agent rendszerek: együttműködő ügynökök

A legizgalmasabb fejlesztés 2026-ban a multi-agent rendszerek térnyerése. Ahelyett, hogy egyetlen agentet próbálsz mindenre megtanítani, specializált agenteket hozol létre, amelyek együttműködnek.

Tipikus architektúra

  • Orchestrator: megkapja a feladatot, felbontja részfeladatokra, kiosztja
  • Kutató agent: webes keresés, dokumentum elemzés, adatgyűjtés
  • Kódoló agent: kód írás, refaktorálás, tesztelés
  • Ellenőr agent: code review, minőség, biztonság

Kommunikációs minták

  • Hierarchikus: az orchestrator irányít, az agentek jelentenek
  • Peer-to-peer: az agentek egymással kommunikálnak
  • Tábla-alapú (blackboard): közös memória, ahova mindenki ír és olvas

Agent keretrendszerek 2026-ban

KeretrendszerErősségIdeális
LangGraphÁllapotkezelés, ciklikus gráfok, perzisztens állapot, emberi jóváhagyási pontokKomplex, többlépéses agentek
OpenAI Agents SDKEgyszerű API, beépített tracing, AgentKit, provider-agnosztikusGyors production agent OpenAI ökoszisztémában
CrewAISzerepalapú architektúra, intuitív API, 35K+ GitHub star, 1,3M+ havi PyPI letöltésCsapat-alapú automatizáció, jól felosztható feladatok
Microsoft AutoGenKonverzáció-alapú multi-agent, HITL támogatás, 48K+ GitHub starNyílt végű problémamegoldás, iteratív workflow
Claude tool use + MCPNatív API képesség, MCP nyílt szabvány, erős reasoningEgyedi agent alkalmazások teljes kontrollal

Az MCP (Model Context Protocol) az Anthropic nyílt szabványa, amit 2025-ben az OpenAI és a Google is adoptált. Egységes interfész az AI modellek és külső eszközök között — ugyanazt a tool-szervert használhatod Claude-dal, GPT-vel és Gemini-vel.

Valós alkalmazások

Kódgeneráló agentek

A modern fejlesztői eszközök mögött valódi agentek dolgoznak. A Claude Code egy terminál-alapú agent, ami közvetlenül a kódbázisoddal dolgozik: fájlokat olvas és ír, parancsokat futtat, gittel verziókezel, és komplex refaktorálásokat hajt végre. A Cursor IDE hasonlóan agentként működik: megérti a projekt kontextusát, többlépéses kódmódosításokat végez. Mindkettő a ReAct pattern élő példája.

Kutatási agentek

Az agent kap egy témát, keres, összegyűjti a forrásokat, kivonatol, és strukturált riportot készít. Jó példa: a Perplexity AI lényegében egy kutatási agent webes felülettel.

Ügyfélszolgálati agentek

Nem chatbot, hanem agent: hozzáfér a CRM-hez, tudásbázishoz, megrendelés-kezelő rendszerhez. Megérti a kontextust, önállóan keres megoldást, és ha nem tud segíteni, emberhez eszkalál — a teljes kontextussal együtt.

Biztonság és korlátok

Az AI agentek nem játékszerek. Komoly biztonsági kérdéseket vetnek fel.

Prompt injection

Ha az agent külső forrásból olvas (web, email, dokumentum), a rosszindulatú tartalom manipulálhatja a viselkedését. Például: egy weboldal rejtett utasítást tartalmaz, ami arra veszi rá az agentet, hogy érzékeny adatokat továbbítson.

Elszabadult agent (runaway agent)

Az agent végtelen ciklusba kerülhet, vagy nem várt műveleteket hajthat végre. Ha az agentnek írási jogosultsága van (email, adatbázis), ez valós kockázat.

Védekezés: iteráció limit, költségplafon, emberi jóváhagyás kritikus lépéseknél, audit log.

Guardrails

  • Token limit: maximum költség/futás beállítása
  • Tool whitelist: csak az engedélyezett eszközök érhetők el
  • Output filtering: a válaszok ellenőrzése szenzitív tartalom szempontjából
  • Human-in-the-loop: kritikus döntéseknél emberi jóváhagyás

Mi jön ezután?

2026-ban az AI agentek már kiléptek a kísérleti fázisból, és a fejlődés exponenciális:

  • Jobb reasoning: a Claude Opus 4.6 és a GPT-5.2 már kiváló többlépcsős gondolkodásra képesek
  • Computer use: az Anthropic computer use képessége lehetővé teszi, hogy az agentek grafikus felületeket kezeljenek
  • MCP ökoszisztéma: nyílt szabvány lett, amit az OpenAI, Google és Microsoft is adoptált
  • Autonóm fejlesztés: a Claude Code és hasonló eszközök már önállóan építenek teljes alkalmazásokat
  • Szabályozás: az EU AI Act keretrendszert ad az agentek használatához

Összegzés

A kérdés nem az, hogy használj-e AI agentet — hanem hogy hogyan használd biztonságosan és hatékonyan. Ha agent-alapú megoldást tervezel, az AppForge csapata segít az architektúrában, a keretrendszer kiválasztásában és a biztonságos implementációban. Kérj 30 perces ingyenes konzultációt.

Megosztás:

Készen állsz?

Beszéljük át a projektedet — 30 perc, ingyenes.

24 órán belül konkrét ár-tartománnyal, becsült átfutási idővel és világos következő lépéssel jövünk vissza. Nem értékesítési hívás.

Projektet indítok