AI ügynökök alapjai: ReAct, tool use és multi-agent rendszerek
Mi az a chatbot és mi az a valódi AI agent?
Amikor ChatGPT-vel beszélgetsz, egy chatbot-tal kommunikálsz: kérdezel, válaszol. Ez egy egyirányú interakció, ahol a modell a kontextusablakán belül dolgozik, nem ér ki a külvilágba, és nem hajt végre önálló műveleteket.
Egy AI agent alapvetően más. Az agent:
- Célokat kap, nem csak kérdéseket
- Gondolkodik a feladatról (reasoning)
- Eszközöket használ (tool use): keres az interneten, adatbázist kérdez, API-t hív, kódot futtat
- Iterál: kiértékeli a saját eredményeit és szükség esetén újrapróbálkozik
- Döntéseket hoz: maga határozza meg, milyen sorrendben és milyen lépéseket tesz
Egy egyszerű analógia: a chatbot egy ügyfélszolgálatos, aki kizárólag a fejében lévő információkból válaszol. Az agent egy junior fejlesztő, aki kap egy feladatot, kutat, próbálkozik, hibákat javít, és visszaadja az eredményt.
A ReAct pattern: gondolkodás + cselekvés
Az AI agent-ek működésének alapja a ReAct (Reason + Act) pattern, amelyet Yao és munkatársai publikáltak 2022-ben. Az ötlet egyszerű, de hatásos: ahelyett, hogy az LLM egyetlen válaszban próbálna mindent megoldani, egy ciklusban gondolkodik és cselekszik.
A ReAct ciklus
1. GONDOLKODÁS (Thought)
"A felhasználó azt kérdezi, mennyi volt a Tesla részvényárfolyam tegnap.
Ezt nem tudom fejből - keresnem kell."
2. CSELEKVÉS (Action)
→ search_web("Tesla stock price yesterday")
3. MEGFIGYELÉS (Observation)
"A Tesla záróárfolyama $248.50 volt."
4. GONDOLKODÁS (Thought)
"Megvan az adat. Most meg tudom válaszolni a kérdést."
5. VÉGSŐ VÁLASZ (Final Answer)
"A Tesla záróárfolyama tegnap $248.50 volt."
A lényeg az, hogy az LLM explicit módon gondolkodik minden lépés előtt, és a gondolkodás eredménye határozza meg a következő cselekvést. Ez a megközelítés:
- Csökkenti a hallucinációt: ahelyett, hogy kitalálna egy választ, az agent inkább keres
- Növeli a megbízhatóságot: a gondolkodási lépések auditálhatók
- Lehetővé teszi a komplex feladatokat: többlépcsős problémákat részfeladatokra bont
Tool use: az agent keze
Az agent önmagában csak gondolkodik. Az eszközök (tools) adják a kezét, amivel a külvilággal interaktálhat. A tool use a modern LLM-ek egyik legfontosabb képessége - a Claude Opus 4.6, a GPT-5.2 és a Gemini 3 Pro mind natívan támogatja.
Hogyan működik a tool use?
Amikor egy LLM-et tool use-zal használsz, a következő történik:
- Tool definíció: Megadod az elérhető eszközök listáját (név, leírás, paraméterek)
- LLM döntés: A modell a kontextus alapján eldönti, melyik eszközt hívja meg és milyen paraméterekkel
- Végrehajtás: A rendszered végrehajtja az eszközhívást
- Eredmény visszaadás: Az eszköz eredményét visszaadod az LLM-nek
- Következő lépés: Az LLM az eredmény alapján dönt - újabb eszközt hív, vagy megadja a végső választ
# Példa tool definíció (Claude API)
tools = [
{
"name": "search_database",
"description": "Keres a vállalati tudásbázisban",
"input_schema": {
"type": "object",
"properties": {
"query": {"type": "string", "description": "Keresési kifejezés"},
"limit": {"type": "integer", "description": "Max találatok száma"}
},
"required": ["query"]
}
},
{
"name": "send_email",
"description": "Email küldése a megadott címre",
"input_schema": {
"type": "object",
"properties": {
"to": {"type": "string"},
"subject": {"type": "string"},
"body": {"type": "string"}
},
"required": ["to", "subject", "body"]
}
}
]
Tool use tipikus eszközök
- Web keresés: Google/Bing API, vagy saját keresőindex
- Adatbázis lekérdezés: SQL query futtatás, vektor keresés
- Kód futtatás: Python interpreter, sandboxed JavaScript
- Fájlműveletek: Olvasás, írás, fájlrendszer navigáció
- API hívások: Bármilyen REST/GraphQL endpoint
- Számológép: Pontos matematikai műveletek (az LLM-ek nem jók számolásban)
Agent memória: rövid- és hosszútávú
Egy komolyabb agent-nek memóriára van szüksége. Az LLM kontextusablaka korlátozott (még ha 200K token is), és a korábbi beszélgetések elvesznek, ha nincs perzisztencia.
Rövidtávú memória (Working Memory)
A kontextusablakban tartott információk: a jelenlegi feladat, az eddigi lépések, a tool use eredmények. Ez a “munkamemória”, ami a futás során elérhető.
Megvalósítás: Egyszerű lista a korábbi üzenetekről (conversation history), amit minden LLM hívásnál átadsz.
Hosszútávú memória (Long-term Memory)
Korábbi interakciók, tanulságok, felhasználói preferenciák - olyan információk, amelyek futások között is megmaradnak.
Megvalósítás: Vektor adatbázis (pl. ChromaDB, Pinecone), ahová az agent elmenti a fontosnak ítélt információkat, és a következő futásnál visszakeresi a releváns kontextust.
Epizodikus memória
Konkrét korábbi helyzetek és megoldásuk: “Amikor legutóbb ilyen típusú feladatot kaptam, ez a megközelítés működött.” Ez a legkevésbé kiforrott, de aktívan kutatott terület.
AI AGENT MEMÓRIA
Rövidtávú (kontextusablak)
· Jelenlegi feladat
· Korábbi lépések
· Tool use eredmények
Hosszútávú (vektor DB)
· Korábbi interakciók
· Felhasználói preferenciák
· Tanult minták
Epizodikus (strukturált)
· Konkrét helyzet → megoldás
· Sikeres stratégiák
· Hibás megközelítések
Planning agent-ek: a feladatot felbontó ügynök
Az egyszerű ReAct agent lépésenként gondolkodik. A planning agent előbb megtervezi az egész megközelítést, majd végrehajtja a tervet.
ReWOO pattern (Reasoning Without Observation)
A ReAct-tal ellentétben a ReWOO előre megtervezi az összes lépést, mielőtt bármit végrehajtana. Ez hatékonyabb, mert kevesebb LLM hívás kell (egy tervezés + végrehajtás vs. lépésenkénti gondolkodás).
1. TERVEZÉS (Plan)
"A feladathoz szükségem van:
- Lépés 1: Keresni a tudásbázisban
- Lépés 2: Az eredmény alapján lekérdezni a CRM-et
- Lépés 3: Összegzést készíteni"
2. VÉGREHAJTÁS (Execute)
→ Lépés 1: search_knowledge_base("ügyfél panasz")
→ Lépés 2: query_crm(customer_id)
→ Lépés 3: generate_summary(results)
3. VÉGSŐ VÁLASZ
Multi-agent rendszerek: együttműködő ügynökök
A legizgalmasabb fejlesztés 2026-ban a multi-agent rendszerek térnyerése. Az ötlet: ahelyett, hogy egyetlen agent-et próbálsz mindenre megtanítani, specializált agent-eket hozol létre, amelyek együttműködnek.
Tipikus multi-agent architektúra
Orchestrator Agent
(feladatot kioszt, eredményt gyűjt)
╱ │ ╲
Kutató Agent Kódoló Agent Ellenőr Agent
- Orchestrator: Megkapja a feladatot, felbontja részfeladatokra, kiosztja a specializált agent-eknek
- Kutató agent: Webes keresés, dokumentum elemzés, adatgyűjtés
- Kódoló agent: Kód írás, refaktorálás, tesztelés
- Ellenőr agent: Code review, minőségellenőrzés, biztonság
Kommunikációs minták
- Hierarchikus: Az orchestrator irányít, az agent-ek jelentenek
- Peer-to-peer: Az agent-ek egymással kommunikálnak (pl. a kódoló megkérdezi a kutatót)
- Tábla-alapú (blackboard): Közös memória, ahova minden agent ír és olvas
Agent keretrendszerek 2026-ban
LangGraph
A LangChain csapat agent orkesztrációs keretrendszere. Gráf-alapú architektúra, ahol a node-ok az agent lépései, az élek a döntési logika. 2026-ban már érett, production-grade megoldásként használják széles körben.
Erősségei: Állapotkezelés, ciklikus gráfok, emberi jóváhagyási pontok, perzisztens állapot Ideális: Komplex, több lépéses agent-ek, amiknek állapotot kell kezelniük
OpenAI Agents SDK
Az OpenAI production-ready agent keretrendszere, ami a korábbi Swarm kísérleti projekt utódja. Az Agents SDK a Responses API-ra épül, és nyílt forráskódú (Python és TypeScript). Beépített tool use, handoff-ok agent-ek között, guardrails és tracing - provider-agnosztikus, tehát nem-OpenAI modellekkel is használható.
Erősségei: Egyszerű API, beépített tracing, AgentKit a magasabb szintű orkesztrációhoz Ideális: OpenAI ökoszisztémában dolgozó csapatok, akik gyorsan akarnak production agent-et építeni
CrewAI
Szerepalapú multi-agent framework. Minden agent-nek van egy “szerepe” (kutató, író, ellenőr), és a “crew” az együttműködő csapat.
Erősségei: Gyors prototípus, intuitív API, 35K+ GitHub star, 1.3M+ havi PyPI letöltés Ideális: Csapat-alapú automatizáció, ahol a feladatok egyértelműen feloszthatók
AutoGen (Microsoft)
Konverzáció-alapú multi-agent framework, ahol az agent-ek beszélgetésen keresztül dolgoznak együtt.
Erősségei: Rugalmas, human-in-the-loop támogatás, kutatás-orientált, 48K+ GitHub star Ideális: Nyílt végű problémamegoldás, iteratív workflow-ok emberi közreműködéssel
Claude tool use + MCP (Anthropic)
Nem keretrendszer, hanem natív API képesség. A Claude modellek (Opus 4.6, Sonnet 5) közvetlenül képesek eszközöket használni - definiálsz tool-okat, és a modell eldönti, mikor és hogyan hívja meg őket. A Model Context Protocol (MCP) az Anthropic nyílt szabványa, amely egységes interfészt biztosít az AI modellek és külső eszközök/adatforrások között - 2025-ben az OpenAI és a Google is adoptálta.
Erősségei: Egyszerű integráció, erős reasoning, biztonságos, MCP ökoszisztéma Ideális: Egyedi agent alkalmazások, ahol teljes kontrollt akarsz az architektúra felett
Valós alkalmazások
Kódgeneráló agent-ek
A modern fejlesztői eszközök mögött valódi agent-ek dolgoznak. A Claude Code például egy terminál-alapú agent, ami közvetlenül a kódbázisoddal dolgozik: fájlokat olvas és ír, parancsokat futtat, git-tel verziókezel, és komplex refaktorálásokat hajt végre önállóan. A Cursor IDE hasonlóan agent-ként működik: megérti a teljes projekt kontextusát, és többlépéses kódmódosításokat végez. Ezek az eszközök a ReAct pattern élő példái:
- Megértik a kódbázis kontextusát (MCP-n és tool use-on keresztül)
- Fájlokat olvasnak és írnak
- Teszteket futtatnak és a hibákat javítják (iteráció)
- Többlépéses refaktorálást végeznek (planning)
Kutatási agent-ek
Automatizált kutatás: az agent kap egy témát, keres az interneten, összegyűjti a releváns forrásokat, kivonatol, és strukturált riportot készít. Jó példa: a Perplexity AI lényegében egy kutatási agent webes felülettel.
Ügyfélszolgálati agent-ek
Nem chatbot, hanem agent: hozzáfér a CRM-hez, tudásbázishoz, megrendelés-kezelő rendszerhez. Megérti a kontextust, önállóan keres megoldást, és ha nem tud segíteni, emberhez eszkalál - a teljes kontextussal együtt.
Biztonság és korlátok
Az AI agent-ek nem játékszerek. Komoly biztonsági kérdéseket vetnek fel:
Prompt injection
Ha az agent külső forrásokból olvas (web, email, dokumentumok), a rosszindulatú tartalom manipulálhatja a viselkedését. Például: egy weboldal rejtett utasítást tartalmaz, ami arra veszi rá az agent-et, hogy érzékeny adatokat továbbítson.
Védekezés: Input szanitizálás, sandboxing, minimális jogosultságok (least privilege), output validáció.
Elszabadult agent (runaway agent)
Az agent végtelen ciklusba kerülhet, vagy nem várt műveleteket hajthat végre. Ha az agent-nek írási jogosultsága van (email küldés, adatbázis módosítás), ez valós kockázat.
Védekezés: Iteráció limit, költségplafon, emberi jóváhagyás kritikus lépéseknél, audit log.
Guardrails
- Token limit: Maximum költség/futás beállítása
- Tool whitelist: Csak az engedélyezett eszközök érhetők el
- Output filtering: A válaszok ellenőrzése szenzitív tartalom szempontjából
- Human-in-the-loop: Kritikus döntéseknél emberi jóváhagyás kérése
Mi jön ezután?
2026-ban az AI agent-ek már kiléptek a kísérleti fázisból, és a fejlődés exponenciális:
- Jobb reasoning: A Claude Opus 4.6 és a GPT-5.2 már kiváló többlépcsős gondolkodásra képesek
- Computer use: Az Anthropic computer use képessége már lehetővé teszi, hogy az agent-ek grafikus felületeket kezeljenek (böngésző, desktop alkalmazások)
- MCP ökoszisztéma: A Model Context Protocol nyílt szabvány lett, amit az OpenAI, Google és Microsoft is adoptált - egységes eszközhasználat minden AI rendszerben
- Autonóm fejlesztés: A Claude Code és hasonló eszközök már önállóan építenek teljes alkalmazásokat
- Szabályozás: Az EU AI Act és más szabályozások keretrendszert adnak az agent-ek használatához
Az AI agent-ek nem a jövő - a jelen. A kérdés nem az, hogy használd-e őket, hanem az, hogy hogyan használd őket biztonságosan és hatékonyan.
Ha AI agent alapú megoldást tervezel a vállalkozásodhoz, az AppForge csapata segít az architektúra tervezésében, a megfelelő keretrendszer kiválasztásában és a biztonságos implementációban.
MI-megoldásra van szükséged?
Automatizáld a munkafolyamataidat és szerezz versenyelőnyt mesterséges intelligencia megoldásainkkal.
Kapcsolódó cikkek
Ezek a cikkek is érdekelhetnek
MI fejlesztés árak 2026 – Mennyibe kerül egy AI megoldás Magyarországon?
Részletes útmutató a mesterséges intelligencia fejlesztés árakról Magyarországon: chatbotok, RAG rendszerek, egyedi modellek és folyamatautomatizálás költségei.
Vállalkozás automatizálás MI-vel: Gyakorlati útmutató KKV-knak
Lépésről lépésre útmutató, hogyan automatizáld az üzleti folyamataidat mesterséges intelligenciával - konkrét eszközökkel és ROI számokkal.
AI Chatbotok: Hogyan teremts VALÓDI üzleti értéket (nem gimmicket)
Gyakorlati útmutató az AI chatbotok üzleti alkalmazásához - ROI számok, buktatók és implementációs best practice-ek.