AI ügynökök alapjai: ReAct, tool use és multi-agent rendszerek

Írta: AppForge Team 2026. január 10. 11 perc olvasás

MI ágens ReAct ciklus eszközhasználat vizualizációval

Mi az a chatbot és mi az a valódi AI agent?

Amikor ChatGPT-vel beszélgetsz, egy chatbot-tal kommunikálsz: kérdezel, válaszol. Ez egy egyirányú interakció, ahol a modell a kontextusablakán belül dolgozik, nem ér ki a külvilágba, és nem hajt végre önálló műveleteket.

Egy AI agent alapvetően más. Az agent:

Célokat kap, nem csak kérdéseket
Gondolkodik a feladatról (reasoning)
Eszközöket használ (tool use): keres az interneten, adatbázist kérdez, API-t hív, kódot futtat
Iterál: kiértékeli a saját eredményeit és szükség esetén újrapróbálkozik
Döntéseket hoz: maga határozza meg, milyen sorrendben és milyen lépéseket tesz

Egy egyszerű analógia: a chatbot egy ügyfélszolgálatos, aki kizárólag a fejében lévő információkból válaszol. Az agent egy junior fejlesztő, aki kap egy feladatot, kutat, próbálkozik, hibákat javít, és visszaadja az eredményt.

A ReAct pattern: gondolkodás + cselekvés

Az AI agent-ek működésének alapja a ReAct (Reason + Act) pattern, amelyet Yao és munkatársai publikáltak 2022-ben. Az ötlet egyszerű, de hatásos: ahelyett, hogy az LLM egyetlen válaszban próbálna mindent megoldani, egy ciklusban gondolkodik és cselekszik.

A ReAct ciklus

1. GONDOLKODÁS (Thought)
   "A felhasználó azt kérdezi, mennyi volt a Tesla részvényárfolyam tegnap.
    Ezt nem tudom fejből - keresnem kell."

2. CSELEKVÉS (Action)
   → search_web("Tesla stock price yesterday")

3. MEGFIGYELÉS (Observation)
   "A Tesla záróárfolyama $248.50 volt."

4. GONDOLKODÁS (Thought)
   "Megvan az adat. Most meg tudom válaszolni a kérdést."

5. VÉGSŐ VÁLASZ (Final Answer)
   "A Tesla záróárfolyama tegnap $248.50 volt."

A lényeg az, hogy az LLM explicit módon gondolkodik minden lépés előtt, és a gondolkodás eredménye határozza meg a következő cselekvést. Ez a megközelítés:

Csökkenti a hallucinációt: ahelyett, hogy kitalálna egy választ, az agent inkább keres
Növeli a megbízhatóságot: a gondolkodási lépések auditálhatók
Lehetővé teszi a komplex feladatokat: többlépcsős problémákat részfeladatokra bont

Tool use: az agent keze

Az agent önmagában csak gondolkodik. Az eszközök (tools) adják a kezét, amivel a külvilággal interaktálhat. A tool use a modern LLM-ek egyik legfontosabb képessége - a Claude Opus 4.6, a GPT-5.2 és a Gemini 3 Pro mind natívan támogatja.

Hogyan működik a tool use?

Amikor egy LLM-et tool use-zal használsz, a következő történik:

Tool definíció: Megadod az elérhető eszközök listáját (név, leírás, paraméterek)
LLM döntés: A modell a kontextus alapján eldönti, melyik eszközt hívja meg és milyen paraméterekkel
Végrehajtás: A rendszered végrehajtja az eszközhívást
Eredmény visszaadás: Az eszköz eredményét visszaadod az LLM-nek
Következő lépés: Az LLM az eredmény alapján dönt - újabb eszközt hív, vagy megadja a végső választ

# Példa tool definíció (Claude API)
tools = [
    {
        "name": "search_database",
        "description": "Keres a vállalati tudásbázisban",
        "input_schema": {
            "type": "object",
            "properties": {
                "query": {"type": "string", "description": "Keresési kifejezés"},
                "limit": {"type": "integer", "description": "Max találatok száma"}
            },
            "required": ["query"]
        }
    },
    {
        "name": "send_email",
        "description": "Email küldése a megadott címre",
        "input_schema": {
            "type": "object",
            "properties": {
                "to": {"type": "string"},
                "subject": {"type": "string"},
                "body": {"type": "string"}
            },
            "required": ["to", "subject", "body"]
        }
    }
]

Tool use tipikus eszközök

Web keresés: Google/Bing API, vagy saját keresőindex
Adatbázis lekérdezés: SQL query futtatás, vektor keresés
Kód futtatás: Python interpreter, sandboxed JavaScript
Fájlműveletek: Olvasás, írás, fájlrendszer navigáció
API hívások: Bármilyen REST/GraphQL endpoint
Számológép: Pontos matematikai műveletek (az LLM-ek nem jók számolásban)

Agent memória: rövid- és hosszútávú

Egy komolyabb agent-nek memóriára van szüksége. Az LLM kontextusablaka korlátozott (még ha 200K token is), és a korábbi beszélgetések elvesznek, ha nincs perzisztencia.

Rövidtávú memória (Working Memory)

A kontextusablakban tartott információk: a jelenlegi feladat, az eddigi lépések, a tool use eredmények. Ez a “munkamemória”, ami a futás során elérhető.

Megvalósítás: Egyszerű lista a korábbi üzenetekről (conversation history), amit minden LLM hívásnál átadsz.

Hosszútávú memória (Long-term Memory)

Korábbi interakciók, tanulságok, felhasználói preferenciák - olyan információk, amelyek futások között is megmaradnak.

Megvalósítás: Vektor adatbázis (pl. ChromaDB, Pinecone), ahová az agent elmenti a fontosnak ítélt információkat, és a következő futásnál visszakeresi a releváns kontextust.

Epizodikus memória

Konkrét korábbi helyzetek és megoldásuk: “Amikor legutóbb ilyen típusú feladatot kaptam, ez a megközelítés működött.” Ez a legkevésbé kiforrott, de aktívan kutatott terület.

            AI AGENT MEMÓRIA

Rövidtávú (kontextusablak)
    · Jelenlegi feladat
    · Korábbi lépések
    · Tool use eredmények

Hosszútávú (vektor DB)
    · Korábbi interakciók
    · Felhasználói preferenciák
    · Tanult minták

Epizodikus (strukturált)
    · Konkrét helyzet → megoldás
    · Sikeres stratégiák
    · Hibás megközelítések

Planning agent-ek: a feladatot felbontó ügynök

Az egyszerű ReAct agent lépésenként gondolkodik. A planning agent előbb megtervezi az egész megközelítést, majd végrehajtja a tervet.

ReWOO pattern (Reasoning Without Observation)

A ReAct-tal ellentétben a ReWOO előre megtervezi az összes lépést, mielőtt bármit végrehajtana. Ez hatékonyabb, mert kevesebb LLM hívás kell (egy tervezés + végrehajtás vs. lépésenkénti gondolkodás).

1. TERVEZÉS (Plan)
   "A feladathoz szükségem van:
    - Lépés 1: Keresni a tudásbázisban
    - Lépés 2: Az eredmény alapján lekérdezni a CRM-et
    - Lépés 3: Összegzést készíteni"

2. VÉGREHAJTÁS (Execute)
   → Lépés 1: search_knowledge_base("ügyfél panasz")
   → Lépés 2: query_crm(customer_id)
   → Lépés 3: generate_summary(results)

3. VÉGSŐ VÁLASZ

Multi-agent rendszerek: együttműködő ügynökök

A legizgalmasabb fejlesztés 2026-ban a multi-agent rendszerek térnyerése. Az ötlet: ahelyett, hogy egyetlen agent-et próbálsz mindenre megtanítani, specializált agent-eket hozol létre, amelyek együttműködnek.

Tipikus multi-agent architektúra

                Orchestrator Agent
          (feladatot kioszt, eredményt gyűjt)
               ╱        │        ╲
     Kutató Agent   Kódoló Agent   Ellenőr Agent

Orchestrator: Megkapja a feladatot, felbontja részfeladatokra, kiosztja a specializált agent-eknek
Kutató agent: Webes keresés, dokumentum elemzés, adatgyűjtés
Kódoló agent: Kód írás, refaktorálás, tesztelés
Ellenőr agent: Code review, minőségellenőrzés, biztonság

Kommunikációs minták

Hierarchikus: Az orchestrator irányít, az agent-ek jelentenek
Peer-to-peer: Az agent-ek egymással kommunikálnak (pl. a kódoló megkérdezi a kutatót)
Tábla-alapú (blackboard): Közös memória, ahova minden agent ír és olvas

Agent keretrendszerek 2026-ban

LangGraph

A LangChain csapat agent orkesztrációs keretrendszere. Gráf-alapú architektúra, ahol a node-ok az agent lépései, az élek a döntési logika. 2026-ban már érett, production-grade megoldásként használják széles körben.

Erősségei: Állapotkezelés, ciklikus gráfok, emberi jóváhagyási pontok, perzisztens állapot Ideális: Komplex, több lépéses agent-ek, amiknek állapotot kell kezelniük

OpenAI Agents SDK

Az OpenAI production-ready agent keretrendszere, ami a korábbi Swarm kísérleti projekt utódja. Az Agents SDK a Responses API-ra épül, és nyílt forráskódú (Python és TypeScript). Beépített tool use, handoff-ok agent-ek között, guardrails és tracing - provider-agnosztikus, tehát nem-OpenAI modellekkel is használható.

Erősségei: Egyszerű API, beépített tracing, AgentKit a magasabb szintű orkesztrációhoz Ideális: OpenAI ökoszisztémában dolgozó csapatok, akik gyorsan akarnak production agent-et építeni

CrewAI

Szerepalapú multi-agent framework. Minden agent-nek van egy “szerepe” (kutató, író, ellenőr), és a “crew” az együttműködő csapat.

Erősségei: Gyors prototípus, intuitív API, 35K+ GitHub star, 1.3M+ havi PyPI letöltés Ideális: Csapat-alapú automatizáció, ahol a feladatok egyértelműen feloszthatók

AutoGen (Microsoft)

Konverzáció-alapú multi-agent framework, ahol az agent-ek beszélgetésen keresztül dolgoznak együtt.

Erősségei: Rugalmas, human-in-the-loop támogatás, kutatás-orientált, 48K+ GitHub star Ideális: Nyílt végű problémamegoldás, iteratív workflow-ok emberi közreműködéssel

Claude tool use + MCP (Anthropic)

Nem keretrendszer, hanem natív API képesség. A Claude modellek (Opus 4.6, Sonnet 5) közvetlenül képesek eszközöket használni - definiálsz tool-okat, és a modell eldönti, mikor és hogyan hívja meg őket. A Model Context Protocol (MCP) az Anthropic nyílt szabványa, amely egységes interfészt biztosít az AI modellek és külső eszközök/adatforrások között - 2025-ben az OpenAI és a Google is adoptálta.

Erősségei: Egyszerű integráció, erős reasoning, biztonságos, MCP ökoszisztéma Ideális: Egyedi agent alkalmazások, ahol teljes kontrollt akarsz az architektúra felett

Valós alkalmazások

Kódgeneráló agent-ek

A modern fejlesztői eszközök mögött valódi agent-ek dolgoznak. A Claude Code például egy terminál-alapú agent, ami közvetlenül a kódbázisoddal dolgozik: fájlokat olvas és ír, parancsokat futtat, git-tel verziókezel, és komplex refaktorálásokat hajt végre önállóan. A Cursor IDE hasonlóan agent-ként működik: megérti a teljes projekt kontextusát, és többlépéses kódmódosításokat végez. Ezek az eszközök a ReAct pattern élő példái:

Megértik a kódbázis kontextusát (MCP-n és tool use-on keresztül)
Fájlokat olvasnak és írnak
Teszteket futtatnak és a hibákat javítják (iteráció)
Többlépéses refaktorálást végeznek (planning)

Kutatási agent-ek

Automatizált kutatás: az agent kap egy témát, keres az interneten, összegyűjti a releváns forrásokat, kivonatol, és strukturált riportot készít. Jó példa: a Perplexity AI lényegében egy kutatási agent webes felülettel.

Ügyfélszolgálati agent-ek

Nem chatbot, hanem agent: hozzáfér a CRM-hez, tudásbázishoz, megrendelés-kezelő rendszerhez. Megérti a kontextust, önállóan keres megoldást, és ha nem tud segíteni, emberhez eszkalál - a teljes kontextussal együtt.

Biztonság és korlátok

Az AI agent-ek nem játékszerek. Komoly biztonsági kérdéseket vetnek fel:

Prompt injection

Ha az agent külső forrásokból olvas (web, email, dokumentumok), a rosszindulatú tartalom manipulálhatja a viselkedését. Például: egy weboldal rejtett utasítást tartalmaz, ami arra veszi rá az agent-et, hogy érzékeny adatokat továbbítson.

Védekezés: Input szanitizálás, sandboxing, minimális jogosultságok (least privilege), output validáció.

Elszabadult agent (runaway agent)

Az agent végtelen ciklusba kerülhet, vagy nem várt műveleteket hajthat végre. Ha az agent-nek írási jogosultsága van (email küldés, adatbázis módosítás), ez valós kockázat.

Védekezés: Iteráció limit, költségplafon, emberi jóváhagyás kritikus lépéseknél, audit log.

Guardrails

Token limit: Maximum költség/futás beállítása
Tool whitelist: Csak az engedélyezett eszközök érhetők el
Output filtering: A válaszok ellenőrzése szenzitív tartalom szempontjából
Human-in-the-loop: Kritikus döntéseknél emberi jóváhagyás kérése

Mi jön ezután?

2026-ban az AI agent-ek már kiléptek a kísérleti fázisból, és a fejlődés exponenciális:

Jobb reasoning: A Claude Opus 4.6 és a GPT-5.2 már kiváló többlépcsős gondolkodásra képesek
Computer use: Az Anthropic computer use képessége már lehetővé teszi, hogy az agent-ek grafikus felületeket kezeljenek (böngésző, desktop alkalmazások)
MCP ökoszisztéma: A Model Context Protocol nyílt szabvány lett, amit az OpenAI, Google és Microsoft is adoptált - egységes eszközhasználat minden AI rendszerben
Autonóm fejlesztés: A Claude Code és hasonló eszközök már önállóan építenek teljes alkalmazásokat
Szabályozás: Az EU AI Act és más szabályozások keretrendszert adnak az agent-ek használatához

Az AI agent-ek nem a jövő - a jelen. A kérdés nem az, hogy használd-e őket, hanem az, hogy hogyan használd őket biztonságosan és hatékonyan.

Ha AI agent alapú megoldást tervezel a vállalkozásodhoz, az AppForge csapata segít az architektúra tervezésében, a megfelelő keretrendszer kiválasztásában és a biztonságos implementációban.

Megosztás:

MI-megoldásra van szükséged?

Automatizáld a munkafolyamataidat és szerezz versenyelőnyt mesterséges intelligencia megoldásainkkal.

MI fejlesztés részletek Ingyenes 30 perces konzultáció

Kapcsolódó cikkek

Ezek a cikkek is érdekelhetnek

MI fejlesztési megoldások költségáttekintéssel

MI árak automatizálás

MI fejlesztés árak 2026 – Mennyibe kerül egy AI megoldás Magyarországon?

Részletes útmutató a mesterséges intelligencia fejlesztés árakról Magyarországon: chatbotok, RAG rendszerek, egyedi modellek és folyamatautomatizálás költségei.

2026. február 6. 14 perc olvasás

MI automatizálás hatékonyság

Vállalkozás automatizálás MI-vel: Gyakorlati útmutató KKV-knak

Lépésről lépésre útmutató, hogyan automatizáld az üzleti folyamataidat mesterséges intelligenciával - konkrét eszközökkel és ROI számokkal.

2026. január 24. 11 perc olvasás

MI chatbot ügyfélszolgálat

AI Chatbotok: Hogyan teremts VALÓDI üzleti értéket (nem gimmicket)

Gyakorlati útmutató az AI chatbotok üzleti alkalmazásához - ROI számok, buktatók és implementációs best practice-ek.

2026. január 13. 9 perc olvasás

Vissza a bloghoz