Mi az a chatbot, és mi a valódi AI agent?
Amikor ChatGPT-vel beszélgetsz, egy chatbot-tal kommunikálsz. Egyirányú interakció: kérdezel, válaszol. A modell a kontextusablakán belül dolgozik, nem nyúl ki a külvilágba, és nem hajt végre önálló műveleteket.
Egy AI agent alapvetően más. Az agent:
- Célokat kap, nem csak kérdéseket
- Gondolkodik a feladatról (reasoning)
- Eszközöket használ: keres, adatbázist kérdez, API-t hív, kódot futtat
- Iterál: kiértékeli a saját eredményeit és újrapróbálkozik
- Döntéseket hoz: maga határozza meg, milyen sorrendben dolgozik
Egyszerű analógia: a chatbot egy ügyfélszolgálatos, aki a fejében lévő információkból válaszol. Az agent egy junior fejlesztő, aki kap egy feladatot, kutat, próbálkozik, hibákat javít, és visszaadja az eredményt.
A ReAct pattern: gondolkodás + cselekvés
Az AI agentek alapja a ReAct (Reason + Act) pattern, amelyet Yao és munkatársai 2022-ben publikáltak. Az ötlet egyszerű: ahelyett, hogy az LLM egyetlen válaszban próbálna mindent megoldani, ciklusban gondolkodik és cselekszik.
A ReAct ciklus
- Gondolkodás (Thought).„A felhasználó a Tesla tegnapi árfolyamát kérdezi. Ezt nem tudom fejből — keresnem kell.”
- Cselekvés (Action).
search_web("Tesla stock price yesterday") - Megfigyelés (Observation).„A Tesla záróárfolyama $248,50 volt.”
- Gondolkodás.„Megvan az adat. Most meg tudom válaszolni.”
- Végső válasz.„A Tesla záróárfolyama tegnap $248,50 volt.”
A lényeg: az LLM explicit módon gondolkodik minden lépés előtt, és a gondolkodás eredménye határozza meg a cselekvést. Ez:
- Csökkenti a hallucinációt — ahelyett, hogy kitalálná a választ, az agent keres
- Auditálható — a gondolkodási lépések visszanézhetők
- Komplex feladatokra alkalmas — többlépcsős problémákat részfeladatokra bont
Tool use: az agent keze
Az agent önmagában csak gondolkodik. Az eszközök (tools) adják a kezét, amivel a külvilággal interaktál. A tool use a modern LLM-ek egyik legfontosabb képessége — a Claude Opus 4.6, a GPT-5.2 és a Gemini 3 Pro mind natívan támogatja.
Hogyan működik a tool use?
- Tool definíció. Megadod az elérhető eszközök listáját (név, leírás, paraméterek)
- LLM döntés. A modell a kontextus alapján eldönti, melyiket hívja meg és milyen paraméterekkel
- Végrehajtás. A rendszered futtatja az eszközhívást
- Eredmény visszaadás. Az eszköz outputját visszaadod az LLM-nek
- Következő lépés. Az LLM az eredmény alapján dönt — újabb hívás, vagy végső válasz
Tipikus eszközök
- Web keresés: Google/Bing API, vagy saját keresőindex
- Adatbázis lekérdezés: SQL query, vektor keresés
- Kód futtatás: Python interpreter, sandboxed JavaScript
- Fájlműveletek: olvasás, írás, fájlrendszer navigáció
- API hívások: bármilyen REST/GraphQL endpoint
- Számológép: pontos matematika (az LLM-ek nem jók számolásban)
Agent memória: rövid- és hosszútávú
Egy komolyabb agentnek memóriára van szüksége. Az LLM kontextusablaka korlátozott (még ha 200K token is), és a korábbi beszélgetések elvesznek perzisztencia nélkül.
Rövidtávú memória (Working Memory)
A kontextusablakban tartott információk: a jelenlegi feladat, az eddigi lépések, a tool use eredmények. Ez a munkamemória, ami a futás során elérhető.
Megvalósítás: egyszerű message-lista a korábbi üzenetekről, amit minden LLM hívásnál átadsz.
Hosszútávú memória (Long-term Memory)
Korábbi interakciók, tanulságok, felhasználói preferenciák — futások között megőrzött információk.
Megvalósítás: vektor adatbázis (ChromaDB, Pinecone, Qdrant), ahova az agent a fontos információkat menti, és a következő futásnál visszakeresi a releváns kontextust.
Epizodikus memória
Konkrét helyzetek és megoldásuk: „amikor legutóbb ilyen feladatot kaptam, ez a megközelítés működött.” A legkevésbé kiforrott, de aktívan kutatott terület.
Planning agentek: a feladatot felbontó ügynök
Az egyszerű ReAct agent lépésenként gondolkodik. A planning agent előbb megtervezi az egész megközelítést, majd végrehajtja a tervet.
ReWOO pattern (Reasoning Without Observation)
A ReAct-tal ellentétben a ReWOO előre megtervezi az összes lépést, mielőtt bármit végrehajtana. Hatékonyabb, mert kevesebb LLM hívás kell (egy tervezés + végrehajtás vs. lépésenkénti gondolkodás).
- Tervezés. „Lépés 1: keresni a tudásbázisban. Lépés 2: az eredmény alapján lekérdezni a CRM-et. Lépés 3: összegzést készíteni.”
- Végrehajtás. Lépés 1 → Lépés 2 → Lépés 3.
- Végső válasz.
Multi-agent rendszerek: együttműködő ügynökök
A legizgalmasabb fejlesztés 2026-ban a multi-agent rendszerek térnyerése. Ahelyett, hogy egyetlen agentet próbálsz mindenre megtanítani, specializált agenteket hozol létre, amelyek együttműködnek.
Tipikus architektúra
- Orchestrator: megkapja a feladatot, felbontja részfeladatokra, kiosztja
- Kutató agent: webes keresés, dokumentum elemzés, adatgyűjtés
- Kódoló agent: kód írás, refaktorálás, tesztelés
- Ellenőr agent: code review, minőség, biztonság
Kommunikációs minták
- Hierarchikus: az orchestrator irányít, az agentek jelentenek
- Peer-to-peer: az agentek egymással kommunikálnak
- Tábla-alapú (blackboard): közös memória, ahova mindenki ír és olvas
Agent keretrendszerek 2026-ban
| Keretrendszer | Erősség | Ideális |
|---|---|---|
| LangGraph | Állapotkezelés, ciklikus gráfok, perzisztens állapot, emberi jóváhagyási pontok | Komplex, többlépéses agentek |
| OpenAI Agents SDK | Egyszerű API, beépített tracing, AgentKit, provider-agnosztikus | Gyors production agent OpenAI ökoszisztémában |
| CrewAI | Szerepalapú architektúra, intuitív API, 35K+ GitHub star, 1,3M+ havi PyPI letöltés | Csapat-alapú automatizáció, jól felosztható feladatok |
| Microsoft AutoGen | Konverzáció-alapú multi-agent, HITL támogatás, 48K+ GitHub star | Nyílt végű problémamegoldás, iteratív workflow |
| Claude tool use + MCP | Natív API képesség, MCP nyílt szabvány, erős reasoning | Egyedi agent alkalmazások teljes kontrollal |
Az MCP (Model Context Protocol) az Anthropic nyílt szabványa, amit 2025-ben az OpenAI és a Google is adoptált. Egységes interfész az AI modellek és külső eszközök között — ugyanazt a tool-szervert használhatod Claude-dal, GPT-vel és Gemini-vel.
Valós alkalmazások
Kódgeneráló agentek
A modern fejlesztői eszközök mögött valódi agentek dolgoznak. A Claude Code egy terminál-alapú agent, ami közvetlenül a kódbázisoddal dolgozik: fájlokat olvas és ír, parancsokat futtat, gittel verziókezel, és komplex refaktorálásokat hajt végre. A Cursor IDE hasonlóan agentként működik: megérti a projekt kontextusát, többlépéses kódmódosításokat végez. Mindkettő a ReAct pattern élő példája.
Kutatási agentek
Az agent kap egy témát, keres, összegyűjti a forrásokat, kivonatol, és strukturált riportot készít. Jó példa: a Perplexity AI lényegében egy kutatási agent webes felülettel.
Ügyfélszolgálati agentek
Nem chatbot, hanem agent: hozzáfér a CRM-hez, tudásbázishoz, megrendelés-kezelő rendszerhez. Megérti a kontextust, önállóan keres megoldást, és ha nem tud segíteni, emberhez eszkalál — a teljes kontextussal együtt.
Biztonság és korlátok
Az AI agentek nem játékszerek. Komoly biztonsági kérdéseket vetnek fel.
Prompt injection
Ha az agent külső forrásból olvas (web, email, dokumentum), a rosszindulatú tartalom manipulálhatja a viselkedését. Például: egy weboldal rejtett utasítást tartalmaz, ami arra veszi rá az agentet, hogy érzékeny adatokat továbbítson.
Elszabadult agent (runaway agent)
Az agent végtelen ciklusba kerülhet, vagy nem várt műveleteket hajthat végre. Ha az agentnek írási jogosultsága van (email, adatbázis), ez valós kockázat.
Védekezés: iteráció limit, költségplafon, emberi jóváhagyás kritikus lépéseknél, audit log.
Guardrails
- Token limit: maximum költség/futás beállítása
- Tool whitelist: csak az engedélyezett eszközök érhetők el
- Output filtering: a válaszok ellenőrzése szenzitív tartalom szempontjából
- Human-in-the-loop: kritikus döntéseknél emberi jóváhagyás
Mi jön ezután?
2026-ban az AI agentek már kiléptek a kísérleti fázisból, és a fejlődés exponenciális:
- Jobb reasoning: a Claude Opus 4.6 és a GPT-5.2 már kiváló többlépcsős gondolkodásra képesek
- Computer use: az Anthropic computer use képessége lehetővé teszi, hogy az agentek grafikus felületeket kezeljenek
- MCP ökoszisztéma: nyílt szabvány lett, amit az OpenAI, Google és Microsoft is adoptált
- Autonóm fejlesztés: a Claude Code és hasonló eszközök már önállóan építenek teljes alkalmazásokat
- Szabályozás: az EU AI Act keretrendszert ad az agentek használatához
Összegzés
A kérdés nem az, hogy használj-e AI agentet — hanem hogy hogyan használd biztonságosan és hatékonyan. Ha agent-alapú megoldást tervezel, az AppForge csapata segít az architektúrában, a keretrendszer kiválasztásában és a biztonságos implementációban. Kérj 30 perces ingyenes konzultációt.



