Introduction
사람은 복잡한 패턴을 잘 찾아낸다. 하지만, 결론을 내기 전에 기존 지식을 보충하기 위해 책, 구글 검색, ... 등 다양한 도구를 사용한다. 사람과 마찬가지로 생성형 AI 모델도 도구를 활용하도록 학습될 수 있다. 예를 들어, 고객의 구매 내역을 조회해 맞춤형 쇼핑 서비스를 제공하거나 다양한 API 호출을 수행해서 사용자 대신 이메일을 작성하는 등 여러 작업들이 가능하다.
What is an Agent?
우리가 누군가에게 "커피 한 잔 부탁해요." 라고 명령을 내린다. 그는 우리의 명령을 듣고 reasoning and planning를 통해 필요한 steps and tools을 생각한다. 예를 들어,
1. 주방에 간다.
2. 커피 머신을 사용한다.
3. 커피를 내린다.
4. 커피를 가져온다.
계획을 세웠다면, Act 해야 한다. 실행하기 위해 tools 목록들에서 필요한 도구를 사용한다. 아마 이 경우엔 그는 커피 머신을 사용할 것이다. 커피 머신을 작동 시키고 커피를 내리고 우리에게 가져온다.
그가 바로 Agent이다. Agent는 추론하고 계획하고 주변 환경과 상호작용하는 AI 모델이다.

Agent는 두 가지 주요 부분으로 나눌 수 있다.
- Brain (AI 모델): Reasoning and planning이 일어난다. 상황에 맞게 어떤 행동을 할 지 결정한다.
- Body (기능과 도구): Agent가 수행할 수 있는 모든 작업을 나타낸다. (행동 범위는 어떤 도구를 가지고 있냐에 따라 달라진다.)
What type of AI Models do we use for Agents?
Agent에서 가장 일반적인 AI 모델은 LLM (Large Language Model)이다. 많이 사용하는 GPT4, LLaMA, Gemini 등이 예시로 있다. LLM은 text를 입력으로 받아 text를 출력하는 모델인데, GPT와 같은 모델을 보면 text를 입력(이미지 생성 요청)했는데 이미지를 출력해준다.

이미지 출력이 가능한 이유는 tools 기능을 추가했기 때문이다. 이 경우에는 tool을 통해 act를 수행한 것이다. 하나의 act에 여러 tools을 사용할 수 있으므로 둘의 개념을 혼동하면 안 된다. 요즘 많이 사용하는 고객 서비스 챗봇 등 다양한 분야에서 agent가 유용하게 사용되고 있다. 심지어 게임 NPC에도 들어가는데, 이 경우에는 정해진 행동 패턴을 따르지 않고 플레이어와 상호작용한다. (유튜브에서 공포 게임에 추가된 것을 본 적이 있는데 매우.. 무섭다..)
Reference
'AI study > Agent' 카테고리의 다른 글
| Agent | LLM은 무엇일까? (0) | 2026.06.15 |
|---|