2025. 02. 20

AI Agent 1편 - 단순한 챗봇을 넘어선 AI

AI Agent의 구조와 원리

AI 에이전트(Agent)는 단순히 질문에 답하는 챗봇이 아닙니다. 사용자의 요청을 이해하고, 외부 시스템과 연동하며, 스스로 계획하고 실행할 수 있는 '행동하는 AI'입니다. 쉽게 말하면 대화하는 뇌 + 판단하는 전략가 + 손발이 달린 AI라고 할 수 있죠.

AI Agent란?

아래와 같이 각 기업마다 정의는 조금씩 다르지만, 핵심은 같습니다.

Huggingface 목표 달성을 위해 AI 모델을 활용해 환경과 상호작용하는 시스템
Anthropic LLM이 자신의 프로세스와 도구 사용을 동적으로 결정하며, 작업 수행 방식을 직접 통제
Google 세상을 관찰하고 가진 도구를 활용해 목표를 달성하는 애플리케이션

즉, AI가 스스로 생각하고 판단하며 도구를 사용해 행동하는 시스템이 바로 AI 에이전트입니다.

AI model, AI Workflow, AI Agent의 차이점

구분	특징
AI model	입력 → 연산 → 출력. 외부 환경과 상호작용 X
AI Workflow	AI 모델 활용, 사전 정의된 절차에 따라 실행. 스스로 절차 생성 X
AI Agent	목표 달성을 위해 계획을 세우고, 도구를 활용하며, 환경과 능동적으로 상호작용

즉, 단순 AI 모델은 '두뇌만 있는 상태', AI Workflow는 '두뇌+정해진 행동 지침', AI 에이전트는 '두뇌+손발+기억+계획 능력'을 가진 존재입니다.

AI Agent의 뼈대와 움직임

1. AI Agent의 뼈대 (구성요소)
사람으로 치면 몸과 장기가 있듯, AI 에이전트도 네 가지 핵심 구성 요소로 이루어져 있습니다.

LLM (두뇌) → 질문을 이해하고, 추론하며, 답을 떠올립니다.
Planner (전략가) → "목표를 이루려면 어떤 단계를 밟아야 하지?" 하고 길을 짜줍니다.
Tool Handler (손발) → 계산기, 검색 엔진, 데이터베이스 같은 외부 도구를 직접 실행합니다.
Memory (기억) → 대화 맥락이나 과거 경험을 저장해 다음 판단에 참고합니다.

즉, 뇌가 생각하고, 전략가가 계획을 세우고, 손발이 직접 행동하며, 기억이 그 과정을 뒷받침하는 구조죠.
2. AI Agent의 움직임 (실행루프)
그렇다면 이 몸뚱이가 실제로 어떻게 움직이는가?AI 에이전트는 보통 다음과 같은 루프를 반복하며 문제를 해결합니다.

Thought (생각) → 지금 상황을 분석하고, 뭘 해야 할지 고민합니다.
Action (행동) → 전략을 따라 외부 도구를 실행합니다.
Observation (관찰) → 실행 결과를 받아보고 다시 판단합니다.
Final Action (최종 행동) → 여러 번의 시행착오 끝에 최종 답변이나 결과물을 내놓습니다.

이게 반복되면서 에이전트는 단순한 챗봇을 넘어, 정말 사람처럼 "생각 → 행동 → 피드백 → 개선"의 사이클을 돌게 되는 거죠.

예시: "오늘 대전 날씨에 맞는 옷차림 추천해줘"

Thought "날씨 정보를 알아야겠다. weather API를 사용하자."
Action weather API 호출

{
  "action": "get_weather",
  "action_input": {"location": "Daejeon"}
}

Observation 대전 기온 확인 → 낮은 온도, 아침/밤 쌀쌀
Final Answer "낮에는 가벼운 자켓, 아침과 밤에는 조금 더 따뜻하게 입으세요"

이 순환 덕분에 AI 에이전트는 단순 답변을 넘어 단계별 문제 해결이 가능합니다.

Python 예제: LLM 기반 에이전트

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("meta-llama/Llama-3.2-3B-Instruct")
model = AutoModelForCausalLM.from_pretrained("meta-llama/Llama-3.2-3B-Instruct")

SYSTEM_PROMPT = """
다음 질문에 최선을 다해 답하세요. 사용 가능한 도구:
- get_weather: 주어진 위치의 현재 날씨를 가져옵니다.
Thought → Action → Observation 순환을 반복하며 최종 답 제공
"""
messages = [
    {"role": "system", "content": SYSTEM_PROMPT},
    {"role": "user", "content": "오늘 대전 날씨 기반으로 옷차림 추천해줘"}
]

prompt = tokenizer.apply_chat_template(messages, add_generation_prompt=True)

여기서 Thought → Action → Observation → Final Answer 루프를 통해 에이전트가 문제를 해결합니다.
👉 정리하면, 에이전트의 구조(LLM, Planner, Tool Handler, Memory)는 사람의 두뇌·전략가·손발·기억처럼 기능을 나누고, 이게 모여서 Thought → Action → Observation → Final Action의 순환 루프를 돌며 실제 문제 해결을 해나가는 거예요.