AI 에이전트 프로토콜 완벽 가이드: MCP부터 AG-UI까지 6가지 정리
안녕하세요, Tom입니다.
AI 에이전트 생태계가 빠르게 성장하면서, 에이전트들이 서로 소통하고 도구를 연결하기 위한 프로토콜도 우후죽순 등장하고 있어요. MCP는 이미 많이 알려졌지만, A2A, UCP, AP2, A2UI, AG-UI 같은 프로토콜은 아직 낯선 분들이 많을 거예요.
오늘은 이 6가지 프로토콜을 레스토랑 공급망이라는 하나의 시나리오로 쉽게 풀어볼게요. 복잡한 기술 스펙 대신, 각 프로토콜이 어떤 문제를 해결하는지에 초점을 맞출게요.
비유로 이해하기: 레스토랑 공급망
레스토랑을 운영한다고 상상해 보세요.
- MCP: 주방에서 냉장고, 오븐, 식재료 저장소에 접근하는 표준화된 방법
- A2A: 다른 레스토랑이나 외부 케이터링 업체와 소통하는 방법
- UCP: 식재료 공급업체들과 주문하는 표준화된 방법
- AP2: 공급업체에 대금을 결제하는 안전한 방법
- A2UI: 손님에게 메뉴판과 주문서를 보여주는 방법
- AG-UI: 손님과 실시간으로 대화하며 주문을 받는 방법
이 비유를 머릿속에 두고 각 프로토콜을 살펴볼게요.
1. MCP (Model Context Protocol)
🎯 핵심: "도구 연결의 표준화"
MCP는 AI 모델이 외부 도구와 데이터에 접근하는 방식을 표준화한 프로토콜이에요. Anthropic이 제안했고, 현재 가장 널리 채택되고 있죠.
해결하는 문제: 각 API마다 커스텀 통합 코드를 작성해야 하는 번거로움
MCP 이전에는 DB에 연결하려면 DB 전용 코드, Notion에 연결하려면 Notion 전용 코드를 작성해야 했어요. MCP는 표준화된 디스커버리 패턴을 제공해서, 한 번 MCP 서버를 만들면 어떤 AI 클라이언트에서든 동일하게 사용할 수 있게 해줘요.
AI Agent ←→ MCP Protocol ←→ Database
←→ Notion
←→ Mailgun
←→ Slack
실무에서의 의미
- DB 쿼리, 파일 시스템, API 호출 등을 하나의 표준으로 통합
- "플러그 앤 플레이" 방식으로 새 도구 추가 가능
- 이미 수천 개의 MCP 서버가 공개되어 있어 생태계가 활발
2. A2A (Agent2Agent)
🎯 핵심: "에이전트 간 통신의 표준화"
A2A는 Google이 제안한 프로토콜로, 서로 다른 팀이나 프레임워크에서 만든 원격 에이전트 간의 통신을 표준화해요.
해결하는 문제: 서로 다른 프레임워크로 만든 에이전트들이 소통할 수 없는 문제
예를 들어, 마케팅 팀의 에이전트(LangChain)와 개발 팀의 에이전트(Claude Code)가 협업해야 할 때, A2A가 없으면 둘 사이에 통역사를 만들어야 해요.
A2A는 Agent Card라는 개념을 도입해요. 각 에이전트가 자신의 능력, 입출력 형식, 엔드포인트를 기술한 카드를 공개하면, 다른 에이전트가 이 카드의 URL만 추가하면 바로 통합이 돼요.
{
"name": "마케팅 분석 에이전트",
"description": "캠페인 성과 분석 및 리포트 생성",
"capabilities": ["campaign_analysis", "report_generation"],
"endpoint": "https://marketing-agent.company.com/a2a"
}3. UCP (Universal Commerce Protocol)
🎯 핵심: "상거래 API의 표준화"
UCP는 공급업체별로 제각각인 상거래 API를 표준화하는 프로토콜이에요.
해결하는 문제: 식재료 공급업체마다 주문 방식이 달라서 각각 연동 코드를 작성해야 하는 문제
독점 SDK 없이 표준 REST API만으로 주문, 결제, 배송 추적을 할 수 있게 해줘요. AI 에이전트가 가격 비교, 자동 발주, 재고 관리를 통합적으로 처리할 때 특히 유용해요.
에이전트 ←→ UCP ←→ 공급업체 A (주문)
←→ 공급업체 B (주문)
←→ 공급업체 C (주문)
같은 인터페이스로 어떤 공급업체든 연결할 수 있으니까, 에이전트가 실시간으로 최적의 공급업체를 선택하는 것도 가능해지죠.
4. AP2 (Agent Payments Protocol)
🎯 핵심: "에이전트의 결제 행위를 안전하게 관리"
AP2는 AI 에이전트가 돈을 다룰 때의 안전장치를 제공하는 프로토콜이에요.
해결하는 문제: AI가 임의로 결제하면 안 되니까, 승인과 감사 추적이 필요
AP2는 세 단계의 흐름으로 결제를 처리해요.
IntentMandate → PaymentMandate → PaymentReceipt
(결제 의도) (결제 승인) (결제 영수증)
- IntentMandate: 에이전트가 "이 물건을 사고 싶다"고 의도를 선언
- PaymentMandate: 사람이나 상위 에이전트가 금액과 대상을 확인하고 승인
- PaymentReceipt: 결제가 완료되면 변조 불가능한 영수증 발행
이 모든 과정이 감사 추적(audit trail)으로 기록되기 때문에, 나중에 "왜 이 결제가 발생했는지" 추적할 수 있어요. AI가 사람의 돈을 다루는 시대에 꼭 필요한 프로토콜이죠.
5. A2UI (Agent-to-User Interface)
🎯 핵심: "에이전트가 동적으로 UI를 생성"
A2UI는 AI 에이전트가 사용자에게 보여줄 UI를 선언적으로 생성하는 프로토콜이에요.
해결하는 문제: 에이전트가 텍스트로만 응답하면 복잡한 정보를 전달하기 어려운 문제
A2UI는 18개의 안전한 컴포넌트 프리미티브를 정의해요. 에이전트가 이 프리미티브들을 JSON으로 조합하면, 클라이언트가 알아서 렌더링하는 방식이에요.
{
"type": "card",
"children": [
{ "type": "heading", "text": "주문 현황" },
{ "type": "progress", "value": 75, "label": "배송 중" },
{ "type": "button", "text": "상세 보기", "action": "view_details" }
]
}에이전트가 임의의 HTML이나 JavaScript를 실행하는 게 아니라, 사전 정의된 안전한 컴포넌트만 사용하기 때문에 보안 위험이 없어요.
6. AG-UI (Agent-User Interaction)
🎯 핵심: "실시간 스트리밍 상호작용의 표준화"
AG-UI는 CopilotKit에서 제안한 프로토콜로, 에이전트와 사용자 간의 실시간 스트리밍 상호작용을 표준화해요.
해결하는 문제: 스트리밍 응답, 도구 호출 중간 상태, 사용자 입력 대기를 일관되게 처리해야 하는 문제
AG-UI는 SSE(Server-Sent Events) 스트림을 기반으로 다음 이벤트들을 표준화해요.
- 텍스트 스트리밍: 글자가 하나씩 나타나는 실시간 응답
- 도구 호출 상태: "지금 검색 중입니다...", "결과를 정리하고 있어요..."
- 사용자 입력 대기: "추가 정보가 필요해요. 입력해 주세요."
Agent ──SSE Stream──→ Client
├─ TextDelta: "분석 결과를..."
├─ ToolCallStart: {tool: "search", status: "running"}
├─ ToolCallEnd: {result: {...}}
├─ InputRequest: {type: "text", prompt: "기간을 선택해 주세요"}
└─ TextDelta: "결론적으로..."
채팅 UI를 만들어 본 분이라면, 스트리밍 응답을 처리하는 게 얼마나 까다로운지 아실 거예요. AG-UI가 이걸 표준화해 주면 프론트엔드 개발이 훨씬 수월해지죠.
⚠️ 어디서부터 시작해야 할까?
6가지 프로토콜을 다 보면 압도당할 수 있는데, 가이드는 대부분 MCP로 시작하라고 권장해요.
단계 1: MCP로 도구 연결
단계 2: 필요시 A2A로 에이전트 간 협업 추가
단계 3: 상거래가 필요하면 UCP + AP2 도입
단계 4: 리치 UI가 필요하면 A2UI 또는 AG-UI 적용
모든 프로토콜을 한 번에 도입하려고 하면 복잡성만 늘어나요. 실제 필요가 생길 때 점진적으로 추가하는 게 현명한 접근이에요.
Tom의 생각
이 가이드를 보면서 AI 에이전트 생태계가 정말 빠르게 성숙해지고 있다는 걸 느꼈어요. 불과 1년 전만 해도 MCP 하나가 전부였는데, 이제는 에이전트 간 통신(A2A), 결제(AP2), UI(A2UI, AG-UI)까지 각 영역에 맞는 전문 프로토콜들이 등장하고 있거든요.
개인적으로 가장 주목하는 건 AP2예요. AI 에이전트가 실제로 돈을 쓰는 시대가 오면, 승인과 감사 추적은 선택이 아니라 필수가 될 거예요. 지금은 아직 초기 단계이지만, 이 프로토콜이 성숙해지면 "AI 비서가 알아서 장을 봐주는" 시나리오가 현실이 될 수 있겠죠.
그리고 AG-UI도 기대돼요. 저도 이 블로그의 워크플로우를 만들면서 스트리밍 상태 관리가 정말 까다로웠거든요. 이게 표준화되면 개발 생산성이 크게 올라갈 것 같아요.
아직은 MCP가 압도적으로 많이 쓰이지만, 나머지 프로토콜들도 눈여겨봐 두면 좋을 것 같아요. 특히 에이전트를 만드는 개발자라면요!
다음에 또 유용한 소식으로 찾아올게요!