OpenAI Agents SDK 진화: 네이티브 샌드박스와 모델 네이티브 하네스 도입

OpenAI가 Agents SDK의 차세대 업데이트를 공개했어요. 이번 변화의 핵심은 네이티브 샌드박스 실행과 모델 네이티브 하네스 두 가지예요. 기존에 개발자가 직접 관리해야 했던 재시도, 인증, 상태 관리, 예외 처리 같은 부분을 SDK가 내부적으로 처리해주는 방향으로 크게 진화했어요.

하네스와 실행 환경의 분리

이번 업데이트에서 가장 중요한 아키텍처 변화는 오케스트레이션 레이어(하네스)와 코드 실행 환경(샌드박스)의 분리예요. 기존에는 에이전트의 제어 로직과 실행 코드가 같은 공간에서 돌아갔는데, 이제는 완전히 별개의 레이어로 나뉘어요.

이렇게 분리하면 보안상 큰 이점이 있어요. 프롬프트 인젝션 등으로 샌드박스 안에서 악성 코드가 생성되더라도, 하네스 자체가 노출되지 않아요. 권한 상승(privilege escalation)을 구조적으로 차단하는 설계예요.

네이티브 샌드박스 실행

샌드박스는 에이전트에게 파일 시스템 접근, 명령어 실행, 패키지 관리, 아티팩트 처리 같은 컴퓨팅 자원을 제공해요. 오케스트레이션 레이어와 같은 머신에서 돌릴 수도 있고, 격리성과 내구성, 보안을 위해 별도 환경으로 분리할 수도 있어요.

주목할 점은 다양한 플랫폼을 지원한다는 거예요. Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel 등이 빌트인으로 지원되고, 커스텀 샌드박스 구현도 가능해요.

참고: 샌드박스 상태를 저장하고 복원하는 스냅샷/리하이드레이션 기능이 내장되어 있어서, 중단된 작업을 새 샌드박스에서 이어서 진행할 수 있어요.

모델 네이티브 하네스

하네스는 에이전트에게 지시(instructions), 도구(tools), 승인 워크플로우(approvals), 트레이싱(tracing), 핸드오프(handoffs), 그리고 세션 재개 관리(resume bookkeeping)를 제공해요. Codex 스타일 에이전트에서 사용하던 패턴을 범용화한 것이라고 보면 돼요.

구체적으로 하네스가 에이전트에게 제공하는 도구는 이래요:

파일 시스템 도구: 파일 읽기/쓰기/탐색
셸 접근: 명령어 실행
스킬 프레임워크: 재사용 가능한 작업 단위
메모리: 메모리 생성 시점과 저장 위치를 개발자가 제어
컴팩션: 컨텍스트 윈도우 압박을 줄이기 위한 자동 압축

핵심 철학은 "모든 것을 컨텍스트에 밀어넣는 대신, 데이터를 샌드박스로 가져온다"는 거예요. 컨텍스트 윈도우의 한계를 실행 환경 확장으로 우회하는 접근이에요.

매니페스트와 워크스페이스 설정

매니페스트(Manifest) 설정을 통해 에이전트의 워크스페이스를 선언적으로 구성할 수 있어요. 로컬 파일 스테이징, Git 레포지토리 클론, 출력 디렉토리 생성은 물론이고, S3, GCS, Azure Blob Storage, Cloudflare R2 같은 외부 스토리지 마운트도 지원해요.

권한 시스템은 Unix 파일 시스템 권한에 매핑되어 있어서, 읽기 전용과 쓰기 접근을 세밀하게 제어할 수 있어요.

개발자에게 의미하는 것

기존 API는 그대로 유지돼요. 이전에 만든 에이전트 코드가 깨지지 않아요. 다만 이제 SDK가 루프, 도구 호출, 실행 환경 유지를 자동으로 처리해주기 때문에, 개발자는 에이전트의 비즈니스 로직에만 집중할 수 있게 됐어요.

또 하나의 장점은 하나의 하네스가 여러 샌드박스를 병렬로 관리할 수 있다는 점이에요. 장시간 실행되는 에이전트를 안정적으로 운영하는 데 꼭 필요한 기능이에요.

현재 상태와 로드맵

현재 Python 구현이 공개되어 있고, TypeScript 지원은 계획 중이에요. 코드 모드(Code Mode)와 서브에이전트(Sub-agents)도 이후 추가될 예정이에요. SDK 자체는 무료이고, 토큰 사용량과 도구 서비스에 대한 표준 요금만 적용돼요.

주의: 아직 TypeScript SDK는 나오지 않았으니, Node.js 환경에서 사용하려면 조금 더 기다려야 해요.

에이전트 개발이 "도구 호출 래퍼" 수준에서 "격리된 실행 환경을 가진 자율적 시스템" 수준으로 올라가고 있다는 걸 보여주는 업데이트예요. 상세한 코드는 OpenAI 공식 블로그에서 확인해보세요.

OpenAI Agents SDK 진화: 네이티브 샌드박스와 모델 네이티브 하네스 도입

하네스와 실행 환경의 분리

네이티브 샌드박스 실행

모델 네이티브 하네스

매니페스트와 워크스페이스 설정

개발자에게 의미하는 것

현재 상태와 로드맵

Anthropic이 Stainless를 인수한 이유: SDK 자동 생성의 핵심을 품다

OpenAI Harness팀의 실험: 코드 0줄 직접 작성, Codex만으로 제품 만들기

Anthropic SDK에 셀프 호스팅 샌드박스 추가: 에이전트를 내 인프라에서

하네스와 실행 환경의 분리

네이티브 샌드박스 실행

모델 네이티브 하네스

매니페스트와 워크스페이스 설정

개발자에게 의미하는 것

현재 상태와 로드맵

관련 글

Anthropic이 Stainless를 인수한 이유: SDK 자동 생성의 핵심을 품다

OpenAI Harness팀의 실험: 코드 0줄 직접 작성, Codex만으로 제품 만들기

Anthropic SDK에 셀프 호스팅 샌드박스 추가: 에이전트를 내 인프라에서