ROACH PI: AI 코딩 에이전트에 엔지니어링 규율을 씌우는 오픈소스 확장

안녕하세요, Tom입니다.

AI 코딩 에이전트를 쓰다 보면 한 가지 찜찜한 점이 있어요. 코드를 짜는 건 정말 잘하는데, 계획 없이 바로 작업에 뛰어들고, 자기가 짠 코드를 자기가 검증하는 구조라는 거예요. 사람 개발자라면 당연히 코드 리뷰를 받고, 테스트를 별도로 돌리잖아요. AI 에이전트한테도 같은 규율을 씌울 수 없을까?

이 질문에서 출발한 프로젝트가 바로 ROACH PI예요.

ROACH PI가 뭔가요?

ROACH PI는 Pi 코딩 에이전트용 오픈소스 확장이에요. 핵심 아이디어는 간단해요 — AI 에이전트에 소프트웨어 엔지니어링 라이프사이클을 강제하는 거예요.

명확화(Clarify) → 계획(Plan) → 실행(Execute) → 검증(Validate) → 정리(Cleanup)

단순히 프롬프트 몇 개 추가한 수준이 아니에요. 12개의 전문화된 에이전트가 각 단계를 담당하고, 특히 실행하는 Worker와 검증하는 Validator가 완전히 분리된 프로세스로 돌아요. Validator는 Worker의 출력을 직접 보지 못하는 정보 격리 구조라서, "자기가 짠 코드를 자기가 OK 하는" 문제를 원천 차단해요.

주요 기능 살펴보기

Ultraplan — 병렬 리뷰 기반 계획 수립

복잡한 작업이 들어오면 5개 관점(실현 가능성, 아키텍처, 리스크, 의존성, 사용자 가치)의 리뷰어가 동시에 분석해요. 그 결과를 종합해서 마일스톤 의존성 DAG로 분해하는 방식이에요. 사람 팀에서 설계 리뷰 미팅 하는 것과 비슷하다고 보면 돼요.

Long Run — 대규모 작업용 체크포인트 복구

큰 프로젝트를 마일스톤 기반 사이클로 쪼개고, 중간에 컨텍스트가 날아가도 체크포인트에서 복구할 수 있어요. 컨텍스트 윈도우 한계 때문에 긴 작업이 꼬이는 경험, 다들 한 번쯤 있으시죠?

AI Slop Cleaner

LLM이 만들어내는 전형적인 저품질 패턴(불필요한 주석, 과도한 추상화 등) 6가지 카테고리를 자동으로 잡아줘요. 이건 꽤 실용적이더라고요.

행동 가드레일

Karpathy의 규칙("쓰기 전에 읽기", "수술적 수정"), Pike의 규칙("최적화 전에 측정") 같은 엔지니어링 원칙을 에이전트에 자동 주입해요.

개인적인 생각

솔직히 가장 인상적인 부분은 투명성이에요. 모든 프롬프트, 에이전트 정의, 도구, 이벤트 훅이 전부 공개되어 있어요. 숨겨진 시스템 프롬프트가 없다는 게 큰 차별점이에요. 실시간으로 프롬프트 캐시 히트율, 컨텍스트 윈도우 사용량까지 보여주는 것도 좋고요.

다만 현재는 Pi 코딩 에이전트 전용이라는 점은 아쉬워요. Claude Code나 Cursor에서 바로 쓸 수 있는 건 아니에요. 그래도 "AI 에이전트에 엔지니어링 규율을 어떻게 씌울 것인가"라는 설계 철학 자체는 모든 AI 코딩 도구에 적용할 수 있는 이야기예요.

AI 에이전트가 코드를 더 잘 짜게 만드는 것도 중요하지만, 더 신뢰할 수 있게 만드는 것이 다음 단계라고 생각해요. ROACH PI는 그 방향의 좋은 레퍼런스가 될 것 같아요.

설치 방법

Pi 코딩 에이전트를 쓰고 있다면 바로 설치할 수 있어요.

pi install git:github.com/tmdgusya/pi-engineering-discipline-extension

설치 후 반드시 /setup을 먼저 실행해야 해요.

관심 있으신 분들은 GeekNews 원문이나 GitHub 레포에서 더 자세히 확인해 보세요. Wiki 문서도 잘 정리되어 있더라고요!

ROACH PI: AI 코딩 에이전트에 엔지니어링 규율을 씌우는 오픈소스 확장

ROACH PI가 뭔가요?

주요 기능 살펴보기

Ultraplan — 병렬 리뷰 기반 계획 수립

Long Run — 대규모 작업용 체크포인트 복구

AI Slop Cleaner

행동 가드레일

개인적인 생각

설치 방법

관련 글

GitButler — GitHub 공동창업자가 Git을 처음부터 다시 만든 이유

Claude Code v2.1.142~144: 에이전트 플래그 대거 추가와 백그라운드 세션 개선

Oh My OpenCode v4.2.0: 안정성의 기초를 다지다