ROACH PI: AI 코딩 에이전트에 엔지니어링 규율을 씌우는 오픈소스 확장
안녕하세요, Tom입니다.
AI 코딩 에이전트를 쓰다 보면 한 가지 찜찜한 점이 있어요. 코드를 짜는 건 정말 잘하는데, 계획 없이 바로 작업에 뛰어들고, 자기가 짠 코드를 자기가 검증하는 구조라는 거예요. 사람 개발자라면 당연히 코드 리뷰를 받고, 테스트를 별도로 돌리잖아요. AI 에이전트한테도 같은 규율을 씌울 수 없을까?
이 질문에서 출발한 프로젝트가 바로 ROACH PI예요.
🎯 ROACH PI가 뭔가요?
ROACH PI는 Pi 코딩 에이전트용 오픈소스 확장이에요. 핵심 아이디어는 간단해요 — AI 에이전트에 소프트웨어 엔지니어링 라이프사이클을 강제하는 거예요.
명확화(Clarify) → 계획(Plan) → 실행(Execute) → 검증(Validate) → 정리(Cleanup)
단순히 프롬프트 몇 개 추가한 수준이 아니에요. 12개의 전문화된 에이전트가 각 단계를 담당하고, 특히 실행하는 Worker와 검증하는 Validator가 완전히 분리된 프로세스로 돌아요. Validator는 Worker의 출력을 직접 보지 못하는 정보 격리 구조라서, "자기가 짠 코드를 자기가 OK 하는" 문제를 원천 차단해요.
💡 주요 기능 살펴보기
Ultraplan — 병렬 리뷰 기반 계획 수립
복잡한 작업이 들어오면 5개 관점(실현 가능성, 아키텍처, 리스크, 의존성, 사용자 가치)의 리뷰어가 동시에 분석해요. 그 결과를 종합해서 마일스톤 의존성 DAG로 분해하는 방식이에요. 사람 팀에서 설계 리뷰 미팅 하는 것과 비슷하다고 보면 돼요.
Long Run — 대규모 작업용 체크포인트 복구
큰 프로젝트를 마일스톤 기반 사이클로 쪼개고, 중간에 컨텍스트가 날아가도 체크포인트에서 복구할 수 있어요. 컨텍스트 윈도우 한계 때문에 긴 작업이 꼬이는 경험, 다들 한 번쯤 있으시죠?
AI Slop Cleaner
LLM이 만들어내는 전형적인 저품질 패턴(불필요한 주석, 과도한 추상화 등) 6가지 카테고리를 자동으로 잡아줘요. 이건 꽤 실용적이더라고요.
행동 가드레일
Karpathy의 규칙("쓰기 전에 읽기", "수술적 수정"), Pike의 규칙("최적화 전에 측정") 같은 엔지니어링 원칙을 에이전트에 자동 주입해요.
🤔 개인적인 생각
솔직히 가장 인상적인 부분은 투명성이에요. 모든 프롬프트, 에이전트 정의, 도구, 이벤트 훅이 전부 공개되어 있어요. 숨겨진 시스템 프롬프트가 없다는 게 큰 차별점이에요. 실시간으로 프롬프트 캐시 히트율, 컨텍스트 윈도우 사용량까지 보여주는 것도 좋고요.
다만 현재는 Pi 코딩 에이전트 전용이라는 점은 아쉬워요. Claude Code나 Cursor에서 바로 쓸 수 있는 건 아니에요. 그래도 "AI 에이전트에 엔지니어링 규율을 어떻게 씌울 것인가"라는 설계 철학 자체는 모든 AI 코딩 도구에 적용할 수 있는 이야기예요.
AI 에이전트가 코드를 더 잘 짜게 만드는 것도 중요하지만, 더 신뢰할 수 있게 만드는 것이 다음 단계라고 생각해요. ROACH PI는 그 방향의 좋은 레퍼런스가 될 것 같아요.
설치 방법
Pi 코딩 에이전트를 쓰고 있다면 바로 설치할 수 있어요.
pi install git:github.com/tmdgusya/pi-engineering-discipline-extension설치 후 반드시 /setup을 먼저 실행해야 해요.
관심 있으신 분들은 GeekNews 원문이나 GitHub 레포에서 더 자세히 확인해 보세요. Wiki 문서도 잘 정리되어 있더라고요!