Anthropic Claude‑컴플렉스는 16개의 AI 에이전트로 구성되어 있으며, 자급자족으로 C 컴파일러를 만들었습니다

Anthropic Claude‑컴플렉스는 16개의 AI 에이전트로 구성되어 있으며, 자급자족으로 C 컴파일러를 만들었습니다

10 software

아나트릭스(Anthropic) 실험에서 16개의 독립형 AI 에이전트를 모아 Rust로 작성된 C 언어 컴파일러를 처음부터 만들었습니다. 결과물은 "순수" 구현으로, Linux 6.19 커널을 빌드하고 PostgreSQL, SQLite, Redis, FFmpeg, QEMU 같은 프로젝트를 컴파일할 수 있지만 GCC에 비해 품질과 효율성에서 크게 뒤처집니다.

어떻게 이루어졌는가

- 준비 단계
Claude Opus 4.6 모델 16개 인스턴스를 인터넷 접근 없이 별도의 Docker 컨테이너에서 실행했습니다. 각 에이전트는 공용 Git 저장소를 클론하고 lock 파일을 통해 과제를 받습니다.

- 자율 계획
중앙 조정자가 없으며, 각 에이전트가 다음에 수행할 “명백한” 작업을 스스로 결정합니다. 충돌 시 코드는 자동으로 병합됩니다.

- 개발 단계
에이전트에게 C 컴파일러를 완전히 새로 작성하도록 지시했습니다. 개발은 2주 동안 진행되었으며 Claude Code 세션이 약 2000회 필요했습니다.

- 테스트 단계
모델의 컨텍스트를 장황한 요청으로 막지 않기 위해 테스트는 요약 모드(출력 몇 줄)로 실행됩니다. 속도를 높이기 위해 1–10% 테스트만 빠르게 처리하는 옵션을 추가했습니다.

최종 제품

- 규모 – 약 100,000줄의 Rust 코드
- 기능성 – x86, ARM, RISC‑V에서 Linux 6.19 커널 빌드 가능; PostgreSQL, SQLite, Redis, FFmpeg, QEMU 컴파일 지원; GCC 테스트의 ~99% 통과
- 제한 사항 – 16비트 머신 코드 생성 불가(리눅스 실행에 GCC 필요), 어셈블러와 링커 오류 발생, GCC보다 낮은 성능. Rust 소스 품질도 숙련된 프로그래머 수준보다 떨어집니다.

실험 비용

항목금액
Claude API 토큰약 $20,000
추가 비용 (모델 교육, 프로젝트 조직, 테스트 세트)명시되지 않음

교훈 및 결론

1. 자율성 한계 – 코드가 ~100,000줄에 이르면 에이전트는 프로젝트를 완전히 이해하지 못합니다. 이는 독립형 AI의 상한선일 수 있습니다.
2. 지원 필요성 – 기능 확장을 시도하면 기존 코드를 손상시키는 경우가 많습니다.
3. 개발 환경 중요성 – 인터넷 격리와 테스트 설정이 에이전트 안정성에 결정적입니다.

결론적으로, 현대 AI 모델은 최소한의 감독으로 복잡한 소프트웨어 시스템을 생성할 수 있지만, 여전히 숙련된 개발자를 완전히 대체하지는 못합니다. 코드 품질, 성능 및 신뢰성이 전통적인 컴파일러보다 낮으며 프로젝트 규모는 수십만 줄에 한정됩니다. 이는 중요한 진전이지만 완전한 자율 소프트웨어 개발에는 아직 멀었습니다.

댓글 (0)

의견을 남겨 주세요. 예의를 지키고 주제에서 벗어나지 말아 주세요.

아직 댓글이 없습니다. 댓글을 남기고 의견을 공유해 주세요!

댓글을 남기려면 로그인해 주세요.

댓글을 남기려면 로그인