코딩 에이전트의 구성 요소: 도구, 메모리, 컨텍스트가 LLM을 확장하는 방법

세바스찬 라슈카는 코딩 작업 성능을 향상시키기 위해 LLM을 애플리케이션 계층으로 감싼 시스템인 코딩 에이전트의 아키텍처를 설명합니다. 그는 LLM, 추론 모델, 에이전트를 구분하며, LLM 시스템의 실질적인 진전은 단순히 더 나은 모델이 아니라 주변 시스템 구성 요소에서 비롯된다고 설명합니다.
코딩 에이전트의 주요 구성 요소
이 글은 코딩 에이전트를 효과적으로 만드는 여섯 가지 주요 구성 요소를 제시합니다:
- 저장소 컨텍스트: 코드 저장소 정보의 탐색 및 관리
- 도구 설계: 외부 도구 및 기능의 통합
- 프롬프트 캐시 안정성: 세션 간 일관된 프롬프트 관리
- 메모리: 상태 유지 및 세션 연속성
- 긴 세션 연속성: 장기간 상호작용에 걸친 컨텍스트 유지
- 모델 선택: 적절한 LLM 또는 추론 모델 선택
아키텍처 계층
라슈카는 에이전트 생태계에서 몇 가지 핵심 개념을 정의합니다:
- LLM: 핵심 다음 토큰 모델
- 추론 모델: 중간 추론, 검증 또는 후보 답변 탐색에 더 많은 추론 시간 컴퓨팅을 소비하도록 훈련되거나 프롬프트된 LLM
- 에이전트: 다음에 무엇을 검사할지, 어떤 도구를 호출할지, 상태를 어떻게 업데이트할지, 언제 멈출지 결정하는 모델 주변의 제어 루프
- 에이전트 하네스: 컨텍스트, 도구 사용, 프롬프트, 상태 및 제어 흐름을 관리하는 에이전트 주변의 소프트웨어 스캐폴드
- 코딩 하네스: 코드 컨텍스트, 도구, 실행 및 반복적 피드백을 관리하는 소프트웨어 엔지니어링을 위한 특수한 에이전트 하네스
그는 Claude Code와 Codex CLI를 코딩 하네스로 간주할 수 있다고 언급합니다. 관계는 다음과 같이 설명됩니다: LLM은 엔진이고, 추론 모델은 강화된 엔진이며, 에이전트 하네스는 모델을 효과적으로 사용하도록 돕습니다.
코딩 작업은 단순히 다음 토큰 생성 이상을 요구합니다—저장소 탐색, 검색, 기능 조회, 차이 적용, 테스트 실행, 오류 검사 및 컨텍스트 관리가 필요합니다. 코딩 하네스는 모델 패밀리, 에이전트 루프 및 런타임 지원의 세 가지 계층을 결합합니다.
📖 Read the full source: HN AI Agents
👀 See Also

실용적인 OpenClaw 조언: 작게 시작하고 흔한 함정 피하기
한 개발자가 OpenClaw로 개인 건강 추적기를 만든 경험에서 얻은 교훈을 공유하며, 좁은 범위, 결정론적 워크플로우, 하나의 LLM 고수 등을 강조했습니다. 이 글은 ChatGPT와 Gemini를 비교한 구체적인 모델 관찰도 포함하고 있습니다.

클로드 코드를 사용한 봇의 OAuth 토큰 자동 갱신
레딧 사용자가 OAuth 토큰 만료를 방지하는 방법을 공유했습니다. Claude Code를 설정하여 8시간마다 자동으로 토큰을 갱신함으로써, 수동 개입 없이 봇을 지속적으로 운영할 수 있습니다.

플로우 맵: 더 빠른 샘플링을 위한 확산 모델의 적분 학습
Sander Dieleman이 플로우 맵(flow maps)을 설명합니다. 이는 확산 모델의 ODE 적분을 직접 예측하는 신경망으로, 더 빠른 샘플링, 보상 기반 학습, 그리고 조종 가능성(steerability)을 가능하게 합니다.

Hostinger VPS에서 OpenClaw 설정 가이드
Hostinger VPS에 OpenClaw를 배포하고, OpenAI와 Entropics의 AI API를 연결하며, 텔레그램과 통합하여 24시간 운영하는 단계별 가이드입니다.