추론 패턴 비교: CoT, ReAct, Plan-and-Execute

추론 패턴은 에이전트가 목표를 달성하기 위해 생각하고 행동을 연결하는 방식의 구조다. 모델이 얼마나 똑똑한지가 아니라, 계획·도구 사용·관찰·수정을 어떤 순서와 조합으로 진행하는지를 설명하는 개념이다. 같은 모델이라도 어떤 추론 패턴을 쓰느냐에 따라 처리할 수 있는 문제의 복잡도와 비용이 크게 달라진다.

이 글에서는 에이전트 시스템에서 논의되는 대표적 추론 패턴의 개념적 차이를 설명한다. 특정 프롬프트 기법의 구현 코드, 모델 간 성능 비교, 최신 연구 성과 평가는 다루지 않는다.

패턴마다 무엇이 다른가

모든 에이전트 시스템의 핵심에는 관찰(Observe) → 추론(Think) → 행동(Act) → 결과 반영(Update)의 루프가 있다. 추론 패턴은 이 루프를 어떻게 설계하느냐에 대한 서로 다른 선택이다.

Chain-of-Thought(CoT)는 최종 답을 바로 내놓는 대신, 중간 추론 단계를 명시적으로 전개한다. 도구 사용이나 다회 실행 없이 단일 응답 안에서 이루어지는 것이 특징이다. "A사의 2024년 영업이익이 전년 대비 개선된 이유를 분석하라"는 질문에, 단번에 결론을 내리는 대신 데이터 항목별로 추론 과정을 펼친다. 추론 과정을 확인할 수 있어 디버깅에 유리하지만, 외부 도구나 반복 실행은 포함되지 않는다.

ReAct는 생각(Thought) → 행동(Action) → 관찰(Observation) 루프를 한 단계씩 반복한다. 각 단계에서 짧은 추론과 도구 호출이 교차하고, 도구에서 받은 결과가 즉시 다음 추론에 반영된다. 고객사 재무 현황을 조회했더니 데이터가 부족하면, 즉시 다른 출처를 탐색하는 방향으로 전환한다. 예측하기 어려운 환경이나 도구 결과에 따라 계획이 자주 바뀌는 작업에 강하다. 단, 매 단계마다 LLM을 호출하므로 단계가 길어질수록 비용과 지연이 선형으로 늘어난다.

Plan-and-Execute는 먼저 전체 계획을 명시적으로 세운 뒤, 계획대로 단계별 실행을 진행하는 2단계 구조다. 규정 준수 검토 태스크를 "조항 추출 → 법령 비교 → 위반 항목 분류 → 보고서 생성"으로 미리 계획하고, 각 단계를 순서대로 실행한다. 장기 계획이 안정적으로 유지되어야 하는 복잡한 워크플로우에 적합하다. 계획 수립에는 큰 모델을 쓰고 실행에는 작은 모델이나 코드를 써서 비용을 절감할 수 있다는 것도 장점이다. 반면 환경이 예측하기 어려울 때는 초기 계획이 자주 깨져 재계획 오버헤드가 발생한다.

Reflexion은 여러 에피소드(시도)를 반복하면서, 각 시도 후 "무엇이 잘못됐고 다음에는 어떻게 해야 하는가"를 자연어로 기록한다. 기록된 자기 평가가 다음 시도의 맥락에 주입되어, 모델 가중치 업데이트 없이 점진적으로 성능이 개선된다. 코딩 태스크나 반복적 의사결정 업무에 적합하지만, 여러 에피소드를 수행해야 하므로 비용이 크게 늘어난다.

LATS(Language Agent Tree Search)는 여러 실행 경로를 트리 구조로 탐색하고, 각 경로의 가치를 평가해 최적 경로를 선택한다. 복잡한 의사결정 작업에서 높은 품질의 결과를 낼 수 있지만, 여러 경로를 동시에 시뮬레이션하므로 토큰 비용과 지연이 다른 패턴에 비해 극단적으로 크다. 이론적으로는 가장 정교하지만, 실운영에서는 비용 대비 효과를 따져야 한다.

주요 추론 패턴 비교

패턴사고와 행동의 관계주요 장점주요 단점적합한 맥락CoT추론 중심, 단일 응답논리 설명 가능도구·다회 실행 없음논리 분석·복잡한 추론ReAct추론↔행동 교차 반복환경 변화에 즉시 대응단계 증가 시 비용 선형 증가정보 탐색·동적 실행Plan-and-Execute계획 수립 후 실행 분리장기 계획 안정적, 비용 절감 가능계획 변경 시 재계획 오버헤드복잡한 다단계 워크플로우Reflexion실행 후 자기 평가 반영가중치 변경 없이 점진적 개선여러 에피소드 필요, 비용 큼반복 작업·코딩 태스크LATS다중 경로 트리 탐색최적 경로 선택 가능극단적 토큰·지연 비용복잡한 의사결정

자주 하는 오해

"추론 패턴이 복잡할수록 성능이 좋다"
복잡해질수록 비용과 지연도 커진다. LATS가 이론적으로 최고 품질을 낼 수 있지만, 실운영에서는 비용 대비 효과가 맞지 않는 경우가 많다. 작업 성격에 따라 단순한 패턴이 더 적합하다.

"ReAct는 단순한 도구 사용 기법이다"
ReAct는 추론과 행동을 교차해 진행하는 흐름 자체를 설명하는 개념이다. 도구 없이도 ReAct 패턴을 적용할 수 있다.

"하나의 패턴을 선택하면 다른 패턴은 쓸 수 없다"
실제 시스템에서는 패턴을 혼합해 사용하는 경우도 있다. 전체 계획은 Plan-and-Execute로 수립하고, 각 단계 실행은 ReAct 방식으로 처리하는 구성이 가능하다.

FAQ

Q1. 추론 패턴은 모델 내부 구조를 의미하는가?
아니다. 모델을 어떻게 활용하고 작업 흐름을 어떻게 구성하는지를 설명하는 개념이다.

Q2. CoT와 Plan-and-Execute의 핵심 차이는 무엇인가?
CoT는 단일 응답 안에서 사고 과정을 전개한다. Plan-and-Execute는 계획을 먼저 명시적으로 만들고, 그 계획에 따라 실행을 분리해 진행한다.

Q3. Reflexion은 학습과 같은 개념인가?
아니다. Reflexion은 모델 가중치를 변경하지 않는다. 자기 평가 텍스트를 다음 시도의 입력으로 주입하는 방식으로, 인-컨텍스트(in-context) 학습에 가깝다.

추론 패턴 비교: CoT, ReAct, Plan-and-Execute

패턴마다 무엇이 다른가

주요 추론 패턴 비교

자주 하는 오해

FAQ

관련 읽을거리