LLM 서비스(Claude, GPT, Gemini 등)를 API로 호출하여 만든 가상 직원
UI에서 사람이 타이핑하는 대신, 코드가 자동으로 프롬프트를 전달하는 구조
시스템 프롬프트만 바꾸면 같은 API로 다른 역할의 직원을 만들 수 있음
시스템 프롬프트 = 역할 부여
system: "너는 마케팅팀 김마케 대리야.
데이터 기반으로 분석하고,
SNS 마케팅 전문가로 행동해."
얼마나 구체적으로 쓰느냐가 직원의 품질을 결정함
성격 / 권한 / 제약 / 말투까지 설정 가능
🔄 2. 에이전트 간 통신 방식
핵심 원리
에이전트들은 직접 대화하지 않음
오케스트레이터(라우터) 가 중간에서 결과를 전달하는 우편배달부 역할
오케스트레이터
↓ 질문 전달
마케팅 에이전트 → 결과 반환
↓ 결과를 다음 에이전트 입력에 삽입
개발 에이전트 → 결과 반환
↓
최종 통합
실제 구조
오해
실제
에이전트끼리 실시간 채팅
오케스트레이터가 순차 호출
에이전트가 서로를 인식
이전 결과를 텍스트로 받을 뿐
복잡한 네트워크 통신
함수 호출 + 결과 전달
💰 3. 비용 구조
Claude.ai 구독 vs API = 완전히 별개!
구분
Claude.ai 구독
Claude API
용도
웹/앱 채팅 UI
코드에서 직접 호출
과금
월정액
토큰당 종량제
2026년 API 요금 (1백만 토큰 기준)
모델
입력
출력
추천 용도
Haiku 4.5
$0.80
$4
단순 작업
Sonnet 4.6
$3
$15
핵심 판단 (가성비)
Opus 4.6
$15
$75
고난도 작업
중소기업 회의 비용 추정
에이전트 3개, 3라운드 회의 1회 → 약 40원
하루 10회 회의 → 월 약 $10 (13,000원)
⚠️ 상시 자율 운영 시 비용 폭발 가능 → 루프 횟수 제한 필수
const MAX_ITERATIONS = 10; // 루프 제한 필수
🏗️ 4. 전체 시스템 구조 (최종)
[사장님 - 텔레그램]
↕
[비서 - Ollama/Groq] ← 무료
/ | \
문의 필터링 답변 해석 우선순위 판단
\ | /
[오케스트레이터 - Claude API]
/ | \
[마케팅 직원] [개발 직원] [재무 직원]
Claude API Claude API Claude API
역할 분담
역할
담당 모델
비용
핵심 업무 수행
Claude API
유료
답변 해석 / 필터링
Ollama or Groq
무료
사장님 소통 채널
텔레그램 봇
무료
📱 5. 텔레그램 실시간 소통 구조
왜 텔레그램인가?
조건
텔레그램
실시간 알림
✅ 푸시 알림 즉시
외부에서 답변
✅ 모바일 앱
API 제공
✅ 무료 + 안정적
비용
✅ 완전 무료
소통 흐름
사건 : 사장 → 비서 → 직원
문의 : 직원 → 비서 → 사장
실제 대화 예시
🤖 마케팅팀 김마케 (AI 직원)
"광고 예산 관련 결정이 필요합니다.
A안 500만 / B안 800만 중 선택해주세요"
👔 사장님
"비용 아껴야하니까 싼걸로"
↓
🧠 비서(Ollama)가 해석
"A안(500만원)을 선택한 것으로 파악"
↓
🤖 마케팅팀 김마케
"✅ A안 500만원으로 진행하겠습니다!
혹시 다르게 이해했다면 말씀해주세요."
텔레그램 봇 만드는 법
1. 텔레그램에서 @BotFather 검색
2. /newbot 입력
3. 봇 이름 설정
4. API Token 발급 완료
답변 수신 방식 (Webhook 추천)
사장님이 텔레그램에서 답장
↓
텔레그램 서버가 자동으로 내 서버에 전송
↓
AI 직원이 즉시 수신 + 업무 재개
안전장치 - 타임아웃 설정 필수
// 30분 내 답변 없으면 기본값으로 진행const answer = await waitForReply({ timeout: 30 * 60 * 1000 });if (!answer) { // 기본 행동으로 업무 계속}
🧠 6. 비서(Ollama) 모델 수준 높이는 방법
방향 1: 더 좋은 모델로 교체
모델
RAM 필요
한국어
추천도
Qwen 2.5 14B
16GB
⭐⭐⭐⭐⭐
비서용 최추천
Llama 3.1 8B
8GB
⭐⭐⭐
가볍게 시작
Mistral 22B
24GB
⭐⭐⭐⭐
균형 좋음
Qwen 2.5 32B
32GB
⭐⭐⭐⭐⭐
고성능
방향 2: 프롬프트 최적화 (비용 0원)
[회사 컨텍스트] 업종, 규모, 현재 상황
[사장님 성향] 말투, 결정 패턴, 우선순위
[판단 기준] 예산 기준, 보고 기준
[출력 형식] JSON 구조화 출력
→ 같은 모델도 2배 이상 성능 차이
방향 3: RAG 추가 ⭐ (가성비 최고)
비서가 답변 해석할 때
+
회사 규정집 참고
회의록 참고
과거 사장님 결정 패턴 참고
↓
훨씬 정확한 해석
예시:
사장님: "저번이랑 똑같이 해"
RAG 없음 → "저번이 뭔지 모름 😢"
RAG 있음 → 과거 회의록 검색 → "3월 캠페인 방식으로 진행"
방향 4: 파인튜닝 (가장 강력)
일반 AI 모델 + 우리 회사 데이터 학습
(사장님 말투, 회사 규칙, 과거 결정들)
↓
우리 회사 전용 비서 AI
단계별 추천 순서
1단계 (지금 당장)
→ 프롬프트 최적화 + Qwen 2.5 14B
비용 없이 성능 대폭 향상
2단계 (시스템 안정화 후)
→ RAG 추가
회사 문서, 과거 결정 학습
3단계 (데이터 충분히 쌓인 후)
→ 파인튜닝
사장님 말투와 패턴 완전 학습
방향별 비교
방법
비용
난이도
효과
모델 교체
전기세/서버비
⭐
⭐⭐⭐
프롬프트 최적화
무료
⭐
⭐⭐⭐⭐
RAG 추가
거의 무료
⭐⭐⭐
⭐⭐⭐⭐⭐
파인튜닝
시간 투자
⭐⭐⭐⭐
⭐⭐⭐⭐⭐
💡 7. 비용 최적화 전략
비서 필터링으로 Claude API 절감
AI 직원이 하루 100번 문의 발생
↓
비서(Ollama)가 분류
↓
80건 → "내가 판단 가능" → Claude만 사용
20건 → "사장님 판단 필요" → 텔레그램 전송
↓
Claude API 호출 80% 절감
구조별 월 비용 비교
구조
월 예상 비용
전부 Claude
$50~100
비서 Ollama 도입
$15~30
필터링까지 추가
$5~15
Ollama 대안: Groq ⭐
Ollama = 내 컴퓨터에서 실행 (PC 항상 켜야 함)
Groq = 클라우드에서 Llama 무료 제공
→ PC 안 켜도 됨, 속도 훨씬 빠름
🛠️ 8. 기술 스택 최종 정리
📦 전체 스택
통신 채널
└── 텔레그램 봇 (무료)
비서 AI (무료)
├── Ollama + Qwen 2.5 14B (로컬)
└── Groq + Llama (클라우드 무료 대안)
AI 직원 - 핵심 업무 (유료)
└── Claude API (Sonnet 4.6 중심)
에이전트 흐름 설계
└── LangGraph ⭐
프론트엔드
├── React + TypeScript
├── Phaser.js (픽셀아트 오피스)
└── Tailwind CSS
서버
└── Node.js
🚀 9. 구현 도구: Claude Code
Claude Code란?
터미널에서 Claude에게 말을 걸어 코드를 자동 생성/실행하는 도구
개발 경험 없어도 대화하듯 시스템 구축 가능
Pro 구독 시 추가 비용 없이 사용 가능
claude "마케팅, 개발, 재무 에이전트 3명이 신제품 출시 전략을 회의하는 시스템 만들어줘. 텔레그램으로 사장님께 보고하는 구조로"