🤖 AI 에이전트 오피스 시스템 - 완전 정리

작성일: 2026-04-01 버전: v2 (텔레그램 비서 구조, Ollama, RAG, 파인튜닝 내용 추가)

📌 1. 핵심 개념

AI 직원이란?

LLM 서비스(Claude, GPT, Gemini 등)를 API로 호출하여 만든 가상 직원
UI에서 사람이 타이핑하는 대신, 코드가 자동으로 프롬프트를 전달하는 구조
시스템 프롬프트만 바꾸면 같은 API로 다른 역할의 직원을 만들 수 있음

시스템 프롬프트 = 역할 부여

system: "너는 마케팅팀 김마케 대리야.
         데이터 기반으로 분석하고,
         SNS 마케팅 전문가로 행동해."

얼마나 구체적으로 쓰느냐가 직원의 품질을 결정함
성격 / 권한 / 제약 / 말투까지 설정 가능

🔄 2. 에이전트 간 통신 방식

핵심 원리

에이전트들은 직접 대화하지 않음
오케스트레이터(라우터) 가 중간에서 결과를 전달하는 우편배달부 역할

오케스트레이터
    ↓ 질문 전달
마케팅 에이전트 → 결과 반환
    ↓ 결과를 다음 에이전트 입력에 삽입
개발 에이전트 → 결과 반환
    ↓
최종 통합

실제 구조

오해	실제
에이전트끼리 실시간 채팅	오케스트레이터가 순차 호출
에이전트가 서로를 인식	이전 결과를 텍스트로 받을 뿐
복잡한 네트워크 통신	함수 호출 + 결과 전달

💰 3. 비용 구조

Claude.ai 구독 vs API = 완전히 별개!

구분	Claude.ai 구독	Claude API
용도	웹/앱 채팅 UI	코드에서 직접 호출
과금	월정액	토큰당 종량제

2026년 API 요금 (1백만 토큰 기준)

모델	입력	출력	추천 용도
Haiku 4.5	$0.80	$4	단순 작업
Sonnet 4.6	$3	$15	핵심 판단 (가성비)
Opus 4.6	$15	$75	고난도 작업

중소기업 회의 비용 추정

에이전트 3개, 3라운드 회의 1회 → 약 40원
하루 10회 회의 → 월 약 $10 (13,000원)
⚠️ 상시 자율 운영 시 비용 폭발 가능 → 루프 횟수 제한 필수

const MAX_ITERATIONS = 10; // 루프 제한 필수

🏗️ 4. 전체 시스템 구조 (최종)

                    [사장님 - 텔레그램]
                           ↕
                  [비서 - Ollama/Groq] ← 무료
                /         |           \
        문의 필터링   답변 해석    우선순위 판단
               \          |           /
          [오케스트레이터 - Claude API]
          /          |           \
  [마케팅 직원]  [개발 직원]  [재무 직원]
   Claude API    Claude API   Claude API

역할 분담

역할	담당 모델	비용
핵심 업무 수행	Claude API	유료
답변 해석 / 필터링	Ollama or Groq	무료
사장님 소통 채널	텔레그램 봇	무료

📱 5. 텔레그램 실시간 소통 구조

왜 텔레그램인가?

조건	텔레그램
실시간 알림	✅ 푸시 알림 즉시
외부에서 답변	✅ 모바일 앱
API 제공	✅ 무료 + 안정적
비용	✅ 완전 무료

소통 흐름

사건 : 사장 → 비서 → 직원
문의 : 직원 → 비서 → 사장

실제 대화 예시

🤖 마케팅팀 김마케 (AI 직원)
"광고 예산 관련 결정이 필요합니다.
A안 500만 / B안 800만 중 선택해주세요"

👔 사장님
"비용 아껴야하니까 싼걸로"
         ↓
🧠 비서(Ollama)가 해석
"A안(500만원)을 선택한 것으로 파악"
         ↓
🤖 마케팅팀 김마케
"✅ A안 500만원으로 진행하겠습니다!
 혹시 다르게 이해했다면 말씀해주세요."

텔레그램 봇 만드는 법

1. 텔레그램에서 @BotFather 검색
2. /newbot 입력
3. 봇 이름 설정
4. API Token 발급 완료

답변 수신 방식 (Webhook 추천)

사장님이 텔레그램에서 답장
        ↓
텔레그램 서버가 자동으로 내 서버에 전송
        ↓
AI 직원이 즉시 수신 + 업무 재개

안전장치 - 타임아웃 설정 필수

// 30분 내 답변 없으면 기본값으로 진행
const answer = await waitForReply({ timeout: 30 * 60 * 1000 });
if (!answer) {
  // 기본 행동으로 업무 계속
}

🧠 6. 비서(Ollama) 모델 수준 높이는 방법

방향 1: 더 좋은 모델로 교체

모델	RAM 필요	한국어	추천도
Qwen 2.5 14B	16GB	⭐⭐⭐⭐⭐	비서용 최추천
Llama 3.1 8B	8GB	⭐⭐⭐	가볍게 시작
Mistral 22B	24GB	⭐⭐⭐⭐	균형 좋음
Qwen 2.5 32B	32GB	⭐⭐⭐⭐⭐	고성능

방향 2: 프롬프트 최적화 (비용 0원)

[회사 컨텍스트] 업종, 규모, 현재 상황
[사장님 성향] 말투, 결정 패턴, 우선순위
[판단 기준] 예산 기준, 보고 기준
[출력 형식] JSON 구조화 출력
→ 같은 모델도 2배 이상 성능 차이

방향 3: RAG 추가 ⭐ (가성비 최고)

비서가 답변 해석할 때
    +
회사 규정집 참고
회의록 참고
과거 사장님 결정 패턴 참고
    ↓
훨씬 정확한 해석

예시:
사장님: "저번이랑 똑같이 해"
RAG 없음 → "저번이 뭔지 모름 😢"
RAG 있음 → 과거 회의록 검색 → "3월 캠페인 방식으로 진행"

방향 4: 파인튜닝 (가장 강력)

일반 AI 모델 + 우리 회사 데이터 학습
(사장님 말투, 회사 규칙, 과거 결정들)
    ↓
우리 회사 전용 비서 AI

단계별 추천 순서

1단계 (지금 당장)
→ 프롬프트 최적화 + Qwen 2.5 14B
  비용 없이 성능 대폭 향상

2단계 (시스템 안정화 후)
→ RAG 추가
  회사 문서, 과거 결정 학습

3단계 (데이터 충분히 쌓인 후)
→ 파인튜닝
  사장님 말투와 패턴 완전 학습

방향별 비교

방법	비용	난이도	효과
모델 교체	전기세/서버비	⭐	⭐⭐⭐
프롬프트 최적화	무료	⭐	⭐⭐⭐⭐
RAG 추가	거의 무료	⭐⭐⭐	⭐⭐⭐⭐⭐
파인튜닝	시간 투자	⭐⭐⭐⭐	⭐⭐⭐⭐⭐

💡 7. 비용 최적화 전략

비서 필터링으로 Claude API 절감

AI 직원이 하루 100번 문의 발생
            ↓
    비서(Ollama)가 분류
            ↓
80건 → "내가 판단 가능" → Claude만 사용
20건 → "사장님 판단 필요" → 텔레그램 전송
            ↓
Claude API 호출 80% 절감

구조별 월 비용 비교

구조	월 예상 비용
전부 Claude	$50~100
비서 Ollama 도입	$15~30
필터링까지 추가	$5~15

Ollama 대안: Groq ⭐

Ollama = 내 컴퓨터에서 실행 (PC 항상 켜야 함)
Groq   = 클라우드에서 Llama 무료 제공
       → PC 안 켜도 됨, 속도 훨씬 빠름

🛠️ 8. 기술 스택 최종 정리

📦 전체 스택

통신 채널
└── 텔레그램 봇 (무료)

비서 AI (무료)
├── Ollama + Qwen 2.5 14B (로컬)
└── Groq + Llama (클라우드 무료 대안)

AI 직원 - 핵심 업무 (유료)
└── Claude API (Sonnet 4.6 중심)

에이전트 흐름 설계
└── LangGraph ⭐

프론트엔드
├── React + TypeScript
├── Phaser.js (픽셀아트 오피스)
└── Tailwind CSS

서버
└── Node.js

🚀 9. 구현 도구: Claude Code

Claude Code란?

터미널에서 Claude에게 말을 걸어 코드를 자동 생성/실행하는 도구
개발 경험 없어도 대화하듯 시스템 구축 가능
Pro 구독 시 추가 비용 없이 사용 가능

claude "마케팅, 개발, 재무 에이전트 3명이
        신제품 출시 전략을 회의하는 시스템 만들어줘.
        텔레그램으로 사장님께 보고하는 구조로"

📅 10. 단계별 구현 로드맵

단계	내용	난이도
1주차	Claude API로 에이전트 회의 동작 확인	⭐
2주차	텔레그램 봇 연동 + 사장님 소통 구현	⭐⭐
3주차	Ollama 비서 도입 + 필터링 로직	⭐⭐⭐
4주차	RAG 추가 (회사 문서 학습)	⭐⭐⭐
이후	Phaser.js 픽셀아트 오피스 UI	⭐⭐⭐⭐
장기	파인튜닝으로 비서 고도화	⭐⭐⭐⭐⭐

🔗 참고 링크

Anthropic API 콘솔: https://console.anthropic.com
LangGraph 공식 문서: https://langchain-ai.github.io/langgraph/
Ollama 공식: https://ollama.ai
Groq (무료 클라우드 LLM): https://groq.com
텔레그램 봇 API: https://core.telegram.org/bots/api
Phaser.js: https://phaser.io
무료 픽셀 에셋: https://itch.io / https://kenney.nl

📝 Claude 프로젝트 활용 팁

프로젝트 지식에 넣으면 좋은 것들

📁 AI 오피스 프로젝트
├── 📄 이 파일 (전체 시스템 구조 요약)
├── 📄 내 회사 정보 (업종, 규모, 목표)
├── 📄 원본 참고 문서 (AI 에이전트 가이드)
└── 📄 기술 스택 결정사항

💡 내 회사 정보를 프로젝트 지식에 넣어두면 Claude가 매번 설명 안 해도 맥락을 알고 더 구체적인 답변을 줄 수 있어요.

태그: AI 에이전트 LLM Claude 멀티에이전트 AI오피스 LangGraph Phaser 텔레그램 Ollama RAG 파인튜닝 비서AI

David Brain

Explorer

AI_Agent_오피스_시스템_완전정리

🤖 AI 에이전트 오피스 시스템 - 완전 정리

📌 1. 핵심 개념

AI 직원이란?

시스템 프롬프트 = 역할 부여

🔄 2. 에이전트 간 통신 방식

핵심 원리

실제 구조

💰 3. 비용 구조

Claude.ai 구독 vs API = 완전히 별개!

2026년 API 요금 (1백만 토큰 기준)

중소기업 회의 비용 추정

🏗️ 4. 전체 시스템 구조 (최종)

역할 분담

📱 5. 텔레그램 실시간 소통 구조

왜 텔레그램인가?

소통 흐름

실제 대화 예시

텔레그램 봇 만드는 법

답변 수신 방식 (Webhook 추천)

안전장치 - 타임아웃 설정 필수

🧠 6. 비서(Ollama) 모델 수준 높이는 방법

방향 1: 더 좋은 모델로 교체

방향 2: 프롬프트 최적화 (비용 0원)

방향 3: RAG 추가 ⭐ (가성비 최고)

방향 4: 파인튜닝 (가장 강력)

단계별 추천 순서

방향별 비교

💡 7. 비용 최적화 전략

비서 필터링으로 Claude API 절감

구조별 월 비용 비교

Ollama 대안: Groq ⭐

🛠️ 8. 기술 스택 최종 정리

🚀 9. 구현 도구: Claude Code

Claude Code란?

📅 10. 단계별 구현 로드맵

🔗 참고 링크

📝 Claude 프로젝트 활용 팁

프로젝트 지식에 넣으면 좋은 것들

Graph View

Table of Contents