1. AI 모델별 특징
주요 모델 비교
| 모델 |
강점 |
약점 |
적합한 용도 |
| GPT-4o |
범용성, 도구 사용, 멀티모달, 풍부한 생태계 |
비용 높음, 가끔 장황함 |
복잡한 추론, 코드 생성, 범용 챗봇 |
| Claude |
긴 컨텍스트(200K), 자연스러운 대화, 캐릭터 유지, 안전성 |
도구 사용 상대적 약함 |
창작, 분석, 캐릭터 기반 대화 |
| Gemini |
구글 생태계 연동, 가격 경쟁력, 무료 티어 |
한국어 상대적 약함 |
구글 서비스 통합, 비용 민감한 경우 |
선택 기준
- 캐릭터 기반 대화 (테라니): Claude가 페르소나 일관성 유지에 강점
- 복잡한 도구 연동: OpenAI의 Function Calling이 가장 성숙
- 비용 우선: Gemini 무료 티어 또는 Claude Haiku
2. 각 API 특징
OpenAI API
엔드포인트
- Chat Completions API: 기본 API, stateless
- Responses API: conversation state 지원 (previous_response_id로 대화 연결)
Conversation State
- 이전 응답 ID만 넣어주면 OpenAI가 대화 이력 추적
- 30일간 보관 후 삭제
- 토큰 절약은 아님 (내부적으로 전체 대화 로드)
- 프로토타입용, 프로덕션에서는 자체 DB 관리 권장
특징
- 풍부한 Function Calling / Tool Use
- 다양한 모델 라인업 (GPT-4o, GPT-4o-mini 등)
- 가장 큰 생태계와 문서
Anthropic API (Claude)
엔드포인트
- Messages API 단일 엔드포인트로 통일
요청 구조
{
"model": "claude-sonnet-4-20250514",
"max_tokens": 1024,
"system": "시스템 프롬프트 (페르소나)",
"messages": [
{"role": "user", "content": "안녕"}
]
}
특징
system 파라미터로 시스템 프롬프트 명확히 분리
- Prompt Caching: 동일 프롬프트 반복 시 캐시된 토큰 비용 90% 절감
- 200K 토큰 컨텍스트, 긴 문서에서도 성능 저하 적음
- 캐릭터/페르소나 일관성 유지에 강점
Gemini API
접근 방식
- Google AI Studio: 빠른 프로토타이핑, 무료 티어 (분당 60회)
- Vertex AI: 프로덕션 환경, 엔터프라이즈 기능