OpenAI·Claude API 연동으로 나만의 AI 웹서비스 만들기 (키 발급·FastAPI·배포 플랫폼)
개발자 오픈카톡방에서 요즘 가장 많이 올라오는 질문이 딱 이거예요.
"API 키 받았는데, 이제 뭘 어떻게 해야 하죠?"
OpenAI나 Claude API에 연동해서 뭔가 만들고 싶은 건 분명한데, 어디서부터 시작할지 막막한 거죠. 키 발급부터 실제 배포까지, 순서대로 정리해봤어요.
OpenAI·Claude API 키 발급과 요금: 생각보다 저렴합니다

OpenAI API는 platform.openai.com에서 시작해요. 일반 ChatGPT 사이트가 아닌 개발자 전용 플랫폼이에요. 로그인 후 [API keys] → [Create new secret key]를 누르면 키가 발급됩니다. 선결제 방식(Prepaid)이라 충전한 크레딧 이상은 절대 청구되지 않아요.
2026년 기준 GPT-4.1 Mini 기준으로 입력 100만 토큰당 $0.40, 출력은 $1.60이에요. 짧은 대화 몇 번으로는 몇 원 수준이라 테스트 비용 걱정은 크게 안 해도 돼요. (출처: OpenAI 공식 가격표)
Claude API는 console.anthropic.com에서 구글 계정 또는 이메일로 가입하면 됩니다. 전화번호 인증까지 완료해야 키가 발급되니 그 부분은 미리 준비하세요.
Claude Haiku 4.5가 가장 경제적인 모델로 입력 100만 토큰당 $1.00, 출력은 $5.00 수준이에요. 동일한 시스템 프롬프트를 반복 사용한다면 프롬프트 캐싱으로 비용을 90%까지 줄일 수 있어요. 즉시 응답이 필요 없는 대량 처리는 Batch API로 50% 할인도 받을 수 있고요. (출처: Anthropic 공식 문서)
한 가지 팁이라면, 처음엔 두 API 모두 소액 무료 크레딧이 제공되니 요금 걱정 없이 시작해보세요.
FastAPI vs Next.js: AI 웹서비스 기술 스택 선택 기준
API 연동 서비스를 만드는 스택은 크게 두 방향이에요.
패턴 A — Python 백엔드 + React 프론트엔드
FastAPI가 핵심이에요. 비동기 처리 지원, 자동 API 문서 생성, Pydantic 기반 데이터 검증이 내장되어 있어서 2025년 기준 AI 챗봇 아키텍처로 가장 인기 있는 조합입니다. .env 파일에 API 키를 저장하고 python-dotenv로 불러오는 패턴이 표준이에요.
실제로 Claude API Python SDK(pip install anthropic)를 쓰면 스트리밍 응답도 몇 줄이면 구현돼요.
import anthropic
client = anthropic.Anthropic()
with client.messages.stream(
model="claude-opus-4-8",
max_tokens=1024,
messages=[{"role": "user", "content": "안녕하세요"}]
) as stream:
for text in stream.text_stream:
print(text, end="", flush=True)
스트리밍 응답을 쓰면 사용자가 실시간으로 텍스트가 생성되는 걸 볼 수 있어요. 단, 토큰을 단어나 문장 단위로 버퍼링해서 보여주는 게 UX 측면에서 낫더라고요.
패턴 B — Next.js 풀스택
Vercel AI SDK와 조합하면 스트리밍 텍스트 생성이 내장 지원됩니다. 프론트엔드와 API 라우트를 단일 프레임워크로 처리하니 빠른 프로토타이핑에 유리해요. Next.js + OpenAI + LangChain + Supabase 조합으로 웹 페이지 요약 앱을 구현한 사례도 많아요.
선택 기준은 단순해요.
데이터 처리가 복잡하거나 기존 Python 코드와 연결할 게 많다면 FastAPI, 실시간 채팅처럼 서버-클라이언트 통합이 중요하다면 Next.js가 더 자연스럽습니다.

Vercel·Railway·Render 배포 플랫폼 비교: 뭘 골라야 할까요
코드를 완성해도 어디에 올리느냐에 따라 비용과 성능이 꽤 달라져요.
2026년 기준 세 플랫폼 비교를 간단히 정리하면 이래요. (출처: Remery Blog AI 배포 플랫폼 비교 2026)
| 항목 | Vercel | Railway | Render |
|---|---|---|---|
| 콜드 스타트 | 1~3초 | 없음 | 5~30초 |
| 최대 실행 시간 | 300초(Pro) | 무제한 | 무제한 |
| 10K 사용자 월비용 | 약 $60 | 약 $45 | 약 $50 |
| 대규모 AI 처리 월비용 | $400+ | 약 $150 | 약 $200 |
Vercel은 Next.js 프로젝트에 가장 자연스러운 선택이에요. 글로벌 엣지 배포라 응답이 빠른 반면, 대량 AI API 처리를 하면 비용이 $400+ 수준으로 급증하는 단점이 있어요. 함수 실행 시간 300초 제한도 긴 작업에는 걸림돌이 됩니다.
Railway는 AI 백엔드 서버에 가장 유연한 선택입니다. 콜드 스타트 없이 지속 실행되고, Docker 컨테이너와 Redis, Postgres 연동이 간편해요. 개인 개발자와 소규모 팀에게 비용 효율적이에요.
Render는 풀스택 앱과 백그라운드 워커가 필요할 때 고려할 만해요. 영구 디스크 지원으로 모델 캐싱이 가능하다는 게 특징이에요.
실무에서 가장 많이 보이는 패턴은 프론트엔드는 Vercel, 백엔드 API 서버는 Railway를 분리해서 쓰는 조합이에요. 각 플랫폼의 강점을 동시에 누릴 수 있거든요.
수익 생각 전에, 내 문제부터 풀어보세요
AI API 시장은 연평균 31.37%로 성장 중이에요. 솔로 개발자들이 AI 기반 SaaS를 빠르게 출시하는 사례도 계속 나오고 있고요.
근데 여기서 냉정한 숫자 하나만 짚고 갈게요.
생성형 AI 서비스 사용자의 97.7%는 무료로만 써요. 유료 전환율은 2.3%에 불과해요. (출처: AI매터스)
그러니까 처음부터 수익을 목표로 잡기보다, 자기 문제를 푸는 도구를 만드는 것부터 시작하는 게 맞아요. 번역 앱이든, 이메일 초안 생성기든, 회의록 요약 봇이든.
API 키 하나면 오늘 당장 시작할 수 있어요.
참고: Anthropic 공식 문서(platform.claude.com/docs), OpenAI 공식 API 가격표(openai.com/api/pricing/)