Về Field Notes

OpenRouter:
Một API key cho toàn bộ AI model đỉnh nhất hiện nay

Vấn đề: juggling SDK và billing từng provider

Xây dựng bất kỳ thứ gì nghiêm túc với LLM đều đụng ngay vào một vấn đề thực tế: các provider hoàn toàn rời rạc nhau. Mỗi bên một API key, một SDK riêng, một cách billing khác, và model mới ra thì update liên tục — không theo dõi kịp là tụt hậu ngay.

🔑
N API keys
OpenAI, Anthropic, Google, Mistral — mỗi ông một key, một account
💸
N billing
Nhiều hoá đơn từ nhiều provider, khó tổng hợp chi phí
📦
SDK loạn
Mỗi provider một SDK, interface khác nhau, update không đồng bộ
💀
Model down
Một provider bị lỗi là cả app gãy, không có fallback tự động

OpenRouter giải quyết toàn bộ lớp vấn đề này bằng một cách tiếp cận đơn giản: đứng ở giữa và gom tất cả về một điểm duy nhất.

OpenRouter là gì?

OpenRouter là AI gateway — lớp trung gian đứng giữa ứng dụng của bạn và toàn bộ hệ sinh thái LLM. Thay vì kết nối trực tiếp đến từng provider, bạn chỉ cần kết nối đến OpenRouter một lần. Từ đó muốn gọi model nào cũng được — đổi tên model trong một dòng code.

Các provider hiện được hỗ trợ:

🟢 OpenAI 🟠 Anthropic 🔵 Google 💙 Meta (Llama) 🟡 Mistral 🟣 DeepSeek ⚫ xAI (Grok) +300 models...

7 tính năng cốt lõi

🔑
Feature 01
Một API key duy nhất
Đăng ký một lần, lấy một key — truy cập 300+ model. Không cần quản lý key từng provider.
🔄
Feature 02
Failover tự động
Model A bị overload? OpenRouter tự route sang provider thứ hai. Uptime không bị gián đoạn.
💰
Feature 03
Giá minh bạch, pay-as-you-go
Giá từng model hiển thị rõ trên dashboard. Không markup ẩn, không phí tháng, xài bao nhiêu tính bấy nhiêu.
🔌
Feature 04
OpenAI-compatible
Đang dùng OpenAI SDK? Chỉ đổi base_url là xong. Hỗ trợ Python, TypeScript, cURL.
📊
Feature 05
Analytics đầy đủ
Số lượt gọi, latency, chi phí theo từng model. Log chi tiết từng request để debug và audit.
🔀
Feature 06
Swap model tức thì
300+ model — GPT-4o, Claude, Gemini, Llama 4, DeepSeek... Đổi trong một dòng code, không cần refactor.
🧩
Feature 07
MCP & ecosystem
Hỗ trợ Model Context Protocol, tích hợp với Claude Desktop, Obsidian và nhiều tool AI agent.

Bắt đầu trong 5 phút

Nếu bạn đang dùng OpenAI SDK, migration sang OpenRouter gần như không tốn công. Chỉ cần thay base_urlapi_key:

Trước — Gọi thẳng OpenAI
from openai import OpenAI   client = OpenAI(   api_key=OPENAI_KEY,   # base_url mặc định OpenAI )   model="gpt-4o" # Muốn dùng Claude? Viết lại toàn bộ...
Sau — Qua OpenRouter
from openai import OpenAI   client = OpenAI(   api_key=OPENROUTER_KEY,   base_url="https://openrouter.ai/api/v1" )   model="anthropic/claude-sonnet-4-5" # Đổi model = đổi 1 dòng, xong!

Ví dụ Python đầy đủ:

Python — OpenRouter quickstart
import os from openai import OpenAI client = OpenAI( api_key=os.environ["OPENROUTER_API_KEY"], base_url="https://openrouter.ai/api/v1", ) # Gọi Llama 4 của Meta completion = client.chat.completions.create( model="meta-llama/llama-4-maverick", messages=[{"role": "user", "content": "Tóm tắt bài này giúp tôi."}] ) print(completion.choices[0].message.content) # Đổi sang Claude — chỉ thay tên model, không thay gì khác completion2 = client.chat.completions.create( model="anthropic/claude-sonnet-4-5", messages=[{"role": "user", "content": "So sánh hai cách tiếp cận này."}] )
Tên model trên OpenRouter theo format provider/model-name. Ví dụ: openai/gpt-4o, anthropic/claude-opus-4, google/gemini-2.5-pro, deepseek/deepseek-r2. Xem đầy đủ tại openrouter.ai/models.

Chọn model đúng cho đúng việc

Một trong những giá trị lớn nhất của OpenRouter là thấy toàn bộ bảng giá và hiệu năng của 300+ model trên cùng một trang — không cần mở 5 tab để so sánh.

Gợi ý lựa chọn theo tác vụ:

  • Routing, phân loại, tóm tắt đơn giản: Llama 4 Scout, Gemini Flash, GPT-4o mini — rẻ hơn 10–20× so với model flagship, tốc độ nhanh hơn.
  • Chat thông thường, viết nội dung, code cơ bản: Claude Sonnet, GPT-4o — cân bằng tốt giữa chất lượng và chi phí.
  • Reasoning phức tạp, phân tích sâu, code nâng cao: Claude Opus, GPT o1/o3, DeepSeek R2 — chỉ dùng khi thực sự cần.
  • Context window lớn, tài liệu dài: Gemini 2.5 Pro (1M token context) — phù hợp khi cần nhét nhiều tài liệu vào một lần gọi.
OpenRouter có trang model rankings hiển thị model nào đang được dùng nhiều nhất theo từng category — hữu ích để theo dõi xu hướng và đánh giá model nào đang được cộng đồng tin dùng thực tế.

Với tính năng cost estimation trước khi chạy, bạn có thể ước tính chi phí cho một batch lớn trước khi thực sự gọi API — tránh bị sốc hoá đơn.

Phù hợp với ai?

👨‍💻
Dev xây dựng AI app
Cần swap model liên tục, tối ưu chi phí inference, hoặc build SaaS cần uptime cao. OpenRouter giảm đáng kể thời gian quản lý provider.
🎨
No-code / Low-code builder
Muốn gắn AI vào app qua n8n, Make, hoặc các tool tương tự — không cần đi xin từng API key từng provider.
🔬
Researcher & team sản phẩm
A/B test nhiều model song song, benchmark hiệu năng, so sánh output từng model với cùng prompt — tất cả trên một interface.
🚀
Indie hacker & startup nhỏ
Không muốn commit vào một provider. Pay-as-you-go, không phí tháng, linh hoạt chuyển model khi có model mới rẻ hơn ra mắt.

Ưu và nhược điểm

Ưu điểm
  • Một API key, một điểm tích hợp cho 300+ model
  • Failover tự động — không lo model down làm gãy app
  • OpenAI-compatible — migration gần như zero effort
  • Bảng giá minh bạch, so sánh được ngay trên dashboard
  • Không phí tháng, pay-as-you-go thực sự
  • Analytics chi tiết từng request, dễ debug và audit
  • Model ranking + community lớn, cập nhật model mới cực nhanh
  • Hỗ trợ MCP, tương thích nhiều AI agent framework
Nhược điểm cần biết
  • Một số model premium chỉ BYOK (tự mang key riêng)
  • Giá token có thể biến động theo giờ cao điểm
  • Phụ thuộc vào OpenRouter làm trung gian — thêm một điểm có thể fail
  • Latency thêm một hop so với gọi thẳng provider
  • Một vài model mới nhất có thể chưa có ngay sau khi release
Lưu ý khi chạy batch lớn: Giá token có thể thay đổi theo thời điểm. Nên check bảng giá hiện tại trước khi kick off job lớn — đặc biệt với các model có pricing theo tier giờ cao điểm.

Nhận định

OpenRouter không phải giải pháp cho mọi vấn đề AI — nhưng nó giải quyết tốt nỗi đau lớn nhất của bất kỳ ai đang xây dựng nghiêm túc với LLM: sự phân mảnh của hệ sinh thái.

Với developer, lợi ích rõ nhất là giảm thời gian quản lý provider và tăng khả năng thử nghiệm model mới. Với team sản phẩm, failover tự động và analytics tập trung giúp vận hành ổn định hơn. Với indie hacker, pay-as-you-go và không bị lock-in vào một provider là lợi thế thực sự.

Bắt đầu bằng 3 bước:

  1. Đăng ký tài khoản free tại openrouter.ai
  2. Lấy API key, đọc docs (chuẩn OpenAI — không có gì lạ)
  3. Đổi base_url trong project hiện tại, chạy thử — xong
Xài OpenRouter rồi thì sẽ auto lười quay lại kiểu quản lý provider truyền thống. Không phải vì nó hoàn hảo — mà vì nó giải quyết đúng vấn đề đúng lúc cần giải quyết.