| Model | Provider | Input / 1M tokens | Output / 1M tokens | ราคา typical (฿) | Context | Knowledge | Multimodal | Free Tier | Quality | Speed | Source | Verified |
|---|
🧮 คำนวณต้นทุน AI
📌 Routing Policy — เลือก Model ตามงาน
💰 Budget Guard — กรอบงบประมาณ
⚡ Cost Optimization Tips
⚠️ Risk: Wrong Layer Usage
การใช้ Claude กับงานทั่วไปที่ Qwen ทำได้ = เผาเงิน 10-50x โดยไม่จำเป็น ตัวอย่าง: chat ถาม-ตอบ ควรใช้ Qwen Turbo ≈ ฿0.05 ไม่ใช่ Claude ≈ ฿5–15
✅ RTK Optimizer ช่วยได้
RTK v0.35.0 ลด token 60-90% ก่อนส่งทุก request โดย CC ไม่รู้ตัว — ประหยัดได้ ฿3,000–8,000/เดือน จากการ filter output ที่ไม่จำเป็น
🔒 Local Model = Zero API Cost
Ollama บน Mac Pro + Travis ประมวลผล ฟรีหลัง setup — ใช้กับข้อมูลลับ ศปอส. ไม่มี PII ออกนอก network ตอบโจทย์ PDPA + พ.ร.บ.คอมฯ 100%
💡 Prompt Caching
Claude Prompt Caching ลดค่า input token ได้ 90% สำหรับ system prompts ที่ใช้ซ้ำ — ROI สูงมากถ้า fleet ใช้ system prompt ยาวๆ ทุก request
📊 ระบบถูกทางแล้ว
Multi-Model Orchestration ที่ออกแบบไว้ (Qwen filter → GPT process → Claude final) เป็น best practice ระดับ enterprise — ROI 3–10x เทียบกับใช้ model เดียว
⚠️ OAuth Token Renewal
Fleet ทุก 7 profiles หมดอายุ 19 เม.ย. 2569 — อีก ~9 วัน ต้อง re-login ก่อนหมดเพื่อไม่ให้ agent หยุดทำงาน