LLM Hosting Explained
Mac mini chạy local → không có IP public → Claude Code không gọi thẳng được.
Cloudflare tạo tunnel ngầm: self-llm.leo.ai → localhost:11434 trên Mac.
Không cần mở firewall, không cần config router — chạy 1 lệnh là xong.
✓ Ưu điểm
- Dùng ngay không cần setup gì
- Model mạnh nhất hiện tại (Opus, Sonnet)
- Tự động update model mới
- Scale vô giới hạn theo nhu cầu
✗ Nhược điểm
- Tốn tiền theo token — cộng dồn nhanh
- Data gửi lên server Anthropic (US)
- Cần internet, phụ thuộc uptime Anthropic
- Ràng buộc TOS / rate limit
Mac mini chạy local → không có IP public → Claude Code không gọi thẳng được.
Cloudflare tạo tunnel ngầm: self-llm.leo.ai → localhost:11434 trên Mac.
Không cần mở firewall, không cần config router — chạy 1 lệnh là xong.
✓ Ưu điểm
- Free hoàn toàn — không tốn token
- Data private — không ra ngoài
- Không bị rate limit
- Có thể dùng offline (sau khi setup)
✗ Nhược điểm
- Cần Mac mạnh (≥32GB RAM cho 70B)
- Model yếu hơn Claude Sonnet/Opus
- Tự setup, tự maintain
- Latency cao hơn nếu hardware yếu
⚠ Claude Max 5x = $100/tháng flat — unlimited usage với Sonnet/Haiku, Opus có giới hạn cao hơn. Self-hosted = chỉ tính tiền điện, không tính hardware (Mac mini M4 ~$599 one-time). Model chất lượng khác nhau đáng kể.