Lewati ke konten utama
Technology Middleware Layer

Satu control plane untuk key, routing, dan akses AI lintas provider.

Bagikan akses tanpa membuka upstream asli. Pilih jalur request sesuai workload. Pantau usage dari satu titik.

  • Share key tanpa bocorkan upstream asli
  • Routing dan fallback dipusatkan di middleware
  • Ganti provider tanpa mengubah integrasi client
Access Layer
Key turunan untuk publik
Upstream asli tidak pernah keluar dari middleware.
Routing Layer
Lane sesuai workload
Chat, workflow, agentic, dan fallback dipisah otomatis.
Ops Layer
Observability di traffic
Usage dan log hidup di titik yang sama dengan request.
System Blueprint
Satu endpoint di depan, banyak keputusan di belakang.
simplified view
Ilustrasi dashboard teknologi dan jaringan data untuk menggambarkan control plane dan routing AI
Request preview
Client cukup bicara ke satu endpoint yang konsisten
OpenAI-compatible surface
POST /v1/chat/completions
Authorization: Bearer rk_live_xxxxx

{
  "model": "auto",
  "messages": [...],
  "metadata": { "lane": "agentic" }
}
Access
Key turunan untuk publik

Akses dibagikan tanpa membuka credential upstream asli.

Routing
Lane dipilih middleware

Client tidak perlu tahu policy, fallback, atau provider aktif.

Upstream
Provider bisa diganti

Perubahan backend dilakukan di belakang layar tanpa ubah integrasi consumer.

Compatible with
OpenAI Anthropic Google AI 9Router Custom Upstream
Why this matters

Lebih rapi dibanding mengelola banyak provider langsung dari client.

Saat tim mulai memakai 2 atau 3 provider, masalahnya bukan kode integrasi, tetapi distribusi key, fallback yang tersebar, dan migrasi yang mahal. Restu AI memindahkan beban itu ke middleware.

Ilustrasi data dan analitik untuk menggambarkan sebaran key dan fallback yang sulit dikontrol
Tanpa middleware
  • Upstream key tersebar di banyak app, tool, dan environment.
  • Fallback dan retry diulang di setiap client.
  • Migrasi provider memaksa semua consumer ikut berubah.
  • Audit usage tercecer di banyak dashboard berbeda.
Dengan Restu AI
  • Akses dibagikan via key turunan, upstream asli tetap private.
  • Routing dan fallback dipusatkan di middleware.
  • Provider bisa diganti tanpa menyentuh integrasi client.
  • Usage dan log terbaca dari satu titik kontrol.
Feature Map

Semua fitur inti proyek dipetakan sebagai sistem, bukan sekadar daftar kemampuan.

Halaman ini menekankan lapisan yang benar-benar dikerjakan oleh produk: registry upstream, key turunan, smart lane selection, fallback, dan panel operasional yang menyatukan log serta usage.

Tim engineering berkolaborasi di depan layar code untuk menggambarkan tooling dan integrasi developer
Built for engineering teams
6 lapisan inti yang membentuk satu control plane.
01
Registry upstream terpusat

Provider, model, base URL, credential, dan status aktif disatukan dalam satu sumber kontrol.

03
Endpoint tetap familiar

Pola integrasi OpenAI dan Anthropic-compatible dipertahankan di belakang satu layer kontrol.

05
Fallback hidup di middleware

Saat model utama gagal atau rate-limit, perpindahan jalur tidak membebani client.

02
Key turunan untuk distribusi aman

Editor, app, dan workflow memakai key turunan tanpa pernah melihat upstream asli.

04
Lane berbeda untuk workload berbeda

Chat, automation, dan sesi agentic tidak harus memakai backend yang sama.

06
Observability dekat dengan traffic

Usage dan log terbaca di layer yang sama untuk audit dan troubleshooting.

Narrative Flow

Satu cerita operasional: request masuk, middleware memutuskan, upstream mengeksekusi.

Section ini menggabungkan cara kerja dan arsitektur menjadi satu visual story. Tujuannya: memperlihatkan bagaimana request bergerak, di mana kebijakan hidup, dan kenapa client tidak perlu ikut menanggung kompleksitas provider.

Ilustrasi infrastruktur cloud dan jalur data untuk menggambarkan middleware AI, routing, dan observability
01 · ingress
Consumer cukup masuk ke satu endpoint.

App, workflow, atau editor tidak perlu tahu provider final. Semuanya masuk lewat surface yang sama.

App / Web Client
Request rutin dengan format kompatibel.
Workflow / Automation
Cron, orchestration, atau pipeline sistem.
Editor / Tool Session
Loop tool, coding session, agentic workload.
02 · control plane
Di sinilah key, policy, routing, dan observability hidup.

Middleware memutuskan lane terbaik, memilih upstream yang cocok, menahan credential asli tetap private, dan mencatat usage di layer yang sama.

Restu Key Registry
Provider, model, base URL, credential, status.
Key Issuance
Customer key, editor key, akses turunan.
Lane Decision
Standard, workflow, agentic, fallback.
Usage + Logs
Audit traffic dekat dengan request sesungguhnya.
03 · execution
Upstream bisa berubah tanpa mengubah client.

Perubahan provider, fallback, atau kombinasi model dilakukan di belakang layar. Consumer tetap memakai pola akses yang sama.

OpenAI-compatible
Balanced general purpose.
Anthropic-compatible
Premium reasoning dan coding.
Google AI / 9Router / Custom
Low cost, spesialis, atau private upstream.
Boundary
Akses publik tidak menyentuh upstream asli

Distribusi key lebih aman, lebih mudah dicabut, dan tidak menyebarkan credential sensitif.

Policy
Pemilihan lane dan fallback ada di pusat

Client tidak perlu mengulang logika provider, retry, atau routing di banyak tempat.

Migration
Provider bisa diganti di belakang layar

Migrasi, ekspansi, atau eksperimen model jadi lebih murah dari sisi integrasi.

Integration Surface

Cocok untuk banyak skenario integrasi tanpa membuat client ikut menanggung kompleksitas provider.

Tim produk dan engineering berdiskusi di depan layar untuk menggambarkan integrasi lintas workflow dan aplikasi
A
App dan dashboard internal

Satu jalur middleware yang konsisten untuk chat, helper, atau fitur AI di produk internal.

Internal apps
B
Workflow automation

Pisahkan jalur orchestrator, cron, atau tool automation agar lebih mudah diaudit.

Automation
C
Tool coding dan editor

Distribusikan Vibe Coding key ke editor, lalu kendalikan routing-nya dari satu tempat.

Agentic tools
D
Migrasi provider

Ubah, tambah, atau gabungkan upstream tanpa memaksa semua consumer ikut berubah.

Migration
Cross-provider pricing

Bandingkan model lintas provider dari satu tempat.

Daftar harga ini mencerminkan model yang dapat diakses melalui ekosistem Restu AI. Semua harga dalam USD per 1 juta token, input ditampilkan pertama, output kedua.

Low cost Balanced Premium reasoning Coding
OpenAI
Balanced
15+ models
GPT-5$1.25 – $5.00
GPT-5 Mini$0.25 – $1.00
GPT-5.1 Codex$3.00 – $12.00
Anthropic
Premium
3 models
Claude Haiku 4.5$0.25 – $1.25
Claude Sonnet 4.6$2.00 – $10.00
Claude Opus 4.6$10.00 – $50.00
Google Gemini
Low cost
10+ models
Gemini 3.1 Flash Lite$0.05 – $0.20
Gemini 3 Flash$0.10 – $0.40
Gemini 2.5 Pro$1.25 – $5.00
More providers
Pilihan ekonomis dan spesialis
DeepSeek
V4 Flash
$0.07 – $0.28
Low cost reasoning
DeepSeek
V4 Pro
$0.35 – $1.40
Mid-tier reasoning
Alibaba Qwen
Qwen3.6 Flash
$0.02 – $0.08
Cheapest tier
Alibaba Qwen
Qwen3.6 Plus
$0.08 – $0.32
Balanced multilingual
BytePlus
Seed 2.0
$0.04 – $0.16
High-volume chat
MiniMax
M2.7
$0.15 – $0.60
Long context
Z.AI
GLM 5
$0.10 – $0.40
General purpose
Moonshot
Kimi K2.6
$0.25 – $1.00
Long doc analysis
NVIDIA
Nemotron
FREE
Open experiment

Harga dalam USD per 1 juta token. Harga input ditampilkan pertama, output kedua.

Lihat Semua Harga di Dashboard
Closing Signal

Sederhanakan integrasi AI di depan. Pusatkan kontrol key, routing, dan observability di belakang.

Cocok untuk tim yang ingin client tetap sederhana, tetapi tetap punya kontrol penuh atas akses, traffic, dan pilihan provider dari satu lapisan middleware.