Technology Middleware Layer

Satu control plane untuk key, routing, dan akses AI lintas provider.

Bagikan akses tanpa membuka upstream asli. Pilih jalur request sesuai workload. Pantau usage dari satu titik.

Share key tanpa bocorkan upstream asli
Routing dan fallback dipusatkan di middleware
Ganti provider tanpa mengubah integrasi client

Mulai Sebagai Customer Lihat Cara Kerja Admin Login

Access Layer

Key turunan untuk publik

Upstream asli tidak pernah keluar dari middleware.

Routing Layer

Lane sesuai workload

Chat, workflow, agentic, dan fallback dipisah otomatis.

Ops Layer

Observability di traffic

Usage dan log hidup di titik yang sama dengan request.

System Blueprint

Satu endpoint di depan, banyak keputusan di belakang.

simplified view

Ilustrasi dashboard teknologi dan jaringan data untuk menggambarkan control plane dan routing AI

Request preview

Client cukup bicara ke satu endpoint yang konsisten

OpenAI-compatible surface

POST /v1/chat/completions
Authorization: Bearer rk_live_xxxxx

{
  "model": "auto",
  "messages": [...],
  "metadata": { "lane": "agentic" }
}

Access

Key turunan untuk publik

Akses dibagikan tanpa membuka credential upstream asli.

Routing

Lane dipilih middleware

Client tidak perlu tahu policy, fallback, atau provider aktif.

Upstream

Provider bisa diganti

Perubahan backend dilakukan di belakang layar tanpa ubah integrasi consumer.

Compatible with

OpenAI Anthropic Google AI 9Router Custom Upstream

Why this matters

Lebih rapi dibanding mengelola banyak provider langsung dari client.

Saat tim mulai memakai 2 atau 3 provider, masalahnya bukan kode integrasi, tetapi distribusi key, fallback yang tersebar, dan migrasi yang mahal. Restu AI memindahkan beban itu ke middleware.

Ilustrasi data dan analitik untuk menggambarkan sebaran key dan fallback yang sulit dikontrol

Tanpa middleware

Upstream key tersebar di banyak app, tool, dan environment.
Fallback dan retry diulang di setiap client.
Migrasi provider memaksa semua consumer ikut berubah.
Audit usage tercecer di banyak dashboard berbeda.

Dengan Restu AI

Akses dibagikan via key turunan, upstream asli tetap private.
Routing dan fallback dipusatkan di middleware.
Provider bisa diganti tanpa menyentuh integrasi client.
Usage dan log terbaca dari satu titik kontrol.

Feature Map

Semua fitur inti proyek dipetakan sebagai sistem, bukan sekadar daftar kemampuan.

Halaman ini menekankan lapisan yang benar-benar dikerjakan oleh produk: registry upstream, key turunan, smart lane selection, fallback, dan panel operasional yang menyatukan log serta usage.

Tim engineering berkolaborasi di depan layar code untuk menggambarkan tooling dan integrasi developer

Built for engineering teams

6 lapisan inti yang membentuk satu control plane.

Registry upstream terpusat

Provider, model, base URL, credential, dan status aktif disatukan dalam satu sumber kontrol.

Endpoint tetap familiar

Pola integrasi OpenAI dan Anthropic-compatible dipertahankan di belakang satu layer kontrol.

Fallback hidup di middleware

Saat model utama gagal atau rate-limit, perpindahan jalur tidak membebani client.

Key turunan untuk distribusi aman

Editor, app, dan workflow memakai key turunan tanpa pernah melihat upstream asli.

Lane berbeda untuk workload berbeda

Chat, automation, dan sesi agentic tidak harus memakai backend yang sama.

Observability dekat dengan traffic

Usage dan log terbaca di layer yang sama untuk audit dan troubleshooting.

Narrative Flow

Satu cerita operasional: request masuk, middleware memutuskan, upstream mengeksekusi.

Section ini menggabungkan cara kerja dan arsitektur menjadi satu visual story. Tujuannya: memperlihatkan bagaimana request bergerak, di mana kebijakan hidup, dan kenapa client tidak perlu ikut menanggung kompleksitas provider.

Ilustrasi infrastruktur cloud dan jalur data untuk menggambarkan middleware AI, routing, dan observability

01 · ingress

Consumer cukup masuk ke satu endpoint.

App, workflow, atau editor tidak perlu tahu provider final. Semuanya masuk lewat surface yang sama.

App / Web Client

Request rutin dengan format kompatibel.

Workflow / Automation

Cron, orchestration, atau pipeline sistem.

Editor / Tool Session

Loop tool, coding session, agentic workload.

02 · control plane

Di sinilah key, policy, routing, dan observability hidup.

Middleware memutuskan lane terbaik, memilih upstream yang cocok, menahan credential asli tetap private, dan mencatat usage di layer yang sama.

Restu Key Registry

Provider, model, base URL, credential, status.

Key Issuance

Customer key, editor key, akses turunan.

Lane Decision

Standard, workflow, agentic, fallback.

Usage + Logs

Audit traffic dekat dengan request sesungguhnya.

03 · execution

Upstream bisa berubah tanpa mengubah client.

Perubahan provider, fallback, atau kombinasi model dilakukan di belakang layar. Consumer tetap memakai pola akses yang sama.

OpenAI-compatible

Balanced general purpose.

Anthropic-compatible

Premium reasoning dan coding.

Google AI / 9Router / Custom

Low cost, spesialis, atau private upstream.

Boundary

Akses publik tidak menyentuh upstream asli

Distribusi key lebih aman, lebih mudah dicabut, dan tidak menyebarkan credential sensitif.

Policy

Pemilihan lane dan fallback ada di pusat

Client tidak perlu mengulang logika provider, retry, atau routing di banyak tempat.

Migration

Provider bisa diganti di belakang layar

Migrasi, ekspansi, atau eksperimen model jadi lebih murah dari sisi integrasi.

Integration Surface

Cocok untuk banyak skenario integrasi tanpa membuat client ikut menanggung kompleksitas provider.

Tim produk dan engineering berdiskusi di depan layar untuk menggambarkan integrasi lintas workflow dan aplikasi

App dan dashboard internal

Satu jalur middleware yang konsisten untuk chat, helper, atau fitur AI di produk internal.

Internal apps

Workflow automation

Pisahkan jalur orchestrator, cron, atau tool automation agar lebih mudah diaudit.

Automation

Tool coding dan editor

Distribusikan Vibe Coding key ke editor, lalu kendalikan routing-nya dari satu tempat.

Agentic tools

Migrasi provider

Ubah, tambah, atau gabungkan upstream tanpa memaksa semua consumer ikut berubah.

Migration

Cross-provider pricing

Bandingkan model lintas provider dari satu tempat.

Daftar harga ini mencerminkan model yang dapat diakses melalui ekosistem Restu AI. Semua harga dalam USD per 1 juta token, input ditampilkan pertama, output kedua.

Low cost Balanced Premium reasoning Coding

OpenAI

Balanced

15+ models

GPT-5$1.25 – $5.00

GPT-5 Mini$0.25 – $1.00

GPT-5.1 Codex$3.00 – $12.00

Anthropic

Premium

3 models

Claude Haiku 4.5$0.25 – $1.25

Claude Sonnet 4.6$2.00 – $10.00

Claude Opus 4.6$10.00 – $50.00

Google Gemini

Low cost

10+ models

Gemini 3.1 Flash Lite$0.05 – $0.20

Gemini 3 Flash$0.10 – $0.40

Gemini 2.5 Pro$1.25 – $5.00

More providers

Pilihan ekonomis dan spesialis

USD per 1M token · input – output

Provider

Model

Harga

Best for

DeepSeek

V4 Flash

$0.07 – $0.28

Low cost reasoning

DeepSeek

V4 Pro

$0.35 – $1.40

Mid-tier reasoning

Alibaba Qwen

Qwen3.6 Flash

$0.02 – $0.08

Cheapest tier

Alibaba Qwen

Qwen3.6 Plus

$0.08 – $0.32

Balanced multilingual

BytePlus

Seed 2.0

$0.04 – $0.16

High-volume chat

MiniMax

M2.7

$0.15 – $0.60

Long context

Z.AI

GLM 5

$0.10 – $0.40

General purpose

Moonshot

Kimi K2.6

$0.25 – $1.00

Long doc analysis

NVIDIA

Nemotron

FREE

Open experiment

Harga dalam USD per 1 juta token. Harga input ditampilkan pertama, output kedua.

Lihat Semua Harga di Dashboard

Closing Signal

Sederhanakan integrasi AI di depan. Pusatkan kontrol key, routing, dan observability di belakang.

Cocok untuk tim yang ingin client tetap sederhana, tetapi tetap punya kontrol penuh atas akses, traffic, dan pilihan provider dari satu lapisan middleware.

Masuk Sebagai Customer Masuk Sebagai Admin