all systems operational
Get started
/ gpu vps · kvm + pci passthrough

GPU VPS.Trenuj. Renderuj. Streamuj.

Maszyny wirtualne KVM z pełnym PCI passthrough do NVIDIA RTX PRO 4500 i RTX PRO 6000 Blackwell. Całe GPU trafia do twojej VM — żadnego krojenia vGPU, żadnych współdzielonych rdzeni CUDA. Bootuje się w minuty. Stała cena miesięczna. Żadnych zaskakujących rachunków godzinowych.

  • 100%GPU przekazane do twojej VM
  • PCIe 5passthrough pełnej przepustowości
  • 10 Gbit/suplink, unmetered
  • ~5 minprovisioning · w magazynie
live · gpu-7
RTX PRO 6000 Blackwell
działa
Wykorzystanie CUDA61%
VRAM
71,4 / 96 GB
Temp.
62 °C
Moc
412 W
Zegar SM
2,61 GHz
Aktywne obciążenie
PID 8421llama-3.1-70b · vLLM68 GB
PID 8422whisper-large-v33,4 GB
/ sprzęt

Dwie karty. Obie klasy workstation.

Profesjonalne GPU przekazane do twojej VM przez PCIe Gen 5 passthrough. ECC VRAM, porządne chłodzenie datacenter. Nie gamingowy krzem, nie sterowniki konsumenckie, nie krojenie vGPU.

entry

RTX PRO 4500 Blackwell

32 GB GDDR7 ECC

Generacja: Blackwell · 10 496 rdzeni CUDA

  • VRAM32 GB GDDR7 · ECC
  • CUDA cores10,496
  • Tensor cores328 (5th gen)
  • RT cores82 (4th gen)
  • FP32 compute49.8 TFLOPS
  • TDP200 W
  • Memory bus256-bit · 672 GB/s
  • NVENC / NVDEC3 / 3 (AV1)
Najlepiej do
  • Inferencja LLM do 30B parametrów
  • Stable Diffusion / Flux
  • Enkodowanie w czasie rzeczywistym (12+ streamów)
  • Rendering 3D · Blender / Octane
flagship

RTX PRO 6000 Blackwell

96 GB GDDR7 ECC

Generacja: Blackwell · 24 064 rdzenie CUDA

  • VRAM96 GB GDDR7 · ECC
  • CUDA cores24,064
  • Tensor cores752 (5th gen)
  • RT cores188 (4th gen)
  • FP32 compute125.5 TFLOPS
  • TDP600 W
  • Memory bus512-bit · 1.79 TB/s
  • NVENC / NVDEC4 / 4 (AV1)
Najlepiej do
  • Inferencja LLM 70B+ na jednym GPU
  • Fine-tuning · LoRA / QLoRA
  • Ciężki rendering 8K · pipeline'y DCC
  • Video AI · upscaling, generacja
/ plany

Wybierz kawałek. Bootuj w minuty.

Najlepszy do inferencji
/ gpu

GPU VPS · RTX PRO 4500

32 GBVRAM
$550/mo
  • GPU1× RTX PRO 4500 Blackwell · 32 GB · full passthrough
  • CPU16 vCPU · EPYC 9354 (3.25 GHz)
  • RAM128 GB DDR5
  • Dysk1 TB NVMe Gen5
  • Sieć10 Gbit/s · unmetered
  • DDoS1,6 Tbit/s w cenie
KVM · cloud-initSnapshoty gratisNatywne IPv6API / panel WWW
Zamów teraz
W magazynie · Kijów, UA · provisioning ~5 min
Flagowiec · 70B na jednej karcie
/ gpu

GPU VPS · RTX PRO 6000

96 GBVRAM
$1200/mo
  • GPU1× RTX PRO 6000 Blackwell · 96 GB · full passthrough
  • CPU32 vCPU · EPYC 9354 (3.25 GHz)
  • RAM256 GB DDR5
  • Dysk2 TB NVMe Gen5
  • Sieć10 Gbit/s · unmetered
  • DDoS1,6 Tbit/s w cenie
KVM · cloud-initSnapshoty gratisNatywne IPv6API / panel WWW
Zamów teraz
W magazynie · Kijów, UA · provisioning ~5 min

Potrzebujesz multi-GPU? Możemy przekazać 2× / 4× karty do jednej VM albo zbudować dedykowany rig bare-metal — pogadaj z engineeringiem.

/ obciążenia

Zbudowane pod to, co ludzie naprawdę robią na GPU.

Jeśli twoja praca to CUDA, enkoder albo render farm — mamy już odpowiedni sprzęt w szafie.

01

Inferencja AI / LLM

Odpal Llama 3.1 70B na jednej VM z Blackwellem albo modele klasy 8B/13B na kawałku 4500. vLLM, llama.cpp, TGI — wszystko natywnie CUDA wewnątrz VM.

vLLMTGITritonCUDA 12.5
02

Diffusion / generatywne wideo

Flux, SD3, AnimateDiff, upscaling wideo. 96 GB VRAM pozwala trzymać duże checkpointy i ControlNety w pamięci — bez swapowania przy każdym żądaniu.

ComfyUIAuto1111SD3Flux
03

Rendering 3D · pipeline'y DCC

Blender · Cycles, Octane, Redshift, V-Ray RT. Stos sterowników pro sprawia, że sceny crashujące na kartach konsumenckich po prostu działają. Długie renderingi wyceniane na stałą stawkę — bez licznika minutowego.

BlenderOctaneHoudiniRedshift
04

Video AI · streaming

Enkodowanie AV1 w czasie rzeczywistym (NVENC), upscaling, interpolacja klatek, automatyczne napisy (Whisper). Łącz z naszymi nodami 100/400 G do dystrybucji.

NVENC AV1WhisperRIFETopaz
05

Fine-tuning · LoRA

Wytrenuj własne LoRA 7B–13B w kilka godzin na 6000-ce. Pełne PCIe Gen 5 + pamięć 1,79 TB/s oznaczają mniej epok traconych na przepustowość.

LoRAQLoRAPEFTAxolotl
06

CUDA / obliczenia naukowe

VM z pełnym passthrough. ECC VRAM. Żadnego hałaśliwego sąsiada na GPU. Odpalaj własne zadania MPI, ray tracing OptiX, solvery CFD — root, nie sandbox.

CUDAOptiXcuDNNTensorRT
/ oprogramowanie

Wybierz obraz. Zbootuj. Odpal zadania.

Gotowe obrazy oszczędzają ci pierwszego dnia walki ze sterownikami. Albo przynieś własne — bare-metal oznacza root.

Sterowniki i runtime
  • CUDA 12.5
  • cuDNN 9
  • TensorRT 10
  • NCCL 2.22
  • sterownik NVIDIA 555+
Frameworki (gotowe obrazy)
  • PyTorch 2.5
  • TensorFlow 2.17
  • JAX 0.4
  • vLLM
  • TGI
  • ComfyUI
Kontenery i orkiestracja
  • Docker + nvidia-runtime
  • Podman
  • k3s ready
  • zgodne ze Slurm
Wybór OS
  • Ubuntu 22.04 / 24.04 LTS
  • Debian 12
  • Rocky 9
  • własny ISO
/ faq

Pytania, które słyszymy non stop.

Więcej? Pingnij nas na Telegram albo złap NOC pod noc@hostfory.com.

  • Dokładnie. Maszyna wirtualna KVM dla warstwy OS, ale całe GPU jest przekazane bezpośrednio przez magistralę PCIe do twojej VM. Każdy rdzeń CUDA, cała VRAM, żadnego krojenia vGPU, żadnego współdzielonego sterownika. CPU i RAM to dedykowane kawałki hosta EPYC — żadnej nadsubskrypcji na planach GPU.

/ start

Odpal GPU VPS. Teraz.

$550 za 32 GB RTX PRO 4500. $1 200 za 96 GB Blackwell. Stała cena miesięczna. Pełny GPU passthrough, unmetered sieć 10G, realni inżynierowie na Telegramie.

Chat with us@hostfory