all systems operational
Get started
/ gpu vps · kvm + pci passthrough

GPU VPS.Entrena. Renderiza. Streamea.

Máquinas virtuales KVM con passthrough PCI completo a NVIDIA RTX PRO 4500 y RTX PRO 6000 Blackwell. Toda la GPU va a tu VM — sin slicing vGPU, sin núcleos CUDA compartidos. Arranca en minutos. Precio mensual fijo. Sin facturas por hora sorpresa.

  • 100%GPU pasada a tu VM
  • PCIe 5passthrough a ancho de banda completo
  • 10 Gbit/suplink, unmetered
  • ~5 minaprovisionamiento · en stock
live · gpu-7
RTX PRO 6000 Blackwell
en ejecución
Utilización CUDA78%
VRAM
71,4 / 96 GB
Temp
62 °C
Potencia
412 W
SM clock
2,61 GHz
Carga activa
PID 8421llama-3.1-70b · vLLM68 GB
PID 8422whisper-large-v33,4 GB
/ hardware

Dos tarjetas. Ambas clase workstation.

GPUs profesionales pasadas a tu VM vía passthrough PCIe Gen 5. VRAM ECC, refrigeración de datacenter en serio. No es silicio gaming, no son drivers de consumo, no es slicing vGPU.

entry

RTX PRO 4500 Blackwell

32 GB GDDR7 ECC

Generación: Blackwell · 10.496 núcleos CUDA

  • VRAM32 GB GDDR7 · ECC
  • CUDA cores10,496
  • Tensor cores328 (5th gen)
  • RT cores82 (4th gen)
  • FP32 compute49.8 TFLOPS
  • TDP200 W
  • Memory bus256-bit · 672 GB/s
  • NVENC / NVDEC3 / 3 (AV1)
Mejor para
  • Inferencia LLM hasta 30B params
  • Stable Diffusion / Flux
  • Codificación en tiempo real (12+ streams)
  • Renderizado 3D · Blender / Octane
flagship

RTX PRO 6000 Blackwell

96 GB GDDR7 ECC

Generación: Blackwell · 24.064 núcleos CUDA

  • VRAM96 GB GDDR7 · ECC
  • CUDA cores24,064
  • Tensor cores752 (5th gen)
  • RT cores188 (4th gen)
  • FP32 compute125.5 TFLOPS
  • TDP600 W
  • Memory bus512-bit · 1.79 TB/s
  • NVENC / NVDEC4 / 4 (AV1)
Mejor para
  • Inferencia LLM 70B+ en una sola GPU
  • Fine-tuning · LoRA / QLoRA
  • Renderizado pesado 8K · pipelines DCC
  • IA de vídeo · upscaling, generación
/ planes

Elige una porción. Arranca en minutos.

Mejor para inferencia
/ gpu

GPU VPS · RTX PRO 4500

32 GBVRAM
$550/mo
  • GPU1× RTX PRO 4500 Blackwell · 32 GB · full passthrough
  • CPU16 vCPU · EPYC 9354 (3.25 GHz)
  • RAM128 GB DDR5
  • Disco1 TB NVMe Gen5
  • Red10 Gbit/s · unmetered
  • DDoS1,6 Tbit/s incluido
KVM · cloud-initSnapshots gratisIPv6 nativoAPI / panel web
Pedir ahora
En stock · Kiev, UA · ~5 min de aprovisionamiento
Flagship · 70B en una sola tarjeta
/ gpu

GPU VPS · RTX PRO 6000

96 GBVRAM
$1200/mo
  • GPU1× RTX PRO 6000 Blackwell · 96 GB · full passthrough
  • CPU32 vCPU · EPYC 9354 (3.25 GHz)
  • RAM256 GB DDR5
  • Disco2 TB NVMe Gen5
  • Red10 Gbit/s · unmetered
  • DDoS1,6 Tbit/s incluido
KVM · cloud-initSnapshots gratisIPv6 nativoAPI / panel web
Pedir ahora
En stock · Kiev, UA · ~5 min de aprovisionamiento

¿Necesitas multi-GPU? Podemos pasar tarjetas 2× / 4× a una sola VM, o construir un rig bare-metal dedicado — habla con ingeniería.

/ cargas

Hecho para las cosas que la gente hace con GPUs.

Si tu trabajo involucra CUDA, un encoder o una render farm — ya tenemos el hardware racked.

01

IA / inferencia LLM

Corre Llama 3.1 70B en una sola VM Blackwell, o modelos clase 8B/13B en una porción 4500. vLLM, llama.cpp, TGI — todo CUDA nativo dentro de la VM.

vLLMTGITritonCUDA 12.5
02

Difusión / vídeo generativo

Flux, SD3, AnimateDiff, upscaling de vídeo. 96 GB de VRAM te permiten mantener checkpoints grandes y ControlNets residentes — sin swapping por petición.

ComfyUIAuto1111SD3Flux
03

Renderizado 3D · pipelines DCC

Blender · Cycles, Octane, Redshift, V-Ray RT. El stack de drivers pro hace que escenas que crashean en tarjetas de consumo simplemente funcionen. Renders largos a precio plano — sin contador por minuto.

BlenderOctaneHoudiniRedshift
04

IA de vídeo · streaming

Codificación AV1 en tiempo real (NVENC), upscaling, interpolación de frames, subtítulos automáticos (Whisper). Combínalo con nuestros nodos 100/400 G para distribución.

NVENC AV1WhisperRIFETopaz
05

Fine-tuning · LoRA

Entrena tus propios LoRAs 7B–13B en pocas horas en la 6000. PCIe Gen 5 completo + 1,79 TB/s de memoria significan menos épocas perdidas por ancho de banda.

LoRAQLoRAPEFTAxolotl
06

CUDA / cómputo científico

VM con passthrough completo. VRAM ECC. Sin vecinos ruidosos en la GPU. Corre tus propios jobs MPI, OptiX ray tracing, solvers CFD — acceso root, no un sandbox.

CUDAOptiXcuDNNTensorRT
/ software

Elige una imagen. Arranca. Empieza jobs.

Las imágenes pre-cocinadas evitan que pierdas el primer día peleando con drivers. O trae la tuya — bare-metal significa root.

Drivers y runtime
  • CUDA 12.5
  • cuDNN 9
  • TensorRT 10
  • NCCL 2.22
  • driver NVIDIA 555+
Frameworks (imágenes preset)
  • PyTorch 2.5
  • TensorFlow 2.17
  • JAX 0.4
  • vLLM
  • TGI
  • ComfyUI
Contenedores y orquestación
  • Docker + nvidia-runtime
  • Podman
  • k3s ready
  • compatible con Slurm
Opciones de SO
  • Ubuntu 22.04 / 24.04 LTS
  • Debian 12
  • Rocky 9
  • ISO personalizada
/ faq

Preguntas que oímos todo el tiempo.

¿Más? Escríbenos por Telegram o contacta al NOC en noc@hostfory.com.

  • Exactamente. Máquina virtual KVM para la capa del SO, pero toda la GPU se pasa por el bus PCIe directamente a tu VM. Cada núcleo CUDA, toda la VRAM, sin slicing vGPU, sin driver compartido. CPU y RAM son porciones dedicadas de un host EPYC — sin oversubscription en planes GPU.

/ empezar

Levanta una GPU VPS. Ahora.

$550 por la RTX PRO 4500 de 32 GB. $1.200 por la Blackwell de 96 GB. Precio mensual plano. Passthrough completo de GPU, red unmetered 10G, ingenieros de verdad en Telegram.

Chat with us@hostfory