all systems operational
Get started
/ gpu vps · kvm + pci passthrough

GPU VPS.Обучайте. Рендерите. Стримьте.

KVM-виртуалки с полным PCI-проксированием на NVIDIA RTX PRO 4500 и RTX PRO 6000 Blackwell. Вся GPU отдаётся вашей VM — никакого vGPU-нарезания, никаких shared CUDA-ядер. Загрузка за минуты. Фиксированная месячная цена. Никаких сюрпризов с почасовкой.

  • 100%GPU отдана вашей VM
  • PCIe 5passthrough на полной полосе
  • 10 Gbit/sаплинк, безлимит
  • ~5 minпровижининг · в наличии
live · gpu-7
RTX PRO 6000 Blackwell
работает
Загрузка CUDA80%
VRAM
71.4 / 96 GB
Темп.
62 °C
Питание
412 W
SM clock
2.61 GHz
Активная нагрузка
PID 8421llama-3.1-70b · vLLM68 GB
PID 8422whisper-large-v33.4 GB
/ железо

Две карты. Обе уровня workstation.

Профессиональные GPU отдаются вашей VM через PCIe Gen 5 passthrough. ECC VRAM, настоящее ДЦ-охлаждение. Не игровой кремний, не потребительские драйверы, никакого vGPU-нарезания.

entry

RTX PRO 4500 Blackwell

32 GB GDDR7 ECC

Поколение: Blackwell · 10 496 CUDA-ядер

  • VRAM32 GB GDDR7 · ECC
  • CUDA cores10,496
  • Tensor cores328 (5th gen)
  • RT cores82 (4th gen)
  • FP32 compute49.8 TFLOPS
  • TDP200 W
  • Memory bus256-bit · 672 GB/s
  • NVENC / NVDEC3 / 3 (AV1)
Лучше всего для
  • LLM-инференс до 30B параметров
  • Stable Diffusion / Flux
  • Энкодинг в реальном времени (12+ потоков)
  • 3D-рендеринг · Blender / Octane
flagship

RTX PRO 6000 Blackwell

96 GB GDDR7 ECC

Поколение: Blackwell · 24 064 CUDA-ядра

  • VRAM96 GB GDDR7 · ECC
  • CUDA cores24,064
  • Tensor cores752 (5th gen)
  • RT cores188 (4th gen)
  • FP32 compute125.5 TFLOPS
  • TDP600 W
  • Memory bus512-bit · 1.79 TB/s
  • NVENC / NVDEC4 / 4 (AV1)
Лучше всего для
  • LLM-инференс 70B+ на одной GPU
  • Файнтюнинг · LoRA / QLoRA
  • Тяжёлый 8K-рендеринг · DCC-пайплайны
  • Video AI · апскейлинг, генерация
/ тарифы

Выберите кусок. Загрузка за минуты.

Лучше всего для инференса
/ gpu

GPU VPS · RTX PRO 4500

32 GBVRAM
$550/mo
  • GPU1× RTX PRO 4500 Blackwell · 32 GB · full passthrough
  • CPU16 vCPU · EPYC 9354 (3.25 GHz)
  • RAM128 GB DDR5
  • Диск1 TB NVMe Gen5
  • Сеть10 Гбит/с · безлимит
  • DDoS1,6 Тбит/с в комплекте
KVM · cloud-initСнапшоты бесплатноНативный IPv6API / веб-панель
Заказать
В наличии · Киев, UA · провижининг ~5 мин
Флагман · 70B в одной карте
/ gpu

GPU VPS · RTX PRO 6000

96 GBVRAM
$1200/mo
  • GPU1× RTX PRO 6000 Blackwell · 96 GB · full passthrough
  • CPU32 vCPU · EPYC 9354 (3.25 GHz)
  • RAM256 GB DDR5
  • Диск2 TB NVMe Gen5
  • Сеть10 Гбит/с · безлимит
  • DDoS1,6 Тбит/с в комплекте
KVM · cloud-initСнапшоты бесплатноНативный IPv6API / веб-панель
Заказать
В наличии · Киев, UA · провижининг ~5 мин

Нужно несколько GPU? Можем пробросить 2× / 4× карты в одну VM или собрать выделенный bare-metal риг — обращайтесь к инженерам.

/ нагрузки

Создано под то, ради чего реально берут GPU.

Если у вашей задачи есть CUDA, энкодер или рендер-ферма — мы уже поставили нужное железо в стойку.

01

AI / LLM-инференс

Запускайте Llama 3.1 70B в одной Blackwell-VM или модели уровня 8B/13B на кусочке 4500. vLLM, llama.cpp, TGI — нативная CUDA прямо внутри VM.

vLLMTGITritonCUDA 12.5
02

Diffusion / генеративное видео

Flux, SD3, AnimateDiff, апскейлинг видео. 96 ГБ VRAM позволяют держать большие чекпоинты и ControlNet'ы резидентно — без свопа на каждый запрос.

ComfyUIAuto1111SD3Flux
03

3D-рендеринг · DCC-пайплайны

Blender · Cycles, Octane, Redshift, V-Ray RT. Pro-драйверы значит, что сцены, падающие на потребительских картах, просто работают. Длинные рендеры — фикс-цена, никакого поминутного счётчика.

BlenderOctaneHoudiniRedshift
04

Video AI · стриминг

AV1-энкодинг в реальном времени (NVENC), апскейлинг, интерполяция кадров, автосубтитры (Whisper). В связке с нашими нодами 100/400 G — для дистрибуции.

NVENC AV1WhisperRIFETopaz
05

Файнтюнинг · LoRA

Тренируйте свои 7B–13B LoRA за несколько часов на 6000. Полноценный PCIe Gen 5 + 1,79 ТБ/с памяти — меньше эпох теряется из-за полосы.

LoRAQLoRAPEFTAxolotl
06

CUDA / научные вычисления

Полный passthrough в VM. ECC VRAM. Никаких соседей по GPU. Запускайте свои MPI-задачи, OptiX-трассировку, CFD-солверы — root-доступ, а не песочница.

CUDAOptiXcuDNNTensorRT
/ софт

Выберите образ. Загрузите. Запускайте задачи.

Готовые образы избавят от того, чтобы первый день драться с драйверами. Или принесите свой — bare-metal означает root.

Драйверы и runtime
  • CUDA 12.5
  • cuDNN 9
  • TensorRT 10
  • NCCL 2.22
  • драйвер NVIDIA 555+
Фреймворки (готовые образы)
  • PyTorch 2.5
  • TensorFlow 2.17
  • JAX 0.4
  • vLLM
  • TGI
  • ComfyUI
Контейнеры и оркестрация
  • Docker + nvidia-runtime
  • Podman
  • k3s ready
  • совместимо со Slurm
Варианты ОС
  • Ubuntu 22.04 / 24.04 LTS
  • Debian 12
  • Rocky 9
  • свой ISO
/ faq

Вопросы, которые слышим постоянно.

Ещё? Пишите в Telegram или связывайтесь с NOC по адресу noc@hostfory.com.

  • Именно. KVM-виртуалка для уровня ОС, но вся GPU прокинута через PCIe-шину прямо в вашу VM. Каждое CUDA-ядро, вся VRAM, никакого vGPU-нарезания, никакого общего драйвера. CPU и RAM — выделенные куски EPYC-хоста, никакого овербукинга на GPU-тарифах.

/ начать

Запустите GPU VPS. Прямо сейчас.

$550 за 32 ГБ RTX PRO 4500. $1200 за 96 ГБ Blackwell. Фиксированная цена в месяц. Полный passthrough GPU, безлимитная сеть 10G, настоящие инженеры в Telegram.

Chat with us@hostfory