Skip to content

Gemma 4 na DigitalOcean GPU Droplet

Návod na spuštění Gemma 4 přes Ollama na DigitalOcean GPU Droplet. Ověřeno na Debian 13 (Trixie) s RTX 4000 Ada (20 GB VRAM), duben 2026.

ModelArchitekturaKontextModalityMin. VRAM (Q4)
gemma4:e2bDense, 2.3B128KText, obraz, audio~3.2 GB
gemma4:e4b (= latest)Dense, 4.5B128KText, obraz, audio~5 GB
gemma4:26bMoE, 3.8B aktivní / 128 expertů256KText, obraz~15.6 GB
gemma4:31bDense, 30.7B256KText, obraz~17.4 GB

DigitalOcean GPU Droplets — RTX 4000 Ada, 1× GPU, 20 GB VRAM, 8 vCPU, 32 GB RAM.

DigitalOcean GPU Droplet s Debian 13 nemá předinstalované NVIDIA ovladače ani CUDA. Bez nvidia-cuda-toolkit Ollama GPU nevidí a model poběží na CPU.

Terminal window
# Non-free repo (nutné pro NVIDIA na Debianu)
echo "deb http://deb.debian.org/debian trixie main contrib non-free non-free-firmware" \
> /etc/apt/sources.list.d/nvidia.list
apt-get update
# Ovladače + CUDA
apt-get install -y linux-headers-amd64 nvidia-driver firmware-misc-nonfree nvidia-cuda-toolkit
# Načtení kernel modulu
modprobe nvidia
# Ollama
curl -fsSL https://ollama.com/install.sh | sh
# Stažení modelu a spuštění
ollama pull gemma4:26b
ollama run gemma4:26b

Pokud chcete přistupovat k Ollama API vzdáleně:

Terminal window
mkdir -p /etc/systemd/system/ollama.service.d
cat > /etc/systemd/system/ollama.service.d/override.conf <<EOF
[Service]
Environment="OLLAMA_HOST=0.0.0.0:11434"
Environment="OLLAMA_ORIGINS=*"
EOF
systemctl daemon-reload && systemctl restart ollama

Doporučené výchozí hodnoty pro Gemma 4:

Terminal window
/set parameter temperature 1.0
/set parameter top_p 0.95
/set parameter top_k 64
/set parameter num_ctx 32768

Přidejte --keepalive 30m při spouštění, aby model zůstal načtený v paměti a nedocházelo ke zdržení při každém dotazu:

Terminal window
ollama run gemma4:26b --keepalive 30m

Gemma 4 podporuje „thinking mode” — model před odpovědí projde interním uvažováním. Aktivuje se přidáním <|think|> tokenu do systémového promptu nebo parametrem enable_thinking=True v chat template.

Terminal window
ollama ps
# Hledejte "100% GPU" ve sloupci PROCESSOR