Kubernetes Deployment

Dagster provides an official Helm chart for deploying to Kubernetes. This is the recommended approach for production workloads requiring scalability, high availability, and cloud-native infrastructure.

Prerequisites

Kubernetes Cluster

Set up a Kubernetes cluster (version 1.18+):

AWS EKS
Google GKE
Azure AKS
Self-managed cluster

Install Helm

Install Helm 3.x:

curl https://raw.githubusercontent.com/helm/helm/main/scripts/get-helm-3 | bash

Add Dagster Repository

Add the Dagster Helm repository:

helm repo add dagster https://dagster-io.github.io/helm
helm repo update

Quick Start Installation

Create namespace

kubectl create namespace dagster

Install Dagster

helm install my-release dagster/dagster \
  --namespace dagster \
  --create-namespace

Verify installation

kubectl get pods -n dagster

Expected output:

NAME                                    READY   STATUS    RESTARTS   AGE
my-release-dagster-daemon-xxx           1/1     Running   0          2m
my-release-dagster-webserver-xxx        1/1     Running   0          2m
my-release-postgresql-0                 1/1     Running   0          2m

Helm Chart Configuration

The Dagster Helm chart is highly configurable through values.yaml. Here are key configuration options:

Chart Structure

Chart.yaml (from helm/dagster/)

apiVersion: v2
name: dagster
version: 0.0.1-dev
kubeVersion: ">= 1.18.0-0"
description: The data orchestration platform built for productivity.
type: application

dependencies:
  - name: dagster-user-deployments
    version: 0.0.1-dev
    condition: dagster-user-deployments.enableSubchart
  - name: postgresql
    version: 8.1.0
    repository: https://raw.githubusercontent.com/bitnami/charts/eb5f9a9513d987b519f0ecd732e7031241c50328/bitnami
    condition: postgresql.enabled
  - name: rabbitmq
    version: 6.16.3
    repository: https://raw.githubusercontent.com/bitnami/charts/eb5f9a9513d987b519f0ecd732e7031241c50328/bitnami
    condition: rabbitmq.enabled
  - name: redis
    version: 12.7.4
    repository: https://raw.githubusercontent.com/bitnami/charts/eb5f9a9513d987b519f0ecd732e7031241c50328/bitnami
    condition: redis.internal

Basic Configuration

global:
  postgresqlSecretName: "dagster-postgresql-secret"
  dagsterHome: "/opt/dagster/dagster_home"

dagsterWebserver:
  replicaCount: 1
  image:
    repository: "docker.io/dagster/dagster-celery-k8s"
    pullPolicy: Always
  service:
    type: ClusterIP
    port: 80

dagsterDaemon:
  enabled: true

postgresql:
  enabled: true
  postgresqlUsername: dagster
  postgresqlPassword: dagster
  postgresqlDatabase: dagster

Deploying User Code

Dagster separates system components from user code. Deploy your code as separate pods:

User Code Deployment

Build user code image

Create a Dockerfile for your Dagster project:

Dockerfile

FROM python:3.10-slim

WORKDIR /opt/dagster/app

# Install dependencies
COPY requirements.txt .
RUN pip install -r requirements.txt

# Copy Dagster code
COPY iris_analysis/ ./iris_analysis/

# Expose gRPC port
EXPOSE 4000

CMD ["dagster", "api", "grpc", "-h", "0.0.0.0", "-p", "4000", "-m", "iris_analysis"]

Configure user deployments

values.yaml

dagster-user-deployments:
  enabled: true
  enableSubchart: true
  
  deployments:
    - name: "iris-analysis"
      image:
        repository: "my-registry/iris-analysis"
        tag: "latest"
        pullPolicy: Always
      
      dagsterApiGrpcArgs:
        - "-m"
        - "iris_analysis"
      
      port: 4000
      
      resources:
        limits:
          cpu: 500m
          memory: 1Gi
        requests:
          cpu: 250m
          memory: 512Mi

Apply configuration

helm upgrade my-release dagster/dagster \
  --namespace dagster \
  -f values.yaml

Example User Code

This example is from examples/deploy_k8s/iris_analysis/:

definitions.py

import dagster as dg
import pandas as pd

@dg.asset
def iris_dataset_size(context: dg.AssetExecutionContext) -> None:
    df = pd.read_csv(
        "https://docs.dagster.io/assets/iris.csv",
        names=[
            "sepal_length_cm",
            "sepal_width_cm",
            "petal_length_cm",
            "petal_width_cm",
            "species",
        ],
    )
    
    context.log.info(f"Loaded {df.shape[0]} data points.")

defs = dg.Definitions(assets=[iris_dataset_size])

Run Launchers

Dagster supports two Kubernetes run launchers:

K8sRunLauncher

Launches each run in a separate Kubernetes Job:

values.yaml

runLauncher:
  type: K8sRunLauncher
  config:
    k8sRunLauncher:
      jobNamespace: dagster
      loadInclusterConfig: true
      kubeconfigFile: ~
      
      # Pod configuration for runs
      envConfigMaps:
        - name: dagster-pipeline-env
      
      envSecrets:
        - name: dagster-aws-credentials
      
      resources:
        limits:
          cpu: 2000m
          memory: 4Gi
        requests:
          cpu: 1000m
          memory: 2Gi

CeleryK8sRunLauncher

Uses Celery for distributed task execution:

values.yaml

runLauncher:
  type: CeleryK8sRunLauncher
  config:
    celeryK8sRunLauncher:
      image:
        repository: "docker.io/dagster/dagster-celery-k8s"
        tag: "1.5.0"
      
      workerQueues:
        - name: "default"
          replicaCount: 3
          resources:
            limits:
              cpu: 1000m
              memory: 2Gi

rabbitmq:
  enabled: true

Generated Instance Configuration

The Helm chart automatically generates dagster.yaml from your values. Here’s what it creates:

ConfigMap: dagster-instance (generated)

apiVersion: v1
kind: ConfigMap
metadata:
  name: dagster-instance
data:
  dagster.yaml: |
    scheduler:
      module: dagster.core.scheduler
      class: DagsterDaemonScheduler
    
    schedule_storage:
      module: dagster_postgres.schedule_storage
      class: PostgresScheduleStorage
      config:
        postgres_db:
          hostname: postgresql
          username: dagster
          password: dagster
          db_name: dagster
          port: 5432
    
    run_launcher:
      module: dagster_k8s
      class: K8sRunLauncher
      config:
        job_namespace: dagster
        load_incluster_config: true
    
    run_storage:
      module: dagster_postgres.run_storage
      class: PostgresRunStorage
      config:
        postgres_db:
          hostname: postgresql
          username: dagster
          password: dagster
          db_name: dagster
          port: 5432
    
    event_log_storage:
      module: dagster_postgres.event_log
      class: PostgresEventLogStorage
      config:
        postgres_db:
          hostname: postgresql
          username: dagster
          password: dagster
          db_name: dagster
          port: 5432
    
    run_coordinator:
      module: dagster.core.run_coordinator
      class: QueuedRunCoordinator
      config:
        max_concurrent_runs: 10

Production Best Practices

Always use an external PostgreSQL database for production. The embedded PostgreSQL is not suitable for production workloads.

High Availability

values.yaml (HA configuration)

dagsterWebserver:
  replicaCount: 3
  
  affinity:
    podAntiAffinity:
      preferredDuringSchedulingIgnoredDuringExecution:
        - weight: 100
          podAffinityTerm:
            labelSelector:
              matchExpressions:
                - key: component
                  operator: In
                  values:
                    - dagster-webserver
            topologyKey: kubernetes.io/hostname

# Only one daemon should run
dagsterDaemon:
  enabled: true
  # Daemon does not support multiple replicas

Resource Management

values.yaml (resource limits)

dagsterWebserver:
  resources:
    limits:
      cpu: 2000m
      memory: 4Gi
    requests:
      cpu: 1000m
      memory: 2Gi

dagsterDaemon:
  resources:
    limits:
      cpu: 1000m
      memory: 2Gi
    requests:
      cpu: 500m
      memory: 1Gi

runLauncher:
  config:
    k8sRunLauncher:
      resources:
        limits:
          cpu: 4000m
          memory: 8Gi
        requests:
          cpu: 2000m
          memory: 4Gi

Monitoring

values.yaml (monitoring)

dagsterWebserver:
  readinessProbe:
    httpGet:
      path: "/server_info"
      port: 80
    periodSeconds: 20
    timeoutSeconds: 10
    successThreshold: 1
    failureThreshold: 3
  
  livenessProbe:
    httpGet:
      path: "/server_info"
      port: 80
    periodSeconds: 30
    timeoutSeconds: 10
    failureThreshold: 5
  
  startupProbe:
    enabled: true
    httpGet:
      path: "/server_info"
      port: 80
    periodSeconds: 10
    failureThreshold: 30

Managing the Deployment

helm upgrade my-release dagster/dagster \
  --namespace dagster \
  -f values.yaml

For detailed Helm chart configuration options, see the values.yaml file in the Dagster repository.

Get Started

Core Concepts

Guides

Integrations

Deployment

Kubernetes Deployment

Kubernetes Deployment

Prerequisites

Quick Start Installation

Helm Chart Configuration

Chart Structure

Basic Configuration

Deploying User Code

User Code Deployment

Example User Code

Run Launchers

K8sRunLauncher

CeleryK8sRunLauncher

Generated Instance Configuration

Production Best Practices

High Availability

Resource Management

Monitoring

Managing the Deployment

Next Steps

Get Started

Core Concepts

Guides

Integrations

Deployment

​Kubernetes Deployment

​Prerequisites

​Quick Start Installation

​Helm Chart Configuration

​Chart Structure

​Basic Configuration

​Deploying User Code

​User Code Deployment

​Example User Code

​Run Launchers

​K8sRunLauncher

​CeleryK8sRunLauncher

​Generated Instance Configuration

​Production Best Practices

​High Availability

​Resource Management

​Monitoring

​Managing the Deployment

​Next Steps

Kubernetes Deployment

Prerequisites

Quick Start Installation

Helm Chart Configuration

Chart Structure

Basic Configuration

Deploying User Code

User Code Deployment

Example User Code

Run Launchers

K8sRunLauncher

CeleryK8sRunLauncher

Generated Instance Configuration

Production Best Practices

High Availability

Resource Management

Monitoring

Managing the Deployment

Next Steps