Tutorials

Build unlimited training data and train state-of-the-art SWE-agents. This guide covers the complete workflow: from environment setup to model training and evaluation.

📋 Prerequisites

System Requirements

Required: Docker Tested on: Ubuntu 22.04.4 LTS Not supported: Windows, macOS

New to SWE-smith? Start with Installation and Quickstart.

Build Environments

Create reproducible Docker images for any repository. Capture dependencies, build containers, and validate with automated testing.

Get started
Create Instances

Generate task instances using LM prompts, procedural modifications, PR mirroring, or combined techniques. Scale to thousands of bugs.

Generate bugs
Validate & Evaluate

Filter candidates that break tests and verify proposed solutions. Built-in harnesses for validation and evaluation workflows.

Run harnesses
Generate Issue Text

Add natural language problem statements to task instances using LM generation or alternative methods.

Create issues
Rate Difficulty · Optional

Classify tasks as easy/medium/hard using a fine-tuned Qwen 2.5 Coder model. Compare against SWE-bench benchmarks.

Assess difficulty
Train SWE-agents

Complete RSFT pipeline: generate trajectories, filter successful solutions, fine-tune models, and evaluate on SWE-bench.

Start training

Recommended Workflow

graph LR
    A[Build Environments] --> B[Create Instances]
    B --> C[Validate & Evaluate]
    C --> D[Generate Issue Text]
    D --> E[Rate Difficulty]
    D --> F[Train SWE-agents]
    E --> F

Build Environments → Set up Docker images
Create Instances → Generate synthetic bugs
Validate & Evaluate → Filter valid task instances
Generate Issue Text → Add problem descriptions
Rate Difficulty (optional) → Classify task complexity
Train SWE-agents → Fine-tune models with RSFT

Our projects

Tutorials

📋 Prerequisites

🎯 Quick Navigation

Recommended Workflow