Skip to content

Main Navigation Guide Concepts Reference Development Operations Releases Roadmap GitHub

Appearance

Sidebar Navigation

Concepts

Architecture

Pipeline

Scoring

Task Lifecycle

On this page

Scoring

Current scoring for code tasks uses weighted dimensions:

Test passing: 40%
Execution success: 25%
Syntax validity: 15%
Completeness (LLM judge): 20%

Notes

Dedicated scorer is implemented for code tasks.
Other task types currently fall back to code scorer behavior.

Pager

Previous pagePipeline

Next pageTask Lifecycle

MIT Licensed

Copyright 2026 validtr