How to: Experiments

Running Experiments

Phoenix supports two workflows for experiments: a UI-driven flow in the Playground and a programmatic SDK flow.

Run Experiments in the UI

Run Experiments with the SDK

SDK Experiment Steps

Upload a Dataset

Create a Task

Configure Evaluators

Run an Experiment

Use Repetitions

Dataset Splits

Using Evaluators

LLM Evaluators

Code Evaluators

Custom Evaluators

Dataset Evaluators

How to: Experiments

Running Experiments

Run Experiments in the UI

Run Experiments with the SDK

SDK Experiment Steps

Upload a Dataset

Create a Task

Configure Evaluators

Run an Experiment

Use Repetitions

Dataset Splits

Using Evaluators

LLM Evaluators

Code Evaluators

Custom Evaluators

Dataset Evaluators

​Running Experiments

Run Experiments in the UI

Run Experiments with the SDK

​SDK Experiment Steps

Upload a Dataset

Create a Task

Configure Evaluators

Run an Experiment

Use Repetitions

Dataset Splits

​Using Evaluators

LLM Evaluators

Code Evaluators

Custom Evaluators

Dataset Evaluators

Running Experiments

SDK Experiment Steps

Using Evaluators