FEAT: Adversarial Benchmark Scenario by ValbuenaVC · Pull Request #1662 · microsoft/PyRIT

ValbuenaVC · 2026-04-27T23:40:50Z

Description

Adds a benchmarking scenario (AdversarialBenchmark) to PyRIT to compare the performance between adversarial targets. Measurement of success uses attack success rate (ASR). The benchmarking scenario is unique in that it takes models as a runtime argument, so we override _get_atomic_attacks_async to patch in live adversarial targets while using the AttackTechniqueRegistry to build AdversarialBenchmarkStrategy. The scenario takes list[PromptTarget] in its constructor.

Includes minor changes to SCENARIO_TECHNIQUES (including adding another attack technique) and a small change to test_rapid_response.py because of said change. Also adds a light aggregate for faster attacks that are benchmark friendly.

Also includes limited parameter support from #1680.

Tests and Documentation

Added tests/unit/scenario/test_benchmark.py.
Updated tests/unit/scenario/test_rapid_response.py.

Victor Valbuena added 2 commits April 23, 2026 17:33

notes

0e86b33

draft PR

42d3ab5

ValbuenaVC changed the title ~~Benchmark~~ [DRAFT] FEAT: Benchmark Scenario Apr 27, 2026

Victor Valbuena and others added 2 commits April 27, 2026 16:43

tests

f5f1563

Merge branch 'main' into benchmark

d36ced0

rlundeen2 reviewed Apr 28, 2026

View reviewed changes

Comment thread pyrit/scenario/scenarios/benchmark/benchmark.py Outdated

Merge branch 'main' into benchmark

1c38950

jbolor21 reviewed Apr 28, 2026

View reviewed changes

Comment thread pyrit/scenario/scenarios/benchmark/benchmark.py Outdated

jbolor21 reviewed Apr 28, 2026

View reviewed changes

Comment thread pyrit/scenario/scenarios/benchmark/benchmark.py Outdated

jbolor21 reviewed Apr 28, 2026

View reviewed changes

Comment thread pyrit/scenario/scenarios/benchmark/benchmark.py Outdated

ValbuenaVC and others added 6 commits April 29, 2026 10:04

Merge branch 'main' into benchmark

53e97d1

.

155dcf0

Merge branch 'main' into benchmark

900ab78

Merge branch 'main' into benchmark

066c514

refactored from 1664

c06fb05

Merge branch 'main' into benchmark

5972cb0

ValbuenaVC marked this pull request as ready for review May 1, 2026 23:40

ValbuenaVC changed the title ~~[DRAFT] FEAT: Benchmark Scenario~~ FEAT: Benchmark Scenario May 1, 2026

ValbuenaVC commented May 1, 2026

View reviewed changes

Comment thread pyrit/scenario/scenarios/benchmark/benchmark.py Outdated

ValbuenaVC added 2 commits May 1, 2026 18:27

Merge branch 'main' into benchmark

5c21b06

Merge branch 'main' into benchmark

af9eea7

ValbuenaVC commented May 4, 2026

View reviewed changes

Comment thread pyrit/scenario/scenarios/benchmark/adversarial.py

rlundeen2 self-assigned this May 4, 2026

rlundeen2 reviewed May 4, 2026

View reviewed changes

Comment thread pyrit/scenario/scenarios/benchmark/benchmark.py Outdated

rlundeen2 reviewed May 4, 2026

View reviewed changes

Comment thread pyrit/scenario/scenarios/benchmark/benchmark.py Outdated

rlundeen2 reviewed May 4, 2026

View reviewed changes

Comment thread pyrit/scenario/scenarios/benchmark/adversarial.py

rlundeen2 reviewed May 4, 2026

View reviewed changes

Comment thread pyrit/scenario/scenarios/benchmark/adversarial.py

rlundeen2 reviewed May 4, 2026

View reviewed changes

Comment thread pyrit/scenario/scenarios/benchmark/benchmark.py Outdated

rlundeen2 reviewed May 4, 2026

View reviewed changes

Comment thread pyrit/scenario/scenarios/benchmark/adversarial.py

jsong468 reviewed May 4, 2026

View reviewed changes

Comment thread pyrit/scenario/scenarios/benchmark/adversarial.py

romanlutz reviewed May 6, 2026

View reviewed changes

Comment thread doc/scanner/0_scanner.md Outdated

Comment thread pyrit/scenario/scenarios/benchmark/adversarial.py Outdated

Victor Valbuena added 4 commits May 6, 2026 10:40

rename

38ce1a2

precommit

8930999

renames

2d0e294

precommit

c90f48d

hannahwestra25 reviewed May 6, 2026

View reviewed changes

Comment thread doc/scanner/adversarial.py Outdated

hannahwestra25 reviewed May 6, 2026

View reviewed changes

Comment thread doc/scanner/0_scanner.md Outdated

hannahwestra25 reviewed May 6, 2026

View reviewed changes

Comment thread pyrit/scenario/scenarios/benchmark/adversarial.py Outdated

hannahwestra25 reviewed May 6, 2026

View reviewed changes

Comment thread pyrit/scenario/scenarios/benchmark/adversarial.py Outdated

hannahwestra25 reviewed May 6, 2026

View reviewed changes

Comment thread pyrit/scenario/scenarios/benchmark/adversarial.py Outdated

hannahwestra25 reviewed May 6, 2026

View reviewed changes

Comment thread doc/scanner/adversarial.py Outdated

Merge branch 'main' into benchmark

61326a1

rlundeen2 reviewed May 6, 2026

View reviewed changes

Comment thread doc/scanner/adversarial.py Outdated

rlundeen2 reviewed May 6, 2026

View reviewed changes

Comment thread doc/scanner/adversarial.py Outdated

rlundeen2 reviewed May 7, 2026

View reviewed changes

Comment thread doc/scanner/adversarial.py Outdated

rlundeen2 reviewed May 7, 2026

View reviewed changes

Comment thread doc/scanner/adversarial.py Outdated

rlundeen2 reviewed May 7, 2026

View reviewed changes

Comment thread pyrit/scenario/scenarios/benchmark/adversarial.py Outdated

ValbuenaVC and others added 5 commits May 6, 2026 17:54

Merge branch 'main' into benchmark

420f29d

pr comments

6dc06c5

pr comments

1ac06c6

notebook

626db62

benchmark notebook

ebf63e5

romanlutz changed the title ~~FEAT: Benchmark Scenario~~ FEAT: Adversarial Benchmark Scenario May 7, 2026

romanlutz approved these changes May 7, 2026

View reviewed changes

ValbuenaVC added this pull request to the merge queue May 7, 2026

Merged via the queue into microsoft:main with commit b86bc5c May 7, 2026
48 checks passed

ValbuenaVC deleted the benchmark branch May 7, 2026 13:45

romanlutz mentioned this pull request May 18, 2026

MAINT: migrate AdversarialBenchmark off deprecated PromptChatTarget #1746

Merged

ValbuenaVC mentioned this pull request Jul 15, 2026

FIX: Aligning Scenarios with Technique Registry #2186

Merged

Uh oh!

Conversation

ValbuenaVC commented Apr 27, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Description

Tests and Documentation

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

6 participants

ValbuenaVC commented Apr 27, 2026 •

edited

Loading