Skip to content

字段说明

字段必填说明
version测试规范版本
skill.name被测 Skill 名称
skill.descriptionSkill 简要说明
defaults.mode默认测试模式,推荐 dry-run
defaults.execution是否允许工具调用,Skill 单测推荐 no_tool_call
cases[].id用例唯一 ID
cases[].typetrigger / plan / contract / edge / failure
cases[].title用例标题
cases[].query测试输入
inputs.files测试依赖文件,无则为空数组
inputs.context额外上下文,无则为空对象
expected.skill.should_use期望使用的 Skill
expected.skill.should_not_use不应使用的 Skill 列表
expected.must_include输出中必须包含的步骤、字段或语义
expected.must_not_include输出中不能出现的行为或内容
expected.artifacts期望产物
expected.routing成功、失败或阻塞时的路由
assertions可被脚本或 LLM Judge 执行的断言
tags用于筛选测试集