我现在在做一套中后台页面的测试代码生成 agent 。这个场景是前端的代码与测试代码都是二次封装的内部库(已经建了内部库的 skills )
也就是说,这不是一个“面对任意前端页面自由发挥”的问题,而是一个:
前端代码有固定规律、测试代码也有固定框架的场景里,怎么借助 AI 做测试生成。
{
component: 'CustomInput',
fieldName: 'fieldCode',
label: '字段 A',
rules: z
.string({ message: t('请输入字段 A') })
.min(1, t('请输入字段 A'))
.max(20, t('最多输入 20 个字符'))
.regex(/^[A-Za-z0-9\\-. *+\\/%$]+$/, t('格式不符合要求')),
rulesBlur: z.string().superRefine(async (value, ctx) => {
const checkResult = await verifyFieldUniqueness('fieldCode', value)
if (!checkResult?.passed && checkResult?.msg) {
return ctx.addIssue({
code: 'custom',
message: t(checkResult?.msg),
})
}
}),
}
这类页面里,很多逻辑不是散落在各处,而是通过字段配置表达:
test('列表查询', async ({
page,
tableLocator,
searchLocator,
formActions,
selectActions,
datePickerActions,
}) => {
const search = searchLocator.createSearchArea(TABLE_ID)
const table = tableLocator.createTable(TABLE_ID)
await formActions.fillInput(search.getInput('keyword'), '示例关键字')
await datePickerActions.setDate(search.getField('period', 'custom-period'), '202601')
await selectActions.selectFromTableByIndex(search.getSelect('category'), 1)
await search.getQueryButton().click()
const row = await table.getRowData(0, ['displayName'])
expect(row.displayName).not.toBeUndefined()
})
也就是说,测试代码本身用的是内部封装的测试库,不是直接裸写 Playwright 。
我最想解决的,不是“怎么生成一份测试代码”,而是:
测试数据不希望写死,而是尽量基于页面当前运行时的表格数据,再借助 AI 去推断。
也就是:
而是尽量来自:
因为在很多中后台页面里:
我更希望是:
而不是让生成器或 LLM 一开始就直接猜测试值。
比如:
这种场景下,是给 AI 更多源码片段更好,还是给:
这种“证据包”更合理?
我现在倾向于:
但不确定这种拆法是不是更稳。
如果有做过类似:
很想听听大家的经验,尤其是这种:
前端代码和测试代码都有固定规律,而且测试数据尽量不写死,而是依赖页面当前运行时表格数据 + AI 推断
的场景下,怎么划分:
1
Jgege 11 小时 58 分钟前
看到你提到的『證據包』方案,你的拆法(規則代碼負責事實,AI 負責語義推斷),我認為方向是對的,但在落地時我建議引入一個 Intermediate Representation (IR) 層:
Schema 驅動而非代碼驅動:既然你們是二次封裝的組件庫,那麼建議不要直接給 AI 原始碼,而是將前端配置轉成靜態的 JSON Schema 。AI 處理結構化數據的穩定性遠高於處理混亂的源碼。 數據劫持( Data Injection ):針對你擔心的數據寫死問題,我建議在 Playwright 層面封裝一個 context.inject(tableData) 的 Hook 。AI 生成的測試代碼只需調用這個 Hook 並指定字段名,具體的真實值由測試 Runtime 在執行時動態注入。 AI 的邊界在於『動作序列』而非『值』:讓 AI 負責決定『點擊哪裡』、『驗證哪個字段』。至於校驗邏輯(如 A > B ),應該在組件庫的 Metadata 裡定義好規則名,AI 只需要識別出該觸發哪個規則。 你目前卡的複雜校驗問題,本質是 Constraint Solving 。如果想更穩,我認為可以考慮用 LangChain 的 Structured Output 強制 AI 輸出固定格式的測試指令,而不是完整的測試腳本。 |
2
licoded 8 小时 2 分钟前
做起来才能发现具体问题吧 在实践中去学习探索
看起来你这个场景属于人工经验已经积累得非常充分了,且没有太多需要 ai 的地方 或者说 工作流程设计划分已经比较清楚,需要 ai 去完成地方也比较清楚 所以,干就完了! |