【实测-AI产品(06)】整理了一个关于智能体的测试点在线脑图,欢迎参与哦~

上个文章发布了关于智能体类的测试点和测试计划后,遭到了一些粉丝朋友的嘲讽,说我也不是人家智能体开发公司的测试人员,也没有工资,犯得着这么贱的去整理人家的测试点么?要么就是我收了广告费了...而且我整理的也没啥用,毕竟开发智能体的公司全世界就那么一手之数,大多数粉丝看完学了也用不上。

    对此,我需要得回应下哈:

    1. 身为测试圈的自媒体博主,对新兴事物进行测试研究很是正常,不说做什么贡献,就本身写这些对我来说就挺有意思的,感兴趣吧算是。总不能让我一个测开博主天天写做买卖副业,写故事会,写卖课的广告吧?

    2. 本人在多个大厂的技术社区都具备一定的流量和title,什么csdn博客专家,阿里云开发者专家,腾讯云社区年度优秀作者,腾讯云内容共创官,掘金领航者..... 作为拿满了一柜子证书奖牌奖杯的民间散修,随便写点和行业相关的不正常么?必须还要领工资么?相比之下,我更在乎粉丝口碑哦~

    3. 谁说这些测试点只能智能体开发公司的测试人员用的上?这个智能体未来必须会普及到每一个软件中,你可以试想一下,你公司的软件产品有一天突然要增加一个AI智能体作为用户的助手。领导要你务必进行全面测试,以防大模型出现问题导致损失。你怎么测?你有模型的测试经验么?知道这小小的智能体有几万条测试用例么?还是说你和人家开发者公司的测试人员是朋友,让其可以把内部机密的测试点表偷偷传给你?到时候还不是要到群里到网上各种问么?你就不怕线上突然有一天看到自己公司智能体回答出了一些错误问题导致用户损失或者违反法律法规公序良俗的话。然后被新闻曝光,然后股票大跌,然后杀测试祭天?

    4. 说我没啥写了,我写这个博流量?你看看这种文章的阅读数,都不到粉丝数的1%,别的博主都不写这个系列。

图片

    

爱看的进群扫码:群内共享创建测试点集合,此测试点不断补充,欢迎一起共创。不用怕被捣乱删除,我冲了年费会员,可以随时回滚到任何历史记录版本哦~

图片


好了,吐槽结束,开始正文。

    之前我说测试智能体,需要站在两个角度。

    1. 用户角度进行测试,考虑的是使用角度。

    2. 开发角度进行测试,考虑的是内部节点,数据来源,筛选整理,模型训练和使用等专业问题,考虑的是开发角度。

    因为我们普通人并非大模型的开发者,也接触不到内部的项目代码,所以第二点,我们虽然知道原理,但无法进行分层测试,或者说标准流程中的集成测试、灰盒测试、单元测试、白盒测试等等。这些就要靠开发团队的测试同学了。

    而第一点,从用户角度测试,相当于公测,这个大家都是可以群策群力,整理出来的测试点可以给需要测试的同学一点帮助。当然,并非是大厂的核心测试组。毕竟智能体这个东西,慢慢可是要普及到各个软件中的,哪怕你的公司很小,但是有天领导弄了一个AI智能体进去了,安排你进行测试,你便可以据此测试点脑图,开拓思维,按部就班的走测试流程,省掉你好多脑细胞和头发呢。

    目前大致先划分为图中结构。欢迎补充

        后续我会不断的去把我见识到的测试方法对号入座到这个脑图中。

比如之前用跳跃式对话,引诱智能体回答出炸yao的制作方法的那个外国佬。就可以归纳到误导性对话这个栏目里。

   这个系列文章先出到这,后续会不定时更新整理的进度

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我去热饭

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值