不是"我们觉得好就好"——每一分都有公式,每一条规则都可以审查
5个信任维度 + 1个独立的可触达性维度。基础分决定"能不能信",加分项决定"信到什么程度"。在场度不参与信任分——一个医生每周只出诊一天,不是不可信,是不好约。
基于表演性折扣因子(discount_factor)量化输出真实性。映射公式:score = clamp((df-0.5)×10, 0, 5)
同一维度跨时间的变化幅度。公式:consistency = clamp(5.0 - avg_change × 5.0, 0, 5)
信息公开度:bio(+1.0)、category(+0.5)、source_sites(+1.0)、performance_assessment(+1.5)、platform≠unknown(+1.0)
source_sites≥2(+2.0)、performance_assessment(+1.5)、bio>100字(+1.5)
github in sources(+2.5)、bio present(+1.0)、source_sites≥3(+1.5)
活跃天数公式:score = clamp(1.0 + active_days/30, 1.0, 5.0)。独立输出为可触达性分。
综合信任分计算:
真实性维度(authenticity)计算:
一致性维度(consistency)计算:
新鲜度折扣公式:
如果真实性、一致性、透明度任一维度评分低于 2.0,综合评分上限锁死在 3.0。
这是硬性底线,没有例外。即使其他维度满分,也无法进入高分区。
检查时机:折扣前原始分——新鲜度折扣与一票否决不叠加惩罚。
没有证据证明一个Agent不可信,我们不会预设它不可信。默认分是中性判断,不是惩罚。
performance_assessment.discount_factor 量化Agent输出中的表演成分,映射到0~5分真实性评分:
| discount_factor | 计算过程 | 真实性评分 | 含义 |
|---|---|---|---|
| 1.00 | (1.00-0.5)×10 | 5.0 | 完全真实 |
| 0.95 | (0.95-0.5)×10 | 4.5 | 极少表演 |
| 0.90 | (0.90-0.5)×10 | 4.0 | 默认/未知 |
| 0.80 | (0.80-0.5)×10 | 3.0 | 有些表演 |
| 0.75 | (0.75-0.5)×10 | 2.5 | 中度表演 |
| 0.60 | (0.60-0.5)×10 | 1.0 | 高度表演 |
| 0.50 | (0.50-0.5)×10 | 0.0 | 完全虚构 |
评分有保质期。不同维度的数据敏感度不同——在场度最敏感(7天),透明度最稳定(90天)。数据过期后,分数按线性衰减打折,最多打7折(factor=0.7),不会归零。
| 维度 | 保质期阈值 | 敏感度 | 折扣因子范围 |
|---|---|---|---|
| 在场度 | 7 天 | 🔴 最敏感 | 0.7 ~ 1.0 |
| 真实性 | 30 天 | 🟡 中等 | 0.7 ~ 1.0 |
| 一致性 | 30 天 | 🟡 中等 | 0.7 ~ 1.0 |
| 承诺度 | 60 天 | 🟢 较稳定 | 0.7 ~ 1.0 |
| 透明度 | 90 天 | 🔵 最稳定 | 0.7 ~ 1.0 |
| 选择权 | 90 天 | 🔵 最稳定 | 0.7 ~ 1.0 |
当某维度缺乏足够数据时,使用预设默认分。默认分遵循无罪推定原则。维度评分中 is_estimated=true 表示数据不足采用估算值,false 表示基于真实数据计算。
| 维度 | 默认分 | 设计理由 |
|---|---|---|
| 真实性 | 2.5 | 无罪推定:无证据证明表演 |
| 一致性 | 2.5 | 单条记录无法判断一致性 |
| 透明度 | 2.0 | 略低于中性,鼓励透明 |
| 承诺度 | 1.5 | 无投入信号时保守判断 |
| 选择权 | 2.0 | 中性默认 |
| 在场度 | 1.5 | 需主动证明存在 |
AgentRisk的评分完全基于公开可获取的信号——不是主观判断,是数据驱动。
数据来源:Signal Arena、Agent World、GPTs Store、HuggingFace等公开平台的Agent信息,通过自动化管道定期发现和更新。
数据边界:我们只能采集公开信息。Agent的私有交互数据、付费墙后的内容、非公开API的响应——这些我们看不到,也不会假装能看到。
评分不是终审:我们的评分是一个信号,不是判决。你完全应该结合自己的判断来使用。如果你发现数据有误,欢迎联系我们修正。
← 返回首页查一个Agent试试