Truthfulness
truthfulness prompts(overview)
truthfulness 的重点不是“让 LLM 永远不犯错”,而是:在证据不足时明确说不知道、把不确定性暴露出来、并能在给定事实中做验证。
学习路径(建议顺序)
- 入门:固定输出格式(结论 + 证据 + 不确定性)
- 进阶:在给定 facts/context 下做核验
- 实战:面向业务的可追溯答复
什么是 Truthfulness Prompt?
Truthfulness Prompt 通过明确证据来源与输出约束,要求模型在可验证事实范围内回答,并在信息不足时输出不确定或拒答。
┌─────────────────────────────────────────────────────────────┐
│ Truthfulness Prompt 流程 │
├─────────────────────────────────────────────────────────────┤
│ │
│ 问题/主张 → 可用事实 → 结论判断 → 证据/不确定性 │
│ (问题陈述) (facts) (成立/不成立) (引用/说明) │
│ │
└─────────────────────────────────────────────────────────────┘
为什么 Truthfulness 很重要?
| 应用场景 | 具体用途 | 业务价值 |
|---|---|---|
| 内容生产 | 事实核验、引用来源 | 降低误导风险 |
| 客服/运营 | 规范答复、避免猜测 | 提升信任 |
| 合规/法律 | 证据可追溯 | 降低合规风险 |
| 研究/写作 | 事实一致性检查 | 提升可信度 |
业务产出(PM 视角)
使用 Truthfulness Prompt 可以交付:
- 可追溯回答:结论 + 证据引用
- 安全兜底:信息不足时明确拒答
- 可审核输出:便于人工复核与合规检查
完成标准(建议):
- 读完本页 + 完成 1 个练习 + 自检 1 次
核心 Prompt 结构
目标:基于事实给出结论
证据:只允许引用给定 facts
格式:结论 + 证据 + 不确定性
输入:问题或主张
通用模板
你是事实核查员,只能基于给定事实回答。
问题/主张:
{claim}
已知事实:
{facts}
要求:
1) 若事实不足,输出 "无法判断"
2) 结论必须引用对应事实编号
3) 输出格式固定
输出格式:
- 结论:
- 证据:
- 不确定性:
Quick Start:简单核验
问题:A 公司 2023 年营收是否增长?
已知事实:
1) A 公司 2022 年营收 10 亿元
2) A 公司 2023 年营收 12 亿元
输出格式:
- 结论:
- 证据:
- 不确定性:
示例 1:纠正幻想(Hallucination)
主张:太阳距离地球 300 万公里。
已知事实:
1) 地球到太阳平均距离约 1.5 亿公里
输出格式:
- 结论:
- 证据:
- 不确定性:
示例 2:信息不足时拒答
问题:B 公司是否计划裁员?
已知事实:
1) B 公司在上季度发布了新产品
2) 没有公开财报或公告
输出格式:
- 结论:
- 证据:
- 不确定性:
示例 3:对比多条事实
主张:课程转化率提高是因为价格下降。
已知事实:
1) 本月价格比上月降低 10%
2) 转化率提升 8%
3) 本月上线了新 landing page
输出格式:
- 结论:
- 证据:
- 不确定性:
迁移模板(替换变量即可复用)
主张/问题:{claim}
已知事实:{facts}
输出:结论 + 证据编号 + 不确定性说明
自检清单(提交前自查)
- 结论是否只基于给定事实?
- 是否明确指出证据来源编号?
- 是否在信息不足时拒答?
- 输出格式是否固定、可解析?
进阶技巧
- 证据编号:要求引用 facts 编号,避免泛化。
- 置信度:输出
high/medium/low。 - 冲突处理:当事实冲突时输出“无法判断”。
- 双向校验:让模型同时输出支持与反驳证据。
- 分步验证:先判断事实是否覆盖主张,再下结论。
常见问题与解决方案
| 问题 | 原因 | 解决方案 |
|---|---|---|
| 结论过度肯定 | 缺少拒答规则 | 加“无法判断” |
| 引入外部知识 | 未限制证据 | 明确“只用 facts” |
| 证据不清楚 | 未要求编号 | 强制引用编号 |
| 解释过长 | 未限制格式 | 固定字段与长度 |
最新研究速览(外部摘要)
- TruthfulQA:提出衡量“是否避免模仿人类错误认知”的基准,强调模型在常识误区问题上的真实性表现。
- SelfCheckGPT:在黑盒场景下通过自一致性/多样化采样检测幻觉,提高输出可信度评估能力。
动手练习
练习 1:拒答场景
问题:C 公司 2024 年是否盈利?
已知事实:
1) C 公司 2023 年亏损 2 亿元
2) 2024 年财报尚未公布
练习 2:证据编号
主张:D 产品销量下降是因为库存不足。
已知事实:
1) D 产品库存本月减少 30%
2) 销量下降 15%
3) 竞品推出了促销活动
练习评分标准(学生自评)
| 维度 | 合格标准 |
|---|---|
| 结论准确 | 与事实一致 |
| 证据清晰 | 引用编号 |
| 拒答合理 | 信息不足时拒答 |
| 格式稳定 | 输出字段一致 |
Index
参考资料
小结
- Truthfulness 的核心是可验证与拒答机制。
- 证据编号能显著提升可审计性。
- 明确“只用给定事实”可抑制幻觉。
- 不确定性应当被明确输出。
- 通过模板和自检建立稳定输出。