The Audit Trail
把 BOM 匹配到排放因子,而不靠平均
一份 100 行的 BOM 就是 100 条审核员能追问的主张。这里讲怎么把它匹配到范围三第 1 类的排放因子——不平均、不编造、不丢痕迹。
一份 100 行的 BOM 不是一个数字。它是 100 条独立的主张,每一条审核员都可以要你拿出依据。把它们平均成一个产品碳足迹,这 100 条主张就全被埋进了一个谁也回溯不动的数字底下。审核员问的从来都是“这一行从哪来”,不是“这个数是多少”。
今天大多数 BOM 行级别的范围三第 1 类——采购的产品和服务(Category 1)——匹配,毛病就在这里。某一行写着“铝板”。工具返回一个因子。因子进模型。模型返回足迹。这条链路里的某处,数据库之间的差异被压平了,一个代理值替你选好了,而支撑这两个动作的推理被丢掉了。你提交。审核员发问。你答不上来——因为答案在上游三步就被扔了。
把 BOM 匹配到排放因子,有一种做法既不平均、也不编造。它从拒绝返回单个数字开始。
Top-k,不是 top-1
Cortex 在 14 个 LCA 数据库间匹配你的 BOM——HiQLCD、Ecoinvent、EF、CarbonMinds,以及其他——每一行返回排名靠前的若干候选,不是只返一个。每个候选都带着你做取舍所需的信息:一个 GWP100 值、它的单位、地理区域、系统模型(截断、APOS 或后果性)、源 URL,以及一个跨五个维度的 DQI 评分——时间性、地理性、技术性、完整性、可靠性——这是对 LCA 从业者早已熟悉的 Pedigree 矩阵谱系做的归一化解读。
整个论点就在这里。返回单个因子会藏起决策;返回一列排好序的候选会把决策摊开。当“铝板,中国”返回一条 Ecoinvent 截断记录、对应某个 GWP100 值,又返回一条值高出两倍多的 EF 记录,这个差距是信息,不是该被平均掉的噪声。它告诉你两个数据库对这种材料的看法不一致,也告诉你:决定哪一个能支撑你研究的,是你,不是模型。
平均恰恰会毁掉这一点。它拿两个建立在不同系统边界上的数据集之间的真实分歧,造出第三个数——这个数描述不了任何一个数据集。审核员无从追溯,因为根本没有东西可追。
匹配如何收窄
匹配是分级的,而且级别可见。Cortex 先找同一物项,再找相近族类,再找等效用途,最后才到通用条目。一行 304 不锈钢,匹配到一个 304 不锈钢数据集,是同物项匹配。一个 316 牌号落在一条 304 记录上,是相近族类的代理值——DQI 差值和区域偏离会被标出来,不会藏起来。
这很重要,因为级别是对匹配置信度的诚实描述。通用条目匹配和同物项匹配是两条不同的主张,把它们当成同一个因子的文案,是在用省略撒谎。级别跟着候选走。DQI 评分也是。源 URL 也是。当你导出时,完整溯源一起带走:三周后打开文件的从业者,或三个月后打开它的核查者,都能看清哪一行是精确匹配、哪一行是代理值,以及为什么。
把速度说具体些:一份 100 行的 BOM,用并行的跨库检索、每行带 DQI 评分的候选来匹配,通常约 10 分钟解析完。速度不是重点。重点是这 10 分钟里没有一步是沉默的。
平均两个数据集,你哪个都没描述。一个凭空冒出来的数字,审核员追溯不了。
Cortex 在哪里停下
BOM 里大部分行都能干净地解析掉。解析不掉的那些,正是你的审核员会圈出来的行——也正是 Cortex 拒绝自作主张放过去的行。
Cortex 在自动化会破坏审计的地方暂停。当覆盖率低于 80%——太多行没有可信匹配——它停下,把决定交回给你。当最接近的数据集并非精确吻合、需要做代理替换时,它停下。当同一种材料返回的跨库差异超过 2× 时,它把差异摆出来征询,而不是替你选边。当一个受限数据集因为你没有访问权限而没有 GWP 时,它把这一行标记出来,而不是悄悄填进一个文献值。
这些不编号,也不是穷举的清单。它们都是模型自己往下走就会制造出一条你日后不得不撤回的主张的地方。在每一处,由从业者决定,决定写进推理链。导出会带上这个选择和它的理由,于是你交给核查者的文件,在问题被问出来之前就已经回答了“为什么用这个代理值”。
驱动一套审计级工作流的工具,和只产出一个数字的工具,分界线就在这里。Cortex 不替代你对代理值的判断。它让这份判断得以规模化:它找出候选、给它们评分、标出偏离,再把决定权交到你手上。
你提交什么
Cortex 产出一条推理链。你提交。没有 CBAM 申报或 EPD 的自动提交,也没有任何认证主张——产出是为了对齐 ISO 14067 和 GHG Protocol 产品生命周期核算与报告标准(Product Life Cycle Accounting and Reporting Standard)的要求而建,但核查是核查者的动作,提交是你的事。
第 1 类——采购的产品和服务——正是这套做法最直接适用的地方:BOM 行级别的因子匹配,正是整条分级、top-k、DQI 评分流水线存在的目的。范围三的其他类别用的是不同的方法和数据,这里并不主张去覆盖它们。而当计算必须在你的建模工具里跑时,Cortex 连接并操作引擎——openLCA、brightway、积木LCA——在你已经在用的工具里构建产品系统、运行计算。它不替代引擎,它驱动引擎。
结果是一份匹配到排放因子的 BOM,没有平均,也没有任何一个编造出来的单一数字。你看得到差异。你看得到级别。你看得到 DQI。在自动化会破坏审计的地方,Cortex 停下,把决定交回给你。你提交的每一行,你都能给出依据——逐行回溯到一个源 URL。
痕迹就是产品
足迹是一个数字。审计是通往它的那条路。匹配你的 BOM 而不平均,这条路就保持完整:每一行可追溯到一个数据集,每一个代理值有名有姓,每一处分歧被保留下来,而不是被溶掉。
在 cortex.hiq.earth/chat 上传一份 BOM,或写信给我们:lizj@hiqlcd.com。
— HiQ Cortex Team