The Audit Trail

176% 的差距：Ecoinvent 与本地数据在中国光伏和风电上的分歧

在 GWP100 口径下，Ecoinvent 与 HiQLCD 在中国光伏上相差 176%、在风电上相差 244%。差距哪里是代表性问题、哪里是系统边界之争，以及当跨库差异这么宽时你的工具该怎么处理。

从 Ecoinvent v3.12.0（cut-off 系统模型，对其清单施加 IPCC GWP100 特征化）里取一度中国光伏电的 GWP100 因子，你得到 0.080 kg CO2-eq。从中国 LCI 数据库 HiQLCD v1.4.0 里取同样一度电，你得到 0.029。两个数字相差 176%。这个差距现在就躺在你的出口碳标签里、你的产品碳足迹里、你的碳市场报价里。这不是四舍五入的问题。它决定了你的产品在口岸那头读起来是干净的，还是脏的。

同一度电。同样的时间尺度。同样的特征化。你最终报出去的数字，完全取决于背景数据来自哪个库。下面讲清楚两个库为什么分歧，哪里的分歧是代表性问题、哪里是系统边界之争，以及当你的工具看到这么宽的差距时，它该做什么。

差距，按数据源拆开

五个中国电力来源，GWP100，kg CO2-eq 每度，HiQLCD v1.4.0 对 Ecoinvent v3.12.0 cut-off：

光伏（Solar PV） —— 0.029 对 0.080。两者相差 176%。
陆上风电（Wind, onshore） —— 0.009 对 0.031。两者相差 244%。
燃煤火电（Coal thermal） —— 1.033 对 1.210。相差 17% 以内。
径流式水电（Run-of-river hydro） —— 0.012 对 0.005。HiQLCD 反而更高。
压水堆核电（Nuclear PWR） —— 0.006 对 0.008。接近。

先看规律，再看成因。两个库在核电上几乎一致。火电上落在一座电厂的噪声范围之内。水电上方向反过来。而恰恰在你的低碳叙事最依赖的那两个来源——光伏和风电——上，两者差出近 3 倍乃至 3.4 倍。（HiQLCD 的光伏和风电数字，假定的是公用事业级容量因子、基础设施全额摊销到发电量；这两个偏低的锚点是由这些边界选择得来的，核查方有权要求你把它们说清楚。）

差距从哪来

在几道关键的制造子工序上——硅片与电池的生产用能、风机的某些部件——具体的 Ecoinvent 记录仍然依赖欧洲或全球平均清单，而不是中国本土建成的数据，于是建模出来的能耗强度反映不出中国实际的电池产线效率。这并不是说中国的数据不存在；它说的是手头这几条具体记录的地理和技术代表性。中国制造了全球大部分光伏电池和很大一部分风机，其效率是移植来的清单看不见的。恰恰在中国工业规模最举足轻重的这两项技术上，两个库在制造负荷上分道扬镳。

底下的电力结构又把差异叠了上去。Ecoinvent 通过区域电力市场组来表示中国电力，以燃煤和褐煤发电为主导，其中若干发电技术在缺少中国本土清单时按全球或世界其余地区平均值建模。HiQLCD 则用一套中国本土建成的能源清单来还原同一幅图景，覆盖全部 31 个省、达到省级精度。当给工厂供电的电网依赖一个偏煤的代理值，制造足迹就继承了那个代理值的碳，背景电网上的差异叠在制造清单里已有的差异之上。

两个可信的库，看着同一度中国电，递给你两个不同的数字。差距本身就是结论，不是脚注。

但不是每一处差距都源于制造代表性。在径流式水电上，HiQLCD 反而读数更高——0.012 对 0.005——因为 HiQLCD 把土建工程（引水堰、进水口、压力管道、厂房——混凝土和钢材）按一个偏低的容量因子摊销到发电量上，而 Ecoinvent 的边界划线不同。这是一处基础设施摊销的边界分歧，不是精度缺陷：它问的是，什么算作”发出这度电”的一部分。核电（0.006 对 0.008）和燃煤（1.033 对 1.210）则贴得很近；残余的差异，一处与铀燃料循环里已知的边界差异相符，另一处落在电厂与电厂之间的常规波动范围内。看清你面对的是哪一种差距，就是这件事的全部。一种你去修正。另一种你去记录。

取平均的陷阱

面对 0.029 对 0.080 这样的差距，大多数自动因子匹配会做那件省事的事：要么挑一个，要么把差距对半分。无论哪种动作，都把你这行光伏数据里最要紧的事实——两个可信的库对它分歧达 176%——埋在了一个工整的单一数字底下，而你的审核员无法把它还原回去。取一个朴素的算术平均得到 0.054，一个没有任何库持有、谁也没有选过的数字。悄悄挑一个，那你就做了一个方法学决定，而你的推理链从未记录它。

这正是 Audit Trail 这一栏要点名的失效模式。差距本身就是信号。把它藏起来，才是错误。

Cortex 的做法

Cortex 在 14 个 LCA 数据库里检索——HiQLCD、Ecoinvent、EF、CarbonMinds 等等——返回的是并排的 top-k 候选，不是 top-1。对你这行中国光伏，这意味着 HiQLCD 的 0.029 和 Ecoinvent 的 0.080 会并排出现在屏幕上，各自携带自己的 GWP100 值、地区、系统模型、来源记录，以及一个 Pedigree-Matrix 谱系、跨五个维度打分的 DQI：时间性、地理性、技术性、完整性、可靠性。在技术性和地理性这两条轴上，本土建成的数据集和移植来的那个会肉眼可见地分开。你看得出，在工序和地区与你的研究吻合的地方，是哪个候选在代表性上得分更高——而代表性不等于准确性，所以选择权仍然在你手里。

而当同一种材料的跨库 GWP 差距超过 2×——就像这里的光伏和风电——Cortex 不取平均，也不替你挑。它暂停，把决定交还给你。在本土建成因子和移植因子之间做选择，是一个方法学判断：它取决于你的目标与范围、你的系统边界、你的核查方是否接受 HiQLCD 作为区域数据源。Cortex 会在自动化将破坏审计的地方暂停——差距超过 2×、代理值并非精确吻合、覆盖太薄站不住、受限数据无法悄悄替代——由从业者来定。这个决定，以及为什么这么定，都记进推理链。

Cortex 不替你挑系统模型，也不替你提交任何东西。它返回带着来源出处的候选，把各个系统模型分开摆放——cut-off 永远不会悄悄和 APOS 混在一起——并产出一条你可以交给核查方的推理链。你来定夺；Cortex 记下你定了，以及定夺的依据。

一度电，站得住

光伏上 176% 的分歧不是数据库里的趣闻。它是你的核查方签字放行的产品碳足迹，和被退回来的那一份之间的区别。“该用哪个因子”的诚实答案，很少是一个数字——它是那个差距、打了分、加上一条记录在案的、关于哪个数据源吻合你范围的决定。Cortex 把两个数字都摆到你面前，在地理性和技术性的代表性上给它们打分，并在一个工整的均值本会悄悄破坏审计的地方停下来。

向 Cortex 问一个中国电力因子，把这两个数字一路倒推回它们分岔的那一点：cortex.hiq.earth/chat。

— HiQ Cortex Team