Practitioner's Journal
那行物料只写了「树脂」
这是一套方法,不是奇迹:一行 BOM 只标了高分子/树脂,没有牌号。Cortex 怎样把一个单词的行变成一个可核查的假设、抓住自己检索返回的坏结果、把代理值的决策交回给你。
卡住我的,是从上往下数的第三行。一台工业物联网控制器,物料清单大概四十个零件,绝大多数是闭着眼都能匹配的东西:一个 304 不锈钢支架,一块 FR-4 板,几个标准连接器。然后是第三行。「材料」一栏,就一个词:「高分子」。后来一版修订里,供应商大方地把它升级成了「树脂」。两个非标命名,没有牌号,没有 CAS 号,没有数据表。一个质量数字,再没有别的能让它落脚。
我做这行够久,知道接下来会发生什么。你给供应商发邮件,供应商转给某个人,那个人再转给采购,三周后你收到一份 PDF,上面写的,归根到底还是「高分子」。而 PCF 的交付日期就在眼前。于是你要做一个选择——这个选择每个从业者都做过,大多数人却宁可不写进文档:挑一个代理值,往下走。
猜,不等于替代
第三行真正的麻烦,不在于我手上没有数字。我完全可以敲进去「通用塑料,大约 3 kg CO2e/kg」,没人会对这版草稿多看一眼。麻烦在于这个数字之后会做什么。代理值替代,是审核员第一个圈出来的地方。问题不在它错,在它没有依据——一个数值,背后没有一条通回决策的线。如果我说不出「为什么选这种树脂、不选那种」,这一行就是披着数据外衣的负债。
所以这次我没猜。我把第三行交给 Cortex,看它在几乎一无所有里跑的是怎样一套方法。
它在读那行没给它的东西
Cortex 做的第一件事不是检索,是发问。光凭「树脂」两个字太薄,无从下手,于是它把澄清问题摆到屏幕上——生产路线、这个零件的功能、成型工艺——一个细心的同行在动手猜之前,问的也正是这些。
然后它去读那行没给它的东西。不是孤零零的「树脂」两个字,而是周边的清单——工艺上下文、这个零件的功能、同一组装件里的其它物料——它把这些通读后做了收敛。从中,它提出了一个候选身份,同样要紧的是,它点明了自己是从哪里推出来的。打个比方,比如一种玻纤增强的工程热塑性塑料——电子件的结构外壳常常就是用这类加填料的树脂注塑成型的。(这只是用来说明这次推断的形状,不是给任何一行真实物料认定的身份。)要点在于:这次判读具体到可以拿去核,而且它把这标成了一次「判读」。
置信度是个假设,不是答案
这一点我想说准确,因为绝大多数工具恰恰在这里夸大其词。Cortex 没有把这当成答案宣布出来。它把自己的判读当成一个待核的假设,而不是一份待归档的判决——然后去找文献和数据库记录,来证实它或推翻它。澄清一直摆在屏幕上:这是我认为它可能是的材料,这是我据以推断的依据,这是我接下来要拿去比对的东西。一个置信度读数,是去核查的理由,不是停下来的理由。
当检索返回的结果是坏的
接着是有意思的那次失败。第一遍数据库检索返回了一批损坏的记录链接——指向虚空的条目,相当于检索版的死引用。我见过那些不如它的工具,在这个节骨眼上会做什么:照样把坏结果递给你,排好序、带着自信,一个齐整的数字端坐在一堆垃圾之上。
Cortex 抓住了它。它检测到这些记录是坏的,然后重新发起检索——一次会自我纠正的检索。它没有把一发打出去的结果硬撑到底,无论返回的是什么。这才是要紧的那种安静的本事:要紧的不在第一遍就完美,在引擎注意到了它不完美,说了出来,然后又去查了一遍。一次会自我声明的干净失败,永远胜过一次脏的成功。
第一个答案是错的。我信任的是,引擎知道它错了。
Top-k,然后它停下了
重新检索返回了我真正需要的东西:给那一行的几个代理候选,不是单一一个数字。每一个都取自 Cortex 检索的 14 个数据库——HiQLCD、Ecoinvent、EF、CarbonMinds,以及其它——每一个都在五个 DQI 维度上打了分:时间性、地理性、技术性、完整性、可靠性(这是 Pedigree Matrix 一脉的传承,不是 Cortex 的发明)。每个候选都带着自己的溯源:数值、地区、系统模型、来源记录。是 top-k,不是 top-1。我能看到这组候选的分散程度,也就是说,我能看到风险在哪。
然后 Cortex 做了那件我在这种行上找它的全部理由。它没有悄悄把最接近的代理值塞进单元格,就当这一行做完了。那个身份本身仍然是个假设,而代理值——那个最接近、但并不严丝合缝的匹配——恰恰是自动化会把审计走坏的地方。所以这两个决策都回到了我手里,附带一条对下一步的专家建议:选哪个候选,依据是什么,地理和技术上的偏差点了名。从业者来定;这次选择,记进推理链。
这就是一个数字和一行经得起追问的数据之间的差别。我选的那个代理值,仍然是个代理值。但现在有了一条线,从「树脂」到那个推断出的材料类别,到我挑的那个候选,再到我挑它的理由——等审核员圈住第三行,我有一条路可以带他们一步步走回去,而不是一个耸肩。
我反复回到的那点
我没有省下三周,因为供应商还欠我一份真正的数据表,而一个被确认的材料,永远胜过一个被推断的材料。变了的是,我不必再在「一个没有依据的猜测」和「一份卡住的交付」之间二选一。Cortex 先发了问,读了一行几乎没怎么给它的物料,把自己的判读当成假设,在检索返回坏结果时核查了自己,然后——在那个唯一会让我日后付代价的猜测点上——停下来,把决策交回给我。
如果你手上有一份 BOM,上面也有那么一行,那种你一直默默发怵的行,拿去问 Cortex。把你手上最糟的那一行带来。
— HiQ Cortex Team