Logo

site iconBanxian | 王半仙

基于Obsidian笔记的数学花园,电子知识大脑。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

Banxian | 王半仙 RSS 预览

AlphaChip:用于布局规划的快速芯片设计

2024-11-15 18:28:00

中文标题:用于布局规划的快速芯片设计

英文标题:A graph placement methodology for fast chip design

发布平台:Nature

Nature

发布日期:2021-06-10

引用量(非实时):603

DOI:10.1038/s41586-021-03544-w

作者:Azalia Mirhoseini, Anna Goldie, Mustafa Yazgan, Joe Wenjie Jiang, Ebrahim Songhori, Shen Wang, Young-Joon Lee, Eric Johnson, Omkar Pathak, Azade Nova, Jiwoo Pak, Andy Tong, Kavya Srinivasa, William Hang, Emre Tuncer, Quoc V. Le, James Laudon, Richard Ho, Roger Carpenter, Jeff Dean

关键字: #强化学习 #芯片设计

文章类型:journalArticle

品读时间:2024-11-14 18:21

1 文章萃取

1.1 核心观点

本文提出了一种基于强化学习的快速芯片设计方案;其中价值网络使用已标注进行有监督学习,策略网络则先借助价值网络的主干部分对输入关键信息进行嵌入表示,然后使用 PPO 算法根据完成芯片设计方案的奖励反馈进行参数更新。奖励函数的设计则依赖于传统的芯片性能评价指标。

在实验分析阶段,AlphaChip 体现出了超越传统算法和人类专家的芯片设计能力,并且对训练时未见过的芯片设计也具有较好的适用性。AlphaChip 在后续的现实实践中也逐步证明了自己的独特价值。

1.2 综合评价

  • 整体的实现偏传统 RL,但对于芯片领域具备开创性
  • 网络架构以 CNN 为核心,存在预测性能改善的空间
  • 不适用于类型较多的标准单元,需要与传统算法配合

1.3 主观评分:⭐⭐⭐⭐⭐

2 精读笔记

2.1 背景知识

前置知识:芯片入门

芯片的层次化结构(由粗到细):

  1. 基本模块,芯片中的高层次功能单元,包括存储子系统、计算单元或控制逻辑系统等
  2. 电路组件,构成模块的基本单元,包括宏(Macro)和标准单元
  3. 宏(Macro),预先设计和验证的较大功能块(包含多个标准单元和其他电路组件),通常用于实现复杂的功能。例如,存储器组件(如SRAM、ROM)
  4. 标准单元,实现基本逻辑功能的最小电路单元,例如逻辑门(NAND、NOR、XOR)、触发器、寄存器等

芯片设计相关的前置概念:

  • 网表(Netlist)的含义:一个描述电路连接关系的列表,列出了所有模块的实例化信息(元件实例 Instances)和它们之间的连接(网络 Nets)。它是芯片设计的基础数据结构
  • 电路组件的超图:超图 Hypergraph 是一种图的扩展,用于表示电路中多个节点之间的连接关系。每个节点代表一个电路组件(如宏或标准单元),边表示它们之间的连接
  • DRC(Design Rule Check),确保布局和布线网表符合流片要求的规则

芯片平面布局规划:

  • 规划在芯片画布(二维网格)上进行,每个网格单元可以放置一个或多个电路组件
  • 性能指标:功耗、延迟、面积(芯片的物理尺寸)和线长(影响功耗和延迟)
  • 硬性约束:组件密度(避免过于集中或稀疏),拥挤度(避免布线困难或信号干扰)

AlphaChip 的芯片布局规划过程(左:预训练前;右:预训练后)

芯片平面布局规划方法总结:

  1. 分区方法(1960s~1980s):以分治法为核心,将网表和芯片布局递归划分为足够细颗粒的问题;该方法求解速度快,但会牺牲芯片设计方案的整体质量,可能导致路由堵塞问题
  2. 模拟退火法(1980s~2000s):启发式随机搜索,能生成高质量的芯片设计方案;但算法的收敛速度慢,难以并行化,无法满足 1990s 后日益复杂的电路问题
  3. 分层分区(1990s~2000s):先使用高效的二次规划方法进行初步的布局,再使用启发式的图划分算法进行局部优化,微调节点位置;兼具全局和局部优化的优势
  4. FD (Forced Directed) 算法(1990s~2000s):基于模拟物理系统动力学来考虑元件之间的拓扑关系和几何约束,寻找系统整体能量最低的稳定状态;该方法的精度高于分层分区,但计算量大
  5. 现代分析方法(2010s~2020s):(1)ePlace,基于电场理论的电路布局优化方法,结合了二次规划和模拟物理的优势(2)RePlAce,通过引入局部密度函数来进一步优化 ePlace(3)DREAMPlace,借助深度学习和 GPU 对 RePlAce 进行加速,但最终精度与 RePlAce 相当
  6. 基于学习的方法(2019):训练一个模型来预测给定宏布局的 DRC 违规数量
  7. 端到端学习(本文):通过梯度更新来优化目标函数,用神经网络近似非线性求解器

注意区别:DREAMPlace 的重点是面向标准单元层次的布局优化,而不是面向宏层次的布局优化;而本文提出AlphaChip 则重点是面向宏层次的布局优化

2.2 模型细节

整体设计与训练概述:

  • 首先定义芯片布局的初始画布(Chip canvas)为 $s_0$,之后基于强化学习的 Agent 考虑宏的放置位置(对应动作 $a_0$),重复以上过程,直到所有的宏均放置完成(对应动作 $a_{T-1}$)
  • 当所有的宏放置完成后,借助 Forced Directed 算法来实现标准单元的放置
  • 需要注意的是,在电路组件放置完成前,每一个动作对应的奖励 $r_0,...,r_{T-1}$ 均为 0
  • 电路组件放置完成后,计算本次迭代后的芯片布局奖励:$r_{T}=-\mathrm{Wirelength}-\lambda\times\mathrm{congestion}-\gamma\times\mathrm{density}$;该奖励是近似线长、拥挤度和组件密度的线性组合,用于指导 Agent 的迭代优化
2.2.1 问题定义

将芯片布局规划问题重新表述为顺序马尔可夫决策过程(MDP),其包含四个要素:

  1. 状态空间,对所有布局信息进行编码,包括网表图(邻接矩阵)、节点特征(宽度、高度、类型)、边特征(连接数)、当前需要布局的节点(宏)以及网表图对应的元数据(路由分配、线路总数、宏和标准单元簇)
  2. 动作,将宏可以放置在其上的所有可能位置(芯片画布中的网格单元)
  3. 状态转移概率,根据当前状态和动作,给出下一步状态的概率分布
  4. 奖励,所有中间动作的奖励为 0,只有布局完成的最后一个动作有奖励

核心问题:需要定义一个神经网络,给出累积奖励最大化下的最佳动作

目标函数: $$ J(\theta,G)=\frac{1}{K}\Sigma_{g\sim G}E_{g,p\sim \pi_{\theta}}[R_{g,p}] $$

  • 其中 $g$ 表示一个网表,$G$ 表示 $K$ 个网表的集合
  • $\pi$ 表示策略网络输出的策略分布,其中的可训练参数为 $\theta$
  • 给定网表 $g$ 和布局 $p$ 的情况下,策略的预期奖励为 $E_{g,p}[R_{g,p}]$

$$E_{g,p}[R_{g,p}]=\mathrm{Wirelength}(g,p)-\lambda \mathrm{Congestion}(g,p)-\gamma \mathrm{Density}(g,p)$$

在本文实验中,设置超参数 $\lambda=0.01$,$\gamma=0.01$;密度最大值为 0.6(硬约束)

2.2.2 策略和价值网络

策略和价值网络的整体架构:

  • 策略和价值网络的输入包括宏特征、网表图、当前宏、网表的元数据和密度掩码(Mask)
  • 价值网络(Value network)输出预测奖励,而策略网络(Policy network)输出预测动作
  • 价值网络使用包含 1w 条数据集进行训练,数据包含芯片设计布局及其相应的奖励标签
  • 训练后的价值网络作为策略网络的编码器层,对网表相关的数据进行嵌入表示(比如宏信息转化为节点嵌入、网表图转化为图嵌入等),提炼成可用于下游任务的低维向量表示
  • 上图中,Graph conv 表示图卷积神经网络,fc 表示全连接层,De-conv 表示反卷积层

Edge-GCN 图卷积神经网络:

  • Edge-GCN 主要用于策略和价值网络中节点嵌入和图嵌入的生成
  • 定义节点 $i$ 的节点嵌入为 $v_i$ ,节点 $j$ 的节点嵌入为 $v_j$,则两节点之间边的嵌入可表示为 $e_{ij}$。在 Edge-GCN 中,边嵌入 $e_{ij}$ 的迭代更新公式如下($w_{ij}^{\mathrm{e}}$ 为可学习的参数):

$$ e_{ij}=\mathrm{fc}_{e}(\mathrm{concat}(v_{i}|v_{j}|w_{ij}^{\mathrm{e}})) $$

  • 节点嵌入则根据邻接边嵌入的聚合信息进行更新:

$$v_{i}=\mathrm{mean}_{j\in\mathrm{Neighbours}(v_{i})}(e_{ij})$$

  • 在训练阶段,Edge-GCN 借助有监督数据(X 为宏特征和网表图,y 为奖励)进行梯度计算和参数更新,最终 Edge-GCN 将实现节点信息和边信息的有效嵌入表示
2.2.3 策略网络的训练

策略网络的核心要素:

  • 状态 $s_t$,时刻 $t$ 的状态嵌入包含图嵌入,节点嵌入,元数据嵌入
  • 动作空间,当前节点放置在网格中每个单元上的可行性(密度掩码)
  • 动作 $a_t$,策略网络在时刻 $t$ 对当前节点的放置位置推测
  • 奖励 $r$,直接来自价值网络的预测输出(所有中间动作的奖励为 0)
  • 网络参数 $\theta$,以最大化累积奖励为目标,用 PPO 算法更新策略网络

优化目标-最大化累积奖励函数:

  • 奖励是近似线长、拥挤度和组件密度的加权和
  • 软约束:较低的拥挤度会改善奖励函数
  • 硬约束:屏蔽组件密度大于特定阈值的情况

为了保证每次迭代的运行时间足够小,需要简化奖励函数的计算

奖励函数的简化:

  • 聚类算法加速标准单元的布置。用 hMETIS(一种基于最小切割目标的图分区技术)将数百万个标准单元划分为几千个簇,再用 FD 方法放置标准单元簇,实现近似而快速的标准单元布局
  • 将布置的网格进行离散化处理。所有宏或标准单元簇的放置中心位于网格单元的中心
  • 使用半周长线长(HPWL)对线长近似。HPWL 定义为网表中所有节点的边界框的半周长(其中 $x_b$ 和 $y_b$ 表示网络 $i$ 中的一个端点坐标,$q_i$ 是归一化因子): $$

\mathrm{HPWL}(i)=(\max_{b=i}{x_{b}}-\min_{b=i}{x_{b}}+1)

+(\max_{b=i}{y_{b}}-\min_{b=i}{y_{b}}+1) $$ $$ \mathrm{HPWL}(\mathrm{netlist})=\sum_{i=1}^{N_{\mathrm{netlist}}}q(i)\mathrm{HPWL}(i). $$

  • 简化拥挤度的计算。先用卷积核分别从水平方向和垂直方向抽样统计每个网络单元的空余布置资源,再使用排名前 10%的拥挤度均值,作为最终布局方案的拥挤度近似估计

用于策略网络的参数更新的 PPO 方法,其目标函数如下: $${\cal L}^{\mathrm{CLIP}}(\theta)=\hat{E}_{t}[\operatorname*{min}(r_{t}(\theta)\hat{A}_{t},\operatorname*{clip}(r_{t}(\theta), 1-\varepsilon, 1+\varepsilon)\hat{A}_{t})]$$

  • 其中 $\hat{E}_{t}$ 表示时刻 $t$ 时的期望值
  • $r_t$ 是时刻 $t$ 时新策略与旧策略的预测动作概率比:$r_t​(\theta)=\frac{\pi \theta_{new}​​(a_t/s_t​)}{\pi \theta_{old}​​(a_t/s_t​)}​$
  • $\hat{A}_{t}$ 是时刻 $t$ 时新策略的预测动作,相比于旧策略的奖励增加值,即估计优势

2.3 其他算法细节补充

基于物理模拟的 FD 算法(简单描述):

  • 将网表转化为一个弹簧系统,根据节点的权重和距离对每个节点施加力
  • 紧密连接的节点间会相互吸引,而重叠的节单间会相互排除(降低组件密度)
  • 弹簧系统构造完成后,根据节点的施力情况移动节点(沿着合力的方向)
  • 为了减少震荡,约束每次移动的最大距离

模拟退火 SA 算法(简单描述):

  • 在每次迭代中,执行 2N 次宏操作(N 表示宏的数量)
  • 宏操作类型包括三种,每种操作的执行概率为 1/3:(1)随机交换两个宏的位置(2)随机移动一个宏到邻近的空白位置(3)镜像,对选择的宏沿着 x 轴或 y 轴进行随机翻转
  • 当完成宏操作后,再使用 FD 算法来放置标准单位簇,同时固定宏的位置
  • 对于每一个宏操作或 FD 操作,当新状态能降低成本/增加奖励时则会被接受,否则以 $p=exp(\Delta_{cost}/t)$ 的概率被接受;其中 $t$ 为温度参数,随着迭代次数的增加逐渐降低(冷却)

2.4 实验分析

不同策略的性能对比:

  • 上图列举了不同算法在 5 种芯片模块上的性能指标对比
  • 性能指标包括延迟(总裕度 TNS 和最差负裕度 WNS,负裕度描述了信号延迟超过预期延迟程度)、面积、功耗、线长和拥挤度(水平 H 和垂直 V),所以性能指标都是越小越好
  • RePIAce 是当前的 SOTA 方法;Manual 指人类专家使用 EDA 工具完成设计

策略网络的预训练和微调:

  • 预训练过的策略网络微调效果明显优于从头开始训练的策略网络

不同数据集下的预训练和微调:

  • 随着数据集的增加,算法收敛速度和最终布局质量均有明显改善

Zero-shot 性能对比,Edge-GCN vs GCN:

  • Edge-GCN 具备更强的模型泛化能力,能适应更多未见过的芯片布局

放置策略可视化(zero-shot VS 微调):

  • Zero-shot 的情况下,策略网络也会在网格中心预留标准单元的放置空间;这种行为能减少线长,说明了预训练的策略网络具备较好的迁移能力;当然微调后的布局质量会更高

消融实验,寻找最佳的拥挤度权重:

  • 拥挤度的权重增加,明显改善了布局延迟、垂直和水平方向的拥挤度
  • 但与之相对应的,布局的线长也会明显增加;因此二者之间需要权衡
  • 用 0.1 作为拥挤度权重,能在保持较低延迟和拥挤度的同时避免线长过大

抗噪声实验:选择不同的随机种子对最终布局的性能影响可忽略(偏差约 0.22%)

后记

论文附录中还有一张自研的 GPU 芯片的真实图片,但是被打码了,啥也看不着...

2022 年 4 月,AlphaChip 解决了之前开源代码的可用性问题

2023 年 9 月,AlphaChip 一文因细节缺乏与可复现性有限受到质疑

2024 年 11 月,开源了预训练的模型文件(官方不推荐直接用)

2024 年 11 月,谷歌 Deepmind 团队的官方博客文章补充:

  • AlphaChip 已用于另外三代谷歌旗舰 AI 加速器张量处理单元 (TPU)
  • 随着每一代 TPU 的不断发展,AlphaChip 与人类专家之间的性能差距不断扩大。与人类专家相比,TPU v5e 线长减少了 3.2% ;TPU v5p 线长减少了 4.5%;Trillium 30 中线长减少了 6.2%
  • 芯片制造商联发科通过 AlphaChip 加速其最先进芯片的开发,改善功耗、性能和面积

Deepmind 团队的 Alpha 系列模型对比:

模型类型 年份 领域 状态空间 基础架构 更新策略 算法辅助 约束
AlphaGo Zero 2017-10 围棋 ~10^360 CNN 自我对弈 MCTS 围棋规则
AlphaChip 2021-06 芯片设计 >10^2500 Edge-GCN PPO FD 物理模拟 线长和密度
AlphaFold2 2021-08 蛋白质 历史库 Evoformer 端到端 OpenMM 刚性,结构
AlphaGeometry 2024-01 数学几何 定理合成 LLMs 微调 推理引擎 规则,辅线
  • 都具备丰富多模态化的数据输入,由此而设计的网络基础结构也各有不同;
  • 都可以用游戏化的思维,量化策略、奖励和状态;也都有游戏规则的约束
  • 站在巨人的肩膀上,大部分依托于已有的数据累积、推理引擎、算法模拟
  • 基础架构逐渐迭代升级,从最初的CNN、GCN,再到后来的 Transformer 和 LLMs

相关资源

芯片入门

2024-11-14 18:48:00

芯片是一套实现特定功能的电路,它具有模块化的特点

模块化的作用:

  • 降低开发难度,缩短开发周期
  • 方便厂商快速地进行产品设计和研发

芯片的设计流程:

  • EDA/IP:EDA 工具是用于设计和验证电子系统(如集成电路、印刷电路板等)的软件工具;IP(Intellectual Property)指的是预先设计和验证的功能模块或电路块
  • IC 设计,即集成电路设计。前端设计包括系统架构设计、RTL(Register Transfer Level)设计、功能验证等;后端设计包括布局布线(Place and Route)、时序分析、物理验证等
  • Foundry 指的是晶圆代工厂,主要根据芯片设计版图进行芯片制造
  • OSAT(Outsourced Semiconductor Assembly and Test)公司提供芯片的封装和测试服务

常见的芯片类型:

  • 按照等级,芯片又可以分为消费级、工业级、汽车级、军工级和航天级等
  • 按照设计理念,还可以分为通用芯片(CPU、GPU等)、专用芯片(AISC)
  • 按照工艺制程来分,例如大家经常听说的28nm、14nm、7nm、5nm、3nm
  • 按照半导体材料来分,例如硅(Si)、锗(Ge)、砷化镓(GaAs)、氮化镓(GaN)等

参考:

写给小白的芯片半导体科普
CPU设计实战 - CPU 芯片研发过程概述
芯片行业大起底,带你了解芯片行业的秘密!

通过深度学习优化血小板输注的个性化风险评估

2024-11-13 10:06:00

中文标题:通过个性化深度学习风险评估系统优化血小板输注以进行需求管理

英文标题:Optimizing platelet transfusion through a personalized deep learning risk assessment system for demand management

发布平台:Blood

Blood

发布日期:2023-12-28

引用量(非实时):

DOI:10.1182/blood.2023021172

作者:Merlin Engelke, Cynthia Sabrina Schmidt, Giulia Baldini, Vicky Parmar, René Hosch, Katarzyna Borys, Sven Koitka, Amin T. Turki, Johannes Haubold, Peter A. Horn, Felix Nensa

关键字: #血小板 #个性化医疗

文章类型:journalArticle

品读时间:2024-11-13 10:06

1 文章萃取

1.1 核心观点

基于 LSTM 实现了不同科室患者的血小板输注个性化实时预测

最终模型能够在高 AUC-PR 下进行未来 24h 是否输注血小板的风险评估

1.2 综合评价

考虑的特征足够丰富,并围绕不同科室的特性进行单独建模

论文细节丰富,对模型的实用价值和局限性进行了充分讨论

在部分科室的预测性能较差,可能存在持续改善的空间

1.3 主观评分:⭐⭐⭐⭐⭐

2 精读笔记

2.1 数据说明

背景知识:

  • 血小板浓缩液(PCs)保质期短,需求波动大,因此存在库存管理问题
  • 10 年来血小板的需求峰值高于其他血液成分,需要策略管理其高峰需求

数据来源:

  • 德国三级护理学术转诊中心埃森大学医院的 5 年回顾性队列研究数据
  • 整个队列包括 262 638 名患者,其中有 34 809 名患者纳入本研究范围
  • 滑动时间窗口生成了 437791 个样本,分别作为训练集、验证集和测试集

滑动时间窗口的采样频率为 12h,即每个患者每天产生 2 条数据样本

窗口的最大长度为 60,即最多记录该患者过去 30 天内的特征时序信息

纳入标准分析:

  • 住院时间>1天:确保患者有足够长的医疗监测以产生数据
  • 最低血小板计数 < $150\times 10^3$:只考虑存在血小板减少风险的患者
  • 48h 内存在全血细胞计数:确保获得有效样本(核心参数不缺失)

预测目标:识别患者在接下来的 24h 内是否需要血小板浓缩液(PCs)

由于血小板计数的检验次数有限,因此会在两次检验之间进行线性插值以丰富数据

2.2 特征分析

患者数据分组分析:

  • 总体来说,训练集与测试集之间的数据分布均衡,但存在性别依赖的异质性
  • 血液和肿瘤科的血小板浓缩液(PCs)输注率为 57%,远高于其他科室
  • 31%的患者来自心胸外科,31%来自血液和肿瘤科,剩余科室占比为 37%

特征的处理和转换:

  • 数据预处理:文本特征(比如科室、病房和性别)进行编码,年龄和血小板计数需要进行标准化、分类数据(比如状态信息、医疗程序或药物使用)先进行 one-hot 编码,再转换为时序特征并编码
  • 考虑科室差异性,对血液肿瘤科和心胸外科进行单独的科室建模;其他科室则合并建模

2.3 建模总结

模型架构:

  • 分类特征有 16 种,包括过去的手术、诊断的情况和过去 30 天内给予的药物
  • 时序张量特征有 7 种(时序最大长度为 60),包括血小板计数、星期几(用余弦和正弦表示)、血小板计数的测量值或插值、是否使用 PCs、是否假期和是否周末
  • 位置特征有 2 种,包括唯一标识患者最后的科室(训练单科室模型时忽略)和病房

训练细节补充:

  • 输出层使用 sigmoid 作为激活函数,将输出映射到 0 和1 之间以实现二分类
  • 训练优化器使用Adam 和 AdamW;权重衰减正则化设置为学习速率的 1/10
  • 使用贝叶斯优化作为超参的搜索策略,目标是最大化 AUC-PR 得分
  • 确定最佳的模型超参后,使用 5 折交叉验证的模型构建集成模型(平均值)
  • 基于 F1 值最大化来寻找输出概率的最佳 cutoff(避免数据集不平衡的影响)

建模性能对比:

  • 综合来看,血液和肿瘤科的模型得分最好,而心胸外科的模型得分最差

模型的可解释性分析:

  • 血小板并不是最重要的模型特征之一,而最相关的时序特征是是否为工作日

讨论和补充:

  • 作者曾训练过 XGBoost 和 RF 模型用于 3 天内的血小板需求预测;但由于纳入的患者需要至少住院 9 天,因此极大限制了模型的性能和临床实用价值;而本文的 LSTM 改善了这一点
  • 训练后的模型表现出较高的特异性,但是灵敏度较低;这对临床决策提出了潜在的挑战,因为它可能导致假阴性并忽视可能从血小板输注中受益的患者
  • 局限性:事件缺少标准化;数据存在不一致或错误;出于隐私考虑未纳入医生信息;纳入标准可能给模型带来偏差,比如可能忽略了部分短期住院、或急性出血事件的患者;
  • 血小板插值对模型性能影响较小,但可能无法捕捉意外事件引起的突然变化

相关资源

基于血液动力学监测数据预测术中大输血

2024-11-12 17:46:00

中文标题:手术过程中使用术中血流动力学监测数据开发和验证需要大量输血的预测模型

英文标题:Development and Validation of a Prediction Model for Need for Massive Transfusion During Surgery Using Intraoperative Hemodynamic Monitoring Data

发布平台:JAMA Network Open

JAMA network open

发布日期:2022-12-14

引用量(非实时):1

DOI:10.1001/jamanetworkopen.2022.46637

作者:Seung Mi Lee, Garam Lee, Tae Kyong Kim, Trang Le, Jie Hao, Young Mi Jung, Chan-Wook Park, Joong Shin Park, Jong Kwan Jun, Hyung-Chul Lee, Dokyoon Kim

关键字: #输血 #血流动力学

文章类型:journalArticle

品读时间:2024-11-12 17:46

1 文章萃取

1.1 核心观点

围绕术前和术中特征构建大输血的实时预测模型,并取得了较好的预测性能
基于模型输出构建“大输血指数”,具备实时提示大输血风险的临床指导意义

1.2 综合评价

  • 分别从特征、预测场景、模型类型等角度构建多种模型
  • 从医疗角度考虑,进行分析和不同人群下的模型验证

1.3 主观评分:⭐⭐⭐⭐

2 精读笔记

2.1 数据说明

背景知识:

  • 常见的大输血手术:肝移植、心脏手术、前置胎盘和脊柱手术

数据来源:

  • 2016 年至 2019 年在首尔国立大学医院 (SNUH) 接受的有创血压监测手术
  • 2020 年至 2021 年在 Boramae 医疗中心 (BMC) 接受的有创血压监测手术
  • SNUH 数据量为 50934,其中包含有创血压监测记录的人群为 21622
  • 接受死者器官捐献的外科手术、少于20分钟的外科手术或儿科外科手术(<18岁)的患者以及体重极低(<30公斤)的患者被排除在研究人群之外
  • 最终,SNUH 用于训练和内部验证(n = 17986 ),BMC 用于外部验证(n = 494 )

主要结局:大输血定义为在一小时内输注 3 个或更多单位的红细胞

2.2 特征分析

术前特征说明:

  • 基线人口因素,包括年龄、性别、体重、身高
  • 基础疾病如高血压、糖尿病、肺结核、肝病、慢性阻塞性肺病、哮喘、心脏病、甲状腺疾病, 肾脏疾病, 血液疾病, 血管疾病,神经系统疾病或妊娠,以及美国麻醉医师协会身体状况分类
  • 与手术相关的特点,包括手术科室和拟采用的麻醉方式
  • 术前实验室检查,包括血红蛋白、红细胞压积、血小板计数、白蛋白、丙氨酸氨基转移酶、天门冬氨酸氨基转移酶、电解质、血糖、高密度脂蛋白、血尿素氮、肌酐、凝血酶原时间、活化部分凝血活酶时间和估计值,肾小球滤过率

术中特征说明:

  1. 术中动脉血压波形,基于波形分解算法测量血压、心率和波形下方的面积
  2. 来自患者监护仪(Solar 8000 M,GE Healthcare)的氧饱和度 (Sp)
  3. 从心电图波形读取ST段抬高(急性心肌梗死的重要特征表现)

2002年的一项分析了212例患者的荟萃分析显示,出现ST段抬高心电图的患者30.2%存在左室肥厚、25.9%存在急性心梗、16.5%存在束支阻滞、其他还有心包炎、室壁瘤等,临床上还有应激性心肌病、Brugada综合征、主动脉夹层等

研究人群的特点:

2.3 建模总结

模型设计与选型:

  • 术前预测:逻辑回归、Lasso 回归、Ridge 回归、随机森林、boosting 模型
  • 术中预测:GRU 模型(实时更新隐藏状态并输出表征,表征结合术前特征进行预测)
  • 两个模型均为二分类任务,使用约登指数计算最佳的 cutoff 值
  • 最终模型性能评估通过重复 10 次的 5 折交叉训练验证的结果为准

建模性能(AUROC 和 AUPRC):

  • 其中黄线表示术前预测模型,蓝线表示术中实时预测模型

不同模型的性能对比:

  • AUAW,每次心跳的动脉波形下的面积; DBP,舒张压; HCT、血细胞比容; HR、心率; GB,梯度提升; MBP,平均血压; SBP,收缩压; Sp,脉搏血氧计测得的外周血氧饱和度; ST,ST段抬高

/ 讨论与补充:

  • 提前 15 分钟或 20 分钟的大输血预测与提前 10 分钟的大输血预测表现出相似的性能(SNUH 内部验证数据集:AUROC,0.972 vs 0.969 vs 0.962 和 AUPRC,0.571 vs 0.555 vs 0.492;P = .60)
  • 定义术中实时预测模型的输出概率为"大输血指数",需要进行大输血的患者对应的"大输血指数"大部分都大于 0.1,而作为对照的未进行大输血的患者的"大输血指数"大部分都小于 0.1
  • 按照麻醉类型、麻醉紧急程度、手术类型(择期/急诊)来划分人群评估模型,均表现出色
  • 临床挑战:电子病历异构、跨系统的数据整合难、数据缺失或异常、缺乏手术室数据的大规模验证
  • 局限性:回顾性数据库、可能存在国情或种族差异(韩国的数据集)、未考虑出血量(难以量化)

相关资源

流言终结者 2024Q3

2024-11-04 17:02:00

  1. 长期喝茶会导致缺钙?不一定,茶叶中可能残留一定量的草酸,可以与与钙结合;但是该情况损失的钙最多几十毫克,远低于人们每天 1000 毫克的钙需求量
  2. 助听器会让老人“越戴越聋”?不一定,只有助听器质量不达标,验配流程不科学,才有可能造成听力下降;老年人是听力问题的高发群体,主要受身体机能衰退或疾病的影响
  3. 晒太阳可以预防骨质疏松?不一定,晒太阳可以帮助人体合成维生素D,但并不能保证可以预防骨质疏松;此外,紫外线会增加罹患皮肤癌的风险;专家建议:每周晒 2 次,每次 5~30 分钟
  4. 用保鲜膜包裹食物加热会致癌?不一定,实际生活中接触到的DEHP 增塑剂浓度通常远低于导致健康问题的剂量;需注意通过正规渠道购买保鲜膜,并避免同一张保鲜膜的重复使用,
  5. 遮阳伞和雨伞可以混用?不对,二者的工艺、结构和检测指标都存在差异,遮阳伞长期接触淋雨,可能会加速涂层的老化、失效、脱落,从而降低防晒效果
  6. 趴着午休会导致胃下垂?不对,不良的饮食习惯(如餐后马上运动)、手术影响、特殊疾病及其他身体因素成胃下垂的常见原因;但饭后立即趴睡时,胃肠蠕动下降加之胃部受挤压,易产生胃胀气等症状
  7. “三伏天”减肥效果加倍?不对,医学统计数据来看,季节与减肥并没有较强关联;该现象往往是出汗较多、身体水分流失所致(注意补充水分及电解质)。补充水分后,体重又会反弹。
  8. 孩子身材矮小可以打“增高针”?不对,因生长激素缺乏症、特纳综合征、特发性矮身材等引发的身材矮小(发病率约为 3%)才需要注射生长激素治疗;大部分生长缓慢患儿只是体质性青春期发育延迟
  9. 电风扇+矿泉水瓶,制冷堪比空调?不一定,装置等效于电扇调高了风速档,人体感觉上会凉爽,但环境温度并不会有效降低,感觉凉爽和温度降低是两种评判标准
  10. “晒背养生”在三伏天做才能“治百病”?不一定,根据中医理论,晒背适合于阳虚或寒湿体质。如果环境温度高、晒背时间过长可能导致体内津液大量流失、肺热或肝火太盛、肝阳上亢
  11. 儿童用药,按成人剂量减半就行?不对,儿童和成人在药物吸收、代谢过程中,对药物的耐受性、反应性等存在显著差异;简单地用药减半可能存在风险,严重时会导致肝肾等重要脏器损伤
  12. 蟑螂不能踩,越踩越多?不一定,这种情况仅限于蟑螂是雌性且携带处于合适阶段的卵鞘
  13. 金针菇在冰箱里“逆生长”是因为打了激素?不对,冰箱内具备金针菇生长的适宜温度、湿度与避光环境
  14. 夏天洗冷水澡更降温?不对,如果是以降温为目的,更推荐用跟体温接近的温水(35℃—40℃),比洗冷水澡更降温;洗冷水澡会导致身体进入“保暖模式”,皮肤血管收缩散热减少,人体的核心温度升高
  15. 舌尖尝甜,舌根尝苦?不对,在舌头上的味蕾中,味觉受体细胞的分布并没有显著的区位性差异
  16. 尿酸高的人不能喝茶?不一定,茶叶本身所含成分不会直接导致尿酸水平升高;但浓茶含有草酸、咖啡因等成分,可能刺激胃肠道,影响睡眠和代谢,间接对尿酸水平产生不利影响
  17. 孩子矫正牙齿越早越好?不一定,牙齿矫正并没有严格的年龄要求;正畸时机因人而异
  18. 酸奶里的益生菌越多越好?不对,益生菌有益于肠道健康,有些益生菌还能促进脂肪和糖的代谢;但过度摄入充益生菌可能扰乱肠道环境,产生严重的负面作用,如腹胀、腹痛甚至腹泻
  19. 月饼久放不坏是因为防腐剂多?不对,月饼能长时间保存并非只取决于防腐剂的添加量,而是因为(1)高温灭菌处理(2)包装工艺提升(3)高脂高糖,水分含量低,不利于微生物繁殖
  20. 葡萄上的白霜是农药残留?不一定,天然的果粉白霜分布自然均匀,它不会覆盖葡萄表皮本身的颜色,只会让葡萄看起来更加漂亮;而由农药形成的白霜分布不均匀,有时还可能会有水滴状的药斑

本文主要内容参考自中国数字科技馆的每月流言榜 和个人网络收集

本文标题致敬了一款个人很喜欢的科普电视节目《流言终结者(MythBusters)》