MoreRSS

site iconBanxian | 王半仙修改

基于Obsidian笔记的数学花园,电子知识大脑。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

Banxian | 王半仙的 RSS 预览

《因果推断:从概念到实践》总结

2026-01-27 17:46:00

1 基本信息

1.1 书籍名称:《因果推断:从概念到实践》

1.2 撰写作者:Matheus Facure

1.3 出版日期:在线文章

1.4 品读时间:2025-12~2026-01

1.5 整体耗时:约 45h

1.6 摘要

对因果推断的常见算法进行总结与实战分析,整体行文重视思路的引导,配合丰富 Python 代码示例,非常适合新手入门和上手;文章后半部分的进阶内容包含作者对因果推断先进方法的看法与总结,虽然在数学理论上不够严密,但作者将个人的推演思路和实践经验进行了很好地展示

#书籍总结

1.7 特点

内容深入浅出,既适合入门,也值得深挖

全文配套代码,理论结合实践,实用性强

文章思路前后贯通,但知识体系有些凌乱

1.8 评分:⭐⭐⭐⭐⭐

2 大纲

2.1 因果关系入门

来上一杯顶着厚泡沫的冰镇啤酒,假设顶上的厚泡沫是数据科学,那啤酒则是统计学基础、科学好奇心和对复杂问题的热情,我们应该学习和关注更实质的存在,而需要忽视泡沫

因果推断基础潜在结果框架 POM

2.2 随机实验

随机对照实验

2.3 统计学回顾

莫弗(Moivre)方程: $$SE=\frac{\sigma}{\sqrt{ n }}$$

  • 其中 $SE$ 表示均值的标准误差, $\sigma$ 表示标准差,$n$ 表示样本容量
  • $SE$ 可用于量化实验结果的不确定性,样本越少,结果的波动性越大
  • $SE$ 可用于构建置信区间 $95%CI=[MEAN+2 SE,MEAN-2 SE]$

差异性检验

2.4 图因果模型

因果图以变量的独立性和条件独立性假设为基础,描述变量间的因果关系

结构因果模型 SCM

2.5 好用的线性回归

线性回归随机实验示例

2.6 分组和虚拟回归

虚拟回归

2.7 混淆变量之外的考虑

随机实验示例 2随机实验示例 3

COP 效应 $$ \begin{align*} &E[Y|T=1] - E[Y|T=0] \\ &=E[Y|Y>0, T=1]P(Y>0|T=1) - E[Y|Y>0, T=0]P(Y>0|T=0) \\ &=\underbrace{{P(Y>0|T=1) - P(Y>0|T=0)}}_{Participation \ Effect} * E[Y|Y>0, T=1] \\ &+\underbrace{{E[Y|Y>0, T=1] - E[Y|Y>0, T=0]}}_{COP \ Effect} * P(Y>0|T=0) \end{align*} $$

  • 实验目的与符号定义:评估营销活动 $T$ 对消费 $Y$ 的影响
  • 由上式可知,两组结果的均值差异由两部分组成(1)参与效应(Participation Effect),其描述了原本不参与消费客户的消费概率增加(2)COP 效应,其描述了原本就可能参与消费客户的消费增加
  • 启示:注意考虑所有从未参与营销的客户,否则对照组和实验组就失去了可比性

控制选择偏差: (1)避免引入干预与结果路径之间的中介特征 (2)避免引入同时受到干预和结果影响的特征

2.8 工具变量

工具变量法 IV

2.9 非服从性与 LATE

非服从性:受试者可能不服从安排和干预,比如医疗实验中的部分倔小孩

内部效度:在特定场景下可识别到的有效因果,比如工具变量法给出的 ATE

外部效应:将当前样本中发现的效应推广到其他人群中,关注效应的预测能力

局部平均干预效应(LATE)

  • 假设有一个实验,其目的是针对商场的营销活动进行效果评估
  • 实际推广后发现,部分非智能手机的用户收不到营销活动的推送
  • 因此该情况下估计的效应值是局部,仅针对具备智能手机的用户群体

工具变量法的结果只是对具有服从行为对象的局部平均干预效应(LATE)

2.10 匹配

子分类估计器(Subclassification Estimator)

  • 根据特征 $X$ 将样本划分为 $K$ 个不同的分组 ${X_{1},X_{2},...,X_{k}}$
  • 假设第 $k$ 的样本数为 $N_{k}$,干预组结果均值为 $Y_{k_{1}}$,对照组结果均值为 $Y_{k_{0}}$
  • 对组内干预与对照的比较并计算 ATE,最后对多组结果加权求和,得到最终 ATE

$$ATE=\Sigma_{i=0}^K(Y_{k_{1}}-Y_{k_{0}}) \times N_{k}/N$$

由于维度诅咒的存在,子分类估计器在实践中应用较少

匹配估计器:为每个干预组样本找到最相似的样本,构建对照组

2.11 倾向得分

倾向得分匹配法 PSM

2.12 双重稳健估计

双重稳健估计

2.13 双重差分法

双重差分法 DID

2.14 面板数据和固定效应

因果推断的不同算法假设

面板数据模型

2.15 合成控制

合成控制法

2.16 断点回归设计

断点回归设计

2.17 预测模型入门

机器学习

  • 一种快速、自动且精准预测方法,其本质在于学习复杂映射函数
  • 根据自定义的输入,映射到部分未知、但定义明确且可观察的输出

机器学习相关概念:损失函数交叉验证

将业务问题转化为预测问题,那么机器学习就会是合适的工具

2.18 异质效应和个性化

异质性干预效应

2.19 评估因果模型

因果效应评价

2.20 可插拔建模流程

非参数机器学习

2.21 元学习

因果效应评估_元学习

2.22 双重机器学习

双重机器学习 DML

2.23 异质效应的非线性

干预效应不仅与结果变量相关,还与干预水平相关

  • 当干预结果是二元的,干预水平和干预效应之间往往呈现 Sigmoid 函数分布,此时应优先考虑干预水平在 50%左右的群体,此时导数最大,干预效应更好
  • 以营销活动为例,假设平均客户转换率较高(比如 80%),“助推”策略应优先考虑历史转化率(50%~60%)较低的客户,此时干预效应更好
  • 以新冠疫苗接种为例,由于患者的平均死亡率远低于 50%,因此“接种”策略应优先考虑死亡风险较高的中老年基础病患者,此时干预效应更好

导致干预效应异质性的关键复杂因素是结果函数 $Y(0)$ 的非线性

2.24 双向固定效应

双向固定效应 TWFE

2.25 合成差分法

合成双重差分法 SDID:融合双重差分法 DID合成控制法的优势

3 教学资源

英文原本(全)《Causal Inference for The Brave and True》 中文译本(仅前 21 章,且更新不及时)《因果推断:从概念到实践》

4 关键字

#因果推断

合成双重差分法 SDID

2026-01-21 18:59:00

前置知识:双重差分法 DID合成控制法双向固定效应 TWFE

前置算法回顾

已知双重差分法 DID 的线性模型可表示如下: $$ Y_{it} = \beta_0 + \beta_1 Post_t + \beta_2 Treated_i + \beta_3 Treated_i Post_t + e_{it} $$

  • 其中 post 表示时间虚拟变量,treated 表示干预虚拟变量

而通过引入个体/时间的固定效应,可以将 DID 表示为 TWFE 的形式: $$ \hat{\tau}^{did} = \underset{\mu, \alpha, \beta, \tau}{argmin} { \sum_{i=1}^N \sum_{t=1}^T \big(Y_{it} - (\mu + \alpha_i + \beta_t + \tau D_{it}\big)^2 } $$

  • 其中 $\alpha_i$ 表示个体固定效应,$\beta_{t}$ 表示时间固定效应
  • TWFE 可以通过借助 DML 的思想来快速估计干预效应

合成控制法则需要先寻找最优的权重来组合样本,使数据满足平行趋势假设;其具体的建模过程,可以表述为一下形式(为例方便与 TWFE 对比分析): $$ \hat{\tau}^{sc} = \underset{\beta, \tau}{argmin} { \sum_{i=1}^N \sum_{t=1}^T \big(Y_{it} - \beta_t - \tau D_{it}\big)^2 \hat{w}^{sc}_i } $$

  • 相比于TWFE,合成控制法额外考虑了个体权重 $\hat{w}^{sc}_i$,但并没有考虑到个体固定效应 $\alpha_i$ 和总体截距 $\mu$,仅考虑到了时间固定效应$\beta_{t}$

合成双重差分法

合成双重差分法(Synthetic Diff-in-Diff,SDID)的公式定义如下: $$ \hat{\tau}^{sdid} = \underset{\mu, \alpha, \beta, \tau}{argmin} { \sum_{i=1}^N \sum_{t=1}^T \big(Y_{it} - (\mu + \alpha_i + \beta_t + \tau D_{it})^2 \hat{w}^{sdid}_i \hat{\lambda}^{sdid}_t \big) } $$

  • SDID 可以简单理解为在 DID 中添加合成控制法拟合的个体/时间权重
  • SDID 也可以理解为在合成控制法估计量中额外考虑个体的固定效应
  • $\hat{w}^{sdid}_i$ 表示个体权重,用于最小化对照组与干预组之间的个体均值差异
  • $\hat{\lambda}^{sdid}_t$ 表示时间权重,用于最小化干预组在干预前后之间的时间均值差异

时间权重 $\hat{\lambda}^{sdid}_t$ 的计算公式如下: $$ \hat{\lambda}^{sdid} = \underset{\lambda}{\mathrm{argmin}} \ ||\bar{\pmb{y}}_{post, co} - (\pmb{\lambda}_{pre} \pmb{Y}_{pre, co} + \lambda_0)||^2_2 \
\text{s.t } \ \sum \lambda_t = 1 \text{ and } \ \lambda_t > 0 \ \forall \ t $$

  • 相比于合成控制法,SDID 允许不同时间段的结果存在常数差异,只需要趋势相关即可;因此 SDID 引入了截距项 $\lambda_0$ ;一般来说,距离干预的时间点越近,时间权重 $\hat{\lambda}^{sdid}_t$ 会越大

个体权重 $\hat{w}^{sdid}_i$ 的计算公式如下: $$ \hat{w}^{sdid} = \underset{w}{\mathrm{argmin}} \ ||\bar{\pmb{y}}_{pre, tr} - (\pmb{Y}_{pre, co} \pmb{w}_{co} + w_0)||^2_2 + \zeta^2 T_{pre} ||\pmb{w}_{co}||^2_2\
\text{s.t } \ \sum w_i = 1 \text{ and } \ w_i > 0 \ \forall \ i $$

  • 相比于合成控制法,SDID 允许不同组之间存在常数差异,只需要趋势平行即可;因此 SDID 引入了截距项 $w_0$;此外,SDID 还引入了 Ridge 回归的正则化项 $\zeta^2$ 来减少估计的方差,让权重分散,防止权重集中在某个个体上(避免过拟合)

SDID 的分析

  • 融合 TWFE 和合成控制法的优势,稳定且效果好
  • 当平行趋势假设成立时,SDID 会退化成 DID
  • 当合成控制法的拟合效果好时,SDID 的结果也很好
  • SDID 只需要加权后的数据满足平行趋势假设

随机实验

2026-01-17 19:59:00

前置知识:因果推断入门

随机实验(Randomised Experiments)

  • 将总体中的个体随机分配到实验组或对照组
  • 随机化通过使潜在结果与治疗无关来消除偏差:$(Y_0, Y_1) \perp!!!\perp T$
  • 因此随机实验可以直接得到平均因果效应 $ATE$ $$

ATE=E[Y|T=1] - E[Y|T=0] = E[Y_1 - Y_0] $$

常见的随机实验:

  • 随机对照试验(RCT)是获得因果效应最可靠的方法,简单直接且极具说服力
  • 在线对照实验(A/B Test)常用于互联网产品在线优化,快速、低成本比较版本差异
  • 集群随机实验(CRT)以群体为最小干预单位的 RCT,常见于教育或政策评估

随机对照实验

随机对照试验(RCT),评估因果效应的金标准

RCT 的基本步骤

  1. 明确研究问题,设计干预方案与结局指标,评估样本量
  2. 对受试者进行严格的随机化分组,划分为实验组与对照组
  3. 对实验组的受试者进行干预,并收集所有受试者的结局指标
  4. 比较组间结局差异,并使用统计检验方法判断差异的显著性

单盲实验:受试者不知道分组信息,但是实验者知道分组信息 双盲实验:受试者不知道分组信息,实验者也不知道分组信息

RCT 的局限性:

  • RCT 的问题在于其实验成本可能非常昂贵或违背道德
  • 成本昂贵:比如在评估《估计信用额度对客户流失的影响》时,不能为银行客户提供完全随机的信用额度,这样的操作成本和代价会非常高
  • 违背道德:比如在评估《怀孕期间吸烟对婴儿出生体重的影响》时,不能强迫一部分孕妇在怀孕期间吸烟,而天然吸烟的孕妇群体又可能是存在特定规律的(比如受教育水平更低或者经济水平偏低,而这些因素也是有可能影响到婴儿出生体重的)
  • 因此许多 RCT 实验设计很难做到完全的随机化,也就得不到理想的实验结论

在线对照实验

在线对照试验 (Online Controlled Experiments),也称为 A/B 测试

A/B 测试基本步骤

  1. 确定需要测试的改动和预期提升的核心指标(如点击率、转化率)
  2. 设计测试方法,包括流量分割比例、受众筛选条件、实验时长等
  3. 将用户随机分流,分配到不同版本的产品,并进行灰度测试
  4. 监控核心指标和护栏指标(限制可能的负面影响,避免影响业务)
  5. 分析指标差异,包括显著性和效应值;决定是否全量发布或回滚

RCT 与 A/B 测试不存在显著区别,也存在术语混用的情况

集群随机实验

集群随机实验(CRT)

CRT 基本步骤

  1. 明确实验设计,寻找合适的随机化集群,并进行基线测量
  2. 对集群进行严格的随机化分组,划分为实验组和对照组
  3. 对实验组的集群(包含集群内的所有个体)进行干预
  4. 对实验组和对照组结果进行差异分析,注意考虑集群内相关性

CRT 的步骤和 RCT 基本一致,只是干预的目标从个体改为集群

随机实验示例 1

以一个简单的 A/B 测试为例

  • 实验目的:分析线上/线下授课对学生成绩的影响
  • 实验设计:(1)将学生随机划分为两组,一组进行线上授课,一组进行线下授课(2)记录两组学生在实验一段时间后的成绩(3)对比实验结果的差异并分析
  • 差异分析方法(1)基于 z 统计量进行假设检验,H0 为两组结果的差异为零,当 p 值<0.05 时拒绝 H0(2)通过两组结果的置信区间对比来评估差异,需要指定置信水平(3)构建是否进行线上授课的 0-1 虚拟变量,通过线性回归得到虚拟变量的平均效应

Python 实现代码如下

import pandas as pd
import numpy as np
from scipy import stats

# 读取数据并随机分组
data = pd.read_csv("data/online_classroom.csv")
online = data.query("format_ol==1")["falsexam"]
face_to_face = data.query("format_ol==0 & format_blended==0")["falsexam"]

confidence=0.95, h0=0
mu1, mu2 = test.mean(), control.mean()
se1, se2 = test.std() / np.sqrt(len(test)), control.std() / np.sqrt(len(control))
diff = mu1 - mu2
se_diff = np.sqrt(test.var()/len(test) + control.var()/len(control))
# 基于z统计量进行假设检验,H0为两组结果的差异为零
z_stats = (diff-h0)/se_diff
p_value = stats.norm.cdf(z_stats)
def critial(se): return -se*stats.norm.ppf((1 - confidence)/2)

# 输出不同组别的置信区间和最终的假设检验结果
print(f"Test {confidence*100}% CI: {mu1} +- {critial(se1)}")
print(f"Control {confidence*100}% CI: {mu2} +- {critial(se2)}")
print(f"Test-Control {confidence*100}% CI: {diff} +- {critial(se_diff)}")
print(f"Z Statistic {z_stats}")
print(f"P-Value {p_value}")

# 通过线性回归直接估计虚拟变量(是否线上授课)的平均因果效应
result = smf.ols('falsexam ~ format_ol', data=data).fit()
result.summary().tables[1] # 系数为负,表示线上授课对成绩存在负面影响

在实际操作过程中,可以引入更多的混淆变量(对因果变量都存在影响的变量)来修正平均因果效应 ATE 的估计;其他优化技巧可参阅回归内生性问题

随机实验示例 2

对 2 家医院进行药物疗效实验

  • 医院 A 的随机分组策略:90% 的患者接受药物治疗,10% 的患者接受安慰剂
  • 医院 B 的随机分组策略:10% 的患者接受药物治疗,90% 的患者接受安慰剂
  • 实验目的:新药物治疗(treatment)是否能有效减少患者的住院天数(days)
  • 单因素分析阶段,发现治疗会增加住院时长(反直觉),深入分析后发现是因为医院 A 相比于医院 B 通常会接收病情更严重的患者,而医院 A 的药物治疗占比也更高,因而导致了错误的结论
  • 合理思路:将病情严重程度(severity)作为混淆变量纳入模型,显著改善预测效果,同时得到新结论:治疗(treatment)会减少住院时长
  • 不合理思路:将医院类型(hospital)作为变量纳入模型,结果变差;而 hospital 作为治疗的预测因子,与住院时长是不直接相关,因此将其纳入模型会增加治疗效果的估计误差

合理的混淆变量必须同时影响干预和结果;severity 满足这一点,hospital 不满足

随机实验示例 3

分析催收邮件对客户还款行为的影响

  • 对 5000 位欠款客户进行随机分组,实验组会收到还款提醒的邮件
  • 实验目的:通过催收邮件(email)是否能增加欠款客户的还款金额(payments)
  • 单因素分析阶段,发现催收邮件会减少还款金额(反直觉),深入分析后发现是因为影响还款金额的因素太多,而催收邮件的影响较小,因此存在较大的估计误差
  • 合理思路:将客户的信用额度(credit_limit)和风险评分(risk_score)作为补充特征,纳入模型;最终预测结果得到明显改善,而新的 ATE 估计方差也小了很多
  • 不合理的思路:将客户点击(opened)和客户同意(agreement)作为补充特征,纳入模型;中介特征是指在因果图中处于干预到结果之间的路径中的特征节点,将其纳入模型会导致选择偏差

当一个特征是结果的有效预测因子,即使它不是混淆变量(同时影响干预和结果),将其纳入模型也是有好处的,能明显降低干预效果的估计方差

2025年Obsidian新玩法总结

2026-01-14 11:05:00

去年总结: 2024年Obsidian新玩法总结

版本更新

  • V1.8(20250130):支持 Obsidian 内部浏览网页的 Web Viewer 核心插件;新增“Download attachments for current file”命令,可下载所有外部嵌入的图片,并将外部链接替换为内部嵌入;脚注自动补全
  • 20250221:官方宣布免费支持商业用途,无须担心商业许可问题
  • V1.9(20250521):引入 bases 核心插件,用于笔记的数据库管理;支持侧边栏管理脚注;引入属性值为列表(以前是文本)的 tags 、 aliases 和 cssclasses 属性
  • 20250822:增强 obsidian 同步的加密方式,改善安全性
  • V1.10(20251001):为 bases 插件进行大量的功能更新和改善
  • V1.10.2(20251029):解决由于 Github 屏蔽导致的插件和主题仓库访问问题
  • V1.11 (20251210):优化 markdown 链接的粘贴与更新;设置新增“Keychain”用于插件密钥的存储;每日笔记相关的格式与启动方式优化

第三方插件

完整的 Obsidian 插件列表:Obsidian-常用插件总览

弃置不再需要或长期不维护的插件:Obsidian-已弃用插件

新增插件:

待看:

经验总结

在搜索结果或知识图谱中忽略特定的文件或文件夹:

  • 打开 Obsidian 的设置,点击 文件与链接
  • 找到忽略文件选项,并进行规则添加(支持正则)

其他经验技巧

Bases 工具:Dataview 查询转换为 . base 文件

其他推荐

IMSwitch in Math Block By XXM

在书写数学公式时自动切换输入法,以提高书写效率。当光标进入数学公式区域($ 符号之间)时,自动切换到英文输入;当光标离开公式区域时,则切换回之前的输入法。

Git Changelog By shumadrid

通过 Git 在侧边栏动态展示知识库与文件的变更历史记录,有效检测数据异常丢失。

Related Notes By Oluwasanya Awe

自动使用成熟的相似性算法分析笔记内容,以发掘库中笔记之间的连接。

MP Preview  MP By Yeban

一键将 Obsidian 笔记转换为微信公众号格式且可实时预览编辑效果(自带模板较为简单,需要人工复制到公众号界面,但是支持自定义模版,可以 mark 一下)

双向固定效应 TWFE

2026-01-12 18:10:00

前置知识:因果效应评估_准实验因果效应评估_异质性双重机器学习 DML

双向固定效应

双向固定效应(Two Way Fixed Effect,TWFE)

  • 作为双重差分法 DID 的一种常见回归模型实现方式
  • TWFE 假设干扰效应是常量,并引入个体/时间的固定效应
  • 对于不同组的干预时间相同的情况,TWFE 和 DID 是等价的

当出现不同组的干预时间不同的情况,即错位实施(Staggered Adoption),TWFE 对干预效应的评估容易存在偏差,尤其是干预效应存在时间异质性的情况

简单来说,TWFE 会将早期干预组的干预效应看作“共同的时间趋势”,从而导致晚期干预组的效应估计被严重低估;此问题的处理将放在下文的"TWFE 改进"一章中进行讨论

TWFE 示例

案例说明:

  • 目的:评估软件新功能上线对不同城市 APP 安装量的影响
  • 上图中三条趋势分别代表三个城市的 APP 安装量;其中红色城市的软件新功能上线时间为 2021-06-01;蓝色城市的软件新功能上线时间为 2021-07-15;紫色城市作为对照组,软件新功能未上线

TWFE 的公式定义如下: $$ Install_{it} = \tau D_{it} + \gamma_i + \theta_t + e_{it} $$

  • 其中 $D_{it}$ 表示干预变量,其系数 $\tau$ 对应干预效应的估计;在本案例中,$D_{it}$ 描述了城市 $i$ 在时刻 $t$ 是否上线了新功能;新功能如果已经上线则 $D$ 为 1,否则为 0
  • $\gamma_i$ 作为个体固定效应,用来消除个体/组别间的差异;一般是对个体/组别的基准描述(比如城市文化或产品契合度)
  • $\theta_t$ 则作为时间固定效应,用来消除时间趋势上的差异;一般每个时间段内都需要统计的外生因素(比如特定时期的基准安装量)

由于虚拟变量过多,因此考虑借助双重机器学习 DML 的思想,对回归模型进行拆分: $$ \begin{align} \tilde{Installs}_{it} &= Installs_{it} - \underbrace{\frac{1}{T}\sum_{t=0}^T Installs_{it}}_\text{Time Average} - \underbrace{\frac{1}{N}\sum_{i=0}^N Installs_{it}}_\text{Unit Average} \\ \ \\ \tilde{D}_{it} &= D_{it} - \frac{1}{T}\sum_{t=0}^T D_{it} - \frac{1}{N}\sum_{i=0}^N D_{it} \end{align} $$ 最后用 $\tilde{Installs}{it} = \tau \tilde D\{it} + e_{it}$ 来快速评估干预效应

TWFE 改进

已知当干预效应存在时间异质性,TWFE 会存在严重的效应估计偏差问题

为了解决这种情况,考虑对 TWFE 的函数形式进行改进,以捕捉时间异质性: $$ Installs_{it} = \sum_{g=0}^G \sum_{t=0}^T \tau_{gt} D_{it} + \gamma_i + \theta_t + e_{it} $$

  • 其中 $G$ 表示队列的总数,$g$ 表示一个单独的队列
  • 已知每个队列中的效应随着时间推移保持相同的模式
  • 通过增加 $T*G$ 个干预效应参数,来捕捉时间异质性

更进一步地思考,干预前的日期效应是可以忽略的,对照组的日期效应也是可以忽略的;因此可以对 TWFE 的函数形式进一步简化,来减少需要处理的参数量: $$ Installs_{it} = \sum_{G=q}^g \sum_{t=g}^T \tau_{gt} D_{it} + \gamma_i + \theta_t + e_{it} $$

  • 用条件 $g<q$ 来表示对照组的队列;用条件 $t<g$ 来表示干预前的日期

25年4季度文章集锦_生物医疗

2026-01-04 10:17:00

仅搜集收录了部分个人感兴趣的文章,并进行简单记录

1 概念科普

1.1 癌症患者戒烟可显著提高生存率,包括晚期患者

2025-10-12 文章链接

一项针对 13,282 名癌症患者的真实世界数据显示

  • 诊断后戒烟与癌症幸存者整体生存率 (OS) 的提高显著相关,这包括晚期癌症患者
  • 与戒烟者相比,持续吸烟的患者全因死亡风险高出 97% (调整后的风险比 aHR 为 1.97)
  • 即使是 III 期或 IV 期晚期癌症患者,持续吸烟者的全因死亡风险也比戒烟者高 2.11 倍
  • 然而,在研究中,只有 22.1% 的吸烟患者在 6 个月内成功戒烟。因此,研究强调所有癌症幸存者,无论癌症类型或分期,都应获得戒烟支持

1.2 性缺失人群特征的大规模研究

2025-10-15 文章链接

一项发表于《美国科学院院刊》(PNAS)的大规模研究,涉及英国和澳大利亚近五十万人;研究者对其中超过40万名39岁到73岁的参与者进行了多年随访,大约1%的参与者表示他们从未发生过性行为。另一项覆盖13 500名18至89岁澳大利亚居民的较小数据集也给出了类似的比例

主要结果

  • 性缺失人群受教育程度更高;更少饮酒、吸烟和使用大麻;使用手机的时间更短;常在较小的年龄就开始佩戴眼镜
  • 更容易感到孤独、不快乐和紧张,朋友和家人的探望也更少。更难找到可以倾诉的对象,更难相信生活是有意义的
  • 在收入不平等程度较高的地区,性缺失的现象更为普遍
  • 对男性来说,身体力量很重要。握力较弱、肌肉量较少的男性更可能终身没有性行为
  • 有14%到17%的性缺失可以用基因差异来解释;性缺失相关的基因模式同时还与这些特征相关:更高的智力和受教育水平;获得更高收入的潜力;更少的成瘾物质使用;更高的孤独症发生率

一种可能的解释是,认知能力较高的人往往把学习或事业放在首位,有时会牺牲亲密关系。另一种可能是,与智力相关的某些社会或人格特质——例如内向或规避风险的倾向——也可能让他们更难找到伴侣

1.3 运动与冠心病发病率之间的性别差异

2025-10-27 文章链接

美国心脏协会、欧洲心脏病学会和世界卫生组织(AHA/ESC/WHO)的指南一致建议:男女每周进行 150 分钟的中高强度身体活动(MVPA)

本研究分析了 80,243 名无冠心病参与者的加速度计测量的 MVPA 数据,以评估冠心病的发病率,并分析了 5,169 名冠心病患者的数据,以评估全因死亡率

主要结论:

  • 与对照组相比,遵循指南(MVPA 150 分钟)的参与者中,女性(以下简称女性)的冠心病风险降低了 22%,男性(以下简称男性)的冠心病风险降低了 17%
  • 女性每周进行 250 分钟的中高强度体力活动(MVPA)即可使冠心病风险降低 30%(风险比(HR)=0.70),而男性则需要每周进行 530 分钟才能获得类似的益处
  • 在冠心病患者中,积极运动的女性死亡风险降低幅度大于男性(HR=0.30 vs. 0.81)

2 疾病监测

2.1 与低温相关的脓毒症休克临床特征

2025-09-29 文章链接

脓毒症休克的诊断(MIMIC-IV 数据库):

  • 国际疾病分类第九版(ICD-9): 78552 代表 "Septic shock"
  • 国际疾病分类第十版(ICD-10): R6521 代表 "Severe sepsis with septic shock"
  • 数据库存储路径:在 mimiciv_hosp(医院模块)的 diagnoses_icd

数据说明:

  • 2008 年至 2019 年间符合年龄超过 18 岁和诊断为脓毒症休克资格标准的 5578 名个体
  • 低温的诊断标准为入院后 24 小时内记录的核心体温<35°C
  • 排除标准:(1)入住 ICU 时间少于 24 小时的患者(2)存在异常数据记录的患者(3)存在缺失数据的患者(4)SOFA 评分低于 2 分的患者;最终纳入 1640 名参与者
  • 特征变量:(1)人口统计学特征(2)合并症:心力衰竭、呼吸衰竭、肝功能不全、肾功能障碍以及恶性肿瘤;(3)ICU 入院时的严重程度评分(4)生命体征(入院后首次测量的值)(5)实验室检查(入院后首次测量的值) (6) 感染部位:沙发凝血、沙发肝脏、沙发心血管、沙发中枢神经系统(CNS)和沙发肾脏。(7) 临床结果:住 ICU 时长和住院时长 (8) 干预措施:血液透析、机械通气、血制品 (9) 药物使用
  • 预测目标:住院时长(生存时间)、是否院内死亡(生存结局)

主要结论:在同时伴有低温的脓毒症休克患者与无低温的脓毒症休克患者之间,多个协变量存在显著差异,如血红蛋白、碳酸氢盐和心率;后续分析显示,血红蛋白、心率、呼吸频率、乳酸和去甲肾上腺素与低温并发症的脓毒症休克的预后相关。此外,构建的列线图显示出在有效评估低温并发症的脓毒症休克方面的良好潜力,其曲线下面积(AUC)为 0.787

  • (a)五种独立预测因子的列线图模型,较高的总分表明并发低温的概率较高(b)校准曲线,横轴为列线图预测的 7-30 天疾病风险概率,纵轴为实际 7-30 天疾病发生比例(c)列线图模型的 ROC 曲线(d)线图模型的决策曲线分析,横轴为高风险阈值,纵轴为净收益

3 模型预测

3.1 智能输血系统应用于术中红细胞输注的效果评价

2025-12-08 文章链接

目的:评估智能输血系统在术中血液管理中的长期应用效果,比较其与临床医生决策的准确性和合理性的差异

方法:回顾性分析 2017—2024 年 26 760 台手术数据,比较系统应用前后(2017—2019 vs 2020—2024)的输血预测准确率、用血合理率及临床指标变化情况。系统基于 XGBoost 算法整合患者检验参数、手术信息等数据预测红细胞输注需求。

结果:智能输血系统预测患者是否输血准确率达 80.62%,高于医生的 24.83%(P<0.001);用血合理率为83.92%,高于医生的18.02%(P<0.001)。智能输血系统应用后,三、四级手术量增加而平均申请血量下降,医生依从率>75%时输血合理率提升至 88.18%。

结论:智能输血系统显著提升输血决策精准性,减少红细胞过度使用,优化围术期输血管理,并提高血液医疗资源利用率

4 治疗干预

4.1 血管升压素起始时机与脓毒症休克患者死亡率

2023-04-03 文章链接

实验设计:

  • 基于 MIMIC-III v1.4 和 MIMIC-IV v2.0 数据库的回顾性观察性队列研究
  • 纳入标准:(1)满足 Sepsis3.0 诊断标准的成年患者,且感染发生在入院前或后不足一天(2)仅考虑首次 ICU(3)同时接收去甲肾上腺素(NE)和血管加压素治疗,且血管加压素治疗时间在 NE 使用之后的 48h 内(4)剔除缺失率超过 10%的患者数据
  • 根据去甲肾上腺素(NE)在去甲肾上腺素起始治疗时的剂量将患者分为两组:低剂量去甲肾上腺素组(NE<0.25 µg/kg/min)和高剂量去甲肾上腺素组(NE ≥ 0.25 µg/kg/min)
  • 结局指标:主要结局为脓毒症休克后的 28 天死亡率;次要结局包括血管加压素血流动力学反应、去甲肾上腺素和血管加压素的使用持续时间、28 天无机械通气日和血液净化无治疗日、血管加压素开始使用后第 1 天、第 2 天的静脉输液和尿量,以及 ICU 和住院持续时间

实验方法:

  • 倾向得分匹配(PSM,1:1 最优匹配方法,匹配宽度为 0.02
  • 统计学显著性验证(t 检验、卡方检验、Fisher 检验)
  • 梯度提升模型(基于“twang”包的 GBM 计算倾向性得分)
  • 逆概率加权模型(以估计倾向性评分作为权重生成加权队列)
  • 双重稳健估计(在加权队列上进行了逻辑回归,调整组间的潜在混杂因素)
  • 多变量逻辑回归(筛选单变量分析中 p 值<0.1 的变量作为最终特征)

关键定义:

  • 脓毒症休克的发生时间:首次启动 NE 并记录平均动脉压(MAP)< 65 mm Hg 的时间
  • 液体负荷量:从休克发生前 6 小时至血管加压素启动期间给予的任何液体负荷
  • 血管加压素的血流动力学反应:在血管加压素后 6 h 内NE 量降低 ≥ 20%且 MAP ≥ 65 mm Hg

实验结论:

  • 实验纳入了 1817 名符合条件的患者(NE 低剂量组 613 例,NE 高剂量组 1204 例)
  • 经过 PSM 后,两组中各纳入了 535 名疾病严重程度无差异的患者进行分析;结果显示,在 NE 低剂量时启动血管加压素与 28 天死亡率降低相关(优势比 OR 0.660,95% CI 0.518–0.840,p<0.001)
  • 与 NE 高剂量组相比,NE 低剂量组患者的 NE 使用时间显著更短,血管加压素启动后第一天静脉补液量更少,第二天尿量更多,机械通气无创天数和 CRRT 无创天数更长
  • 在血管加压素的血流动力学反应、血管加压素使用时间以及 ICU 或住院时间方面,两组间无显著差异

4.2 脓毒症休克个体化液体复苏的再思考

2025-10-27 文章链接

一、初始复苏:防止不足

  1. 初始阶段的风险

脓毒性休克早期几乎所有患者存在相对低血容量(由于血管扩张)和可能的绝对低血容量(如腹膜炎、呕吐、腹泻造成的液体丢失)。如果复苏不足: 心输出量无法提升;组织缺氧持续存在;乳酸无法下降;多器官功能障碍不可逆 复苏不足的致命性,往往在数小时内表现为死亡,而液体过负荷的危害通常是可逆的中期并发症。 2. 初始剂量的思考 并非机械性执行“30 mL/kg”,而是结合病因与失液量: 腹膜炎/消化道穿孔 → 绝对缺液明显,应在 30 mL/kg 基础上适度增加 肺炎等单纯感染 → 以相对血管扩张为主,可适度下调 初始阶段不宜等待容量反应性测试,否则可能延误复苏时机。

结论:初期不怕适度多补,但千万不能少给

二、优化阶段:避免过量

  1. 容量反应性评估

随着液体输入,患者很快会进入“非反应性”状态,此时盲目继续补液只会导致水肿。动态评估至关重要:

  • 被动抬腿试验 (PLR):非有创、可重复
  • 潮气量挑战 (Vt challenge):在机械通气患者中有效
  • 微量液体试验 (Mini-fluid challenge):仅需 100-150 mL,但不能频繁重复
  1. 联合血管活性药物

去甲肾上腺素不仅升压,还能通过增加静脉回流、提升平均循环充盈压,起到“类液体”的作用。 对于重度低血压、舒张压极低 (<40 mmHg) 的患者,应尽早联合 NE,而不是单纯追求大剂量补液。 2. 停止补液的信号

  • ARDS 患者:关注肺外水、肺血管通透性,而非单纯 PaO₂/FiO₂。
  • 腹腔病变患者:注意腹腔压 (IAP),避免因液体加重腹腔间隔综合征。
  • CVP 升高:提示静脉回流受阻,应警惕器官淤血

三、稳定期:精准监测与目标调整

  1. 治疗目标

组织灌注:皮肤花斑消退、毛细血管再充盈时间缩短 代谢改善:乳酸下降、ScvO₂上升、二氧化碳差值改善 循环改善:心输出量增加,而非单纯血压上升 2. ICU 中的监测 热稀释法、肺动脉导管:重症患者的金标准 超声心动图:评估左室充盈压、心排出量 动脉波动指标:PPV、SVV 变化 组织氧合指标:乳酸、ScvO₂、二氧化碳差

四、清除液液阶段:防止后遗症

  1. ROSE 四阶段模型

R(Resuscitation):复苏 O(Optimization):优化 S(Stabilization):稳定 E(Evacuation):清除 真正避免液体过负荷的关键在于“主动清除液体”。 2. 液体清除的适应证 高 CVP、肺外水增加、肺 B 线显著、腹腔压升高 影像学证据:肺淤血、全身水肿 3. 液体清除方式 利尿剂:首选 CRRT 超滤:少尿或无尿患者 白蛋白+利尿剂:低白蛋白血症合并水肿患者更有效 4. 液体清除的安全性 液体清除前必须确认“安全性”,否则极易引起循环崩溃。 可通过 PLR 或 mini-fluid challenge 等方法确认

4.3 ICU中AKI患者透析撤离的最佳时机

2025-11-18 文章链接

LIBERATE-D 是一项多中心、随机、平行对照临床试验,由美国加州大学旧金山分校(UCSF)牵头。
入组标准包括:

  1. 成人 AKI-D 患者,病因主要为急性肾小管坏死;
  2. 已启动肾脏替代治疗;
  3. 血流动力学稳定-无升压药依赖。

两组方案如下:

  • 保守组:仅在出现明确代谢紊乱(如血尿素氮>112 mg/dL、K⁺>6 mmol/L、pH<7.15)或容量负荷导致缺氧时才启动透析。
  • 常规组:继续每周三次间歇性透析,直至尿量或肌酐清除符合停透标准。
  • 研究共纳入221例患者,平均年龄56 岁,男性占67%,排除 3 人,最终每组 109 人

结局指标:

  • 主要终点为出院时肾功能恢复(即连续 14 天无透析且生存天数)
  • 关键次要终点包括每周透析次数及 28 天无透析天数

主要结论:

  1. 肾功能恢复率:保守组 64%,常规组 50%(差值 13.8%,P = 0.04)。
  2. 每周透析次数:保守组 1.8 次 vs 常规组 3.1 次。
  3. 28 天无透析天数:保守组中位 21 天 vs 常规组 5 天。
  4. 透析相关低血压事件更少:69 vs 97 次