2024-11-15 18:28:00
DOI:10.1038/s41586-021-03544-w
作者:Azalia Mirhoseini, Anna Goldie, Mustafa Yazgan, Joe Wenjie Jiang, Ebrahim Songhori, Shen Wang, Young-Joon Lee, Eric Johnson, Omkar Pathak, Azade Nova, Jiwoo Pak, Andy Tong, Kavya Srinivasa, William Hang, Emre Tuncer, Quoc V. Le, James Laudon, Richard Ho, Roger Carpenter, Jeff Dean
文章类型:journalArticle
品读时间:2024-11-14 18:21
本文提出了一种基于强化学习的快速芯片设计方案;其中价值网络使用已标注进行有监督学习,策略网络则先借助价值网络的主干部分对输入关键信息进行嵌入表示,然后使用 PPO 算法根据完成芯片设计方案的奖励反馈进行参数更新。奖励函数的设计则依赖于传统的芯片性能评价指标。
在实验分析阶段,AlphaChip 体现出了超越传统算法和人类专家的芯片设计能力,并且对训练时未见过的芯片设计也具有较好的适用性。AlphaChip 在后续的现实实践中也逐步证明了自己的独特价值。
- 整体的实现偏传统 RL,但对于芯片领域具备开创性
- 网络架构以 CNN 为核心,存在预测性能改善的空间
- 不适用于类型较多的标准单元,需要与传统算法配合
前置知识:芯片入门
芯片的层次化结构(由粗到细):
芯片设计相关的前置概念:
芯片平面布局规划:
AlphaChip 的芯片布局规划过程(左:预训练前;右:预训练后)
芯片平面布局规划方法总结:
注意区别:DREAMPlace 的重点是面向标准单元层次的布局优化,而不是面向宏层次的布局优化;而本文提出AlphaChip 则重点是面向宏层次的布局优化
整体设计与训练概述:
将芯片布局规划问题重新表述为顺序马尔可夫决策过程(MDP),其包含四个要素:
核心问题:需要定义一个神经网络,给出累积奖励最大化下的最佳动作
目标函数: $$ J(\theta,G)=\frac{1}{K}\Sigma_{g\sim G}E_{g,p\sim \pi_{\theta}}[R_{g,p}] $$
$$E_{g,p}[R_{g,p}]=\mathrm{Wirelength}(g,p)-\lambda \mathrm{Congestion}(g,p)-\gamma \mathrm{Density}(g,p)$$
在本文实验中,设置超参数 $\lambda=0.01$,$\gamma=0.01$;密度最大值为 0.6(硬约束)
策略和价值网络的整体架构:
Edge-GCN 图卷积神经网络:
$$ e_{ij}=\mathrm{fc}_{e}(\mathrm{concat}(v_{i}|v_{j}|w_{ij}^{\mathrm{e}})) $$
$$v_{i}=\mathrm{mean}_{j\in\mathrm{Neighbours}(v_{i})}(e_{ij})$$
策略网络的核心要素:
优化目标-最大化累积奖励函数:
为了保证每次迭代的运行时间足够小,需要简化奖励函数的计算
奖励函数的简化:
\mathrm{HPWL}(i)=(\max_{b=i}{x_{b}}-\min_{b=i}{x_{b}}+1)
+(\max_{b=i}{y_{b}}-\min_{b=i}{y_{b}}+1) $$ $$ \mathrm{HPWL}(\mathrm{netlist})=\sum_{i=1}^{N_{\mathrm{netlist}}}q(i)\mathrm{HPWL}(i). $$
用于策略网络的参数更新的 PPO 方法,其目标函数如下: $${\cal L}^{\mathrm{CLIP}}(\theta)=\hat{E}_{t}[\operatorname*{min}(r_{t}(\theta)\hat{A}_{t},\operatorname*{clip}(r_{t}(\theta), 1-\varepsilon, 1+\varepsilon)\hat{A}_{t})]$$
基于物理模拟的 FD 算法(简单描述):
模拟退火 SA 算法(简单描述):
不同策略的性能对比:
策略网络的预训练和微调:
不同数据集下的预训练和微调:
Zero-shot 性能对比,Edge-GCN vs GCN:
放置策略可视化(zero-shot VS 微调):
消融实验,寻找最佳的拥挤度权重:
抗噪声实验:选择不同的随机种子对最终布局的性能影响可忽略(偏差约 0.22%)
论文附录中还有一张自研的 GPU 芯片的真实图片,但是被打码了,啥也看不着...
2022 年 4 月,AlphaChip 解决了之前开源代码的可用性问题
2023 年 9 月,AlphaChip 一文因细节缺乏与可复现性有限受到质疑
2024 年 11 月,开源了预训练的模型文件(官方不推荐直接用)
2024 年 11 月,谷歌 Deepmind 团队的官方博客文章补充:
Deepmind 团队的 Alpha 系列模型对比:
模型类型 | 年份 | 领域 | 状态空间 | 基础架构 | 更新策略 | 算法辅助 | 约束 |
---|---|---|---|---|---|---|---|
AlphaGo Zero | 2017-10 | 围棋 | ~10^360 | CNN | 自我对弈 | MCTS | 围棋规则 |
AlphaChip | 2021-06 | 芯片设计 | >10^2500 | Edge-GCN | PPO | FD 物理模拟 | 线长和密度 |
AlphaFold2 | 2021-08 | 蛋白质 | 历史库 | Evoformer | 端到端 | OpenMM | 刚性,结构 |
AlphaGeometry | 2024-01 | 数学几何 | 定理合成 | LLMs | 微调 | 推理引擎 | 规则,辅线 |
2024-11-14 18:48:00
芯片是一套实现特定功能的电路,它具有模块化的特点
模块化的作用:
芯片的设计流程:
常见的芯片类型:
参考:
2024-11-13 10:06:00
DOI:10.1182/blood.2023021172
作者:Merlin Engelke, Cynthia Sabrina Schmidt, Giulia Baldini, Vicky Parmar, René Hosch, Katarzyna Borys, Sven Koitka, Amin T. Turki, Johannes Haubold, Peter A. Horn, Felix Nensa
文章类型:journalArticle
品读时间:2024-11-13 10:06
基于 LSTM 实现了不同科室患者的血小板输注个性化实时预测
最终模型能够在高 AUC-PR 下进行未来 24h 是否输注血小板的风险评估
考虑的特征足够丰富,并围绕不同科室的特性进行单独建模
论文细节丰富,对模型的实用价值和局限性进行了充分讨论
在部分科室的预测性能较差,可能存在持续改善的空间
背景知识:
数据来源:
滑动时间窗口的采样频率为 12h,即每个患者每天产生 2 条数据样本
窗口的最大长度为 60,即最多记录该患者过去 30 天内的特征时序信息
纳入标准分析:
预测目标:识别患者在接下来的 24h 内是否需要血小板浓缩液(PCs)
由于血小板计数的检验次数有限,因此会在两次检验之间进行线性插值以丰富数据
患者数据分组分析:
特征的处理和转换:
模型架构:
训练细节补充:
建模性能对比:
模型的可解释性分析:
讨论和补充:
2024-11-12 17:46:00
DOI:10.1001/jamanetworkopen.2022.46637
作者:Seung Mi Lee, Garam Lee, Tae Kyong Kim, Trang Le, Jie Hao, Young Mi Jung, Chan-Wook Park, Joong Shin Park, Jong Kwan Jun, Hyung-Chul Lee, Dokyoon Kim
文章类型:journalArticle
品读时间:2024-11-12 17:46
围绕术前和术中特征构建大输血的实时预测模型,并取得了较好的预测性能
基于模型输出构建“大输血指数”,具备实时提示大输血风险的临床指导意义
- 分别从特征、预测场景、模型类型等角度构建多种模型
- 从医疗角度考虑,进行分析和不同人群下的模型验证
背景知识:
数据来源:
主要结局:大输血定义为在一小时内输注 3 个或更多单位的红细胞
术前特征说明:
术中特征说明:
2002年的一项分析了212例患者的荟萃分析显示,出现ST段抬高心电图的患者30.2%存在左室肥厚、25.9%存在急性心梗、16.5%存在束支阻滞、其他还有心包炎、室壁瘤等,临床上还有应激性心肌病、Brugada综合征、主动脉夹层等
研究人群的特点:
模型设计与选型:
建模性能(AUROC 和 AUPRC):
不同模型的性能对比:
/ 讨论与补充:
2024-11-04 17:02:00
本文主要内容参考自中国数字科技馆的每月流言榜 和个人网络收集
本文标题致敬了一款个人很喜欢的科普电视节目《流言终结者(MythBusters)》
2024-11-01 10:11:00
从内容的广度、普适性和短期及时性的角度考虑:信息>工具>知识
从内容的深度、专业性和长期有效性的角度考虑:信息<工具<知识
信息管理的载体:RSS 体系
RSS 用久了会发现一个很现实的问题:信息的冗余(可能需要一个冗余信息合并的机制?)
未来规划:比较看好的一个替代工具是 Follow,但目前(241101)细节还需要打磨
工具管理的载体:书签 体系
最初试用 Obsidian 来进行工具管理,但发现流程繁琐,无论是记录还是更新
当前的方式化简了记录的过程,还依然存在更新繁琐的问题,此处需要替代品?
未来规划:半自动化分类,引入 AI 总结,引入定期的资源有效性巡检
知识管理的载体:笔记 体系
扩展资料:Obsidian-第三方教程 、Obsidian-常用插件总览 、 7_software/编辑写作/Obsidian/2024年Obsidian新玩法总结 未来规划:增强笔记间的关联性;考虑引入自动化多平台的发布机制(难)
信息是三大体系的源头,需要进行严格的管理和控制:
当你规划每日的信息摄入时间为 1h 时,你只需要耗时 1h 的信息量(不然永远看不完)
书签是对信息的分流,对于不需要特意消化的优质信息的保留
Obsidian 官方推出的剪藏机制可能是一种对书签的友好替代(不用怕网页失效了)
知识是加工沉淀后的信息,而个体的知识产出量是有限的
知识体系的建立和完善是一个不断推翻再开始的过程
个人反思:目前在已有知识的回顾复习这一块没有做到太好
当你受益于这个世界时,你就需要学会对这个世界反哺
融入知识的正向循环,促进整个人类知识体系的新陈代谢
不同体系的反哺:
当整个知识体系相对完善时,还会考虑进行网站的 SEO 优化?
目前的反哺还只是单纯的对互联网内容补充,其中大部分可能是无意义的,但或许某些文章中记录的某几个片段会引起某个人的感慨,又或对某个人问题的解决有所启发
其他反哺的思路:公众号?播客?视频号?知识星球?个人课程?