2024-12-22 17:56:04
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
这篇文章是对“2024 Science年度十大科学突破”的详细报道,主要概述了《科学》杂志评选出的本年度十大科学突破,包括长效HIV预防针剂lenacapavir作为暴露前预防(PrEP)的重要进展,其显著降低了HIV感染风险并展现出对抗其他病毒性疾病的潜力;嵌合抗原受体T细胞(CAR-T)疗法在自身免疫疾病治疗方面的新突破,为狼疮、硬皮病等疾病患者带来希望;詹姆斯·韦伯空间望远镜(JWST)揭示的宇宙早期星系的形成与演化机制;基于RNA干扰(RNAi)的杀虫剂在害虫控制领域的创新应用;硝基体作为真核生物固氮细胞器的发现对进化论的补充;地幔波动对大陆轮廓形成及地质活动影响的新理论;SpaceX“星舰”火箭的成功着陆及其对未来太空探索成本降低的意义;以及其他在遗传学研究、固氮细胞器发现、地幔波动研究等领域的重大进展。这些突破共同展示了2024年在科学领域的广泛进步和深远影响。
这篇文章是关于“AlphaFold 2新方法高通量预测蛋白质构象分布”的研究报告摘要,主要讲述了美国布朗大学的研究团队在Nature Communications上发表的一项研究,该研究提出了一种创新的AlphaFold 2(AF2)使用方法,通过亚采样多序列比对预测蛋白质构象分布,准确率超过80%。
论文链接: https://doi.org/10.1038/s41467-024-47504-0
文章介绍了一种基于纳米孔测序技术的端粒分析方法——Telomere Profiling,可以在单核苷酸分辨率下测量细胞中每个端粒的长度。该方法具有低成本、高度准确性及优异的可重复性。
文章链接:https://www.science.org/doi/10.1126/science.ado0431
文章使用雌雄大鼠模型,从多器官、多组学、多时间点解析耐力运动后的分子变化,并总结分析了其关联生物学通路的组织、性别差异。
论文链接:https://www.nature.com/articles/s41586-023-06877-w
文章综合了众多三代基因测序技术,进行了基因测序和组装,获得了长度为2.77 Gbp(表示十亿个碱基对)的完整的高质量小鼠参考基因组序列,填补了约7.7%的基因组空白。
excluderanges是一个用于处理和检索问题基因组区域(problematic genomic regions)的R工具包,适用于人类、小鼠和一些模式生物。它提供问题基因组区域的坐标信息,这些区域在基因组数据分析时应避免使用。统一了多个实验室生成的不同排除集(exclusion sets)的检索。
这篇文章是关于如何撰写研究计划的指南,主要介绍了撰写研究计划的重要性、步骤、技巧以及注意事项,旨在帮助研究人员更好地规划和准备研究项目。
这是关于篇文章是如何清除Docker缓存和释放系统空间的指南,主要介绍了Docker中占用磁盘空间的不同构建缓存项和如何逐个或全部清除它们,以及在持续集成(CI)环境中管理Docker构建缓存的方法。
8、OpenWDL (The Workflow Description Language (WDL))
工作流描述语言(WDL)是一种开放标准,用于用人类可读和可写的语法描述数据处理工作流。WDL使得定义分析任务、将它们在工作流中连接起来以及并行执行变得简单直接。该语言力求对所有类型的用户都易于访问和理解,包括程序员、分析师和生产系统操作员。该语言允许使用常见的模式,如散列收集和条件执行,以简单的方式表达。WDL旨在具有可移植性,并提供多种实现方式,可在各种环境中运行,包括高性能计算系统和云平台。
MuSiC的原始版本是一种去卷积方法,该方法利用跨样本scRNA-seq来估计bulk RNA-seq数据中的细胞类型比例。
MuSiC2是一种迭代算法,旨在通过使用scRNA-seq数据作为参考,在大量RNA-seq数据生成自具有多个临床条件(其中至少有一个条件与scRNA-seq参考不同)的样本时,提高细胞类型去卷积。
10、Yew | 用于创建可靠和高效的Web应用程序的Rust/Wasm框架
这篇文章主要介绍了医学科学研究过程中常用的网络数据库,包括各种专注于转录本、表观遗传基因编辑、药物预测、基因siRNA效能等方面的数据库资源。
「Openbiox 生信周刊」运维小队:
这个周刊每周日发布,同步更新在微信公众号「优雅R」(elegant-r)上。
微信搜索“优雅R”或者扫描二维码,即可订阅。
2024-12-15 20:52:19
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: ShixiangWang/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
在有些领域,理论和实验技术都已发展到了很高的水平(比如高能物理),其实验设计和分析的范式已经高度统一,没有太多任由实验人员自行裁量的空间,结果可重复性自然就高。然而像心理学这样的学科,目前的技术水平还无法做到这种程度的一致性,需要假以时日等待技术的自然进步,在此之前,要对可重复的实验比例有个理性的预期。
1、Nature Medicine │新一代三合一无创产前筛查多中心前瞻性临床研究成果
文章运用创新的无创产前筛查技术——协同等位基因靶向富集测序(COATE-seq),通过分析孕妇血浆中的游离DNA,在临床上首次运用无创的方法全面筛查包括单基因疾病、染色体非整倍体和染色体微缺失综合征等不同类型的胎儿遗传变异。
2、Nature Genetics | 揭示癌症突变背后的秘密:MuSiCal算法的突破与应用
这篇文章主要介绍了MuSiCal(Mutational Signature Calculator)这一创新分析框架及其算法在癌症突变特征分析中的突破与应用。该算法通过解决标准工作流中的主要问题,提高了特征发现和分配的准确性,为癌症研究提供了更加精确的生物标志物,并为未来的癌症诊断和治疗提供了强有力的分子基础。 - 文章链接:https://www.nature.com/articles/s41588-024-01659-0
3、Cancer Cell | 功能性解析乳腺癌基因组变异互作在精准治疗中的指导价值
文章系统性绘制了全面的乳腺癌基因组变异互作网络,结合临床治疗队列及体内外模型功能性解析了基因组变异互作对乳腺癌治疗结局的影响,提出了基于基因组变异互作的精准治疗新策略。
4、Science Bulletin | 构建TMB相关免疫浸润调节因子群,助力免疫治疗疗效预测及增效策略开发
文章开发了TMB相关免疫浸润调节因子群(MOTIF),揭示在同等水平TMB水平下诱导CD8+ T细胞浸润能力差异的原因。
这篇文章是SHAP(SHapley Additive exPlanations)模型解释的详细教程,主要介绍了SHAP值在机器学习和深度学习模型中的应用,通过分配特征的重要性值来解释模型的预测结果,并提供了多种可视化方法和具体案例来展示SHAP在实践中的使用。
6、The Surprising Things That CSS Can Animate
此网站探讨了CSS动画的意外可能性,展示了一些通常不与动画关联的CSS属性如何被用来创建有趣的动画效果,包括z-index、text-transform、content和counter-increment等属性的动画化,以及如何通过这些动画技巧实现复杂的视觉效果和交互。
这篇文章将针对最新版本的KEGG数据库进行介绍,并教大家如何利用KEGG挖掘数据
8、MEBOCOST-单细胞转录组建立代谢细胞-细胞通讯模型
MEBOCOST是一个基于python的计算工具,利用单细胞RNA-seq数据来推断代谢物,如脂质,介导的细胞间通讯事件。MEBOCOST包括一个人工管理的代谢物传感器合作伙伴数据库,并根据代谢物外流和流入的速率以及酶和传感器基因的表达水平分别定义发送和接收细胞。
为web开发人员整理的100%免费的资源和工具。
Coolify是Heroku / Netlify / Vercel等的一个开源和自托管的替代品。它可以帮助您在自己的硬件上管理服务器、应用程序和数据库;你只需要一个SSH连接。你可以管理VPS,裸金属,树莓派斯,和其他任何东西。
11、WPS-Zotero-一个用于与Zotero集成的WPS Writer插件
这个插件可以让你在Linux下写论文,再发给别人在Windows/MS Word下改,两边插入的引用可以共通(需要选择将引用存储为域)。
12、GPB | GP-Plotter:一款通用灵活的蛋白质组学质谱数据可视化工具
中国科学院大连化学物理研究所叶明亮研究员课题组发展了GP-Plotter这一可视化工具用于实现蛋白质组学质谱谱图的离子标注与图片输出。该软件可读取并展示常见鉴定工具的结果,也能实现对糖肽谱图的全面注释,并支持镜像谱图等多种显示模式。用户可以通过软件界面轻松修改图片展示的参数,并将标注谱图以矢量图等常见的图像格式输出,促进组学数据的分析与共享。 - 论文链接:https://pubmed.ncbi.nlm.nih.gov/39378133/
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)这个周刊每周日发布,同步更新在微信公众号「优雅R」(elegant-r)上。
微信搜索“优雅R”或者扫描二维码,即可订阅。
(完)
2024-12-08 21:30:40
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
封面来源:30 Advantages of Self-Discipline That Will Help You to Achieve your Goals
每个人都想成为更好的自己,却不是人人都可以做到的。因为这世上有太多的拦路虎,做一个自律的人,就要有所戒。第一戒懒得勤,以勤治惰,一勤天下无难事;第二,戒骄得稳,满招损,谦受益,戒掉骄傲自大,让自己稳步向前;第三,戒躁得缓,情绪焦躁了,人就会被带着走,学会放下浮躁,好好沉淀自己。
@NiEntropy: 作为一个还在上学的研究生,每天都要面对生活和工作压力,自律在这种情况下显得尤为重要,自律可以帮助你更好地管理时间,帮助你控制开支,避免不必要的消费,确保基本生活需求得到满足,帮助你建立健康的生活习惯,如定期锻炼、健康饮食和充足睡眠,这些都有助于缓解压力,保持心理健康。
这篇文章主要讲述了染色体外DNA(ecDNA)在癌症中的重要作用。研究发现,ecDNA是一种独立于染色体的环状DNA分子,存在于细胞核中,其不均匀遗传促进了肿瘤内遗传异质性、拷贝数高度升高,是癌症治疗抗性和患者不良预后的主要因素。三篇论文分别从ecDNA的起源及影响、肿瘤细胞中ecDNA的协同遗传、以及ecDNA的潜在治疗靶点等角度进行了深入探讨,为开发新的癌症治疗策略提供了潜在靶点
2、Nature丨发现抑制癌症免疫疗法的新CD4+ T细胞亚群
文章发现含有高剂量相同MHC-Ⅱ新抗原(HDVax)的疫苗抑制了肿瘤的排斥反应,这些HDVax诱导的抑制细胞被鉴定为细胞溶解性1型调节性T(Tr1)细胞,消除Tr1细胞或抑制其功能可使癌症免疫疗法更有效。
3、Cell|泛癌种单细胞整合分析揭示表型各异的肿瘤浸润B细胞亚类
文章整合了来自19种癌症类型患者的大规模单细胞转录组测序数据,描绘了肿瘤浸润B细胞在泛癌种水平上丰度和构成的异质性,发现了能够与CD4 T细胞进行互作并具有预后潜力的肿瘤相关非典型B细胞
文章首次在同一研究框架中结合了前瞻性临床试验、多组学样本刻画、人源化小鼠模型三大要素,于卵巢癌治疗领域内成功践行了逆转化医学的先进理念。
Evo是由Arc Institute、斯坦福大学和TogetherAI研究人员共同开发的一款大型生物基础模型,它能够处理DNA、RNA和蛋白质等生物学基础语言,并在分子到整个基因组规模(超过650k个标记长度)上进行预测任务和生成设计。Evo基于StripedHyena深度信号处理架构,拥有70亿参数,使用131k标记的上下文长度生成DNA序列,旨在提高效率和质量,超越了当前流行的Transformer架构。该模型通过GitHub仓库和Together playground提供,用户可以在浏览器中生成DNA序列,并且研究人员还计划开源一个包含2.7M个公开可用的原核生物和噬菌体基因组的大型300B标记训练数据集OpenGenome,这是目前公开可用的最大DNA预训练数据集,旨在加速DNA语言建模领域的研究。
该文章测试验证了一些假设:
通过文本生成任务来可视化Transformer的运行流程,允许使用自己自定义的文本输入,帮助你更加深入的理解Transformer的工作原理。
ggalign 是一个扩展了 ggplot2 的R包,它提供了高级工具来对齐和组织多个图表,特别是那些自动重新排序观测值的图表(如树状图),并允许用户通过精细控制布局调整和图表注释,以创建复杂的、出版质量的可视化效果,同时仍然使用熟悉的 ggplot2 语法。
Pagoda2 是一个强大的 R 包,专为分析和交互式探索大规模单细胞 RNA-seq 数据集而设计。它特别擅长处理现代 scRNAseq 数据集,这些数据集通常非常大(大约 100 万个细胞或更多)且稀疏。Pagoda2 提供了一整套工具,用于质量控制、过滤、聚类、可视化、差异表达和基因集/通路过度分散分析。
Candle 是一个专为 Rust 编程语言设计的极简机器学习 (ML) 框架。它强调性能,包括对 GPU 加速的支持,并旨在用户友好。 Candle 提供各种模型的在线演示,例如 Whisper、LLaMA2、T5、YOLO 和 Segment Anything。
癌症系统生物学是一门新兴的研究领域,旨在利用数学和计算工具来捕捉涉及复杂相互作用的生物现象的复杂性。《癌症计算系统生物学》由巴黎居里研究所的癌症计算系统生物学实验室成员撰写,旨在阐明计算系统生物学在癌症研究中的应用。书中介绍了癌症的分子生物学基础、高通量实验技术、系统生物学的工具和标准,以及数学建模在癌症研究中的应用。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「优雅R」(elegant-r)上。
微信搜索“优雅R”或者扫描二维码,即可订阅。
(完)
2024-12-01 19:35:46
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
人类细胞图谱计划最新成果登Nature封面
@kkjtmac HCA计划对于理解人类生物学和疾病具有深远的意义,它有助于揭示细胞功能、发育过程以及疾病状态下的细胞变化。HCA对数据共享的重视,不仅促进了科学发现,也为人工智能和计算工具的发展提供了丰富的资源。最近Nature发表的一篇《A cell atlas foundation model for scalable search of similar human cells》也是充分结合利用该项目的成果。
1、Nature Communications | 基于深度生成模型(PRnet)进行新化合物扰动转录响应预测加速药物研发
中国科学院赵屹教授团队和四川大学杨胜勇教授团队合作开发了基于深度生成模型PRnet的新化合物扰动转录响应预测模型,该模型的基本原理是利用深度生成模型,通过编码器-解码器架构来预测新化合物对细胞转录响应的影响。它包括扰动适配器、扰动编码和扰动解码器三个关键组件,能够将化合物结构、剂量信息与未受扰动的转录谱作为输入,预测扰动后的转录响应变化。PRnet在大规模高通量筛选数据集上进行训练,确保了其在面对未知疾病和化合物时的准确性和泛化能力。
2、Cell | 开发CRISPR-Cas13筛选技术并鉴定人类必需lncRNA
纽约大学Neville E. Sanjana团队在《Cell》杂志上发表的研究中,开发了一种CRISPR-Cas13系统,用于在转录组层面上进行大规模RNA靶向筛选,成功鉴定出778个对人类细胞生存至关重要的长链非编码RNA(lncRNA)。这项技术允许研究者以更高的特异性干扰lncRNA,避免了传统CRISPR-Cas9技术可能影响附近基因的问题。研究发现,这些必需lncRNA显示出细胞类型特异性,与蛋白质编码基因的必需性相比,它们在不同细胞系之间的共享性较低。此外,这些lncRNA在发育和癌症进展中扮演着重要角色,它们的表达变化与特定肿瘤类型的生存率相关,为未来的生物标志物发现和治疗靶点识别提供了新的视角。这项研究不仅加深了我们对lncRNA功能的理解,也为非编码RNA的系统性研究提供了强大的工具。
3、Nature | 肿瘤从多克隆至单克隆转变的早期演化新模式
理解肿瘤的早期发生机制,对实现肿瘤的早期精准筛查和防治至关重要。对早期肿瘤起源和发生机制的认识不足,极大地限制了我们在肿瘤精准筛查和早期干预上的突破。研究团队首次在哺乳动物中建立了基于碱基编辑器的细胞谱系示踪技术(称为SMALT),实现了小鼠体内单细胞分辨率的高精度谱系追踪。SMALT技术结合了胞苷脱氨酶(AID)、人工DNA条形码序列和Tet-On可诱导表达系统,通过AID介导的靶向突变和后续DNA测序,能够大规模、高精确地重建单细胞谱系树(图1a)。研究团队利用携带SMALT系统的转基因小鼠,构建了两种小鼠肠癌模型:炎症诱导肠癌模型(AOM/DSS模型)和多发性息肉模型(ApcMin/+模型)。基于高分辨率谱系树分析,团队发现大多数(66.7%)炎症诱导的早期肠癌和所有Apc息肉均表现出多克隆起源(图1b)。通过整合DNA条形码测序、全基因组测序和单细胞转录组数据,研究团队进一步发现单克隆肿瘤(图1c)比多克隆肿瘤具有更高的恶性程度,这表明单克隆肿瘤可能代表肿瘤发生的更“晚期”阶段。基于这些发现,团队提出了肿瘤发生的“多克隆向单克隆转变”新模型(图1d),为早期肿瘤演化提供了新的理论框架。
4、Nature Genetics | 基于62.6万个细胞构建迄今最全面的人类子宫内膜单细胞综合参考图谱
英国Wellcome Sanger研究所和牛津大学的研究者们在《Nature Genetics》上发表了一项突破性研究,创建了人类子宫内膜单细胞参考图谱(HECA),涵盖了62.6万个细胞,是迄今为止最全面的图谱。该图谱不仅揭示了多种之前未发现的细胞类型,还详细描述了这些细胞在月经周期中的动态变化。研究发现,蜕膜化基质细胞和巨噬细胞可能在子宫内膜异位症中失调,为理解子宫内膜异位症的病理提供了新见解。HECA的建立为子宫内膜生理学和疾病研究提供了一个重要工具,有助于开发与生理相关的人类子宫内膜体外模型系统。
Ro/e(Representation Odds Ratio to Expected)是一种用于单细胞分析的统计工具,它旨在评估特定细胞类型在不同组织中的分布是否显著偏离随机分布的期望值。这个工具提供了一种比较细胞类型在不同组织中的相对丰度的方法。 下面是对Ro/e概念的详细解释: - 随机期望值: 在没有任何生物学差异的情况下,我们期望每种细胞类型在各个组织中的分布是随机的。这个随机期望值是基于所有细胞类型在所有组织中的分布计算得出的。 - Ro/e > 1(富集): 如果某个细胞簇在特定组织中的Ro/e值大于1,这意味着该细胞簇在该组织中的细胞数量高于随机分布的期望值。换句话说,该细胞簇在该组织中是富集的,或者说在该组织中过度表示。 - Ro/e < 1(消耗): 相反,如果Ro/e值小于1,这表明该细胞簇在特定组织中的细胞数量低于随机分布的期望值。这意味着该细胞簇在该组织中是消耗的,或者说在该组织中表示不足。 - 与卡方检验的区别: 卡方检验是一种统计方法,用于确定观察到的频率与期望频率之间是否存在显著差异。然而,卡方检验只能告诉你是否存在偏离随机期望的情况,但不能告诉你具体是哪些细胞簇在特定组织中富集或消耗。 Ro/e则提供了更详细的信息,它不仅能够显示偏离的程度,还能够指出具体是哪些细胞簇在特定组织中表现出富集或消耗。 - Ro/e的应用: 在单细胞分析中,Ro/e可以帮助研究人员识别特定组织中的关键细胞类型,这些细胞类型可能在疾病状态下或特定生物学过程中发挥作用。 通过比较不同组织中细胞类型的Ro/e值,研究人员可以更好地理解细胞类型的组织特异性和功能。 总结来说,Ro/e是一个强大的工具,它通过比较实际观察到的细胞分布与随机期望值,帮助研究人员识别和理解细胞类型在不同组织中的分布模式。这种方法提供了一种量化细胞类型组织特异性的方法,对于揭示细胞类型的生物学意义和功能具有重要价值。
这是一个关于独立开发的100个思考归档,涵盖从竞争、工作模式重构、行动时机、开发者挑战、合作选择、成功策略、智囊团组建到成本控制等多个维度。这些思考旨在帮助独立开发者优化工作流程、提升效率、洞察用户需求,并在竞争激烈的市场中脱颖而出。内容强调创新和降维打击的重要性,以及在独立开发过程中避免沉没成本、寻找合作伙伴和构建个人智囊团的策略。
7、Top 25 R Packages in 2024 这篇文章主要介绍了2024年前沿的25个R语言包,涵盖了数据清理、数据总结、用户界面、代码模块化、数据处理、包管理、缺失数据处理、机器学习、表格制作、表格式可视化、深度学习、API构建、文件系统操作、相关性分析、日期时间处理、并行处理、图形组合、交互式可视化、文档自动化、Shiny应用构建、全栈开发、优化框架和地图功能等多个方面。
8、刘钝:为何说中国的知识分子应读一读竺可桢? 本文主要阐述了竺可桢作为气象学、地理学及教育学家的卓越贡献,并强调了当代知识分子应学习竺可桢的道德操守与献身精神。
9、Scplotter | 单细胞数据可视化的R包 scplotter是一个建立在plotthis的基础上,提供了一套函数,以轻松高效的方式可视化单细胞测序数据的R包,支持 TCR/BCR 分析并与 scRepertoire 兼容。
XPipe允许用户通过一个平台管理所有的服务器连接、配置文件和隧道,支持多种工具和环境,如 SSH、Docker、Podman、LXD 容器实例等。XPipe 的设计理念是高度集成和可扩展,使得用户可以轻松地添加对更多工具的支持或通过模块化扩展系统实现自定义功能。
11、frpc-desktop | 跨平台的内网穿透配置桌面客户端
frpc-desktop目前支持所有版本的 frp(Fast Reverse Proxy),旨在通过可视化配置实现内网穿透,实现远程访问公司、家庭内部的设备,简化用户操作。
12、高性能计算中文翻译计划
本书涵盖了一名合格的计算科学家需要掌握的基础知识,可以作为研究生或高级本科生的教材;或者您也可以把它作为额外的参考,也可以当作阅读练习的材料。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「优雅R」(elegant-r)上。
微信搜索“优雅R”或者扫描二维码,即可订阅。
(完)
2024-11-23 10:32:13
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
文中回顾和精心编理了对OpenAI CEO Sam Altman的专访。Sam Altman认为,“AI具有令人难以置信的扩展性,迅速渗透到了各个领域。如今你使用的产品和服务背后都包含着大量的晶体管技术,但你不会把这些公司看作是’晶体管公司’。”
@Wangcy-rachel
:目前,AI革命正迅速嵌入到我们的生活和各个行业中,AI会像晶体管一样将迅速迭代发展,并迅速应用到各个行业的产品中,这些产品将会极大方便我们的生活和工作。
1、Nat Commun | 发表迄今最大的亚洲多祖先SV图谱,揭示亚洲人群的基因组变异模式
这篇文章是关于“Nat Commun发表迄今最大的亚洲多祖先SV图谱,揭示亚洲人群的基因组变异模式”的文献摘要,主要介绍了新加坡科技研究局联合多单位研究人员在Nature Communications上发表的一项大规模亚洲人群多祖先SV研究,该研究填补了亚洲人群基因组变异图谱的关键空白,对理解亚洲人群的基因组变异模式具有重要意义。
2、Nature Methods | 新算法利用空间转录组数据构建肿瘤的“空间进化图谱”
这篇文章是关于“Nature Methods发表新算法CalicoST,利用空间转录组数据构建肿瘤的‘空间进化图谱’”摘要,主要介绍了美国普林斯顿大学和华盛顿大学的科研团队合作开发的一种新算法CalicoST,该算法能从空间转录组数据中推断等位基因特异性拷贝数变异(CNAs),并重建肿瘤的空间进化轨迹。
3、Nature | 临床功能蛋白质组学分析策略解析胰腺癌细胞间信号转导网络
该篇Nature文章开发了多维度临床功能蛋白质组学分析策略并应用于系统解析胰腺癌肿瘤微环境中的细胞间信号转导网络,为发现新的胰腺癌标志物和药物靶点提供了新的思路和系统的功能蛋白质组大数据。
在人体肠道微生态研究领域,宏基因组测序技术是一种高效的研究手段,可以快速获取微生物群的物种特征以及其发挥的功能信息。目前有很多封装好的宏基因组分析软件或者包,但是对于初学者来说,直接利用这些封装好的一站式的软件或者包,对于理解宏基因组的分析过程不是很友好,有很多“黑箱”内容没办法理解。推荐的这篇文章描述了宏基因组分析过程的每个步骤的理解内容,适合初学者用来理解和学习。
文中介绍了一篇有关B细胞免疫检查点与癌症治疗的综述,可以帮助我们了解B细胞免疫检查点与癌症治疗的详细知识和前沿热点。
文中详细总结了使用R包pwrss计算各种检验和回归的样本量的代码以及示例图。
7、Tidyplots | 让生命科学家轻松实现基于代码的数据可视化
文中介绍了一个用户友好的基于代码的工具tidyplots,可用于创建可定制的、有洞察力的图表。
8、SplitsTree App | 使用系统发育树和网络进行交互式分析和可视化
文中介绍了一个通过系统发育树和网络分析进化数据的软件SplitsTreeApp,集成了超过100种算法,并且能够处理各种输入格式,满足不同类型的数据分析需求。
9、DHR | 比blast和hmmer快几万倍同源基因鉴定新工具
本文提供了一种超快速、高灵敏度的方法——密集同源物检索器(Dense Homolog Retriever, DHR),基于蛋白质语言模型和密集检索技术来检测同源物。它的双编码器架构为同一蛋白质序列生成不同的嵌入,并通过对比较这些表示来轻松定位同源物。其无需对齐的特性提高了速度,而蛋白质语言模型则在DHR嵌入中纳入了丰富的进化和结构信息。与以往的方法相比,DHR在灵敏度上提高了超过10%,在超家族级别对于难以使用基于对齐方法识别的样本,灵敏度提高了超过56%。它比传统方法如PSI-BLAST和DIAMOND快22倍以上,比HMMER快28,700倍以上。DHR独特发现的新的远缘同源物对于揭示已知蛋白质之间的联系以及提高我们对蛋白质进化、结构和功能的认识非常有用。
10、AIGC算法必读论文清单
文中详细汇总了不同AIGC算法的必读论文、相关资料以及链接的清单,值得相关专业的朋友们阅读。
可以在 https://github.com/exacity/deeplearningbook-chinese/releases/download/v0.5-beta/dlbook_cn_v0.5-beta.pdf 下载 PDF。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「优雅R」(elegant-r)上。
微信搜索“优雅R”或者扫描二维码,即可订阅。
(完)
2024-11-17 16:39:21
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: ShixiangWang/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
中外科研课题的差异反映了两者不同的文化背景、社会需求、资源配置以及科研体制。中国在应用研究和国家战略需求上具有明显优势,而西方国家则在基础科学研究和学术自由方面拥有更强的传统和优势。
1、Nature|单细胞多组学核酸分析新技术MUSIC解析人脑高龄组织异质性
文章介绍了一种创新的单细胞多组学核酸分析技术MUSIC,这种技术首次在单细胞层面上同时捕获染色质间的multi-way相互作用、基因表达谱以及染色质与RNA的相互作用。
2、Cancer discovery | “不需要肿瘤组织”甲基化组和片段组即可预测帕博利珠单抗治疗结局
近日,加拿大多伦多大学教学医院Lillian L. Siu团队利用cfMeDIP-seq从单一数据类型中整合甲基化和片段化分析,以监测患者对ICB的应答。证明了在接受帕博利珠单抗治疗的患者中,不依赖肿瘤组织(Tumor-naïve)的ctDNA甲基化和片段化的早期变化可预测临床获益和生存期。 - 文章链接:https://doi.org/10.1158/2159-8290.CD-23-1060
3、Nat Immunol|郭安源团队与合作者联合开发并验证肿瘤免疫治疗联用药物的通用筛选方法CM-Drug
文章基于Core和Minor基因集、以及小分子化合物扰动数据库,构建出一种基于大数据的药物筛选打分计算方法——CM-Drug,用于预测和排序潜在的能与ICB疗法联用增强抗肿瘤效果的药物。
4、Nature|多模态生成式AI助手PathChat:赋能人类病理学研究
PathChat 是一个针对人类病理学定制的视觉语言通用AI助手。它在多项选择诊断题和开放式问答中均表现出色,并且能够胜任多种应用场景。PathChat 在诊断准确率和答案质量方面均优于现有的最佳商业解决方案 GPT4V 和其他公开可用的 MLLMs。随着技术的成熟,PathChat 有望在病理学教育、研究以及人机协作临床决策中发挥重要作用。 - 文章链接:https://doi.org/10.1038/s41586-024-07618-3
在潇湘晨报的“AI写作”评测中,讯飞星火不仅平均分位居首位,且获得了全场最高分56分。潇湘晨报邀请湖南知名作家、编辑作为阅卷老师,对国内五大AI大模型产品——百度文心一言、讯飞星火、阿里通义千问、字节豆包、腾讯元宝的高考作文进行评分,经过四位阅卷老师的综合打分,讯飞星火以49分的平均分高居首位。
6、多重检验和FDR
文中讲述了介绍了多重假设检验时FDR的计算方法,并从其它角度解释了FDR方法的含义。
介绍了十多种R语言打开方式及常用小tips
列举了多篇顶刊文中的中的配色十六进制代码
提供了仪表盘的成套解决方案。
Apache Arrow定义了一种与语言无关的列式内存格式,用于平面和分层数据,旨在现代硬件(如CPU和GPU)上进行高效的分析操作。Arrow内存格式还支持零拷贝读取,以实现无序列化开销的闪电般快速数据访问。目前有非常多语言的实现,非常值得一试。
13、寇享学术
寇享学术网站(Kouxiang Academic)是一个为学术界提供各类服务的平台,核心目的是为学术界的研究人员提供一个集学术资源共享、问题讨论、科研支持于一体的平台,帮助学者更高效地开展科研工作,获得所需的工具和资源。同时,它也为学术交流提供了一个线上互动的渠道。
14、基因组学中的机器学习
近日,Nature Reviews Genetics系统整理关于机器学习方法和在基因组学中应用的关键综述。方法部分涵盖:如何选择合适的机器学习方法?方法选择和使用上有哪些潜在的“坑”?如何使用基于深度学习的方法处理高维的基因组数据?如何增加模型可解释性并从中获取遗传学机制见解?
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)这个周刊每周日发布,同步更新在微信公众号「优雅R」(elegant-r)上。
微信搜索“优雅R”或者扫描二维码,即可订阅。
(完)