2025-05-25 17:59:28
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
文章探讨了中外科研课题选择的差异,以脑研究为例,指出国外多选择果蝇等简单生物进行基础研究,而国内则倾向于选择猴等复杂生物。文章质疑这种差异是否源于中国科研界对企业的过度依赖,以及对基础研究积累和技术磨练的忽视。同时,指出国外科研遵循从简单到复杂的逻辑,先在低等生物上积累经验、改进技术,再逐步向高等生物拓展,而国内部分科研项目可能缺乏这种循序渐进的规划,甚至存在企业主导科研、套取国家经费的现象。 文章揭示了中外科研在选题和组织方式上的差异,强调了基础研究重要性。中国科研应注重循序渐进积累,避免盲目追求复杂课题,同时警惕企业过度介入科研可能带来的问题,确保科研回归科学本质。
1.Cell Genomics | 新一代基因组浏览器用以整合单细胞和空间多模态数据可视化
西南大学王翊课题组在《Cell Genomics》期刊发布新一代基因组浏览器SGS,用于整合单细胞和空间多模态数据的可视化。该工具用户友好,支持多操作系统,无需编程即可安装使用;具备强大的多用户协同功能,方便团队实时协作和数据共享;支持多种单细胞和空间组学数据的可视化,提供丰富的交互功能和数据比较模式;此外,SGS兼容多种数据格式,与主流分析工具无缝对接,为生命科学研究提供了高效便捷的新工具。
2.Cancer Cell | TCR测序解码鼻咽癌免疫监视密码,突破早期诊断瓶颈
研究首次通过大规模T细胞受体(TCR)免疫组库测序,锁定鼻咽癌特异性T细胞克隆,构建可提前6-12个月预警鼻咽癌发生的T-score模型,并揭示EB病毒(EBV)与肿瘤抗原双重识别的免疫监视机制,为鼻咽癌早诊与细胞治疗提供全新策略。
3.Cell Systems | 基于邻近标记的空间可视化蛋白质组学新技术
研究基于邻近标记策略开发了一种具有细胞类型分辨率的空间可视化蛋白质组学方法PSPro,该方法可以在亚微米尺度的空间分辨率下一次性标记和富集组织切片中目标细胞类型的蛋白质组,流程简单方便,具有大规模应用潜力。
4.使用Cherry Studio + MCP实现自动搜索及下载arxiv文献
一篇关于利用Cherry Studio及MCP实现自动搜索arxiv文献的教程。下载速度和网络有关系,普通网络下载arxiv可能会比较慢。下载完毕后会自动将PDF论文转换成markdown形式方便AI阅读。如果需要PDF原文,我们也可以在提示词中直接让MCP保留PDF原文。
5.Nature综述 | Transformers与基因组语言模型
综述将目光投向基因组数据,尝试用Transformer这一AI领域最强大的模型,去挖掘DNA序列中的隐含信息,帮助科学家更高效地预测基因调控、理解突变影响、甚至解析未知的生物机制。 - 文章链接:https://www.nature.com/articles/s42256-025-01007-9
在论文发表、项目申报等场景中,生信人员经常需要生成各种可视化图表来辅助分析和展示研究结果。而想要发好文章,我们通常会参考别人发表的高分论文,希望能复现其中的图片效果。笔者为了帮助生信人员解决这一问题,将前期探索的工作逻辑梳理成一个框架。按照这个框架操作,可以基于AI模型实现图片复现。
7.FeedMe
FeedMe 是一款由 Seanium 开发的 AI 驱动的 RSS 阅读器,旨在通过人工智能技术重新定义 RSS 阅读体验。它支持多源 RSS 聚合、AI 摘要生成、定时更新机制、分类浏览、明暗主题切换等功能,并且可以轻松部署到 GitHub Pages 或通过 Docker 在本地服务器上运行。该工具适合希望一站式了解多个信息源动态,但又不想使用传统 RSS 阅读器的用户,提供了轻量级、自由配置和开源的解决方案。
8.RedNote-MCP|超好用的小红书内容访问MCP服务
RedNote-MCP 是一款专门用于访问和分析小红书内容的工具,基于 MCP(Model Context Protocol)协议开发。它可以帮助内容创作者和企业用户更高效地获取小红书上的笔记和评论内容,支持 Cookie 持久化、关键词搜索笔记、命令行初始化等功能,方便开发人员快速集成和使用。
9.mLLMCelltype | 基于大语言模型的单细胞RNA-seq数据自动注释工具
mLLMCelltype是一个创新的R包和Python包,能够利用大型语言模型(如Claude 3.7、Gemini 2.5等)自动注释单细胞RNA-seq数据中的细胞类型。该工具通过多LLM共识机制提高注释准确性,支持多种LLM模型,可以处理各种组织和物种的单细胞数据。相比传统方法,mLLMCelltype无需预训练数据集,适用性更广,特别适合分析罕见细胞类型或新型数据集。使用者只需提供表达矩阵和标记基因,即可获得准确的细胞类型注释结果。
GeeksforGeeks 是一个专注于计算机科学和编程知识的在线学习平台,提供广泛的编程教程、算法、数据结构、编程语言(如 Python、Java、C++ 等)的讲解,以及面试准备、在线课程和实践练习等功能。它旨在帮助程序员和计算机科学爱好者提升技能、准备面试和学习新技术。
11.首个中国开源三万人多组学样本库:西湖生物样本库数据批量下载详细步骤
西湖生物样本库(Westlake BioBank for Chinese, WBBC)是一个以人口为基础的前瞻性研究项目,其主要目的是更好地理解遗传和环境因素对从青少年到老年人生长发育的影响。WBBC计划招募至少10万个中国样本。目前,WBBC试点项目已招募约35,000名参与者,包括约28,000名平均年龄为19岁的青少年和约7,000名65岁以上的老年人,覆盖中国31个省级行政区域。研究人员若需要访问原始遗传数据,必须获得中华人民共和国科学技术部和西湖大学机构审查委员会的许可。且研究必须符合中国人类遗传资源管理(HGRAC)的规定。
这篇文章推荐了人工智能时代单细胞领域必读的10个细胞基础大模型,并提供了模型链接。文章指出,这些AI基础模型是生物医学与AI交叉的范例,通过大规模参数和深度学习架构,能够实现对细胞行为的深度解析,推动生命科学从“试错实验”向“数据驱动”范式转变。文章还提出了开放性讨论问题,包括AI模型的下游任务、效果对比传统算法工具的优势,以及AI模型可以实现而经典软件无法达到的分析场景。
「Openbiox 生信周刊」运维小队:
这个周刊每周日发布,同步更新在微信公众号「优雅R」(elegant-r)上。
微信搜索“优雅R”或者扫描二维码,即可订阅。
2025-05-14 22:16:21
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
中国科技期刊卓越行动计划(以下简称“卓越计划”)二期的名单甫一公示,就引发了生命科学领域的一场舆论风暴。因为这个领域的明星期刊《Cell Research》落选“英文期刊领军项目”。
这可能是中国期刊界最重要的评选活动,它把入选的463个项目分成了6大类,第一类的“英文领军期刊”有50本期刊入选,将会在未来5年中获得每年不超过150万的资助,第二类的“英文梯队期刊”有150本期刊入选,其中就包括《Cell Research》,同样获得5年稳定资助,但资助金额不超过50万一年,只有“英文领军期刊”的三分之一。
与此同时,一封名为“国际一流期刊《Cell Research》在国内只能评B档?”的公开信立刻在科学圈开始流传,多位生命科学领域的科学家都对此颇为微词。
1.Nat Commun | 使用机器学习算法揭示癌症进展中的DNA复制时序动态异质性
癌症治疗的主要挑战之一在于肿瘤细胞的高可塑性和异质性,这使得对肿瘤发生机制的研究以及有效疗法的开发变得复杂。为了更好地理解这些现象,2025年2月8日,来自法国居里研究所的研究团队在Nature Communications上发表了相关研究。该研究开发了一种名为“Mix ‘n’ Match”(MnM)的机器学习工具,能够从复杂的单细胞全基因组测序数据中精准解析DNA复制时序(Replication Timing, RT),并揭示癌症进展中的基因组异质性。 - 文章链接:https://doi.org/10.1038/s41467-025-56783-0
2.NCB背靠背 | 江龙达/李炜/Rahul Satija推出新计算方法分析单细胞扰动,揭示细胞对扰动的不同响应机制
在功能基因组学和单细胞技术迅速发展的今天,理解细胞对扰动(Perturbation)的响应如何在单细胞层面产生差异,以及背后的分子机制成为了生物学和医学研究的关键问题。2025年2月26日,New York Genome Center的Rahul Satija团队和美国Children’s National Hospital 的李炜团队在Nature Cell Biology背靠背发表的两篇研究论文,分别开发了全新的单细胞扰动测序实验和分析方法, 为破解基因组调控网络和通过扰动响应寻找新的生物学知识提供了强大工具。
3.Nature | 王凌华/Anirban Maitra团队联合揭示转移性胰腺癌转录组与癌细胞谱系表型可塑性的空间图谱
2025年4月23日,美国德克萨斯大学MD安德森癌症中心王凌华教授和Anirban Maitra教授领导的合作团队在Nature在线发表题为Spatial mapping of transcriptomic plasticity in metastatic pancreatic cancer的研究论文。该研究利用空间转录组技术,对来自13位胰腺导管腺癌(PDAC)患者的55份肿瘤原发灶及多器官转移灶(包括肝、肺和腹腔转移)样本进行了高分辨率空间解析,系统绘制了癌细胞的克隆结构、谱系表型及肿瘤微环境(TME)的空间图谱。
4.Cell|整合16.8万个样本,构建超大型全球肠道微生物组数据库
近日,芝加哥大学Ran Blekhman团队在Cell杂志上发表了题为Integration of 168,000 samples reveals global patterns of the human gut microbiome的文章。该研究整合了来自68个国家的168,464个16S测序样本,构建了一个全球人类肠道微生物组数据库(microbiomap.org),并分析了地理和技术因素对肠道微生物组的影响。 - 文章链接:https://doi.org/10.1016/j.cell.2024.12.017
指标 | RData | rds | qs |
---|---|---|---|
保存时间(秒) | 23.63 | 23.50 | 3.52 |
加载时间(秒) | 3.14 | 3.12 | 1.27 |
文件体积(MB) | 886.41 | 886.41 | 264.05 |
针对单细胞数据分析的导入和存储这一常见任务场景,作者测试并提出 qs 是目前最佳的实践方案。
qs | fst | saveRDS |
---|---|---|
Not Slow | ✔ | ✔ |
Numeric Vectors | ✔ | ✔ |
Integer Vectors | ✔ | ✔ |
Logical Vectors | ✔ | ✔ |
Character Vectors | ✔ | ✔ |
Character Encoding | ✔ | (vector-wide only) |
Complex Vectors | ✔ | ❌ |
Data.Frames | ✔ | ✔ |
On disk row access | ❌ | ✔ |
Random column access | ❌ | ✔ |
Attributes | ✔ | Some |
Lists / Nested Lists | ✔ | ❌ |
Multi-threaded | ✔ | ✔ |
7.在 VS Code 中免费使用 DeepSeek-R1!
前不久微软正式官宣,DeepSeek R1 强势登录微软 AI 平台,Azure AI Foundry 和 GitHub Models 都有它的身影。
本文将介绍如何在 VS Code 里,通过 AI Toolkit Extension 与 DeepSeek 模型进行交互。
推文介绍了2024年度“中国生命科学十大进展”,包含7个知识创新类和3个技术创新类成果。
9.barba
Barba.js——又名Barba——是一个小型且易于使用的库,可帮助用户在网站页面之间创建流畅的过渡。它可以使网站像SPA(单页应用程序)一样运行,有助于减少页面之间的延迟,以最大限度地减少浏览器HTTP请求,同时增强用户的网络体验。
10.Rspack|基于 Rust 的高性能 Web 打包工具
Rspack 是一个基于 Rust 编写的高性能JavaScript 打包工具, 它提供对webpack 生态良好的兼容性,能够无缝替换 webpack,并提供闪电般的构建速度。
在项目管理中,甘特图作为一种直观的时间管理工具,被广泛应用于展示项目的进度和计划。然而,传统的甘特图绘制工具往往操作复杂,难以满足科研工作者和项目经理对高效、美观的追求。今天,我们将一起探索一个强大的R包——gantrify,看看它是如何帮助我们用R绘制出既高效又美观的甘特图的。
12.顶刊美图社 1-40 期
13.生信百晓生2024年单细胞、空间转录组、免疫、组织学、会议报告、教程资源、注释marker推文合集
更新在这里
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)
2025-04-26 12:45:26
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
我国各学科最具影响力期刊论文数量、高水平国际期刊论文数量及被引用次数继续保持世界第1位,但研究者发现中国排名前10%的论文有62%的引用来自国内。
@Wangcy-rachel
:中国排名前10%的论文大部分引用来自国内,说明这些论文在国内学术界得到了广泛关注和认可,但这些高水平论文在国际上的影响力相对有限。
1、Leukemia|针对儿童癌症的液体活检Panel仅需1mL血浆即可检测多种不同基因组改变
研究开发了一种针对儿童癌症细胞游离DNA样本中不同体细胞基因组变异的深度测序方法PeCan-Seq,该方法可通过DNA捕获Panel对儿童癌症相关的357个基因进行深度测序,以从头检测染色体拷贝数变异(CNA)和单基因变异。
文章全面绘制了人类健康与疾病蛋白质组图谱,并结合人工智能大数据分析方法构建了疾病诊断预测模型以及发现了26个药物治疗新靶点,为精准医学的实施提供了重要科学依据。
3、Nat Commun∣AI驱动的肽从头测序精准算法π-PrimeNovo
文章研发了首个基于非自回归模型的肽从头测序算法π-PrimeNovo,它彻底颠覆了传统的自回归生成方式,实现了一次性生成整个序列的能力。通过Transformer的自注意力机制,π-PrimeNovo能够让每个氨基酸在生成过程中同时参考序列中其他位置的信息,从而充分捕捉氨基酸之间的双向依赖关系,显著提高了预测准确性。
本文介绍了利用ggplot2绘制森林图的方法。
OpenAI添加了DALL-E 3生成图像的功能,意在为用户提供基于LLM的基本图像绘制,并允许用户不断要求模型“让它更X”,其中X可以是任何东西。
有研究通过长达22.3年的随访,对1487名受试者进行了深入研究发现:频繁促炎饮食会显著提高痴呆症的发病风险。
推文中介绍了如何使用iSeq下载原始测序数据,iSeq可用于从GSA, SRA, ENA, 和 DDBJ数据库下载原始数据和元信息。
推文分享了一款用于常规组学分析的工具cOmicsArt,cOmicsArt目前支持常规转录组、蛋白组+代谢组三类常见组学,常规的分析内容均包含,并支持将分析的数据及R代码导出。
张泽民实验室致力于用前沿的基因组学和生物信息学技术来解决癌生物学中的重要问题,结合计算(干)和实验(湿)方法来揭示肿瘤发生、微环境和对药物响应中的系统变化和具体遗传因素,以推进癌症免疫治疗和靶向治疗的发展。首先,用单细胞测序技术来研究肿瘤微环境。第二,将尖端生物信息学方法应用到癌基因组学大数据,发现新型癌症靶点和标记物。第三,开发原创性的生物信息学工具。归纳总结,张泽民团队代表性工作主要是三个方向:①肿瘤微环境各类细胞单细胞图谱;② 肿瘤免疫治疗图谱;③ 生信工具。
该推文汇总了张院士团队长期在单细胞领域的工作进展。
11、AI、大模型、深度学习、算法与生物学(Evo、GENERator)及单细胞和空间转录组 相关文献、讲座和软件列表
推文分享了AI、大模型、深度学习、算法与生物学有关的相关文献、讲座和软件列表。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)
2025-04-13 11:14:21
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
迄今为止最大的脑图 - 图源
中美在数据和技术领域的紧张关系加剧,美国于2024年底推出了针对跨境数据的新规,并将在2025年开始实施。该新规旨在限制中国等“受关注国家”获取美国人的敏感个人数据,这对中国科研人员使用美国的公共医学和学术数据库可能带来重大影响。
涉及大量美国人健康/基因信息的数据库(如SEER, TCGA, dbGaP等)在新规下对中国几乎封闭,而以公开文献和统计为主的资源(如PMC, ClinicalTrials.gov, CDC数据)仍然开放。介于两者之间的是一些已经公开但含匿名个体数据的资源(如GEO, 部分NIH数据),目前看大概率继续开放,但需关注政策动向。
@ShixiangWang
: 协作共享有时比想象中艰难。万事万物都遵循着动态的平衡。之前是全世界分析M国数据,就政策导向看,以后会产生一些相对的数据孤立。个人观点,长久看,对M国也未必是好事。我们国家也确确实实需要有真正意义上类似 TCGA 的计划,而不是坐地分钱。
1、Science | 5’端单细胞测序绘制CD4+T细胞双向转录增强子多模态图谱
团队利用5’端单细胞RNA测序方法构建T细胞双向转录增强子多模态图谱,同时开发了ReapTEC方法,实现高核苷酸分辨率和高灵敏度鉴定btcEnhs,捕获真正的增强子区域。
2、Nat Methods | 系统性评估11种空间组学技术
基于测序空间转录组技术(sST)的快速发展改变了在空间背景下测量基因表达的能力,被Nature Methods评为2020年的年度技术。然而技术的发展应该关注哪些指标,如何对这些技术进行标准化的多维度评估和比较,尚未有清晰的解决方案。为了解决技术标准不清晰,评估方案混乱等问题,研究团队对 11 种 sST 方法进行了全面比较(包括 10X Genomics Visium(基于 poly-A 和基于探针的两种方法)、DynaSpatial、HDST、BMKMANU S1000、Slide-seq V2、Curio Seeker(Slide-seq 的商业版本)、Slide-tag、Stereo-seq、PIXEL-seq、Salus 和 DBiT-seq)。他们使用具有明确形态的参考组织来评估它们的性能。研究建立了一套具有不同组织结构特征的标准参考组织,包括胚胎小鼠眼睛、成年小鼠海马区和嗅球。在进行统一的组织块制备和切片后,他们使用11种sST方法对这些组织进行了空间转录组学分析,生成了一个跨平台的数据集(称为cadasSTre),以便直接比较空间分辨率、分子捕获效率和分子扩散。
3、Nat Med|AI驱动的血液WGS ctDNA检测平台——MRD-EDGE,可高灵敏度预测癌症复发
团队开发了一种由机器学习驱动的血浆全基因组测序(WGS)ctDNA信号富集平台——“MRD-EDGE”,可以极高敏感度监测肿瘤负荷。
Ming Tommy Tang 在文章中介绍了学习的4步经验,涵盖了具体的学习资料,主要步骤如下:
探索 after_stat() 的逻辑,一窥 ggplot 内部机制。
6、华盛顿大学蛋白质设计研究所创新之道及其对生命科学新型研发机构建设的启示
文章介绍了华盛顿大学蛋白质设计研究所的历史沿革与创新成就,分析了蛋白质设计研究所创新特点,总结了有关生命科学新型研发机构建设的启示。
7、zotero-actions-tags | 自定义 Zotero 工作流程
8、玉竹
玉竹是一套简洁的内容管理(博客、微博客)、财务管理(记账)系统。
10、canvasxpress | 深入数据分析和无缝集成的JavaScript库
以交互式和可扩展的视觉呈现更快地转换数据。有对应 R 包 binding:https://github.com/neuhausi/canvasXpress 。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)
2025-03-31 01:41:27
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
- 来源:Peter Glagowski
本书作者提出了科学探索的双重维度——“夜间科学”与”日间科学”。前者如同混沌的创意温床,充满无序的灵感碰撞;后者则是严谨的逻辑验证,构成系统化的知识体系。研究指出,突破性创新往往诞生于夜间科学的自由探索过程中,而对话尤其成为激发创意的关键媒介。在交流中,语言具有独特的思维整理功能:它能迫使混沌的思维显影,将朦胧的灵感转化为线性表达,进而暴露出潜藏的思维断层。更重要的是,学术伙伴的即时反馈既能增强研究者的信心,又有效消解了学术探索中的孤独感。这种创造力的绽放,终究需要一个安全包容的环境——当研究者无需担忧观点的幼稚性时,最大胆的创新才有可能破茧而出。
@NiEntropy : 看了三遍,先是看了一遍公众号翻译,把原文找出来看了一遍,让R1也看了一遍并进行拓展。大晚上的给我看激动了,所以未来我们也可能会成为可以改变世界的小团队吗!加油everyone!
@R1版《陋室铭》: 人不在多,协契则灵。思不在繁,互启则明。 - 文章连接:https://www.nature.com/articles/s41587-023-02074-2
1、Nat Methods | 西湖大学团队开发非侵入式谱系追踪的新工具
文章开发了一款谱系追踪新计算工具 MethylTree。MethylTree无需基因编辑,就可以精准地、以多组学的方式追踪细胞谱系,开启了非侵入式谱系追踪的新篇章。 - 文章链接:https://www.nature.com/articles/s41592-024-02567-1
2、scCancerExplorer | 人类泛癌单细胞多组学在线分析工具
南京医科大学研究团队推出人类泛癌单细胞多组学在线分析工具scCancerExplorer。该数据库集成了基因表达、染色质、蛋白质活性、DNA甲基化和DNA复制等分析模块,支持用户友好操作,能通过简单点击探索癌症相关数据。scCancerExplorer免费访问,为癌症研究提供有力工具
3、The Innovation | 精准用药,基因先行:首个中国人药物基因组学图谱
文章利用来自全国的206,640名中国个体的低深度全基因组测序数据,成功绘制了首个中国人药物基因组图谱,并构建了相关数据库,方便公开免费访问查询。 - 文章链接:https://doi.org/10.1016/j.xinn.2024.100773
4、 从简单到复杂的漫长之旅
本文以约翰·梅纳德·史密斯的经典理论为框架,系统梳理了生命演化史上的八大“变形记”——从原始RNA分子到真核细胞,从无性繁殖到人类社会——每一次转变都标志着生物复杂性的跃升。
谷歌 DeepMind 宣布最新版 AI 蛋白质结构预测工具 AlphaFold3 正式开源,科学家们可以下载其底层代码,并将其应用于非商业领域。
这真是雪中送炭!AlphaFold 3 近期已正式开源,现在就有技术大佬分享了详细的 Conda 环境配置和运行教程,想尝鲜的小伙伴们赶紧动手试试吧!
GEO癌症分析套件(GCAS)是一个多功能的R包,旨在分析和可视化癌症研究中的基因表达数据。GCAS允许对正常样本和肿瘤样本之间的基因表达进行比较、相关性分析、免疫浸润分析、差异表达分析、共表达分析和富集分析。它包含一个Shiny应用程序,用于交互式可视化,也可以直接在R环境中用于高级脚本编写。GCAS非常适合希望高效、有效地探索癌症基因组数据的研究人员、临床医生和生物信息学家。
PROGENy是一种用于推断信号通路活性的工具,特别适用于基因表达数据的分析。它通过整合大量公开的扰动实验数据,生成一组核心基因集,用于评估信号通路的活性。与传统的通路富集分析方法不同,PROGENy能够更精确地反映信号通路的活性,因为它考虑了翻译后修饰和下游基因的影响。
文章介绍了如何利用 R 绘制双分组倾斜火山图。
10、 读《单细胞组学基础》
《单细胞组学基础》系统介绍了单细胞组学技术的发展、核心方法和应用场景,涵盖转录组学、表观组学、代谢组学及空间组学等多个领域。书中既包含理论基础,也强调实践操作,特别是算法与数据分析部分深入浅出,助力读者掌握核心技能。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)
2025-03-25 12:16:33
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
科学的大厦建立在大量可重复的研究结果之上,然而,近年来,种种迹象表示,在生物医学领域,大量的研究结果似乎不可重复。比如,Plos Biology 最近发表的一篇对近 2000 名生物医学研究人员的调研报告中,在最终收回的问卷中,72%的参与调研的活跃一线科研人员认同生物医学领域存在可重复性危机,其中 27%的参与者甚至认为这场危机非常严重。
由此可见,可重复性的问题在生物医学领域可谓旷日持久。解决这一问题,绝不会是朝夕之功。这方面,也许一个稍微没有那么热门的领域—心理学的故事,可以给我们带来一些启示。
1.Science |蛋白质语言模型 EVOLVEpro 实现快速的定向进化
文章开发了名为 EVOLVEpro 的高效的蛋白进化方法,它结合了蛋白质语言模型(PLMs)和回归模型,通过少量实验数据快速改进蛋白质活性。
2.Science |首个人类剪接体图谱,揭示 RNA 剪接交叉调控的复杂网络
西班牙基因组调控中心(CRG)的研究人员耗时 10 余年成功绘制了人类剪接体的第一张图谱。研究团队敲低了人类癌细胞中的 305 个剪接体和不同类别 AS 决定的功能性剪接因子,进行全转录组分析,并重建了不同功能性剪接因子网络,发现剪接体的不同组分具有独特的调控功能,揭示了剪接因子交叉调控的复杂网络。这些结果为剪接体治疗癌症或罕见病的策略提供了全新的见解。相关研究已发表在 Science 上。
3.Nature |基于质谱的蛋白质组学:从单细胞到临床应用
文章系统地回顾了近十年来基于质谱的蛋白质组学技术的发展历程和最新进展,详细介绍了该技术领域内的全流程革新。
4.“血液生态十亿细胞多组学计划” (HEMO ABC) 开始招募
为促进血液学科发展,推动血液疾病临床转化研究和精准医学取得新突破,华大与海河实验室携手全球科学家,共同启动“血液生态十亿细胞多组学计划” (Hematopoietic Ecosystem Multi-Omics Atlas of Billion-Cells, HEMO ABC)。该计划旨在通过大规模细胞多组学技术,绘制人类血液细胞的高精度分子图谱,全面解析血液细胞的基因组学、表观组学、转录组学和时空组学等多组学特征,构建全球最完整最精细的血液生态细胞多组学数据共享平台。这一平台将为全球科学家提供宝贵的数据资源,推动血液学及血液疾病研究进入全新的时代。
5.AI 编程三剑客:Cline(插件)规划模式+DeepSeek R1(构建计划)架构设计+Claude3.5 智能编码实战指南
本文探讨了统计学家可能对 LLM 发展做出重要贡献的潜在领域,特别是那些旨在增强人类用户信任度和透明度的方向。
AI 头像生成。看介绍非常不错,但实际测试效果一般。
$ you-get 'https://www.youtube.com/watch?v=jNQXAC9IVRw'
site: YouTube
title: Me at the zoo
stream:
- itag: 43
container: webm
quality: medium
size: 0.5 MiB (564215 bytes)
# download-with: you-get --itag=43 [URL]
Downloading Me at the zoo.webm ...
100% ( 0.5/ 0.5MB) ├██████████████████████████████████┤[1/1] 6 MB/s
Saving Me at the zoo.en.srt ... Done.
You-Get 是一个小型命令行实用程序,用于从网络上下载媒体内容(视频、音频、图像),以防没有其他方便的方法。
9.Trae
Trae 是一个自适应的 AI IDE,通过与其对话的形式,高效构建项目代码,并可以做到即时可视化,方便调整。
10.dockstore
dockstore 是一个开源免费的 docker 平台,提供诸多数据分析类的 pipeline。
11.CS197
哈佛大学的 AI 课程
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)