MoreRSS

site icon 生信爱好者周刊修改

记录每周值得分享的生信相关内容,周日发布。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

生信爱好者周刊的 RSS 预览

生信爱好者周刊(第 168 期):”future you“ AI工具,可模拟未来的自己

2025-06-22 13:28:21

生信爱好者周刊(第 168 期):”future you“ AI工具,可模拟未来的自己

这里记录值得分享的生信相关内容,每半月发布。

本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。

「生信周刊讨论区」

封面图

本周话题:”future you“ AI工具,可模拟未来的自己

麻省理工的研究人员推出了一款名为“未来的你”(Future You)的AI工具,可以模拟用户30年后的状态。该工具会要求用户回答一系列关于目前生活状况的问题,然后根据回答为用户模拟30年后的生活状态,如果用户上传自己的照片,还能生成30年后的外貌。

生信研究

1、Nature | 通过整合全基因组关联研究和空间转录组数据定位复杂疾病相关细胞的空间分布

文章开发了一种新的分析方法gsMap,通过整合全基因组关联研究数据和空间转录组数据,描绘了人类复杂疾病(性状)相关的细胞在组织中的空间分布。

  • 文章链接:https://www.nature.com/articles/s41586-025-08757-x

2、Nat Commun | 跨越39种人类细胞类型的等位基因特异性DNA甲基化综合图谱

文章绘制了跨越39种人类细胞类型的等位基因特异性DNA甲基化综合图谱。除利用深度全基因组测序、涵盖所有主要人类细胞类型等特点外,该图谱的一个突出优势就是基于纯化的、新鲜分离的各细胞类型的DNA绘制。

  • 文章链接:https://www.nature.com/articles/s41467-025-57433-1

3、Genome Biol | 纳米孔RNA直测新方法DEMINERS

研究开发出一款名为DEMINERS的创新纳米孔直接RNA测序(DRS)盒分析框架,突破了传统DRS技术在样本混合、碱基识别及数据分析方面的局限,实现了多达24个样本的同时直接测序以及高达93.54%的碱基识别准确率。

  • 文章链接:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-025-03536-3

博文资讯

4、让conda与Rstudio无缝衔接

推文介绍了如何通过创建 Conda 环境并修改 Rstudio 配置来使用 Conda 环境中配置的 R 版本。

5、 EBiomedicine | 用 R 快速重建 eBioMedicine 分段回归图

推文使用模拟数据复现了BPFI (Blood Pressure Response Index)与死亡风险的非线性关系,并使用 R 快速重建了分段回归图。 - 文章链接:https://pubmed.ncbi.nlm.nih.gov/39059317/

6、Rust Coreutils 0.1 正式发布:性能超越 GNU,重新定义命令行工具

推文介绍了Rust Coreutils 0.1该工具的优点。相对于传统的Coreutils而言,用Rust重写的Coreutils命令功能得到强化,其速度更快,占用内存更低,运维体验更好。

工具

7、 Deep-Live-Cam | 一种基于 AI 技术的开源的人脸替换工具

Deep-Live-Cam是一款深度伪造软件,它可以帮助艺术家为自定义角色制作动画、创作引人入胜的内容,甚至可以使用模型进行服装设计。

8、tinytable | R中的简单和可定制表格

9、DSCRIPT | 一种针对蛋白质-蛋白质相互作用序列预测的结构感知可解释深度学习模型

  • 官网:https://dscript.csail.mit.edu/

资源

10、Arc细胞虚拟图谱

“Arc虚拟细胞图谱”是一个由高质量、精心策划的开放数据集组成的集合,旨在加速虚拟细胞模型的创建。该图谱包含了超过3.3亿个细胞(且数据量在不断增长)的观察数据和扰动数据。

11、Posit Cheatsheets

Posit Cheatsheets网页上提供了常见的使用软件包及教程的链接,会定时更新。

贡献者(GitHub ID)

「Openbiox 生信周刊」运维小队:

  • @ShixiangWang(王诗翔)
  • @kkjtmac(阚科佳)
  • @NiEntropy(赵启祥)
  • @He-Kai-fly(何凯)
  • @JnanZhang(张佳楠)
  • @Tomcxf(陈啸枫)
  • @wangdepin(王德品)
  • @kongjianyang(空间阳)
  • @donghongyu2020(董弘禹)
  • @DrRobinLuo(罗鹏)
  • @Wangcy-rachel - 王春阳
  • @zoe3251 - 舒晨阳

订阅

这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。

微信搜索“生信协作组”或者扫描二维码,即可订阅。

(完)

生信爱好者周刊(第 167 期):打破传统论文评审困局:去中心化如何重塑学术同行评审生态?

2025-06-07 22:33:56

生信爱好者周刊(第 167 期):打破传统论文评审困局:去中心化如何重塑学术同行评审生态?

  • 内容编辑:王诗翔
  • 校对编辑:何凯

这里记录值得分享的生信相关内容,每半月发布。

本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。

「生信周刊讨论区」

封面图

本周话题:打破传统论文评审困局:去中心化如何重塑学术同行评审生态?

同行评审作为科研质量的重要把关机制,在科学知识的传播中起着至关重要的作用。然而,现行的同行评审制度却面临着前所未有的信任危机,常被批评缺乏客观性、透明度和系统性,让许多科研人员感叹“中稿如中彩”。审稿周期漫长、评审意见质量良莠不齐、缺乏透明度等问题,不仅影响科研效率,也削弱了学术体系的公信力。

The Innovation期刊近期发文提出去中心化的同行评审模型为构建一个更公平、透明且高效的知识评估体系提供了全新的思路。本文提出的TDA 模型通过双重激励机制与去中心化系统的结合,不仅使评审过程的公开与可验证成为可能,同时也能有效地激发学者在评审活动和学术共识构建中的积极性,让每一位学者都成为学术质量的守护者。

@ShixiangWang: 文章中通过构建Total Democracy in Assessment (TDA) 模型,“一方面通过经济激励,鼓励严谨而细致的批评性审稿意见;另一方面通过学术声誉激励,鼓励积极并具有建设性的审稿意见”。这是对新一代学术评审机制的畅想。但技术细节上确实困难重重,且不说经济激励中涉及到的金钱问题,学术声誉激励目前虽然能通过ORCID等机制进行标识,但无法判断和定量细节贡献,另外虽然有不少期刊开放了评审意见,但真正会去阅读的少之又少,自然无法有效评估贡献了。希望先有一些真正可行的软件系统出现,逐步推动一些期刊采纳运行起来看看效果,期刊这一块国内作为后起者,又无软件技术上的阻碍,说不定可以领先构建新一代评审体系。

@He-Kai-fly: TDA模型突破了“审稿工作无回报”的长期弊端,将审稿意见视为具备学术价值的独立成果,不仅提升了评审过程的正向激励,也有望丰富学术评价体系中对“隐性劳动”的认可。

生信研究

1、Nature | 填补全球遗传图谱关键空白——系统性分析东南亚人群基因组多样性及演化进程

研究通过深度短读长测序分析了30个东南亚大陆族群中3,023个个体,并对37个代表个体进行长读长全基因组测序,构建了目前最完整的东南亚人群基因组数据集SEA3K。

  • 论文链接:https://www.nature.com/articles/s41586-025-08998-w

2、Cancer Cell | 大规模泛癌蛋白质组图谱

研究利用数据非依赖性采集质谱(DIA-MS)构建了一个大规模泛癌种蛋白质组图谱,覆盖22种癌症类型的999例原发肿瘤样本,共定量9,670种蛋白质。

  • 论文链接:https://www.cell.com/cancer-cell/abstract/S1535-6108(25)00212-0

3、Nat Metab | 薛宇/贾大团队合作揭示生酮饮食发挥作用的新机制

研究团队通过算法预测、细胞实验、动物实验等发现生酮饮食或添加β-羟基丁酸可增加缩醛酶B(Aldolase B, Aldob)的K108位赖氨酸β-羟基丁酰化修饰水平,抑制mTOR信号通路和糖酵解过程,削弱癌细胞增殖,从而揭示了生酮饮食重塑代谢的新机制。此研究不仅发现了生酮饮食发挥作用的新机制,还为预测功能重要的赖氨酸修饰位点提供了普遍适用的语言模型。

  • 论文链接:https://www.nature.com/articles/s42255-024-01093-w

博文资讯

4、缺失数据:为什么应关注它以及如何处理

在统计分析中,缺失数据是一个常见但经常被忽视的问题。不当处理的缺失数据可能会导致分析结果的偏差,影响研究结论的可靠性。推文中介绍了缺失数据的不同类型以及如何处理缺失数据。

5、靳文菲 | 勤奋为笔,刻画细胞千姿百态

常规测序获得一群细胞的信号均值,丢失了细胞的个性化信息,而单细胞测序的出现则弥补了这一不足。单细胞测序是在单个细胞水平对基因组、转录组或表观基因组进行测序分析的技术。本文介绍了靳文菲专注于开发基因组技术和计算方法解决生物医学难题的历程,在单细胞测序、组学大数据挖掘等方面取得了系统性成果,并把这些技术应用到肿瘤研究中。

靳文菲,南方科技大学生科院副教授,研究员、博士生导师、国家高层次青年人才、珠江人才计划青年拔尖人才。长期从事基因组学、肿瘤免疫相关研究。主要研究方向:1.发展和利用单细胞测序技术研究肿瘤微进化和肿瘤微环境;2.生物信息。

6、Everything you need to know to resolve the Git Push RPC error

本文介绍了如何探索和处理 git push 遇到的 RPC 相关错误。

error: RPC failed; http2 499 curl 16 Error in HTTP2 framing layerfatal: remote hung up unexpectedly

工具

7、一个Rust编写的Python包和项目管理器-UV

亮点:

  • 一个单一的工具来取代pip, pip-tools等工具,运行数独比pip快10~100倍。
  • 提供全面的项目管理,具有通用的锁文件。
  • 运行脚本,支持内联依赖元数据。
  • 安装和管理Python版本。
  • 运行并安装作为Python包发布的工具。
  • 包括一个与pip兼容的接口,通过一个熟悉的CLI来提高性能。
  • 为可伸缩的项目支持cargo风格的工作空间。
  • 有效的磁盘空间,为依赖重复数据删除提供全局缓存。
  • 可以通过curl或pip安装,不需要Rust或Python。
  • 支持macOS、Linux、Windows操作系统。

8、fzf | 一款通用的命令行模糊查找器

这是一个适用于任何类型列表的交互式过滤器程序;文件、命令历史、进程、主机名、书签、Git 提交等。它实现了一个“模糊”匹配算法,因此您可以快速输入省略字符的图案,仍然得到您想要的结果。

9、aisuite | 简单、统一的界面,连接多个生成式AI提供商

aisuite通过标准化接口让开发者轻松使用多个LLM。使用类似OpenAI的接口,aisuite使得与最受欢迎的LLM交互和比较结果变得简单。它是对python客户端库的轻量级封装,允许创作者在不更改代码的情况下无缝切换和测试来自不同LLM提供商的响应。

资源

10、如何绘制Nature同款尖尖朝上的倒三角热图?

贡献者(GitHub ID)

「Openbiox 生信周刊」运维小队:

  • @ShixiangWang(王诗翔)
  • @kkjtmac(阚科佳)
  • @NiEntropy(赵启祥)
  • @He-Kai-fly(何凯)
  • @JnanZhang(张佳楠)
  • @Tomcxf(陈啸枫)
  • @wangdepin(王德品)
  • @kongjianyang(空间阳)
  • @donghongyu2020(董弘禹)
  • @DrRobinLuo(罗鹏)
  • @Wangcy-rachel - 王春阳
  • @zoe3251 - 舒晨阳

订阅

这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。

微信搜索“生信协作组”或者扫描二维码,即可订阅。

(完)

生信爱好者周刊(第166期): 为什么中外科研课题如此不同

2025-05-25 17:59:28

生信爱好者周刊(第166期): 为什么中外科研课题如此不同

这里记录每周值得分享的生信相关内容,周日发布。

本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。

「生信周刊讨论区」

封面图

本周话题: 为什么中外科研课题如此不同

文章探讨了中外科研课题选择的差异,以脑研究为例,指出国外多选择果蝇等简单生物进行基础研究,而国内则倾向于选择猴等复杂生物。文章质疑这种差异是否源于中国科研界对企业的过度依赖,以及对基础研究积累和技术磨练的忽视。同时,指出国外科研遵循从简单到复杂的逻辑,先在低等生物上积累经验、改进技术,再逐步向高等生物拓展,而国内部分科研项目可能缺乏这种循序渐进的规划,甚至存在企业主导科研、套取国家经费的现象。 文章揭示了中外科研在选题和组织方式上的差异,强调了基础研究重要性。中国科研应注重循序渐进积累,避免盲目追求复杂课题,同时警惕企业过度介入科研可能带来的问题,确保科研回归科学本质。

生信研究

1.Cell Genomics | 新一代基因组浏览器用以整合单细胞和空间多模态数据可视化

西南大学王翊课题组在《Cell Genomics》期刊发布新一代基因组浏览器SGS,用于整合单细胞和空间多模态数据的可视化。该工具用户友好,支持多操作系统,无需编程即可安装使用;具备强大的多用户协同功能,方便团队实时协作和数据共享;支持多种单细胞和空间组学数据的可视化,提供丰富的交互功能和数据比较模式;此外,SGS兼容多种数据格式,与主流分析工具无缝对接,为生命科学研究提供了高效便捷的新工具。

  • SGS官网:https://sgs.bioinfotoolkits.net/home

2.Cancer Cell | TCR测序解码鼻咽癌免疫监视密码,突破早期诊断瓶颈

研究首次通过大规模T细胞受体(TCR)免疫组库测序,锁定鼻咽癌特异性T细胞克隆,构建可提前6-12个月预警鼻咽癌发生的T-score模型,并揭示EB病毒(EBV)与肿瘤抗原双重识别的免疫监视机制,为鼻咽癌早诊与细胞治疗提供全新策略。

  • 文章链接:https://www.cell.com/cancer-cell/fulltext/S1535-6108(25)00168-0

3.Cell Systems | 基于邻近标记的空间可视化蛋白质组学新技术

研究基于邻近标记策略开发了一种具有细胞类型分辨率的空间可视化蛋白质组学方法PSPro,该方法可以在亚微米尺度的空间分辨率下一次性标记和富集组织切片中目标细胞类型的蛋白质组,流程简单方便,具有大规模应用潜力。

  • 论文链接:https://doi.org/10.1016/j.cels.2025.101291

博文资讯

4.使用Cherry Studio + MCP实现自动搜索及下载arxiv文献

一篇关于利用Cherry Studio及MCP实现自动搜索arxiv文献的教程。下载速度和网络有关系,普通网络下载arxiv可能会比较慢。下载完毕后会自动将PDF论文转换成markdown形式方便AI阅读。如果需要PDF原文,我们也可以在提示词中直接让MCP保留PDF原文。

5.Nature综述 | Transformers与基因组语言模型

综述将目光投向基因组数据,尝试用Transformer这一AI领域最强大的模型,去挖掘DNA序列中的隐含信息,帮助科学家更高效地预测基因调控、理解突变影响、甚至解析未知的生物机制。 - 文章链接:https://www.nature.com/articles/s42256-025-01007-9

6.基于Cursor复现生信分析图片工作流程

在论文发表、项目申报等场景中,生信人员经常需要生成各种可视化图表来辅助分析和展示研究结果。而想要发好文章,我们通常会参考别人发表的高分论文,希望能复现其中的图片效果。笔者为了帮助生信人员解决这一问题,将前期探索的工作逻辑梳理成一个框架。按照这个框架操作,可以基于AI模型实现图片复现。

工具

7.FeedMe

FeedMe 是一款由 Seanium 开发的 AI 驱动的 RSS 阅读器,旨在通过人工智能技术重新定义 RSS 阅读体验。它支持多源 RSS 聚合、AI 摘要生成、定时更新机制、分类浏览、明暗主题切换等功能,并且可以轻松部署到 GitHub Pages 或通过 Docker 在本地服务器上运行。该工具适合希望一站式了解多个信息源动态,但又不想使用传统 RSS 阅读器的用户,提供了轻量级、自由配置和开源的解决方案。

8.RedNote-MCP|超好用的小红书内容访问MCP服务

RedNote-MCP 是一款专门用于访问和分析小红书内容的工具,基于 MCP(Model Context Protocol)协议开发。它可以帮助内容创作者和企业用户更高效地获取小红书上的笔记和评论内容,支持 Cookie 持久化、关键词搜索笔记、命令行初始化等功能,方便开发人员快速集成和使用。

  • 相关链接:https://github.com/iFurySt/RedNote-MCP

9.mLLMCelltype | 基于大语言模型的单细胞RNA-seq数据自动注释工具

mLLMCelltype是一个创新的R包和Python包,能够利用大型语言模型(如Claude 3.7、Gemini 2.5等)自动注释单细胞RNA-seq数据中的细胞类型。该工具通过多LLM共识机制提高注释准确性,支持多种LLM模型,可以处理各种组织和物种的单细胞数据。相比传统方法,mLLMCelltype无需预训练数据集,适用性更广,特别适合分析罕见细胞类型或新型数据集。使用者只需提供表达矩阵和标记基因,即可获得准确的细胞类型注释结果。

资源

10.GeeksforGeeks

GeeksforGeeks 是一个专注于计算机科学和编程知识的在线学习平台,提供广泛的编程教程、算法、数据结构、编程语言(如 Python、Java、C++ 等)的讲解,以及面试准备、在线课程和实践练习等功能。它旨在帮助程序员和计算机科学爱好者提升技能、准备面试和学习新技术。

11.首个中国开源三万人多组学样本库:西湖生物样本库数据批量下载详细步骤

西湖生物样本库(Westlake BioBank for Chinese, WBBC)是一个以人口为基础的前瞻性研究项目,其主要目的是更好地理解遗传和环境因素对从青少年到老年人生长发育的影响。WBBC计划招募至少10万个中国样本。目前,WBBC试点项目已招募约35,000名参与者,包括约28,000名平均年龄为19岁的青少年和约7,000名65岁以上的老年人,覆盖中国31个省级行政区域。研究人员若需要访问原始遗传数据,必须获得中华人民共和国科学技术部和西湖大学机构审查委员会的许可。且研究必须符合中国人类遗传资源管理(HGRAC)的规定。

12.人工智能时代,单细胞领域必读的10个细胞基础大模型

这篇文章推荐了人工智能时代单细胞领域必读的10个细胞基础大模型,并提供了模型链接。文章指出,这些AI基础模型是生物医学与AI交叉的范例,通过大规模参数和深度学习架构,能够实现对细胞行为的深度解析,推动生命科学从“试错实验”向“数据驱动”范式转变。文章还提出了开放性讨论问题,包括AI模型的下游任务、效果对比传统算法工具的优势,以及AI模型可以实现而经典软件无法达到的分析场景。

贡献者(GitHub ID)

「Openbiox 生信周刊」运维小队:

  • @ShixiangWang(王诗翔)
  • @kkjtmac(阚科佳)
  • @NiEntropy(赵启祥)
  • @He-Kai-fly(何凯)
  • @JnanZhang(张佳楠)
  • @kkjtmac(阚科佳)
  • @Tomcxf(陈啸枫)
  • @wangdepin(王德品)
  • @kongjianyang(空间阳)
  • @donghongyu2020(董弘禹)
  • @DrRobinLuo(罗鹏)
  • @Wangcy-rachel - 王春阳
  • @zoe3251 - 舒晨阳

订阅

这个周刊每周日发布,同步更新在微信公众号「优雅R」(elegant-r)上。

微信搜索“优雅R”或者扫描二维码,即可订阅。

生信爱好者周刊(第 165 期):明星期刊“落选”引发科学界震动,在中国做学术期刊有多难?

2025-05-14 22:16:21

生信爱好者周刊(第 165 期):明星期刊“落选”引发科学界震动,在中国做学术期刊有多难?

这里记录每周值得分享的生信相关内容,周日发布。

本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。

「生信周刊讨论区」

封面图

本周话题:明星期刊“落选”引发科学界震动,在中国做学术期刊有多难?

中国科技期刊卓越行动计划(以下简称“卓越计划”)二期的名单甫一公示,就引发了生命科学领域的一场舆论风暴。因为这个领域的明星期刊《Cell Research》落选“英文期刊领军项目”。

这可能是中国期刊界最重要的评选活动,它把入选的463个项目分成了6大类,第一类的“英文领军期刊”有50本期刊入选,将会在未来5年中获得每年不超过150万的资助,第二类的“英文梯队期刊”有150本期刊入选,其中就包括《Cell Research》,同样获得5年稳定资助,但资助金额不超过50万一年,只有“英文领军期刊”的三分之一。

与此同时,一封名为“国际一流期刊《Cell Research》在国内只能评B档?”的公开信立刻在科学圈开始流传,多位生命科学领域的科学家都对此颇为微词。

生信研究

1.Nat Commun | 使用机器学习算法揭示癌症进展中的DNA复制时序动态异质性

癌症治疗的主要挑战之一在于肿瘤细胞的高可塑性和异质性,这使得对肿瘤发生机制的研究以及有效疗法的开发变得复杂。为了更好地理解这些现象,2025年2月8日,来自法国居里研究所的研究团队在Nature Communications上发表了相关研究。该研究开发了一种名为“Mix ‘n’ Match”(MnM)的机器学习工具,能够从复杂的单细胞全基因组测序数据中精准解析DNA复制时序(Replication Timing, RT),并揭示癌症进展中的基因组异质性。 - 文章链接:https://doi.org/10.1038/s41467-025-56783-0

2.NCB背靠背 | 江龙达/李炜/Rahul Satija推出新计算方法分析单细胞扰动,揭示细胞对扰动的不同响应机制

在功能基因组学和单细胞技术迅速发展的今天,理解细胞对扰动(Perturbation)的响应如何在单细胞层面产生差异,以及背后的分子机制成为了生物学和医学研究的关键问题。2025年2月26日,New York Genome Center的Rahul Satija团队和美国Children’s National Hospital 的李炜团队在Nature Cell Biology背靠背发表的两篇研究论文,分别开发了全新的单细胞扰动测序实验和分析方法, 为破解基因组调控网络和通过扰动响应寻找新的生物学知识提供了强大工具。

  • 文章链接: https://www.nature.com/articles/s41556-025-01626-9 https://doi.org/10.1038/s41556-025-01622-z

3.Nature | 王凌华/Anirban Maitra团队联合揭示转移性胰腺癌转录组与癌细胞谱系表型可塑性的空间图谱

2025年4月23日,美国德克萨斯大学MD安德森癌症中心王凌华教授和Anirban Maitra教授领导的合作团队在Nature在线发表题为Spatial mapping of transcriptomic plasticity in metastatic pancreatic cancer的研究论文。该研究利用空间转录组技术,对来自13位胰腺导管腺癌(PDAC)患者的55份肿瘤原发灶及多器官转移灶(包括肝、肺和腹腔转移)样本进行了高分辨率空间解析,系统绘制了癌细胞的克隆结构、谱系表型及肿瘤微环境(TME)的空间图谱。

  • 文章链接: https://doi.org/10.1038/s41586-025-08927-x

4.Cell|整合16.8万个样本,构建超大型全球肠道微生物组数据库

近日,芝加哥大学Ran Blekhman团队在Cell杂志上发表了题为Integration of 168,000 samples reveals global patterns of the human gut microbiome的文章。该研究整合了来自68个国家的168,464个16S测序样本,构建了一个全球人类肠道微生物组数据库(microbiomap.org),并分析了地理和技术因素对肠道微生物组的影响。 - 文章链接:https://doi.org/10.1016/j.cell.2024.12.017

博文资讯

5.用qs替代RData:加速大型单细胞对象存储的终极方案

指标 RData rds qs
保存时间(秒) 23.63 23.50 3.52
加载时间(秒) 3.14 3.12 1.27
文件体积(MB) 886.41 886.41 264.05

针对单细胞数据分析的导入和存储这一常见任务场景,作者测试并提出 qs 是目前最佳的实践方案。

  • https://github.com/qsbase/qs
qs fst saveRDS
Not Slow
Numeric Vectors
Integer Vectors
Logical Vectors
Character Vectors
Character Encoding (vector-wide only)
Complex Vectors
Data.Frames
On disk row access
Random column access
Attributes Some
Lists / Nested Lists
Multi-threaded

6.诺奖得主的13条科研建议:把精力用在最重要的事情上

  1. Don’t be too busy (No excuses. If you’re too busy, you’re not being creative).创造力与忙碌的权衡,避免工作饱和。
  2. Learn to say no. 懂得拒绝。
  3. What question to ask: Find the biggest unanswered question that can be approached in the next 5-10 years. 寻找最有价值的问题。
  4. Science communication: When you talk about your work, always start by stating what the important open question is (this is fundamental, but very few do it). 通过学术交流磨练讲故事的能力。
  5. Prioritize: Know when to quit a project (as important as coming up with new ideas). 认清项目优先级,及时退出并投入更重要的工作。
  6. Change fields when the open questions are no longer interesting: Being from a different field allows you to look at problems with a fresh perspective. 及时退出难以激发大众兴趣的领域,投入到自己能提供独特见解的领域。
  7. Ask for help - don’t reinvent the wheel. 寻求帮助,避免花过多时间在复现他人工作。
  8. Don’t listen to advice if it doesn’t make sense to you. 相信自己的判断。
  9. Hire people who are smart, efficient, and kind (don’t forget about “kind”). 与聪明、高效、友好的人共事。
  10. Champion the underprivileged. 帮助弱者。
  11. Collaborate with people with very different training and experience. 互补合作。
  12. Cultivate friends who tell you when you are wrong. 结交能够谏言的朋友。
  13. Don’t forget why you got into this business in the first place: Science is fun. Minimize the noise that causes anxiety. 不忘初心,探寻科学的乐趣,屏蔽内耗因素的影响。

7.在 VS Code 中免费使用 DeepSeek-R1!

前不久微软正式官宣,DeepSeek R1 强势登录微软 AI 平台,Azure AI Foundry 和 GitHub Models 都有它的身影。

本文将介绍如何在 VS Code 里,通过 AI Toolkit Extension 与 DeepSeek 模型进行交互。

8.2024中国生命科学十大进展!

推文介绍了2024年度“中国生命科学十大进展”,包含7个知识创新类和3个技术创新类成果。

工具

9.barba

Barba.js——又名Barba——是一个小型且易于使用的库,可帮助用户在网站页面之间创建流畅的过渡。它可以使网站像SPA(单页应用程序)一样运行,有助于减少页面之间的延迟,以最大限度地减少浏览器HTTP请求,同时增强用户的网络体验。

10.Rspack|基于 Rust 的高性能 Web 打包工具

Rspack 是一个基于 Rust 编写的高性能JavaScript 打包工具, 它提供对webpack 生态良好的兼容性,能够无缝替换 webpack,并提供闪电般的构建速度。

11.ganttrify|能够高效绘制精美的甘特图的R包

在项目管理中,甘特图作为一种直观的时间管理工具,被广泛应用于展示项目的进度和计划。然而,传统的甘特图绘制工具往往操作复杂,难以满足科研工作者和项目经理对高效、美观的追求。今天,我们将一起探索一个强大的R包——gantrify,看看它是如何帮助我们用R绘制出既高效又美观的甘特图的。

资源

12.顶刊美图社 1-40 期

13.生信百晓生2024年单细胞、空间转录组、免疫、组织学、会议报告、教程资源、注释marker推文合集

更新在这里

  • https://singlecell.yuque.com/aie23e/caygp4/kgw9x8yexpa0qzgg

14.Beej 的 Git 指南

贡献者(GitHub ID)

「Openbiox 生信周刊」运维小队:

  • @ShixiangWang(王诗翔)
  • @kkjtmac(阚科佳)
  • @NiEntropy(赵启祥)
  • @He-Kai-fly(何凯)
  • @JnanZhang(张佳楠)
  • @Tomcxf(陈啸枫)
  • @wangdepin(王德品)
  • @kongjianyang(空间阳)
  • @donghongyu2020(董弘禹)
  • @DrRobinLuo(罗鹏)
  • @Wangcy-rachel - 王春阳
  • @zoe3251 - 舒晨阳

订阅

这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。

微信搜索“生信协作组”或者扫描二维码,即可订阅。

(完)

生信爱好者周刊(第 164 期):德日学者称中国学术界更偏好“内循环”

2025-04-26 12:45:26

生信爱好者周刊(第 164 期):德日学者称中国学术界更偏好“内循环”

这里记录每周值得分享的生信相关内容,周日发布。

本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。

「生信周刊讨论区」

封面图

本周话题:德日学者称中国学术界更偏好“内循环”

我国各学科最具影响力期刊论文数量、高水平国际期刊论文数量及被引用次数继续保持世界第1位,但研究者发现中国排名前10%的论文有62%的引用来自国内。

@Wangcy-rachel:中国排名前10%的论文大部分引用来自国内,说明这些论文在国内学术界得到了广泛关注和认可,但这些高水平论文在国际上的影响力相对有限。

生信研究

1、Leukemia|针对儿童癌症的液体活检Panel仅需1mL血浆即可检测多种不同基因组改变

研究开发了一种针对儿童癌症细胞游离DNA样本中不同体细胞基因组变异的深度测序方法PeCan-Seq,该方法可通过DNA捕获Panel对儿童癌症相关的357个基因进行深度测序,以从头检测染色体拷贝数变异(CNA)和单基因变异。

  • 文章链接:https://www.nature.com/articles/s41375-024-02461-x

2、Cell | 全面绘制人类健康与疾病蛋白质组图谱

文章全面绘制了人类健康与疾病蛋白质组图谱,并结合人工智能大数据分析方法构建了疾病诊断预测模型以及发现了26个药物治疗新靶点,为精准医学的实施提供了重要科学依据。

  • 文章链接:https://www.cell.com/cell/fulltext/S0092-8674(24)01268-6

3、Nat Commun∣AI驱动的肽从头测序精准算法π-PrimeNovo

文章研发了首个基于非自回归模型的肽从头测序算法π-PrimeNovo,它彻底颠覆了传统的自回归生成方式,实现了一次性生成整个序列的能力。通过Transformer的自注意力机制,π-PrimeNovo能够让每个氨基酸在生成过程中同时参考序列中其他位置的信息,从而充分捕捉氨基酸之间的双向依赖关系,显著提高了预测准确性。

  • 文章链接:https://www.nature.com/articles/s41467-024-55021-3
  • 软件链接:https://github.com/PHOENIXcenter/pi-PrimeNovo

博文资讯

4、R语言画图 | 换个风格绘制森林图

本文介绍了利用ggplot2绘制森林图的方法。

5、如果不断要求 AI 改进代码会怎样

OpenAI添加了DALL-E 3生成图像的功能,意在为用户提供基于LLM的基本图像绘制,并允许用户不断要求模型“让它更X”,其中X可以是任何东西。

6、长期这样吃饭,全身炎症上升,痴呆风险增加!

有研究通过长达22.3年的随访,对1487名受试者进行了深入研究发现:频繁促炎饮食会显著提高痴呆症的发病风险。

工具

7、原始数据下载专题 | 用iSeq下载原始测序数据

推文中介绍了如何使用iSeq下载原始测序数据,iSeq可用于从GSA, SRA, ENA, 和 DDBJ数据库下载原始数据和元信息。

  • github地址:https://github.com/BioOmics/iSeq

8、gitbutler | 跨平台 Git GUI 软件

9、cOmicsArt | 可定制的组学分析工具

推文分享了一款用于常规组学分析的工具cOmicsArt,cOmicsArt目前支持常规转录组、蛋白组+代谢组三类常见组学,常规的分析内容均包含,并支持将分析的数据及R代码导出。

  • 工具链接: https://icb-dcm.github.io/cOmicsArt/

资源

10、张泽民院士单细胞文章专题汇总

张泽民实验室致力于用前沿的基因组学和生物信息学技术来解决癌生物学中的重要问题,结合计算(干)和实验(湿)方法来揭示肿瘤发生、微环境和对药物响应中的系统变化和具体遗传因素,以推进癌症免疫治疗和靶向治疗的发展。首先,用单细胞测序技术来研究肿瘤微环境。第二,将尖端生物信息学方法应用到癌基因组学大数据,发现新型癌症靶点和标记物。第三,开发原创性的生物信息学工具。归纳总结,张泽民团队代表性工作主要是三个方向:①肿瘤微环境各类细胞单细胞图谱;② 肿瘤免疫治疗图谱;③ 生信工具。

该推文汇总了张院士团队长期在单细胞领域的工作进展。

11、AI、大模型、深度学习、算法与生物学(Evo、GENERator)及单细胞和空间转录组 相关文献、讲座和软件列表

推文分享了AI、大模型、深度学习、算法与生物学有关的相关文献、讲座和软件列表。

贡献者(GitHub ID)

「Openbiox 生信周刊」运维小队:

  • @ShixiangWang(王诗翔)
  • @kkjtmac(阚科佳)
  • @NiEntropy(赵启祥)
  • @He-Kai-fly(何凯)
  • @JnanZhang(张佳楠)
  • @Tomcxf(陈啸枫)
  • @wangdepin(王德品)
  • @kongjianyang(空间阳)
  • @donghongyu2020(董弘禹)
  • @DrRobinLuo(罗鹏)
  • @Wangcy-rachel - 王春阳
  • @zoe3251 - 舒晨阳

订阅

这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。

微信搜索“生信协作组”或者扫描二维码,即可订阅。

(完)

生信爱好者周刊(第 163 期):美国公共数据库对中国科研人员禁用

2025-04-13 11:14:21

生信爱好者周刊(第 163 期):美国公共数据库对中国科研人员禁用

这里记录每周值得分享的生信相关内容,周日发布。

本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。

「生信周刊讨论区」

封面图

迄今为止最大的脑图 - 图源

本周话题:美国公共数据库对中国科研人员禁用

中美在数据和技术领域的紧张关系加剧,美国于2024年底推出了针对跨境数据的新规,并将在2025年开始实施。该新规旨在限制中国等“受关注国家”获取美国人的敏感个人数据,这对中国科研人员使用美国的公共医学和学术数据库可能带来重大影响。

涉及大量美国人健康/基因信息的数据库(如SEER, TCGA, dbGaP等)在新规下对中国几乎封闭,而以公开文献和统计为主的资源(如PMC, ClinicalTrials.gov, CDC数据)仍然开放。介于两者之间的是一些已经公开但含匿名个体数据的资源(如GEO, 部分NIH数据),目前看大概率继续开放,但需关注政策动向。

@ShixiangWang: 协作共享有时比想象中艰难。万事万物都遵循着动态的平衡。之前是全世界分析M国数据,就政策导向看,以后会产生一些相对的数据孤立。个人观点,长久看,对M国也未必是好事。我们国家也确确实实需要有真正意义上类似 TCGA 的计划,而不是坐地分钱。

生信研究

1、Science | 5’端单细胞测序绘制CD4+T细胞双向转录增强子多模态图谱

团队利用5’端单细胞RNA测序方法构建T细胞双向转录增强子多模态图谱,同时开发了ReapTEC方法,实现高核苷酸分辨率和高灵敏度鉴定btcEnhs,捕获真正的增强子区域。

  • 论文链接:https://www.science.org/doi/10.1126/science.add8394

2、Nat Methods | 系统性评估11种空间组学技术

基于测序空间转录组技术(sST)的快速发展改变了在空间背景下测量基因表达的能力,被Nature Methods评为2020年的年度技术。然而技术的发展应该关注哪些指标,如何对这些技术进行标准化的多维度评估和比较,尚未有清晰的解决方案。为了解决技术标准不清晰,评估方案混乱等问题,研究团队对 11 种 sST 方法进行了全面比较(包括 10X Genomics Visium(基于 poly-A 和基于探针的两种方法)、DynaSpatial、HDST、BMKMANU S1000、Slide-seq V2、Curio Seeker(Slide-seq 的商业版本)、Slide-tag、Stereo-seq、PIXEL-seq、Salus 和 DBiT-seq)。他们使用具有明确形态的参考组织来评估它们的性能。研究建立了一套具有不同组织结构特征的标准参考组织,包括胚胎小鼠眼睛、成年小鼠海马区和嗅球。在进行统一的组织块制备和切片后,他们使用11种sST方法对这些组织进行了空间转录组学分析,生成了一个跨平台的数据集(称为cadasSTre),以便直接比较空间分辨率、分子捕获效率和分子扩散。

  • 论文链接:https://www.nature.com/articles/s41592-024-02325-3

3、Nat Med|AI驱动的血液WGS ctDNA检测平台——MRD-EDGE,可高灵敏度预测癌症复发

团队开发了一种由机器学习驱动的血浆全基因组测序(WGS)ctDNA信号富集平台——“MRD-EDGE”,可以极高敏感度监测肿瘤负荷。

  • 论文链接:https://www.nature.com/articles/s41591-024-03040-4

博文资讯

4、我学习基因组学深度学习的4步法

Ming Tommy Tang 在文章中介绍了学习的4步经验,涵盖了具体的学习资料,主要步骤如下:

  • Step 1, get a high-level understanding
  • Step2, code it out!
  • Step 3, apply it to real biological examples
  • Step 4, apply the learning to a real project

5、揭开ggplot惰性求值的神秘面纱

探索 after_stat() 的逻辑,一窥 ggplot 内部机制。

6、华盛顿大学蛋白质设计研究所创新之道及其对生命科学新型研发机构建设的启示

文章介绍了华盛顿大学蛋白质设计研究所的历史沿革与创新成就,分析了蛋白质设计研究所创新特点,总结了有关生命科学新型研发机构建设的启示。

工具

7、zotero-actions-tags | 自定义 Zotero 工作流程

8、玉竹

玉竹是一套简洁的内容管理(博客、微博客)、财务管理(记账)系统。

  • 示例:https://www.8ug.icu/

9、文捕 | 博客内容一键解析下载工具

资源

10、canvasxpress | 深入数据分析和无缝集成的JavaScript库

以交互式和可扩展的视觉呈现更快地转换数据。有对应 R 包 binding:https://github.com/neuhausi/canvasXpress 。

贡献者(GitHub ID)

「Openbiox 生信周刊」运维小队:

  • @ShixiangWang(王诗翔)
  • @kkjtmac(阚科佳)
  • @NiEntropy(赵启祥)
  • @He-Kai-fly(何凯)
  • @JnanZhang(张佳楠)
  • @Tomcxf(陈啸枫)
  • @wangdepin(王德品)
  • @kongjianyang(空间阳)
  • @donghongyu2020(董弘禹)
  • @DrRobinLuo(罗鹏)
  • @Wangcy-rachel - 王春阳
  • @zoe3251 - 舒晨阳

订阅

这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。

微信搜索“生信协作组”或者扫描二维码,即可订阅。

(完)