MoreRSS

site icon 生信爱好者周刊修改

记录每周值得分享的生信相关内容,周日发布。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

生信爱好者周刊的 RSS 预览

生信爱好者周刊(第 156 期):说说2024你的收获吧~

2025-01-26 18:33:26

生信爱好者周刊(第 156 期):说说2024你的收获吧~

这里记录每周值得分享的生信相关内容,周日发布。

本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。

「生信周刊讨论区」

封面图

GPU paints the Mona Lisa

本周话题:说说2024你的收获吧~

@kkjtmac 简短概括一下:2024在科研、技术开发和项目管理方面取得了一定的进展,更加深入探索细胞与基因治疗等领域,推动多个技术平台应用。

生信研究

1、Nature Genetics | 一种高通量、大视野的空间转录组学新技术(MAGIC-seq)

Nature Genetics 上这篇文章报道了中国科学院动物研究所赵方庆团队在空间转录组学领域取得的重大突破。他们开发了一种名为 MAGIC-seq 的高通量、大视野空间转录组学新技术,通过创新的网格化微流控芯片设计和新的空间编码技术,显著提高了检测通量和捕获面积,同时降低了成本和批次效应。该技术首次提出了“拼接芯片”的概念,能够灵活调整网格布局,适应不同样本形状和数量的需求。MAGIC-seq在小鼠多个组织(包括大脑、小脑、心脏等)的测试中表现出色,成功构建了高质量的三维空间转录组图谱,为空间转录组学研究提供了强大的工具。

  • 论文链接:https://www.nature.com/articles/s41588-024-01906-4

2、Nature | AI从头设计蛋白,攻克百年难题

诺贝尔化学奖得主David Baker教授团队在《Nature》发表成果,利用AI从头设计的蛋白质成功阻断了眼镜蛇、蝰蛇等毒蛇毒液中致命毒素的作用。研究团队通过AI工具RFdiffusion设计出“迷你结合剂”,能够紧密结合蛇毒中的关键毒素成分。实验表明,这些结合剂在体外和体内均能有效中和毒素,甚至在小鼠被注射致死剂量毒素15分钟后,仍能实现完全保护。该研究不仅为蛇咬伤治疗提供了新的思路,还展示了AI在蛋白质设计领域的巨大潜力。

  • 论文链接:https://www.nature.com/articles/s41586-024-08393-x

3、Genome Biology | 表观基因组学预训练语言模型EpiGePT

人类基因组中非编码区域的调控机制一直是基因组学的难题。传统基因组语言模型在预测新细胞类型的表观基因组信号方面存在局限。Genome Biology上发表提出了EpiGePT模型。该模型基于Transformer架构,融合DNA序列、转录因子表达和结合基序信息,突破了传统模型的局限,能够准确预测染色质开放性、组蛋白修饰等多种表观基因组信号,并具备细胞类型感知能力。EpiGePT通过三维基因组数据引导训练,增强了对染色质互作关系的捕捉能力,验证了其在人类和小鼠细胞系中的高准确性和泛化能力。该模型为解码基因调控机制、解读致病变异提供了有力支持,并有望推动精准医学和靶向药物研发。

  • 论文链接:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-024-03449-7

4、Nature Methods | 核苷酸转换模型(Nucleotide Transformer)

近几年,人工智能(AI)领域的基础模型为这一难题带来了新曙光。这些模型(如BERT、GPT)通过从文本中学习语言规则,在自然语言处理中实现了从无到有的认知飞跃。受此启发,研究人员将这一技术嫁接到基因组学中,开发出了专门用于DNA序列分析的核苷酸转换模型(Nucleotide Transformer, NT)。它不仅能像阅读文本一样解读DNA序列,还能够预测基因组中的关键功能区域。更令人兴奋的是,NT模型通过跨物种的数据训练,展现了强大的任务适应性和功能泛化能力。无论是剪接位点的精确定位,还是复杂增强子活性的预测,这一模型都打破了传统方法的桎梏,为基因组学研究提供了前所未有的洞见。

  • 论文链接: https://doi.org/10.1038/s41592-024-02523-z

博文资讯

5、蛋白翻译后修饰:从1906到2024

蛋白翻译后修饰(PTMs)是指蛋白质在生物合成后氨基酸侧链的化学修饰,目前已发现超过400种PTMs类型,对蛋白质功能有深远影响。文章回顾了PTMs的历史发展,介绍了经典和新兴的PTMs类型。经典PTMs包括磷酸化(1906年首次发现,调控蛋白质活性,参与细胞信号传导等过程)、乙酰化(1964年发现,影响染色质稳定性和蛋白质相互作用)和泛素化(1975年发现,调控蛋白质降解和信号转导)。新兴PTMs包括巴豆酰化(2011年发现,标记活跃启动子和增强子)和乳酸化(2019年发现,参与基因表达和代谢调节)。这些修饰的研究不断拓展,为理解蛋白质功能和疾病机制提供了重要视角。

6、2025年度癌症报告

2025年1月16日,《临床医师癌症杂志》发布了《2025年度癌症报告》。报告指出,从1991年到2022年,美国癌症死亡率下降了34%,避免了约450万人死亡。2025年预计美国将有2,041,910例新癌症诊断(每天5,600例),618,120例癌症死亡病例。前列腺癌、肺癌和结直肠癌占男性发病的48%,乳腺癌、肺癌和结直肠癌占女性发病的51%。尽管吸烟率从1965年的42%下降到2020年的12%,肺癌仍是主要死亡原因。癌症发病率在中年群体中增加,尤其是女性。儿童和青少年癌症发病率略有下降,但死亡率显著降低。报告强调,癌症负担正在从老年人向年轻人、从男性向女性转移,乳腺癌、前列腺癌和子宫癌发病率上升需关注。

7、如果 GPU 那么好,为什么我们还用 CPU

这篇文章探讨了尽管GPU(图形处理单元)在处理并行计算任务方面表现出色,但CPU(中央处理单元)仍然被广泛使用的原因。文章指出,CPU在处理复杂逻辑、顺序执行以及低功耗场景中具有独特优势。例如,CPU更适合运行操作系统、处理多任务和执行复杂的算法,而GPU则在图形渲染、深度学习等并行任务中表现更好。此外,CPU的通用性和兼容性使其能够适应各种应用场景,而GPU则需要特定的硬件和软件支持。文章强调,CPU和GPU各有优势,未来可能会继续共存,而不是一方完全取代另一方。

工具

8、ggview | 减少 R 语言图片输出时尺寸设置的试错

使用R语言进行数据可视化时,调整输出图片的尺寸是一个常见的痛点,尤其是需要多次导出图片进行尺寸调整时,不仅耗时,还可能影响工作效率。ggview包通过在RStudio界面中实时预览ggplot2生成的图片尺寸,帮助用户在导出图片前准确调整尺寸,避免了反复试错。

  • 工具链接:https://github.com/idmn/ggview

9、METAFlux | 基于R语言的单细胞及Bulk转录组代谢通量分析流程及可视化

METAFlux,一款基于R语言的代谢通量分析工具,专门用于从单细胞和Bulk RNA-seq数据中推断代谢通量。该工具于2022年发表在《Nature Communications》上,旨在解决现有代谢组学和通量分析方法在模拟复杂肿瘤微环境时的局限性。METAFlux通过基因组尺度的代谢模型从基因表达数据计算代谢反应活性得分,并应用通量平衡分析来估计代谢通量。它特别适用于肿瘤微环境代谢分析,但也适用于非肿瘤细胞。

  • 工具链接:https://github.com/milanvarady/Applite

10、tracksPlot | 轨道/热图

本文通过scRNAtoolVis包演示了如何绘制tracksPlot。

  • 工具链接:https://github.com/junjunlab/scRNAtoolVis

资源

11、可变剪接及其表观遗传调控综述

本资源根据 2016 年 8 月复旦大学倪挺教授在「表观基因组学暑期国际讲习班」中的报告整理而成。

12、Bioconductor既往课程资料集合

本资源列出了Bioconductor过往基于基因组数据分析的课程材料,并按年份分类。此外,Bioconductor还提供定制化工作坊,针对不同教育和工业客户的需求,提供基因组数据分析的统计方法和软件培训。

贡献者(GitHub ID)

「Openbiox 生信周刊」运维小队:

  • @ShixiangWang(王诗翔)
  • @kkjtmac(阚科佳)
  • @NiEntropy(赵启祥)
  • @He-Kai-fly(何凯)
  • @JnanZhang(张佳楠)
  • @Tomcxf(陈啸枫)
  • @wangdepin(王德品)
  • @kongjianyang(空间阳)
  • @donghongyu2020(董弘禹)
  • @DrRobinLuo(罗鹏)
  • @Wangcy-rachel - 王春阳
  • @zoe3251 - 舒晨阳

订阅

这个周刊每周日发布,同步更新在微信公众号「优雅R」(elegant-r)上。

微信搜索“优雅R”或者扫描二维码,即可订阅。

(完)

生信爱好者周刊(第 155期):对话拉斯克奖得主陈志坚:专注一个课题,你能跟世界上任何实验室竞争

2025-01-19 14:20:42

生信爱好者周刊(第 155期):对话拉斯克奖得主陈志坚:专注一个课题,你能跟世界上任何实验室竞争

这里记录每周值得分享的生信相关内容,周日发布。

本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。

「生信周刊讨论区」

封面图

image

本周话题:对话拉斯克奖得主陈志坚:专注一个课题,你能跟世界上任何实验室竞争

拉斯克奖得主陈志坚用他的科研经历告诉我们坚持的意义,“如果专注于某一个课题,你要相信这个世界上能比你对这个课题更懂的人不多。虽然有些实验室看上去很大,但真正和一个课题相关的可能就少数一两个学生或博后。如果你找到合适的课题并投身其中,你可以和世界上任何一个实验室竞争”。

生信研究

1、Nat Cancer | 基于机器学习和泛癌蛋白基因组学构建人类癌症功能网络

image

文章基于监督机器学习方法,结合11种癌症类型中1,194个个体的大量蛋白质组学和RNA测序(RNA-seq)数据构建了一种名为FunMap的泛癌功能网络。

  • 文章链接:https://www.nature.com/articles/s43018-024-00869-z

2、National Science Review | 单细胞水平筛选抗肿瘤药物的深度学习框架——“神农”

Image 该文章介绍了良渚实验室团队开发的深度学习框架“神农”,该框架利用单细胞测序技术和人工智能技术,在单细胞水平上高效筛选抗肿瘤药物,并揭示了药物的作用机制及潜在副作用。通过构建泛肿瘤单细胞图谱,神农框架能够识别新适应症药物、预测潜在作用靶点及评估组织损伤效应,展现出良好的稳健性和泛化能力,有望显著提升药物筛选的效率和准确度,加速新药开发进程。

3、Science | 经活动驱动线粒体DNA转录

Image 浙江大学医学院马欢教授团队揭示了大脑通过神经活动驱动线粒体基因转录的节能机制,并提出通过增强这一机制可能有助于对抗大脑衰老,为神经科学研究和人工智能发展提供了新视角。

博文咨询

4、Cell推出“全球科学50人”

该文章展示了Cell Press推出的“全球科学50人”系列采访中14位华人科学家的杰出贡献,涵盖多个科学领域,体现了华人科学家在全球科学研究中的重要地位。

5、一个生信工作者与大模型的一天

image

该推文介绍了一场关于人工智能技术在大模型应用和科学研究中高效协作的讨论会。会议深入探讨了人工智能技术,如智能体、知识图谱、自然语言处理等在文本工作、文献搜索、代码辅助以及科学研究中的应用,并分享了实际工作中的应用案例和挑战解决方案。

6、排版引擎纵谈:程序员的视角

image

该推文从程序员的视角深入探讨了HTML/CSS、LaTeX、LaTeX.js、Typst和react-pdf多种排版引擎的优缺点,并解释了为何PPResume选择LaTeX作为默认排版引擎。

工具

7、fasthtml | 现代纯Python网络应用程序

image

像是一个类 Shiny 的项目。

  • 项目地址:https://github.com/answerdotai/fasthtml
  • Gallery:https://gallery.fastht.ml/

8、LexicMap | 针对数百万个原核生物基因组的高效序列比对

image

LexicMap是一种核苷酸序列比对工具,能够高效地查询基因、质粒、病毒或长读长序列,与多达数百万个原核生物基因组进行比对。

  • 工具:https://github.com/shenwei356/LexicMap
  • 文章链接:https://doi.org/10.1101/2024.08.30.610459

9、ReactPress | 一个基于Next.js的博客&CMS系统

自己建站应该是一个不错的选择。

资源

10、经典的试验设计入门书出版中文版

image

文章推荐了一本中文版本的经典实验设计入门书,这本书介绍了现代试验设计在统计方面应用的基本思想。

11、Data Commons

image

谷歌集纳的一个数据集合与解读网站。

image

贡献者(GitHub ID)

「Openbiox 生信周刊」运维小队:

  • @ShixiangWang(王诗翔)
  • @kkjtmac(阚科佳)
  • @NiEntropy(赵启祥)
  • @He-Kai-fly(何凯)
  • @JnanZhang(张佳楠)
  • @Tomcxf(陈啸枫)
  • @wangdepin(王德品)
  • @kongjianyang(空间阳)
  • @donghongyu2020(董弘禹)
  • @DrRobinLuo(罗鹏)
  • @Wangcy-rachel - 王春阳
  • @zoe3251 - 舒晨阳

订阅

这个周刊每周日发布,同步更新在微信公众号「优雅R」(elegant-r)上。

微信搜索“优雅R”或者扫描二维码,即可订阅。

img

(完)

生信爱好者周刊(第 154 期):海归青椒“硬着陆”

2025-01-03 18:14:21

生信爱好者周刊(第 154 期):海归青椒“硬着陆”

这里记录每周值得分享的生信相关内容,周日发布。

本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。

「生信周刊讨论区」

在发布这期内容之前,我回查了下记录:2021年9月12日我发布了第1期的内容,2022年8月6日开始以协作组的形式发布了第39期的内容。现在回头其实难以想象,为这个没有什么直接受益的事情坚持了三年多的时间,访问阅读量其实也并不多。我其实也不知道有多少读者能够有所收获,但我们一直在坚持着。这种坚持离不开所有weekly成员的付出,除了我之外,像阚科佳、陈啸枫、何凯、赵启祥等2024年都负责了超过了4次内容的编排,他们以及其他成员活跃地贡献了大部分内容的整理。感谢我自己的坚持,也感谢他们的坚持和信任,共同的努力是延续的根本。三年多前,我刚博士毕业、博士后入站不久;当前,我成为一名较为独立的科研工作者、高校教师,weekly以及weekly团队伴随了这一段成长经历,真心希望「生信爱好者周刊」的标志也能够伴随每位团队成员和读者的分享和成长。2025,我们坚持分享周刊进入第5年了,感谢大家!

——王诗翔

封面图

树莓派掌上电脑

本周话题:海归青椒“硬着陆”

数据显示,中国留学人员环流趋势明显。2020年留学回国发展人数首次超过出国留学人数,2021年留学回国人员超过100万,十五年前,这一数字为6.93万人。今天,与大批留学回国人员一起求职的还有1000多万本土应届毕业生。在近年来的相关研究或者社会讨论中,人们愈发关注归国青年教师所面临的多重挑战。对于他们中的许多人来说,找到一份合适的教职仅仅是第一关,他们还需要从零启动科研,建立新的学术网络联结,在教学、研究与行政琐事寻找平衡。“非升即走”背景下,水涨船高的考核标准如同达摩克利斯之剑一般,悬在许多人头上。有人在阵痛期顺应土壤,调整自己的重心和工作安排;有人累积科研资本,申请”人才帽子”等以保障自己稳定的科研生产。也有人离开,重启赛道。

@ShixiangWang:政策和文化不要通过竞争机制去消耗人才资源,去生硬地适应环境,而是通过竞争连接、分享、沉淀、创新。这算是我个人对于推文最后一段内容的回应吧。

生信研究

1、Cell | 整合多组学、多类型的肿瘤数据,构建全面的肿瘤治疗靶点全景图

文章通过整合多种组学、多种癌症类型的肿瘤数据,构建了全面的肿瘤治疗靶点全景图,成功发现并验证了多种癌症治疗的潜在靶点,揭示了改进和开发癌症治疗策略的新机会。

  • 论文链接:https://www.cell.com/cell/fulltext/S0092-8674(24)00583-X

2、Nature Communications|通过野生和栽培辣椒基因组研究揭示辣椒为什么会辣

文章通过组装两个端粒到端粒(T2T)无缺口辣椒基因组,深入解析了辣椒着丝粒序列特征,发现了独特的重复序列元件。并基于分子钟估计了茄科中辣椒素合成通路的进化时间节点,揭示了茄科植物中辣味形成和丧失的遗传基础。 - 论文链接:https://www.nature.com/articles/s41467-024-48643-0

3、Nature Communications | 肿瘤外显子测序数据的ecDNA扩增鉴定新方法

研究团队研发了一种机器学习模型和工具GCAP,用于预测肿瘤基因组中的ecDNA扩增及其相关基因。该模型从基因组变异角度出发,结合了肿瘤样本和基因水平的基因组损伤、拷贝数变异信息以及其他相关因素,能够预测单一样本中ecDNA扩增的情况。此外,该方法还适用于肿瘤全基因组和SNP芯片数据,具有广泛的实用价值。

  • 论文链接:https://www.nature.com/articles/s41467-024-45479-6

博文资讯

4、一个快速构建多个Git标识的小技巧

Git是一个分布式版本控制软件,Garrit Franke的这篇博客分享了关于如何快速构建多个Git标识。

5、一图流:机器学习基本流程

原文用一张图介绍了机器学习的基本流程和知识,适合机器学习的初学者进行阅读。

工具

6、GW-快速浏览基因组数据信息

GW是一个快速的基因组浏览器,允许您显示测序数据,特征轨迹,缩略图,生成静态图像和标签变体。

7、sshx | 一个安全的基于网络的协作终端

8、Omnivore-全面的文本阅读器

Omnivore是一个完整的、开源的文本阅读器,它支持高亮显示、笔记、搜索和分享、全键盘导航等功能。

9、RainbowGPT AI Agent

RainbowGPT结合了AI Agent代理、GPT-4、GPT3.5、ChatGlm3、Qwen LLM、ChromaDB矢量数据库、Langchain知识库问答检索和谷歌搜索引擎。

资源

10、jyshare-工具导航站

一个很齐全的工具导航站点,涵盖常用的编译、搜索和AI应用等相关工具软件,建议收藏!

贡献者(GitHub ID)

「Openbiox 生信周刊」运维小队:

  • @ShixiangWang(王诗翔)
  • @kkjtmac(阚科佳)
  • @NiEntropy(赵启祥)
  • @He-Kai-fly(何凯)
  • @JnanZhang(张佳楠)
  • @Tomcxf(陈啸枫)
  • @wangdepin(王德品)
  • @kongjianyang(空间阳)
  • @donghongyu2020(董弘禹)
  • @DrRobinLuo(罗鹏)
  • @Wangcy-rachel - 王春阳
  • @zoe3251 - 舒晨阳

订阅

这个周刊每周日发布,同步更新在微信公众号「优雅R」(elegant-r)上。

微信搜索“优雅R”或者扫描二维码,即可订阅。

(完)

生信爱好者周刊(第 153 期):做诚实的学问,做正直的人

2024-12-29 18:23:49

生信爱好者周刊(第 153 期):做诚实的学问,做正直的人

这里记录每周值得分享的生信相关内容,周日发布。

本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。

「生信周刊讨论区」

封面图

免疫先锋:T细胞在抗癌战斗中的关键作用. Credit: James Cavallini/Science Photo Library

本周话题:做诚实的学问,做正直的人

本次的话题来自施一公在2018年全国科学道德和学风建设宣讲教育报告会上的演讲报告

@kkjtmac 当前学术造假现象屡见不鲜,部分与当下急功近利的体系和制度相关。科研的核心在于求真,杜绝学术造假,需要完善监督和更加严格的处罚机制,同时倡导独立人格与内心驱动的科研动力。

生信研究

1、Nature Methods|大语言模型助力基因功能发现

文章创新性得将5个主流大模型引入到基因功能分析中,其中GPT-4在73%的案例中给出的功能描述与人工注释高度相符。

  • 论文链接:https://www.nature.com/articles/s41592-024-02525-x

2、Science | 构建衰老全景图谱,首次揭示不同器官、性别和衰老阶段的细胞动态变化

文章构建了一张覆盖超过两千万个细胞的哺乳动物衰老全景图谱(PanSci),首次揭示了不同器官、性别和衰老阶段的细胞动态变化。

  • 论文链接:https://www.science.org/doi/10.1126/science.adn3949

博文资讯

3、一文总结队列研究

本文以Lancet Glob Health经典的队列研究文章为例,对队列研究系列的重要知识点进行总结,为读者未来在临床实践中开展队列研究并撰写文章提供思路。

4、提升 Shell 脚本用户体验

本文介绍了6种方法,让shell脚本更安全且易于使用,包括错误处理、彩色输出、进度报告、错误处理策略、平台适配和时间戳文件输出。

5、140+ ggplot2 扩展包让你的图表更出彩

这个网页中收录了140+个ggplot2可视化扩展包,供大家学习和探索。

6、Cancer Cell | 癌细胞状态:人类肿瘤单细胞RNA测序十年的经验教训

本文总结了单细胞RNA测序技术在分析人类肿瘤中十年的应用经验,探讨了肿瘤内异质性、计算方法、常见程序和未来研究方向,强调了联合多组学方法全面理解癌症复杂性的重要性。

7、Cell | 建立整体细胞状态和状态转换的概念框架

文提出一个旨在促进定量、整合和预测模型发展的概念框架,以更好地理解细胞的功能、行为和对扰动的响应。尽管目前还存在许多挑战,如数据整合的技术难题、模型的复杂性等,但随着技术的发展,这些问题是有望得到解决的。在未来,随着技术的进步和数据的积累,细胞生物学有望在大数据时代取得重大进展。通过本文提出的框架,研究人员可以更好地理解细胞状态和状态转换,从而推动生物医学研究的发展。

工具

8、TissueEnrich | 计算组织特异性基因富集的工具

TissueEnrich是用于计算一组输入基因中组织特异性基因富集的工具。原文详细介绍了TissueEnrich软件包以及TissueEnrich的下载安装和使用介绍。 - 工具链接:https://github.com/Tuteja-Lab/TissueEnrich - 论文链接:https://doi.org/10.1093/bioinformatics/bty890

9、applite | 用户友好的GUI macOS应用程序,用于Homebrew Casks

Applite 是一个免费且开源的 macOS 应用程序,它通过 Homebrew 简化了第三方应用程序的安装和管理。

  • 工具链接:https://github.com/milanvarady/Applite

10、eheat | 扩展复杂热图的R包

“eheat”的软件包起到了一个桥梁的作用,它连接了两个不同的R语言绘图包:ggplot2和ComplexHeatmap。

  • 工具链接:https://github.com/Yunuuuu/eheat

资源

11、科研必备数据资源集合 | 80+生物医学权威数据集

本文介绍了Genomics、Medical Imaging、Proteomics、Microbiome & Metagenomics、EHR、ClinicalTrial、Biobank 和Spatial Transcriptomics 8大类生物医学核心数据集,涵盖近80+权威数据集。

贡献者(GitHub ID)

「Openbiox 生信周刊」运维小队:

  • @ShixiangWang(王诗翔)
  • @kkjtmac(阚科佳)
  • @NiEntropy(赵启祥)
  • @He-Kai-fly(何凯)
  • @JnanZhang(张佳楠)
  • @Tomcxf(陈啸枫)
  • @wangdepin(王德品)
  • @kongjianyang(空间阳)
  • @donghongyu2020(董弘禹)
  • @DrRobinLuo(罗鹏)
  • @Wangcy-rachel - 王春阳
  • @zoe3251 - 舒晨阳

订阅

这个周刊每周日发布,同步更新在微信公众号「优雅R」(elegant-r)上。

微信搜索“优雅R”或者扫描二维码,即可订阅。

(完)

生信爱好者周刊(第152期):2024 Science年度十大科学突破

2024-12-22 17:56:04

生信爱好者周刊(第152期):2024 Science年度十大科学突破

这里记录每周值得分享的生信相关内容,周日发布。

本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。

「生信周刊讨论区」

封面图

本周话题: 2024 Science年度十大科学突破

这篇文章是对“2024 Science年度十大科学突破”的详细报道,主要概述了《科学》杂志评选出的本年度十大科学突破,包括长效HIV预防针剂lenacapavir作为暴露前预防(PrEP)的重要进展,其显著降低了HIV感染风险并展现出对抗其他病毒性疾病的潜力;嵌合抗原受体T细胞(CAR-T)疗法在自身免疫疾病治疗方面的新突破,为狼疮、硬皮病等疾病患者带来希望;詹姆斯·韦伯空间望远镜(JWST)揭示的宇宙早期星系的形成与演化机制;基于RNA干扰(RNAi)的杀虫剂在害虫控制领域的创新应用;硝基体作为真核生物固氮细胞器的发现对进化论的补充;地幔波动对大陆轮廓形成及地质活动影响的新理论;SpaceX“星舰”火箭的成功着陆及其对未来太空探索成本降低的意义;以及其他在遗传学研究、固氮细胞器发现、地幔波动研究等领域的重大进展。这些突破共同展示了2024年在科学领域的广泛进步和深远影响。

生信研究

  1. Nat Commun | AlphaFold2新方法高通量预测蛋白质构象分布,准确率超80%

这篇文章是关于“AlphaFold 2新方法高通量预测蛋白质构象分布”的研究报告摘要,主要讲述了美国布朗大学的研究团队在Nature Communications上发表的一项研究,该研究提出了一种创新的AlphaFold 2(AF2)使用方法,通过亚采样多序列比对预测蛋白质构象分布,准确率超过80%。

文章介绍了一种基于纳米孔测序技术的端粒分析方法——Telomere Profiling,可以在单核苷酸分辨率下测量细胞中每个端粒的长度。该方法具有低成本、高度准确性及优异的可重复性。

文章使用雌雄大鼠模型,从多器官、多组学、多时间点解析耐力运动后的分子变化,并总结分析了其关联生物学通路的组织、性别差异。

文章综合了众多三代基因测序技术,进行了基因测序和组装,获得了长度为2.77 Gbp(表示十亿个碱基对)的完整的高质量小鼠参考基因组序列,填补了约7.7%的基因组空白。

  • 文章链接:https://www.science.org/doi/10.1126/science.adq8191

博文资讯

  1. excluderanges

excluderanges是一个用于处理和检索问题基因组区域(problematic genomic regions)的R工具包,适用于人类、小鼠和一些模式生物。它提供问题基因组区域的坐标信息,这些区域在基因组数据分析时应避免使用。统一了多个实验室生成的不同排除集(exclusion sets)的检索。

  1. 撰写研究计划

这篇文章是关于如何撰写研究计划的指南,主要介绍了撰写研究计划的重要性、步骤、技巧以及注意事项,旨在帮助研究人员更好地规划和准备研究项目。

  1. 如何清除Docker缓存并释放系统空间

这是关于篇文章是如何清除Docker缓存和释放系统空间的指南,主要介绍了Docker中占用磁盘空间的不同构建缓存项和如何逐个或全部清除它们,以及在持续集成(CI)环境中管理Docker构建缓存的方法。

工具

8、OpenWDL (The Workflow Description Language (WDL))

工作流描述语言(WDL)是一种开放标准,用于用人类可读和可写的语法描述数据处理工作流。WDL使得定义分析任务、将它们在工作流中连接起来以及并行执行变得简单直接。该语言力求对所有类型的用户都易于访问和理解,包括程序员、分析师和生产系统操作员。该语言允许使用常见的模式,如散列收集和条件执行,以简单的方式表达。WDL旨在具有可移植性,并提供多种实现方式,可在各种环境中运行,包括高性能计算系统和云平台。

9、MuSiC | 多样本单细胞去卷积

MuSiC的原始版本是一种去卷积方法,该方法利用跨样本scRNA-seq来估计bulk RNA-seq数据中的细胞类型比例。

MuSiC2是一种迭代算法,旨在通过使用scRNA-seq数据作为参考,在大量RNA-seq数据生成自具有多个临床条件(其中至少有一个条件与scRNA-seq参考不同)的样本时,提高细胞类型去卷积。

10、Yew | 用于创建可靠和高效的Web应用程序的Rust/Wasm框架

资源

11、在线数据库周刊(11.11-11.17)

这篇文章主要介绍了医学科学研究过程中常用的网络数据库,包括各种专注于转录本、表观遗传基因编辑、药物预测、基因siRNA效能等方面的数据库资源。

贡献者(GitHub ID)

「Openbiox 生信周刊」运维小队:

  • @ShixiangWang(王诗翔)
  • @kkjtmac(阚科佳)
  • @NiEntropy(赵启祥)
  • @He-Kai-fly(何凯)
  • @JnanZhang(张佳楠)
  • @kkjtmac(阚科佳)
  • @Tomcxf(陈啸枫)
  • @wangdepin(王德品)
  • @kongjianyang(空间阳)
  • @donghongyu2020(董弘禹)
  • @DrRobinLuo(罗鹏)
  • @Wangcy-rachel - 王春阳
  • @zoe3251 - 舒晨阳

订阅

这个周刊每周日发布,同步更新在微信公众号「优雅R」(elegant-r)上。

微信搜索“优雅R”或者扫描二维码,即可订阅。

生信爱好者周刊(第 151 期):一半以上实验结果无法重复,学术界正在遭遇一场危机吗

2024-12-15 20:52:19

生信爱好者周刊(第 151 期):一半以上实验结果无法重复,学术界正在遭遇一场危机吗

这里记录每周值得分享的生信相关内容,周日发布。

本杂志开源(GitHub: ShixiangWang/weekly),欢迎提交 issue,投稿或推荐生信相关内容。

「生信周刊讨论区」

封面图

本周话题:一半以上实验结果无法重复,学术界正在遭遇一场危机吗?

在有些领域,理论和实验技术都已发展到了很高的水平(比如高能物理),其实验设计和分析的范式已经高度统一,没有太多任由实验人员自行裁量的空间,结果可重复性自然就高。然而像心理学这样的学科,目前的技术水平还无法做到这种程度的一致性,需要假以时日等待技术的自然进步,在此之前,要对可重复的实验比例有个理性的预期。

生信研究

1、Nature Medicine │新一代三合一无创产前筛查多中心前瞻性临床研究成果

文章运用创新的无创产前筛查技术——协同等位基因靶向富集测序(COATE-seq),通过分析孕妇血浆中的游离DNA,在临床上首次运用无创的方法全面筛查包括单基因疾病、染色体非整倍体和染色体微缺失综合征等不同类型的胎儿遗传变异。

  • 文章链接:https://www.nature.com/articles/s41591-023-02774-x

2、Nature Genetics | 揭示癌症突变背后的秘密:MuSiCal算法的突破与应用

这篇文章主要介绍了MuSiCal(Mutational Signature Calculator)这一创新分析框架及其算法在癌症突变特征分析中的突破与应用。该算法通过解决标准工作流中的主要问题,提高了特征发现和分配的准确性,为癌症研究提供了更加精确的生物标志物,并为未来的癌症诊断和治疗提供了强有力的分子基础。 - 文章链接:https://www.nature.com/articles/s41588-024-01659-0

3、Cancer Cell | 功能性解析乳腺癌基因组变异互作在精准治疗中的指导价值

文章系统性绘制了全面的乳腺癌基因组变异互作网络,结合临床治疗队列及体内外模型功能性解析了基因组变异互作对乳腺癌治疗结局的影响,提出了基于基因组变异互作的精准治疗新策略。

  • 文章链接:https://doi.org/10.1016/j.ccell.2024.03.006

4、Science Bulletin | 构建TMB相关免疫浸润调节因子群,助力免疫治疗疗效预测及增效策略开发

文章开发了TMB相关免疫浸润调节因子群(MOTIF),揭示在同等水平TMB水平下诱导CD8+ T细胞浸润能力差异的原因。

  • 文章链接:https://doi.org/10.1016/j.scib.2024.01.025

博文资讯

5、SHAP全解析:机器学习、深度学习模型解释保姆级教程

这篇文章是SHAP(SHapley Additive exPlanations)模型解释的详细教程,主要介绍了SHAP值在机器学习和深度学习模型中的应用,通过分配特征的重要性值来解释模型的预测结果,并提供了多种可视化方法和具体案例来展示SHAP在实践中的使用。

6、The Surprising Things That CSS Can Animate

此网站探讨了CSS动画的意外可能性,展示了一些通常不与动画关联的CSS属性如何被用来创建有趣的动画效果,包括z-index、text-transform、content和counter-increment等属性的动画化,以及如何通过这些动画技巧实现复杂的视觉效果和交互。

7、KEGG又添新功能?疾病和药品信息一网打尽

这篇文章将针对最新版本的KEGG数据库进行介绍,并教大家如何利用KEGG挖掘数据

工具

8、MEBOCOST-单细胞转录组建立代谢细胞-细胞通讯模型

MEBOCOST是一个基于python的计算工具,利用单细胞RNA-seq数据来推断代谢物,如脂质,介导的细胞间通讯事件。MEBOCOST包括一个人工管理的代谢物传感器合作伙伴数据库,并根据代谢物外流和流入的速率以及酶和传感器基因的表达水平分别定义发送和接收细胞。

9、Devsnp-web开发工具

为web开发人员整理的100%免费的资源和工具。

10、Coolify帮你管理服务器

Coolify是Heroku / Netlify / Vercel等的一个开源和自托管的替代品。它可以帮助您在自己的硬件上管理服务器、应用程序和数据库;你只需要一个SSH连接。你可以管理VPS,裸金属,树莓派斯,和其他任何东西。

11、WPS-Zotero-一个用于与Zotero集成的WPS Writer插件

这个插件可以让你在Linux下写论文,再发给别人在Windows/MS Word下改,两边插入的引用可以共通(需要选择将引用存储为域)。

12、GPB | GP-Plotter:一款通用灵活的蛋白质组学质谱数据可视化工具

中国科学院大连化学物理研究所叶明亮研究员课题组发展了GP-Plotter这一可视化工具用于实现蛋白质组学质谱谱图的离子标注与图片输出。该软件可读取并展示常见鉴定工具的结果,也能实现对糖肽谱图的全面注释,并支持镜像谱图等多种显示模式。用户可以通过软件界面轻松修改图片展示的参数,并将标注谱图以矢量图等常见的图像格式输出,促进组学数据的分析与共享。 - 论文链接:https://pubmed.ncbi.nlm.nih.gov/39378133/

贡献者(GitHub ID)

「Openbiox 生信周刊」运维小队:

  • @ShixiangWang(王诗翔)
  • @kkjtmac(阚科佳)
  • @NiEntropy(赵启祥)
  • @He-Kai-fly(何凯)
  • @JnanZhang(张佳楠)
  • @Tomcxf(陈啸枫)
  • @wangdepin(王德品)
  • @kongjianyang(空间阳)
  • @donghongyu2020(董弘禹)
  • @DrRobinLuo(罗鹏)

订阅

这个周刊每周日发布,同步更新在微信公众号「优雅R」(elegant-r)上。

微信搜索“优雅R”或者扫描二维码,即可订阅。

(完)