2025-03-02 09:26:17
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
谷歌DeepMind CEO Demis Hassabis说,将人工智能视为普通技术是错误的,人工智能将具有“划时代的意义”,很快将治愈所有疾病、解决气候和能源问题并丰富我们的生活,AGI大概需要 10 年时间,因为还需要 2 到 3 项重大创新,下一项就是基于代理的系统,能够完成你给它的特定目标或任务。
1、Evo2 | NVIDIA发布预测所有物种DNA、RNA、蛋白质的形式和功能的最大AI生物模型
Arc研究所、斯坦福大学和NVIDIA联合发布了史上最大生物AI模型Evo-2。该模型基于128,000个基因组训练,涵盖从人类到细菌的多种生物,可预测DNA、RNA、蛋白质的功能,并生成染色体和小基因组。它还理解非编码基因变体,有望助力基因组设计和疾病研究。
2、Science | 赢得诺奖不是终点!David Baker再获里程碑突破——AI首次从头设计出蛋白酶
该研究利用 AI 从头设计了具有复杂活性位点的丝氨酸水解酶,这也是首次从头设计一种新的酶,其能够加快一个四步化学反应,该反应对于许多生物和工业过程至关重要,其中包括塑料降解和回收。
3、Cancer Cell | 三阴性乳腺癌化疗与免疫治疗的协同机制
研究团队系统整合了前期关于紫杉醇联合PD-L1抗体治疗的单细胞测序数据,并结合最新生成的白蛋白结合型紫杉醇(Nab-PTX)与PD-L1抗体联合的单细胞测序数据,对TNBC患者接受紫杉醇、白蛋白紫杉醇及其与PD-L1抗体阿替丽珠单抗联合治疗后的肿瘤免疫微环境进行了系统性分析,揭示了不同化疗药物在拮抗或协同免疫治疗中的独特作用机制,并提出了肥大细胞作为潜在治疗靶点的新观点,为优化TNBC的精准治疗策略提供了全新的理论依据。
该推文复现了Nature中出现的风车图,包含所有代码和数据文件。
5、万人围观,用DeepSeek搭建个人知识库,真香!(附完整教程)
本文介绍如何使用DeepSeek搭建个人知识库,方便集中管理和快速检索文档、笔记等资料。教程包括:下载安装Cherry Studio、注册登录“硅基流动”平台、配置API秘钥、添加对话和嵌入模型、创建知识库、上传文件并生成向量,以及通过智能助手引用知识库回复问题。网页版适合个人数据不涉及泄露风险的用户,本地部署则需较高硬件配置。
推文中详细讲解了如何设计一个生物信息学研究,包括从科研问题到数据分析的各个步骤。
7、shiny 版交互式大语言模型 shiny.ollama
本文介绍了 shiny.ollama,一个基于 R Shiny 和 Ollama 的交互式大语言模型工具,支持本地部署,具备完全离线、隐私保护、模型选择、消息输入、聊天记录保存等功能。用户需先安装 Ollama 和 shiny.ollama(可通过 CRAN 或 GitHub 下载)。安装完成后运行 shiny.ollama::run_app() 即可启动应用。
9、Stirling-PDF | 本地托管的 PDF 操作工具
推文中分类介绍了生物信息学中最常用的30个Python库,包括SciPy、Matplotlib、Biopython等。
11、40个顶刊同款图含代码
推文汇总了40个顶刊的同款图以及代码,包括拟合散点图、火山图、小提琴图、韦恩图、累积柱状图、热图、箱线图、火柴杆图等。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)
2025-02-16 15:32:08
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
图源:The best science images of 2024 — Nature’s picks
“为持续深化科学基金人才项目改革,确保人才项目健康发展,切实起到激励人才成长的目的,避免“帽子化”等异化使用现象,自2025年起,将国家杰出青年科学基金项目更名为青年科学基金项目(A类),将优秀青年科学基金项目更名为青年科学基金项目(B类),将青年科学基金项目更名为青年科学基金项目(C类)。”本次更名进行得十分低调且突然,出乎很多申请人的意料。这意味着,杰青、优青这两个为学术界熟知的名字,可能从此成为历史的遗迹,被青年科学基金项目(A类)、(B类)替代。刚过去的2024年是“国家杰出青年科学基金”设立30周年,仅仅一个月不到,这块三十年的招牌已经成为历史。
@ShixiangWang
:更名在短时间内难以取缔,类似985一样。在正式文件下,是沉默的潜规则。有时候讨论这类问题,有点绕,因为更名本身没有意义,有意义的是后续的行动以及要塑造的科学文化。人才的去帽子化是一个好的开始。但其他人才项目是否会跟进?去帽子化会不会促进更普世自由的研究资助?另外近期也看到马斯克在漂亮国大变革,其中包括大量裁撤科学基金人员和资助,这是否会对我们国家人才项目等行动产生影响有待未来观察。
现有空间蛋白质组学技术受限于质谱检测通量和高昂成本,难以兼顾高分辨率与大面积组织分析需求,限制了其在复杂组织研究中的广泛应用。中国科学院动物研究所的赵方庆团队提出了全新的空间蛋白组学技术框架——PLATO,通过整合人工智能深度学习算法与微流控技术,实现了全组织切片水平的高分辨率空间蛋白质组检测(25微米分辨率,数千个蛋白),突破了高通量原位组学技术的瓶颈。
2、iMeta | 结合treeio和ggtree包解析系统发育位置数据
文章提出的工具结合treeio和ggtree包,能够有效解析复杂的系统发育放置数据,并提供定制化的不确定性可视化解决方案。
在人工智能快速发展的今天,AI在医疗领域展现出巨大潜力。这项技术不仅能够提高诊断准确性,还能扩大医疗服务覆盖范围,减轻医护人员的行政负担,使他们能够将更多精力投入到病患护理中。然而,医疗AI的开发门槛依然很高,需要海量数据、专业知识和强大的计算资源。为了降低这一门槛,Google研究院健康AI团队于近日推出了全新的开源模型套件——Health AI Developer Foundations(HAI-DEF)。在本次HAI-DEF的首次发布中,Google推出了三个专注于医疗影像应用的重要模型。首先是CXR Foundation胸部X光模型,该模型基于EfficientNet-L2架构,使用超过80万张X光片进行训练,支持图像分类、语义搜索和零样本分类等功能。其次是Derm Foundation皮肤影像模型,它采用BiT ResNet-101x3架构,可用于皮炎、黑色素瘤等皮肤病诊断,同时支持身体部位识别和图像质量评估。第三个是Path Foundation病理学模型,它基于ViT-S架构,专门处理H&E染色图像,可用于肿瘤分级、组织分类等重要临床任务。
被列入不可靠实体清单的外国实体,将面临包括限制或禁止其从事与中国有关的进出口活动、限制或禁止其在中国境内投资、限制或禁止其相关人员入境等一系列措施。
一位优青获得者的基金申请书撰写体会。更多内容阅读原推文。
该推文中的研究对比分析了9种去卷积方法的性能,并提出了一系列推荐指南,以帮助研究者在不同应用场景下选择最优工具。
该推文介绍了2024年生物信息学领域的十大突破,包括按需设计蛋白质、AlphaFold3、多模态人工智能等内容。
8、基于 Typst 的新一代的学术幻灯片(Slides)神器 —— Touying
Typst 是为写作而诞生的基于标记的排版系统,Typst 的目标是成为功能强大的排版工具,并且让用户可以愉快地使用它。简单来说:Typst = LaTeX 的排版能力 + Markdown 的简洁语法 + 强大且现代的脚本语言。
而 Touying 是为 Typst 开发的幻灯片/演示文稿包。Touying 也类似于 LaTeX 的 Beamer,但是得益于 Typst,你可以拥有更快的渲染速度与更简洁的语法。
iseq -i accession [options]
Accepted accession formats:
1.Projects: PRJEB, PRJNA, PRJDB, PRJC, GSE
2.Studies: ERP, DRP, SRP, CRA
3.BioSamples: SAMD, SAME, SAMN, SAMC
4.Samples: ERS, DRS, SRS, GSM
5.Experiments: ERX, DRX, SRX, CRX
6.Runs: ERR, DRR, SRR, CRR
iSeq用于从GSA, SRA, ENA, 和 DDBJ数据库下载原始数据和元信息。
10、AI 调色盘生成器
11、Cell杂志评选出2014-2024重大成果(时间线一览)附2025新年社论
为期一年的《细胞》(Cell)50周年庆典接近尾声之际,期刊推出了“Cell Line: 2014–2024”时间线,重点展示了该期刊发表的一系列杰出科学成果——包括里程碑式的论文和重要的综述文章。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)
2025-01-26 18:33:26
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
@kkjtmac 简短概括一下:2024在科研、技术开发和项目管理方面取得了一定的进展,更加深入探索细胞与基因治疗等领域,推动多个技术平台应用。
1、Nature Genetics | 一种高通量、大视野的空间转录组学新技术(MAGIC-seq)
Nature Genetics 上这篇文章报道了中国科学院动物研究所赵方庆团队在空间转录组学领域取得的重大突破。他们开发了一种名为 MAGIC-seq 的高通量、大视野空间转录组学新技术,通过创新的网格化微流控芯片设计和新的空间编码技术,显著提高了检测通量和捕获面积,同时降低了成本和批次效应。该技术首次提出了“拼接芯片”的概念,能够灵活调整网格布局,适应不同样本形状和数量的需求。MAGIC-seq在小鼠多个组织(包括大脑、小脑、心脏等)的测试中表现出色,成功构建了高质量的三维空间转录组图谱,为空间转录组学研究提供了强大的工具。
诺贝尔化学奖得主David Baker教授团队在《Nature》发表成果,利用AI从头设计的蛋白质成功阻断了眼镜蛇、蝰蛇等毒蛇毒液中致命毒素的作用。研究团队通过AI工具RFdiffusion设计出“迷你结合剂”,能够紧密结合蛇毒中的关键毒素成分。实验表明,这些结合剂在体外和体内均能有效中和毒素,甚至在小鼠被注射致死剂量毒素15分钟后,仍能实现完全保护。该研究不仅为蛇咬伤治疗提供了新的思路,还展示了AI在蛋白质设计领域的巨大潜力。
3、Genome Biology | 表观基因组学预训练语言模型EpiGePT
人类基因组中非编码区域的调控机制一直是基因组学的难题。传统基因组语言模型在预测新细胞类型的表观基因组信号方面存在局限。Genome Biology上发表提出了EpiGePT模型。该模型基于Transformer架构,融合DNA序列、转录因子表达和结合基序信息,突破了传统模型的局限,能够准确预测染色质开放性、组蛋白修饰等多种表观基因组信号,并具备细胞类型感知能力。EpiGePT通过三维基因组数据引导训练,增强了对染色质互作关系的捕捉能力,验证了其在人类和小鼠细胞系中的高准确性和泛化能力。该模型为解码基因调控机制、解读致病变异提供了有力支持,并有望推动精准医学和靶向药物研发。
4、Nature Methods | 核苷酸转换模型(Nucleotide Transformer)
近几年,人工智能(AI)领域的基础模型为这一难题带来了新曙光。这些模型(如BERT、GPT)通过从文本中学习语言规则,在自然语言处理中实现了从无到有的认知飞跃。受此启发,研究人员将这一技术嫁接到基因组学中,开发出了专门用于DNA序列分析的核苷酸转换模型(Nucleotide Transformer, NT)。它不仅能像阅读文本一样解读DNA序列,还能够预测基因组中的关键功能区域。更令人兴奋的是,NT模型通过跨物种的数据训练,展现了强大的任务适应性和功能泛化能力。无论是剪接位点的精确定位,还是复杂增强子活性的预测,这一模型都打破了传统方法的桎梏,为基因组学研究提供了前所未有的洞见。
蛋白翻译后修饰(PTMs)是指蛋白质在生物合成后氨基酸侧链的化学修饰,目前已发现超过400种PTMs类型,对蛋白质功能有深远影响。文章回顾了PTMs的历史发展,介绍了经典和新兴的PTMs类型。经典PTMs包括磷酸化(1906年首次发现,调控蛋白质活性,参与细胞信号传导等过程)、乙酰化(1964年发现,影响染色质稳定性和蛋白质相互作用)和泛素化(1975年发现,调控蛋白质降解和信号转导)。新兴PTMs包括巴豆酰化(2011年发现,标记活跃启动子和增强子)和乳酸化(2019年发现,参与基因表达和代谢调节)。这些修饰的研究不断拓展,为理解蛋白质功能和疾病机制提供了重要视角。
2025年1月16日,《临床医师癌症杂志》发布了《2025年度癌症报告》。报告指出,从1991年到2022年,美国癌症死亡率下降了34%,避免了约450万人死亡。2025年预计美国将有2,041,910例新癌症诊断(每天5,600例),618,120例癌症死亡病例。前列腺癌、肺癌和结直肠癌占男性发病的48%,乳腺癌、肺癌和结直肠癌占女性发病的51%。尽管吸烟率从1965年的42%下降到2020年的12%,肺癌仍是主要死亡原因。癌症发病率在中年群体中增加,尤其是女性。儿童和青少年癌症发病率略有下降,但死亡率显著降低。报告强调,癌症负担正在从老年人向年轻人、从男性向女性转移,乳腺癌、前列腺癌和子宫癌发病率上升需关注。
这篇文章探讨了尽管GPU(图形处理单元)在处理并行计算任务方面表现出色,但CPU(中央处理单元)仍然被广泛使用的原因。文章指出,CPU在处理复杂逻辑、顺序执行以及低功耗场景中具有独特优势。例如,CPU更适合运行操作系统、处理多任务和执行复杂的算法,而GPU则在图形渲染、深度学习等并行任务中表现更好。此外,CPU的通用性和兼容性使其能够适应各种应用场景,而GPU则需要特定的硬件和软件支持。文章强调,CPU和GPU各有优势,未来可能会继续共存,而不是一方完全取代另一方。
8、ggview | 减少 R 语言图片输出时尺寸设置的试错
使用R语言进行数据可视化时,调整输出图片的尺寸是一个常见的痛点,尤其是需要多次导出图片进行尺寸调整时,不仅耗时,还可能影响工作效率。ggview包通过在RStudio界面中实时预览ggplot2生成的图片尺寸,帮助用户在导出图片前准确调整尺寸,避免了反复试错。
9、METAFlux | 基于R语言的单细胞及Bulk转录组代谢通量分析流程及可视化
METAFlux,一款基于R语言的代谢通量分析工具,专门用于从单细胞和Bulk RNA-seq数据中推断代谢通量。该工具于2022年发表在《Nature Communications》上,旨在解决现有代谢组学和通量分析方法在模拟复杂肿瘤微环境时的局限性。METAFlux通过基因组尺度的代谢模型从基因表达数据计算代谢反应活性得分,并应用通量平衡分析来估计代谢通量。它特别适用于肿瘤微环境代谢分析,但也适用于非肿瘤细胞。
本文通过scRNAtoolVis包演示了如何绘制tracksPlot。
本资源根据 2016 年 8 月复旦大学倪挺教授在「表观基因组学暑期国际讲习班」中的报告整理而成。
本资源列出了Bioconductor过往基于基因组数据分析的课程材料,并按年份分类。此外,Bioconductor还提供定制化工作坊,针对不同教育和工业客户的需求,提供基因组数据分析的统计方法和软件培训。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)
2025-01-19 14:20:42
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
拉斯克奖得主陈志坚用他的科研经历告诉我们坚持的意义,“如果专注于某一个课题,你要相信这个世界上能比你对这个课题更懂的人不多。虽然有些实验室看上去很大,但真正和一个课题相关的可能就少数一两个学生或博后。如果你找到合适的课题并投身其中,你可以和世界上任何一个实验室竞争”。
1、Nat Cancer | 基于机器学习和泛癌蛋白基因组学构建人类癌症功能网络
文章基于监督机器学习方法,结合11种癌症类型中1,194个个体的大量蛋白质组学和RNA测序(RNA-seq)数据构建了一种名为FunMap的泛癌功能网络。
2、National Science Review | 单细胞水平筛选抗肿瘤药物的深度学习框架——“神农”
该文章介绍了良渚实验室团队开发的深度学习框架“神农”,该框架利用单细胞测序技术和人工智能技术,在单细胞水平上高效筛选抗肿瘤药物,并揭示了药物的作用机制及潜在副作用。通过构建泛肿瘤单细胞图谱,神农框架能够识别新适应症药物、预测潜在作用靶点及评估组织损伤效应,展现出良好的稳健性和泛化能力,有望显著提升药物筛选的效率和准确度,加速新药开发进程。
浙江大学医学院马欢教授团队揭示了大脑通过神经活动驱动线粒体基因转录的节能机制,并提出通过增强这一机制可能有助于对抗大脑衰老,为神经科学研究和人工智能发展提供了新视角。
该文章展示了Cell Press推出的“全球科学50人”系列采访中14位华人科学家的杰出贡献,涵盖多个科学领域,体现了华人科学家在全球科学研究中的重要地位。
该推文介绍了一场关于人工智能技术在大模型应用和科学研究中高效协作的讨论会。会议深入探讨了人工智能技术,如智能体、知识图谱、自然语言处理等在文本工作、文献搜索、代码辅助以及科学研究中的应用,并分享了实际工作中的应用案例和挑战解决方案。
该推文从程序员的视角深入探讨了HTML/CSS、LaTeX、LaTeX.js、Typst和react-pdf多种排版引擎的优缺点,并解释了为何PPResume选择LaTeX作为默认排版引擎。
像是一个类 Shiny 的项目。
8、LexicMap | 针对数百万个原核生物基因组的高效序列比对
LexicMap是一种核苷酸序列比对工具,能够高效地查询基因、质粒、病毒或长读长序列,与多达数百万个原核生物基因组进行比对。
9、ReactPress | 一个基于Next.js的博客&CMS系统
自己建站应该是一个不错的选择。
文章推荐了一本中文版本的经典实验设计入门书,这本书介绍了现代试验设计在统计方面应用的基本思想。
11、Data Commons
谷歌集纳的一个数据集合与解读网站。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)
2025-01-03 18:14:21
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
在发布这期内容之前,我回查了下记录:2021年9月12日我发布了第1期的内容,2022年8月6日开始以协作组的形式发布了第39期的内容。现在回头其实难以想象,为这个没有什么直接受益的事情坚持了三年多的时间,访问阅读量其实也并不多。我其实也不知道有多少读者能够有所收获,但我们一直在坚持着。这种坚持离不开所有weekly成员的付出,除了我之外,像阚科佳、陈啸枫、何凯、赵启祥等2024年都负责了超过了4次内容的编排,他们以及其他成员活跃地贡献了大部分内容的整理。感谢我自己的坚持,也感谢他们的坚持和信任,共同的努力是延续的根本。三年多前,我刚博士毕业、博士后入站不久;当前,我成为一名较为独立的科研工作者、高校教师,weekly以及weekly团队伴随了这一段成长经历,真心希望「生信爱好者周刊」的标志也能够伴随每位团队成员和读者的分享和成长。2025,我们坚持分享周刊进入第5年了,感谢大家!
——王诗翔
树莓派掌上电脑
数据显示,中国留学人员环流趋势明显。2020年留学回国发展人数首次超过出国留学人数,2021年留学回国人员超过100万,十五年前,这一数字为6.93万人。今天,与大批留学回国人员一起求职的还有1000多万本土应届毕业生。在近年来的相关研究或者社会讨论中,人们愈发关注归国青年教师所面临的多重挑战。对于他们中的许多人来说,找到一份合适的教职仅仅是第一关,他们还需要从零启动科研,建立新的学术网络联结,在教学、研究与行政琐事寻找平衡。“非升即走”背景下,水涨船高的考核标准如同达摩克利斯之剑一般,悬在许多人头上。有人在阵痛期顺应土壤,调整自己的重心和工作安排;有人累积科研资本,申请”人才帽子”等以保障自己稳定的科研生产。也有人离开,重启赛道。
@ShixiangWang
:政策和文化不要通过竞争机制去消耗人才资源,去生硬地适应环境,而是通过竞争连接、分享、沉淀、创新。这算是我个人对于推文最后一段内容的回应吧。
1、Cell | 整合多组学、多类型的肿瘤数据,构建全面的肿瘤治疗靶点全景图
文章通过整合多种组学、多种癌症类型的肿瘤数据,构建了全面的肿瘤治疗靶点全景图,成功发现并验证了多种癌症治疗的潜在靶点,揭示了改进和开发癌症治疗策略的新机会。
2、Nature Communications|通过野生和栽培辣椒基因组研究揭示辣椒为什么会辣
文章通过组装两个端粒到端粒(T2T)无缺口辣椒基因组,深入解析了辣椒着丝粒序列特征,发现了独特的重复序列元件。并基于分子钟估计了茄科中辣椒素合成通路的进化时间节点,揭示了茄科植物中辣味形成和丧失的遗传基础。 - 论文链接:https://www.nature.com/articles/s41467-024-48643-0
3、Nature Communications | 肿瘤外显子测序数据的ecDNA扩增鉴定新方法
研究团队研发了一种机器学习模型和工具GCAP,用于预测肿瘤基因组中的ecDNA扩增及其相关基因。该模型从基因组变异角度出发,结合了肿瘤样本和基因水平的基因组损伤、拷贝数变异信息以及其他相关因素,能够预测单一样本中ecDNA扩增的情况。此外,该方法还适用于肿瘤全基因组和SNP芯片数据,具有广泛的实用价值。
Git是一个分布式版本控制软件,Garrit Franke的这篇博客分享了关于如何快速构建多个Git标识。
原文用一张图介绍了机器学习的基本流程和知识,适合机器学习的初学者进行阅读。
GW是一个快速的基因组浏览器,允许您显示测序数据,特征轨迹,缩略图,生成静态图像和标签变体。
Omnivore是一个完整的、开源的文本阅读器,它支持高亮显示、笔记、搜索和分享、全键盘导航等功能。
RainbowGPT结合了AI Agent代理、GPT-4、GPT3.5、ChatGlm3、Qwen LLM、ChromaDB矢量数据库、Langchain知识库问答检索和谷歌搜索引擎。
一个很齐全的工具导航站点,涵盖常用的编译、搜索和AI应用等相关工具软件,建议收藏!
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)
2024-12-29 18:23:49
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
免疫先锋:T细胞在抗癌战斗中的关键作用. Credit: James Cavallini/Science Photo Library
本次的话题来自施一公在2018年全国科学道德和学风建设宣讲教育报告会上的演讲报告
@kkjtmac 当前学术造假现象屡见不鲜,部分与当下急功近利的体系和制度相关。科研的核心在于求真,杜绝学术造假,需要完善监督和更加严格的处罚机制,同时倡导独立人格与内心驱动的科研动力。
1、Nature Methods|大语言模型助力基因功能发现
文章创新性得将5个主流大模型引入到基因功能分析中,其中GPT-4在73%的案例中给出的功能描述与人工注释高度相符。
2、Science | 构建衰老全景图谱,首次揭示不同器官、性别和衰老阶段的细胞动态变化
文章构建了一张覆盖超过两千万个细胞的哺乳动物衰老全景图谱(PanSci),首次揭示了不同器官、性别和衰老阶段的细胞动态变化。
3、一文总结队列研究
本文以Lancet Glob Health经典的队列研究文章为例,对队列研究系列的重要知识点进行总结,为读者未来在临床实践中开展队列研究并撰写文章提供思路。
本文介绍了6种方法,让shell脚本更安全且易于使用,包括错误处理、彩色输出、进度报告、错误处理策略、平台适配和时间戳文件输出。
这个网页中收录了140+个ggplot2可视化扩展包,供大家学习和探索。
6、Cancer Cell | 癌细胞状态:人类肿瘤单细胞RNA测序十年的经验教训
本文总结了单细胞RNA测序技术在分析人类肿瘤中十年的应用经验,探讨了肿瘤内异质性、计算方法、常见程序和未来研究方向,强调了联合多组学方法全面理解癌症复杂性的重要性。
文提出一个旨在促进定量、整合和预测模型发展的概念框架,以更好地理解细胞的功能、行为和对扰动的响应。尽管目前还存在许多挑战,如数据整合的技术难题、模型的复杂性等,但随着技术的发展,这些问题是有望得到解决的。在未来,随着技术的进步和数据的积累,细胞生物学有望在大数据时代取得重大进展。通过本文提出的框架,研究人员可以更好地理解细胞状态和状态转换,从而推动生物医学研究的发展。
8、TissueEnrich | 计算组织特异性基因富集的工具
TissueEnrich是用于计算一组输入基因中组织特异性基因富集的工具。原文详细介绍了TissueEnrich软件包以及TissueEnrich的下载安装和使用介绍。 - 工具链接:https://github.com/Tuteja-Lab/TissueEnrich - 论文链接:https://doi.org/10.1093/bioinformatics/bty890
9、applite | 用户友好的GUI macOS应用程序,用于Homebrew Casks
Applite 是一个免费且开源的 macOS 应用程序,它通过 Homebrew 简化了第三方应用程序的安装和管理。
“eheat”的软件包起到了一个桥梁的作用,它连接了两个不同的R语言绘图包:ggplot2和ComplexHeatmap。
本文介绍了Genomics、Medical Imaging、Proteomics、Microbiome & Metagenomics、EHR、ClinicalTrial、Biobank 和Spatial Transcriptomics 8大类生物医学核心数据集,涵盖近80+权威数据集。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)