2025-04-26 12:45:26
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
我国各学科最具影响力期刊论文数量、高水平国际期刊论文数量及被引用次数继续保持世界第1位,但研究者发现中国排名前10%的论文有62%的引用来自国内。
@Wangcy-rachel
:中国排名前10%的论文大部分引用来自国内,说明这些论文在国内学术界得到了广泛关注和认可,但这些高水平论文在国际上的影响力相对有限。
1、Leukemia|针对儿童癌症的液体活检Panel仅需1mL血浆即可检测多种不同基因组改变
研究开发了一种针对儿童癌症细胞游离DNA样本中不同体细胞基因组变异的深度测序方法PeCan-Seq,该方法可通过DNA捕获Panel对儿童癌症相关的357个基因进行深度测序,以从头检测染色体拷贝数变异(CNA)和单基因变异。
文章全面绘制了人类健康与疾病蛋白质组图谱,并结合人工智能大数据分析方法构建了疾病诊断预测模型以及发现了26个药物治疗新靶点,为精准医学的实施提供了重要科学依据。
3、Nat Commun∣AI驱动的肽从头测序精准算法π-PrimeNovo
文章研发了首个基于非自回归模型的肽从头测序算法π-PrimeNovo,它彻底颠覆了传统的自回归生成方式,实现了一次性生成整个序列的能力。通过Transformer的自注意力机制,π-PrimeNovo能够让每个氨基酸在生成过程中同时参考序列中其他位置的信息,从而充分捕捉氨基酸之间的双向依赖关系,显著提高了预测准确性。
本文介绍了利用ggplot2绘制森林图的方法。
OpenAI添加了DALL-E 3生成图像的功能,意在为用户提供基于LLM的基本图像绘制,并允许用户不断要求模型“让它更X”,其中X可以是任何东西。
有研究通过长达22.3年的随访,对1487名受试者进行了深入研究发现:频繁促炎饮食会显著提高痴呆症的发病风险。
推文中介绍了如何使用iSeq下载原始测序数据,iSeq可用于从GSA, SRA, ENA, 和 DDBJ数据库下载原始数据和元信息。
推文分享了一款用于常规组学分析的工具cOmicsArt,cOmicsArt目前支持常规转录组、蛋白组+代谢组三类常见组学,常规的分析内容均包含,并支持将分析的数据及R代码导出。
张泽民实验室致力于用前沿的基因组学和生物信息学技术来解决癌生物学中的重要问题,结合计算(干)和实验(湿)方法来揭示肿瘤发生、微环境和对药物响应中的系统变化和具体遗传因素,以推进癌症免疫治疗和靶向治疗的发展。首先,用单细胞测序技术来研究肿瘤微环境。第二,将尖端生物信息学方法应用到癌基因组学大数据,发现新型癌症靶点和标记物。第三,开发原创性的生物信息学工具。归纳总结,张泽民团队代表性工作主要是三个方向:①肿瘤微环境各类细胞单细胞图谱;② 肿瘤免疫治疗图谱;③ 生信工具。
该推文汇总了张院士团队长期在单细胞领域的工作进展。
11、AI、大模型、深度学习、算法与生物学(Evo、GENERator)及单细胞和空间转录组 相关文献、讲座和软件列表
推文分享了AI、大模型、深度学习、算法与生物学有关的相关文献、讲座和软件列表。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)
2025-04-13 11:14:21
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
迄今为止最大的脑图 - 图源
中美在数据和技术领域的紧张关系加剧,美国于2024年底推出了针对跨境数据的新规,并将在2025年开始实施。该新规旨在限制中国等“受关注国家”获取美国人的敏感个人数据,这对中国科研人员使用美国的公共医学和学术数据库可能带来重大影响。
涉及大量美国人健康/基因信息的数据库(如SEER, TCGA, dbGaP等)在新规下对中国几乎封闭,而以公开文献和统计为主的资源(如PMC, ClinicalTrials.gov, CDC数据)仍然开放。介于两者之间的是一些已经公开但含匿名个体数据的资源(如GEO, 部分NIH数据),目前看大概率继续开放,但需关注政策动向。
@ShixiangWang
: 协作共享有时比想象中艰难。万事万物都遵循着动态的平衡。之前是全世界分析M国数据,就政策导向看,以后会产生一些相对的数据孤立。个人观点,长久看,对M国也未必是好事。我们国家也确确实实需要有真正意义上类似 TCGA 的计划,而不是坐地分钱。
1、Science | 5’端单细胞测序绘制CD4+T细胞双向转录增强子多模态图谱
团队利用5’端单细胞RNA测序方法构建T细胞双向转录增强子多模态图谱,同时开发了ReapTEC方法,实现高核苷酸分辨率和高灵敏度鉴定btcEnhs,捕获真正的增强子区域。
2、Nat Methods | 系统性评估11种空间组学技术
基于测序空间转录组技术(sST)的快速发展改变了在空间背景下测量基因表达的能力,被Nature Methods评为2020年的年度技术。然而技术的发展应该关注哪些指标,如何对这些技术进行标准化的多维度评估和比较,尚未有清晰的解决方案。为了解决技术标准不清晰,评估方案混乱等问题,研究团队对 11 种 sST 方法进行了全面比较(包括 10X Genomics Visium(基于 poly-A 和基于探针的两种方法)、DynaSpatial、HDST、BMKMANU S1000、Slide-seq V2、Curio Seeker(Slide-seq 的商业版本)、Slide-tag、Stereo-seq、PIXEL-seq、Salus 和 DBiT-seq)。他们使用具有明确形态的参考组织来评估它们的性能。研究建立了一套具有不同组织结构特征的标准参考组织,包括胚胎小鼠眼睛、成年小鼠海马区和嗅球。在进行统一的组织块制备和切片后,他们使用11种sST方法对这些组织进行了空间转录组学分析,生成了一个跨平台的数据集(称为cadasSTre),以便直接比较空间分辨率、分子捕获效率和分子扩散。
3、Nat Med|AI驱动的血液WGS ctDNA检测平台——MRD-EDGE,可高灵敏度预测癌症复发
团队开发了一种由机器学习驱动的血浆全基因组测序(WGS)ctDNA信号富集平台——“MRD-EDGE”,可以极高敏感度监测肿瘤负荷。
Ming Tommy Tang 在文章中介绍了学习的4步经验,涵盖了具体的学习资料,主要步骤如下:
探索 after_stat() 的逻辑,一窥 ggplot 内部机制。
6、华盛顿大学蛋白质设计研究所创新之道及其对生命科学新型研发机构建设的启示
文章介绍了华盛顿大学蛋白质设计研究所的历史沿革与创新成就,分析了蛋白质设计研究所创新特点,总结了有关生命科学新型研发机构建设的启示。
7、zotero-actions-tags | 自定义 Zotero 工作流程
8、玉竹
玉竹是一套简洁的内容管理(博客、微博客)、财务管理(记账)系统。
10、canvasxpress | 深入数据分析和无缝集成的JavaScript库
以交互式和可扩展的视觉呈现更快地转换数据。有对应 R 包 binding:https://github.com/neuhausi/canvasXpress 。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)
2025-03-31 01:41:27
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
- 来源:Peter Glagowski
本书作者提出了科学探索的双重维度——“夜间科学”与”日间科学”。前者如同混沌的创意温床,充满无序的灵感碰撞;后者则是严谨的逻辑验证,构成系统化的知识体系。研究指出,突破性创新往往诞生于夜间科学的自由探索过程中,而对话尤其成为激发创意的关键媒介。在交流中,语言具有独特的思维整理功能:它能迫使混沌的思维显影,将朦胧的灵感转化为线性表达,进而暴露出潜藏的思维断层。更重要的是,学术伙伴的即时反馈既能增强研究者的信心,又有效消解了学术探索中的孤独感。这种创造力的绽放,终究需要一个安全包容的环境——当研究者无需担忧观点的幼稚性时,最大胆的创新才有可能破茧而出。
@NiEntropy : 看了三遍,先是看了一遍公众号翻译,把原文找出来看了一遍,让R1也看了一遍并进行拓展。大晚上的给我看激动了,所以未来我们也可能会成为可以改变世界的小团队吗!加油everyone!
@R1版《陋室铭》: 人不在多,协契则灵。思不在繁,互启则明。 - 文章连接:https://www.nature.com/articles/s41587-023-02074-2
1、Nat Methods | 西湖大学团队开发非侵入式谱系追踪的新工具
文章开发了一款谱系追踪新计算工具 MethylTree。MethylTree无需基因编辑,就可以精准地、以多组学的方式追踪细胞谱系,开启了非侵入式谱系追踪的新篇章。 - 文章链接:https://www.nature.com/articles/s41592-024-02567-1
2、scCancerExplorer | 人类泛癌单细胞多组学在线分析工具
南京医科大学研究团队推出人类泛癌单细胞多组学在线分析工具scCancerExplorer。该数据库集成了基因表达、染色质、蛋白质活性、DNA甲基化和DNA复制等分析模块,支持用户友好操作,能通过简单点击探索癌症相关数据。scCancerExplorer免费访问,为癌症研究提供有力工具
3、The Innovation | 精准用药,基因先行:首个中国人药物基因组学图谱
文章利用来自全国的206,640名中国个体的低深度全基因组测序数据,成功绘制了首个中国人药物基因组图谱,并构建了相关数据库,方便公开免费访问查询。 - 文章链接:https://doi.org/10.1016/j.xinn.2024.100773
4、 从简单到复杂的漫长之旅
本文以约翰·梅纳德·史密斯的经典理论为框架,系统梳理了生命演化史上的八大“变形记”——从原始RNA分子到真核细胞,从无性繁殖到人类社会——每一次转变都标志着生物复杂性的跃升。
谷歌 DeepMind 宣布最新版 AI 蛋白质结构预测工具 AlphaFold3 正式开源,科学家们可以下载其底层代码,并将其应用于非商业领域。
这真是雪中送炭!AlphaFold 3 近期已正式开源,现在就有技术大佬分享了详细的 Conda 环境配置和运行教程,想尝鲜的小伙伴们赶紧动手试试吧!
GEO癌症分析套件(GCAS)是一个多功能的R包,旨在分析和可视化癌症研究中的基因表达数据。GCAS允许对正常样本和肿瘤样本之间的基因表达进行比较、相关性分析、免疫浸润分析、差异表达分析、共表达分析和富集分析。它包含一个Shiny应用程序,用于交互式可视化,也可以直接在R环境中用于高级脚本编写。GCAS非常适合希望高效、有效地探索癌症基因组数据的研究人员、临床医生和生物信息学家。
PROGENy是一种用于推断信号通路活性的工具,特别适用于基因表达数据的分析。它通过整合大量公开的扰动实验数据,生成一组核心基因集,用于评估信号通路的活性。与传统的通路富集分析方法不同,PROGENy能够更精确地反映信号通路的活性,因为它考虑了翻译后修饰和下游基因的影响。
文章介绍了如何利用 R 绘制双分组倾斜火山图。
10、 读《单细胞组学基础》
《单细胞组学基础》系统介绍了单细胞组学技术的发展、核心方法和应用场景,涵盖转录组学、表观组学、代谢组学及空间组学等多个领域。书中既包含理论基础,也强调实践操作,特别是算法与数据分析部分深入浅出,助力读者掌握核心技能。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)
2025-03-25 12:16:33
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
科学的大厦建立在大量可重复的研究结果之上,然而,近年来,种种迹象表示,在生物医学领域,大量的研究结果似乎不可重复。比如,Plos Biology 最近发表的一篇对近 2000 名生物医学研究人员的调研报告中,在最终收回的问卷中,72%的参与调研的活跃一线科研人员认同生物医学领域存在可重复性危机,其中 27%的参与者甚至认为这场危机非常严重。
由此可见,可重复性的问题在生物医学领域可谓旷日持久。解决这一问题,绝不会是朝夕之功。这方面,也许一个稍微没有那么热门的领域—心理学的故事,可以给我们带来一些启示。
1.Science |蛋白质语言模型 EVOLVEpro 实现快速的定向进化
文章开发了名为 EVOLVEpro 的高效的蛋白进化方法,它结合了蛋白质语言模型(PLMs)和回归模型,通过少量实验数据快速改进蛋白质活性。
2.Science |首个人类剪接体图谱,揭示 RNA 剪接交叉调控的复杂网络
西班牙基因组调控中心(CRG)的研究人员耗时 10 余年成功绘制了人类剪接体的第一张图谱。研究团队敲低了人类癌细胞中的 305 个剪接体和不同类别 AS 决定的功能性剪接因子,进行全转录组分析,并重建了不同功能性剪接因子网络,发现剪接体的不同组分具有独特的调控功能,揭示了剪接因子交叉调控的复杂网络。这些结果为剪接体治疗癌症或罕见病的策略提供了全新的见解。相关研究已发表在 Science 上。
3.Nature |基于质谱的蛋白质组学:从单细胞到临床应用
文章系统地回顾了近十年来基于质谱的蛋白质组学技术的发展历程和最新进展,详细介绍了该技术领域内的全流程革新。
4.“血液生态十亿细胞多组学计划” (HEMO ABC) 开始招募
为促进血液学科发展,推动血液疾病临床转化研究和精准医学取得新突破,华大与海河实验室携手全球科学家,共同启动“血液生态十亿细胞多组学计划” (Hematopoietic Ecosystem Multi-Omics Atlas of Billion-Cells, HEMO ABC)。该计划旨在通过大规模细胞多组学技术,绘制人类血液细胞的高精度分子图谱,全面解析血液细胞的基因组学、表观组学、转录组学和时空组学等多组学特征,构建全球最完整最精细的血液生态细胞多组学数据共享平台。这一平台将为全球科学家提供宝贵的数据资源,推动血液学及血液疾病研究进入全新的时代。
5.AI 编程三剑客:Cline(插件)规划模式+DeepSeek R1(构建计划)架构设计+Claude3.5 智能编码实战指南
本文探讨了统计学家可能对 LLM 发展做出重要贡献的潜在领域,特别是那些旨在增强人类用户信任度和透明度的方向。
AI 头像生成。看介绍非常不错,但实际测试效果一般。
$ you-get 'https://www.youtube.com/watch?v=jNQXAC9IVRw'
site: YouTube
title: Me at the zoo
stream:
- itag: 43
container: webm
quality: medium
size: 0.5 MiB (564215 bytes)
# download-with: you-get --itag=43 [URL]
Downloading Me at the zoo.webm ...
100% ( 0.5/ 0.5MB) ├██████████████████████████████████┤[1/1] 6 MB/s
Saving Me at the zoo.en.srt ... Done.
You-Get 是一个小型命令行实用程序,用于从网络上下载媒体内容(视频、音频、图像),以防没有其他方便的方法。
9.Trae
Trae 是一个自适应的 AI IDE,通过与其对话的形式,高效构建项目代码,并可以做到即时可视化,方便调整。
10.dockstore
dockstore 是一个开源免费的 docker 平台,提供诸多数据分析类的 pipeline。
11.CS197
哈佛大学的 AI 课程
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)
2025-03-17 13:20:25
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
文章主要讨论了科学评价体系中存在的问题,并以已故科学家周光召先生的判断力为例,强调了科学决策中判断力的重要性。文章指出,无论是国内还是国外,科学评审过程中普遍存在判断失误的问题。在中国,科学评审常常由训练背景不足、知识准备不够的人主导,甚至以拉关系为主导,导致决策质量低下。在美国,由于优秀科学家稀缺且忙碌,同行评议往往变成低水平评审高水平,阻碍了科学创新。此外,文章还提到,在应用领域,许多决策者缺乏科学素养,依赖权力和资本进行决策,导致误判频发。文章最后以1990年代减肥新药的误判为例,说明即使是大型药厂和资本方也可能因判断失误而错失良机。
文章构建了全切片病理AI基础模型Prov-GigaPath,可以读取整个切片的模式,以提高对患者特定癌症突变及其亚型的预测,以及肿瘤微环境可能对不同疗法的影响。
论文链接:https://doi.org/10.1038/s41586-024-07441-w
这项研究为脑科学领域提供了一个强大的新工具,其创新性和应用前景值得肯定。尽管存在一些局限性,但随着技术的不断优化和改进,该平台有望在未来的脑科学研究中发挥重要作用。
文章链接:https://www.science.org/doi/10.1126/science.adh9979
文章对8000多个疑似罕见单基因疾病家庭成员的外显子组和基因组进行了测序和分析。最终证实,基因组测序可以为一些受罕见单基因疾病影响的家庭提供诊断,将罕见病的诊断率提高8%
文中汇总了5种scRNA-Seq差异分析后的单细胞热图绘制的代码和图例。
活性氧(ROS)是生物系统中短暂存在但必不可少的重要物质。ROS的产生和消除是基本的生物化学过程,其微妙的平衡由一组复杂的分子机制维持。氧化还原稳态的失衡与各种疾病,尤其是癌症密切相关。细胞中ROS的普遍升高被认为是在肿瘤的发生发展中发挥重要作用。因此,通过靶向ROS及其调控机制调节细胞氧化还原被认为是癌症治疗的有效策略。
2009年,中山大学肿瘤防治中心黄蓬教授在 Nature 旗下综述期刊 Nature Reviews Drug Discovery 期刊发表了该领域相关的综述论文。在15年后,黄蓬教授团队再次在该期刊发表题为:Targeting ROS in cancer: rationale and strategies 的综述论文。
这篇最新综述总结了活性氧(ROS)领域近十多年取得的重大进展,包括发现了新的氧化还原信号通路,ROS对肿瘤代谢、肿瘤免疫、相分离、肿瘤干细胞、细胞命运的影响,以及靶向ROS的新型抗癌剂。该文章探讨了这些研究进展对肿瘤治疗和药物研发的影响和应用,并剖析ROS领域的新概念、争议热点和未来研究方向。
大型语言模型(LLM)在自然语言处理和理解领域已取得重大突破。同样,在生物学领域,一些采用类似 LLM 结构的大型细胞模型(Large Cellular Model,LCM)被开发用于单细胞转录组学,这些模型展示了 LCM 在各种生物任务中的应用潜力,并说明了 LCM 彻底改变未来生物学研究的可能性。
近日,《Quantitative Biology》期刊采访了一些最具影响力的 LCM 背后的有影响力的作者。例如:腾讯 AI Lab 杨帆和姚建华、加州大学 Christina V. Theodoris、多伦多大学王波、清华大学张学工以及中国科学院李鑫和杨戈。
该评论文章详细介绍了这些模型背后的总体框架和核心人工智能概念,并前瞻性地讨论了这些模型如何与生物学知识有效结合。还讨论了 LCM 研究和开发过程中面临的关键挑战,包括缩放规律问题和数据预训练的必要性。
这些观点阐明了 LCM 对生物研究的变革性影响,并让我们看到了 AI 和生命科学融合,回答有关生命的关键问题的未来
Youdeyiwu 是一个开源的轻量级论坛,它在功能上虽然没有 WordPress 强大,但是对于想搭建一个简约论坛的用户来说,提供了新的选择。
除了基本功能和后台管理,它还具有以下功能:
以匿名方式创建文章
设置积分权限和奖励
通过标签和版块组组织内容
文章审核管理
动态权限管理
8、BEDOPS|快速、高度可扩展且易于并行化的基因组分析工具包
BEDOPS是一个开源的命令行工具包,执行高度高效和可扩展的布尔和其他集合操作、统计计算、归档、转换以及其他任意规模基因组数据的管理。
该套件包括集合和统计操作工具(bedops、bedmap和closest-features)以及将大型输入压缩到一种新颖的无损格式(starch)的工具,这种格式可以比当前替代品提供更大的空间节省和更快的数据提取。BEDOPS除了支持BED格式外,还提供了对此深度压缩格式的原生支持。
易于使用,简单编码,功能全面,交互式JavaScript表格和数据网格。
这篇文章是一篇关于肿瘤单细胞测序(scRNA-seq)和免疫微环境的综述,主要探讨了单细胞测序技术在肿瘤浸润免疫细胞研究中的应用和进展。文章详细介绍了单细胞测序技术在肿瘤免疫微环境研究中的应用,强调了肿瘤浸润免疫细胞的异质性、特定细胞亚群的功能特征以及它们在肿瘤进展和免疫治疗中的作用。通过结合空间转录组学,研究者能够更全面地理解肿瘤微环境的复杂性,为癌症治疗提供了新的视角和潜在靶点。
「Openbiox 生信周刊」运维小队:
这个周刊每周日发布,同步更新在微信公众号「优雅R」(elegant-r)上。
微信搜索“优雅R”或者扫描二维码,即可订阅。
2025-03-11 13:36:58
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
巴菲特说,他考察候选人,就看三个“i”。 即
•integrity(正直)
•intelligence(智慧)
•initiative(主动)
这三个“i”当中,“主动”最重要。“正直”和“智慧”的人到处都是,但如果不主动,不是自己想去做些什么,就什么也不会发生。
1.Cell | 多参数成像揭示头颈癌临床相关的癌细胞-间质相互作用动力学
文章通过整合细胞状态和形态标记进行图像分析,探讨了在驱动肿瘤侵袭过程中肿瘤和基质之间的相互作用。
2.艾伦研究所与华盛顿大学团队推出开源科研大模型 OpenScholar,用小参数超越 GPT-4o
越来越多的研究人员开始使用 ChatGPT、Perplexity 等 AI 工具来进行文献检索和信息综合。 然而,这些通用模型在处理科学问题时往往存在生成幻觉、成本高昂以及参数规模过大的缺陷,限制了它们在科学领域的适用性。 为此,由艾伦人工智能研究所 (Ai2) 和华盛顿大学合作,开发了一个针对科研的开源模型 OpenScholar。 作为一种“检索增强型语言模型”(Retrieval-Augmented Language Model),它将尖端检索系统与经过微调的语言模型相结合,旨在应对科学查询时能够检索出相关文献并生成带有真实引用的综合性回答。
3.Nat Commun | 百岁老人罕见 LOF 突变负荷显著降低,揭示健康长寿的潜在遗传机制
文章通过分析大群体德系犹太人的全外显子测序数据,全面比较了罕见 LOF 突变负荷。与对照组相比,百岁老人的 LOF 突变负荷明显较低,其后代中也观察到了类似效应。
GitHub Spark 是一个由人工智能驱动的工具,用于创建和共享微应用程序(“sparks”),可以根据您的确切需求和偏好量身定制,并且可以直接从您的桌面和移动设备上使用。无需编写或部署任何代码。
5.一文速通 WDL
文中介绍了经典生物信息学工具 WDL 的使用教程,包含解释和完整的代码。
辛顿家族最辉煌的是两百年前数学家 Boole、其数学家和教育家的妻子 Mary Everest 以及他们的 5 个孩子。辛顿家谱多彩多姿:屠夫、牧师、数学家、律师、作家、革命者、养牛郎/放牛妹、被涂黑诬陷为杀人的。在这样的背景下,2024 年获诺贝尔奖似乎小菜一碟
7.rag-web-ui | 基于 RAG(检索增强生成)技术的智能对话系统
Galaxy 是一个免费的开源系统,用于数据分析、工作流程创作、培训和教育、发布工具、基础设施管理以及更多。
9.Liubai | 你的笔记 + 日程 + 待办清单 + 任务 with AI
在企业和开发者社区中,可靠地监控服务状态变得越来越重要。Kener 应运而生,它是一个现代的自托管状态页面,使得服务状态监控和通知变得轻松而直观。
10.表观遗传系列视频
本视频为 2016 年复旦大学「表观基因组学暑期国际讲习班」的录制视频,是入门、精进表观基因组学不可多得的珍贵材料。
本仓库提供了一系列中文期刊和学位论文的 CSL 样式,其中大部分是由 GB/T 7714—20151 衍生的。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)