2025-05-26 08:00:00
周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
为提升家庭凝聚力,增进彼此了解,2022年我提议了一个活动——家庭读书会。虽然各种因素导致读书会老是不能按时举办,但三年下来,还是共读了27本书,开了24次读书会,收获颇丰。很幸运,读书是大家共同的爱好,否则一时兴起的活动不可能坚持这么久。
周末将腾讯文档重新整理到了飞书知识库,重看相关内容,回忆满满。好的习惯需要坚持,共同记忆也不会凭空产生,都是日常点滴积累。
2025年5月23日,Anthropic公司推出了新一代Claude模型:Claude Opus 4和Claude Sonnet 4。Claude Opus 4是全球最佳的编程模型,擅长处理复杂、长时间的任务和代理工作流;Claude Sonnet 4则是对Sonnet 3.7的重大升级,提供更精确的指令响应和卓越的编程与推理能力。此次更新还包括扩展思考与工具使用(beta)、新模型功能(如并行工具使用、本地文件访问时的显著记忆能力提升)以及Claude Code的全面可用性。Claude Code支持GitHub Actions背景任务,并与VS Code和JetBrains原生集成。此外,Anthropic API还发布了四项新功能,使开发者能够构建更强大的AI代理。
文章系统性地分享AB实验的理论基础与实践经验。AB实验作为互联网企业数据驱动决策的关键工具,能够验证策略的因果关系并定量评估增长价值。然而,实验设计与实施面临诸多挑战,如小样本、溢出效应、方差与P值计算陷阱等,尤其是在美团履约业务等复杂场景中。为此,美团履约技术团队制定了零门槛运行可信实验的范式与流程,通过数据科学家、数仓开发、系统开发的多方协作,规范实验流程,提供标准化的实验分析引擎,帮助实验者避开各类统计陷阱并快速输出实验报告。白皮书还提供了实验方法选择指南,优先推荐随机实验,其次为准实验和观察性研究。
文章介绍AB实验的核心原理与统计学基础。首先阐述了AB实验的原理,源自Rubin潜在结果模型,通过随机分配用户至实验组和对照组来模拟平行时空,从而估计策略迭代的收益、风险与成本。实验准确性的两大前提是:个体处理稳定性假设(SUTVA),即实验单元间独立,不受其他单元分组影响;分组随机性,即实验单元的分组完全由实验者随机分配,不受自身行为影响。若这两者被破坏,实验结果将不准确。
在统计学基础方面,文章介绍了参数估计,包括点估计和置信区间。点估计通过样本数据计算单一数值来估计总体参数,常用的评估标准为相合性、无偏性和有效性。置信区间则考虑估计参数的波动性,以区间形式呈现估计结果。假设检验作为AB实验的关键工具,通过反证法论证新策略是否有效,包括提出假设、选择显著性水平、构造检验统计量、计算p值和作出决策等步骤。
文章分享了团队在代码风格和结构一致性方面的实践与思考。随着业务复杂度增加,传统的代码分层结构(如Controller->Service->DAO)已无法满足需求,业务逻辑层变得复杂且缺乏规范,导致代码模式多样、新人上手困难、团队协作效率低下。为解决这些问题,团队借鉴淘宝交易应用的代码模式,采用入口服务->业务流程与活动->领域服务->能力->扩展点的分层结构,通过框架形式约束代码结构,降低复杂性。同时,开发了Idea插件,实现流程视图导航,提升编码效率。经过2.5年的推进,团队在12个服务端应用中实现了600+个入口服务、400+个流程、180+个领域、1k+个领域服务的规范化。这一实践显著提升了代码的可读性和可维护性,降低了跨领域学习成本,提高了团队协作效率。文章还提出了后续的优化方向,包括领域划分、流程优化、监控告警以及AI代码生成等,旨在进一步提升代码质量和开发效率。
Defuddle是一款用于清理网页杂乱元素并提取主要内容的工具,旨在输出干净一致的HTML文档。
selfhost-hub收集和展示各种高质量自托管服务和工具。
spring-ai是为人工智能(AI)工程设计的应用框架,旨在将Spring生态系统的设计原则应用于AI领域,促进使用POJOs(Plain Old Java Objects)作为构建AI应用的基础。
JetBrains 宣布上线中文版 IntelliJ IDEA 官方文档。
Anthropic公司提供的教育课程,主要面向希望学习如何使用Claude SDK和相关技术的用户。这些课程旨在帮助用户掌握从基础到高级的提示工程技术,并将其应用于实际场景。
文章是作者作为一名35岁程序员的自我反思与分享。他回顾了自己与编程界大神Larry Wall和Linus的接触经历,从他们身上感受到的纯真与热爱,让他意识到编程的真正意义。作者讲述了自己2018年离开自己创建的公司后陷入低谷,通过在祁连雪山下的一次经历重新找回快乐,最终走出低谷,如今拥有自己的公司和团队,虽然忙碌但内心充实。
他给程序员的建议是:保持对编程的纯真热爱,不要因年龄设限,35岁依然可以享受编程带来的乐趣;面对痛苦和迷茫时,交给时间去治愈,多读书来丰富自己,提升看待世界的视角。作者通过自己的经历和感悟,鼓励程序员们保持初心,不被外界干扰,享受编程带来的快乐,同时在困境中学会自我治愈和成长。
文章由BBC Sport和Getty Images联合制作,庆祝F1诞生75周年,通过图片和文字回顾了F1自1950年以来的发展历程、传奇人物和重要时刻。1950年代,F1由法拉利等意大利车队主导,阿根廷车手范吉奥五次夺冠。1960年代,英国车手崛起,吉姆·克拉克和杰基·斯图尔特等成为传奇。1970年代,F1电视转播兴起,尼基·劳达和詹姆斯·亨特成为标志性人物。1980年代,塞纳、普罗斯特、曼塞尔和皮奎特四大车手激烈竞争,塞纳与普罗斯特的碰撞成为经典瞬间。
1990年代,塞纳去世后,舒马赫崛起并开启传奇生涯。2000年代初,舒马赫和法拉利统治F1,阿隆索成为最年轻冠军,汉密尔顿崭露头角。2010年代,维特尔和红牛短暂统治,汉密尔顿与梅赛德斯成为最成功组合。2020年代,维斯塔潘崛起,2021年在极具争议的赛季中获得首个世界冠军,2024年实现四连冠。文章还提到F1在美国的日益流行,以及年轻车手的崛起,如2025年迈阿密大奖赛冲刺赛中成为最年轻杆位获得者的基米·安托内利。
2025-05-19 08:00:00
周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
事情是这样的,5月初刚给娃买了奶粉,最近618启动就再看了一下价格,好家伙直接便宜了300多(总价2000)。买之前也看了价格追踪软件,去年的最低价和我买时差不多,所以就没等618提前下了单(毕竟娃吃奶也等不了)。虽然7天保价超过了3天,但想着这么大的价格波动,多少会有些补偿吧,就问了下商家客服(非自营店),但也没抱太大希望。
但和客服一聊就来气了,张口闭口就是没有、不行、平台要求和正常价格波动这种车轱辘话,态度冷漠机械,还给我截那种详情页字小的不能再小的截图,和当时让我好评返现时态度简直判若两人。其实之前也在这家店买过3次了,后面也有复购的需求,况且也不是追究久远订单的补偿,如果是任何一家线下店或者是想做回头客生意的店,多少会照顾一点老顾客吧。
也在小🍠上看了一些经验贴,但嫌麻烦上班还忙,沟通无果想着只能咽下。不过我媳妇是个维权老手了,后面直接找了平台Plus专属客服寻求解决。具体的过程不详述了,简而言之就是商家不愿意和平台一起承担差价,平台侧最后提供了一些补偿金(估计是看在了11年老用户和7年Plus上吧)。
就事情本身来说不算啥大事,商家、平台不作任何补偿也无可厚非,但在这个过程中,我深刻感受到了规则的冷漠和人的无能为力。只按规则办事,没有丝毫的人情味。但所有工具和规则都是为人服务,若人离开了,还有什么用呢?
对于规则,除了严苛时间限制的保价功能,对于哪些在极短周期内价格剧烈波动的商品,是否也能提供一些补偿措施呢?至少对于我这样价格敏感型客户,还是挺能提升用户粘性。
OpenAI推出了Codex,一个基于云端的软件工程代理,由优化后的Codex-1驱动,专为软件工程设计。它能够并行处理多项任务,支持ChatGPT Pro、Enterprise和Team用户,未来也将向Plus和Edu用户开放。用户可以通过ChatGPT侧边栏访问Codex,为其分配编码任务。Codex在独立沙盒环境中运行,可以读取、编辑文件并运行命令,任务完成时间通常在1到30分钟之间,用户可实时监控进度。
本文探讨了在现代分布式系统中,为何最终一致性比强一致性更为重要。以打车应用为例,若追求强一致性,系统会在后台服务达成完美一致前拒绝显示任何信息,导致用户界面卡顿。而采用最终一致性,系统可先显示部分信息,后续再进行数据同步与校正。现代应用多基于事件驱动的分布式系统,数据异步流动,组件独立更新,这使得一致性无法立即保证。最终一致性允许组件独立工作,之后再进行协调,优先考虑可用性和响应速度。文章还介绍了如何在事件驱动的世界中构建具有最终一致性的系统,包括处理事件顺序错乱和设计能应对延迟的系统。
文章主要介绍了Git的一些实用技巧,包括将多个commit压缩成一个、找回丢失的commit节点或分支、获得干净的工作空间、修改最近一个commit、提交文件的部分修改、禁止修改多人共用的远端分支、撤销合并、从历史中删除文件以及其他一些好用的命令。文章通过操作录屏的方式让读者更直观地了解命令的使用方法,每个技巧都是独立的,读者可以根据自己的需要学习。
本文提出了两个编程优化原则:“将条件判断(if)上移”和“将循环操作(for)下移”。作者建议将函数内部的条件判断逻辑推到调用者层面,通过类型检查或前置断言集中控制流程,减少重复检查,避免冗余逻辑。例如,通过将枚举匹配逻辑上移至主函数,可以简化代码结构,避免分支冗余。
同时,作者提倡将循环操作推到数据层面,引入“批量”概念,将批量处理作为基础情况,单个操作作为特殊情况,从而分摊启动成本,提高性能。例如,FFT算法通过批量处理多个点来优化性能。这两种优化方式可以结合使用,例如将条件判断移出循环,减少分支,可能解锁向量化操作。这种模式在微小层面和宏观架构设计中都有效,如TigerBeetle架构通过数据平面的批量处理分摊控制平面决策成本。这些优化方法有助于简化代码、提升性能,并使程序更具表达性。
用于构建 MCP(Model Context Protocol,模型上下文协议)服务器和客户端的 Python 库。
browser-use 是一个开源项目,允许 AI 代理通过浏览器执行任务。它支持多种语言模型,如 OpenAI 和 DeepSeek,并提供快速安装和使用指南。用户可以通过 pip 安装,并使用 Playwright 安装浏览器。
一个由Rust编写的极快速Python包和项目管理器。它集成了pip、pip-tools、pipx、poetry、pyenv、twine、virtualenv等多个工具的功能,速度比pip快10 - 100倍。它提供全面的项目管理,包括通用锁定文件、脚本运行支持、Python版本安装管理等功能。
详细介绍了DNS的工作原理,包括DNS解析过程、查找第一个DNS服务器的方法、DNS解析如何驱动应用程序的网络请求、递归解析器与根、顶级域名(TLD)和权威域名服务器的交互,以及域名注册商在DNS设置中的作用。DNS通过将域名转换为IP地址,使互联网用户能够轻松访问网站。还探讨了DNS缓存的工作原理以及如何为新域名设置DNS。
一个专为程序员设计的开源烹饪指南,通过模块化的菜谱和清晰的步骤描述,帮助程序员轻松在家做饭。它不仅提供了丰富的菜谱资源,还涵盖了厨房准备、烹饪技巧、食品安全等多方面内容,适合不同烹饪水平的用户学习和实践。
文章探讨了人工智能(AI)对其创作和思考能力的影响。作者发现,在AI的背景下,自己的写作、编程和项目创作变得毫无价值,因为AI能够更高效、更完善地完成这些任务。过去,通过写作整理思路并获得认可,但如今,AI能够快速生成完整的想法,导致他的思考能力退化,分享意愿降低。作者意识到,尽管使用AI能获取知识,但缺乏自主思考过程中的智力成长,反而让他变得更迟钝。
作者反思自己可能错误地将AI当作思维辅助工具,而实际上它更像是让人陷入麻木的工具。AI的输出虽然完善,但缺乏自主思考过程中的智力锻炼。尽管作者知道得更多了,却感觉失去了对知识的深入理解。尽管如此,他仍坚持用自己的方式表达想法,认为直接传达原始想法仍然有意义。他提醒读者,在AI时代,我们不能完全依赖技术,而应努力保持自主思考的能力,以应对未来的挑战。
这篇文章是作者通过观察婚礼等社交场合中人们的互动,分享了对人类社交行为的深刻洞察。作者从多个角度分析了人们在交流中的细微表现,包括注意力的集中度、情感表达的真实性、与他人互动的开放性等。她指出,通过观察人们的语调、语气和行为,可以感知到他们的情绪状态、自尊水平以及对世界的爱与接受程度。
文章提到,注意力的性质像光谱,从跳跃到稳定不等,而解离状态则是注意力的缺失。作者还讨论了调情的本质,认为这是一种营销行为,试图通过展示自己来获得他人的回应。她还区分了快乐与礼貌的不同,快乐是自然流露的,而礼貌则是经过计算的。
在社交互动中,作者观察到人们与世界互动的方式反映了他们是否接纳自己。那些接纳自己的人通常不会对他人表现出强烈的敌意,而那些自视甚高的人往往不愿给予他人真正的关注。此外,作者还提到,通过观察一个人的肢体语言和表情,可以判断他们是否相信自己有权存在,以及他们的情绪历史。
文章还探讨了亲密关系中的信任问题,指出情侣之间的信任可以通过他们与他人互动的方式体现出来。作者最喜欢的那类人,他们的动作有一种弹性,表现出对每个人的无条件接受,这种开放性和好奇心使他们很受人喜爱。
总的来说,这篇文章通过对社交场合中人们行为的细致观察,揭示了人类社交互动的复杂性和多样性,展现了人们在交流中的真实情感和心理状态。
2025-05-12 08:00:00
周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
四月每周成都老家两头跑,再加上工作事情比较多,天天加班到22、23点,不得已停更了一个月。五一还体验了一把川A大军出城,没见过凌晨三点的洛杉矶,但体验过了20点出发凌晨三点到家的酸爽(正常4个半小时)。别的也没啥新鲜事分享,就周末更新了一篇阅读方案文章:"碎片时间刷文章!懒人阅读方案分享",感兴趣的朋友可以看看。
比尔・盖茨计划在接下来的 20 年内,通过比尔和梅琳达・盖茨基金会几乎完全捐出自己的财富,目标是将全球范围内的生命拯救和改善作为首要任务。盖茨提到,他已经思考了这个决定很长时间,受到安德鲁・卡内基的《富人福音》的启发,认为富有的人有责任回馈社会。
巴菲特宣布将在年底卸任伯克希尔·哈撒韦公司董事长一职。巴菲特在伯克希尔·哈撒韦公司任职超过六十年,期间将公司打造成了一家价值超过 1.16 万亿美元的商业帝国。他以其投资才能和机智而闻名,成为了一位著名的亿万富翁。巴菲特的离任标志着公司领导层的重大变化,格雷格·阿贝尔将面临挑战,继续公司的成功之路。
GitHub博客发布了对Git和Linux创造者Linus Torvalds的访谈,庆祝Git诞生20周年。Git最初由Linus在2005年4月7日开发,起因是Linux内核开发者因许可证问题失去对BitKeeper的访问权限。Linus仅用10天时间开发出Git,最初是为了满足内核开发的需求,但其分布式设计和强大的性能使其迅速普及,改变了软件开发的协作方式。
访谈中,Linus回顾了Git的开发历程,强调其设计理念受到Unix哲学的影响,即保持核心概念简单,复杂性体现在实现细节中。他还提到,Git的分布式特性使其在个人项目和大型项目中都适用,这也是GitHub等平台能够快速发展的基础。
尽管Git已经成为全球最主流的版本控制系统之一,Linus认为其面临的最大挑战是满足多样化用户需求,例如微软的单体仓库实践曾暴露出Git的可扩展性问题。Linus希望Git未来能在缺陷跟踪等功能上进一步改进,但他也表示,Git的成功离不开社区的贡献。
文总结了作者4年多的线上故障应急处理经验,强调故障处理的四大黄金法则:止血优先,快速恢复功能;寻找变量,定位故障根源;谨慎执行,避免二次故障;高效沟通,确保信息同步。作者还分享了提升应急能力的方法,包括打磨技术基本功、熟悉业务流程、沉淀工具脚本、梳理排查流程、学习复盘案例和调整心态。
在故障复盘方面,作者指出其核心是防止故障再次发生,需精确梳理时间线、分析根因并制定行动方案。同时,面对故障定责,作者认为承认错误是责任心的体现,但保持良好心态也至关重要。
本文探讨了在AI时代如何避免技能退化的问题。AI编程助手的兴起虽然提高了生产力,但也可能导致工程师技能的退化。文章指出,过度依赖AI可能导致批判性思维和问题解决能力的下降,甚至在面对AI无法解决的问题时,工程师可能发现自己无能为力。研究发现,过度依赖AI工具会削弱人们的批判性思维能力,导致解决方案的多样性降低。文章建议,应将AI视为合作伙伴而非拐杖,通过主动学习和实践来保持和提升技能,以确保在AI的帮助下提高生产力的同时,不失去核心技能。
一款服务器管理软件,支持windows和linux系统,可以通过Web端轻松管理服务器,提升运维效率。例如:创建管理网站、FTP、数据库,拥有可视化文件管理器,可视化软件管理器,可视化CPU、内存、流量监控图表,计划任务等功能。
Readrops 是一款开源的多服务 RSS 客户端,适用于 Android 平台,它支持本地 RSS 解析、外部服务支持(集成FreshRSS)、分享等功能。
面向开发人员的资源库,旨在提供各种技术栈的快速参考备忘清单,以帮助开发者快速查阅和学习相关技术。
为任意 Github Repo 自动创建详细的架构图和文档,非常适合研究或者重构代码。
ADoyle 的工具箱是一个全面且持续更新的资源列表,涵盖了从开发工具到生活辅助工具的各个方面,为用户提供了一站式的工具参考。它不仅包含了各种编程语言的开发工具栈,还涉及了设计、机器学习、硬件、网络等技术领域,以及养生、人文等非技术内容,为开发者和爱好者提供了丰富的资源和工具选择。
介绍了构建可靠的 LLM 应用程序的12个原则,旨在指导开发者构建可靠、可扩展且易于维护的LLM(大型语言模型)驱动的应用程序。
详细介绍了提示工程(Prompt Engineering)的概念、方法、最佳实践以及在不同领域的应用,旨在帮助读者更好地理解和运用大型语言模型(LLM)的输入输出,以提高模型的响应质量和效率。
模型上下文协议(MCP)的中文入门指南,介绍了MCP的定义、核心功能以及如何开发、调试MCP服务器和客户端。MCP是一种开源协议,使大语言模型能连接各种数据源和工具。文中以开发网络搜索服务器为例,详细说明了使用Python和相关工具进行开发、调试的过程,并介绍了如何在不同平台和场景下使用MCP,包括与LangChain集成、在Claude桌面端加载MCP Server、通过serverless部署到云端等。
吉卜力工作室上传了其几乎所有电影的数百张高分辨率静态图片,这些图片被标注为 "仅供个人影迷使用,以进一步欣赏吉卜力工作室的电影",并呼吁人们 "请在常识范围内自由使用这些图片"。
本文围绕睡眠、饮食、心态、学习、大脑健康和长寿六个方面,结合专家观点和个人实践,探讨如何优化人体系统以提升健康和寿命。文章指出,良好睡眠需调节生物钟,饮食上推荐间歇性禁食和摄入健康食物,心态方面强调通过成长型思维维持多巴胺水平,学习时利用神经可塑性提升效果,大脑健康需保证睡眠和摄入关键营养素,长寿可通过饮食、运动和药物等手段实现。作者分享了个人实践,并提醒建议需结合专业指导执行。
本文探讨了语言腐败的十大现象及其危害。作者指出,互联网黑话、废话文学、官话套话、丧事喜办、政治正确、商业话术、学术黑箱化、历史虚无话术、情绪绑架式话术以及算法驯化语言等现象,本质上是权力关系在话语层面的投射。这些语言腐败形式通过扭曲事实、掩盖真相、模糊概念等手段,导致信息失真、集体记忆被重塑,进而破坏公共理性空间。例如,互联网黑话过度包装简单事物,废话文学空洞无物,官话套话回避问题,商业话术掩盖剥削,学术黑箱化垄断话语权,情绪绑架式话术实施语言暴力等。这些现象不仅削弱了语言的表意功能,还对社会的理性思考和公共讨论造成负面影响。作者呼吁个体应培养批判性语言认知能力,避免被语言腐败所误导。
2025-04-07 08:00:00
周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
这哥们真的是直播鬼才,切片能看一下午。
抖音建立安全与信任中心,推进算法和平台治理透明化。
去哪儿网针对业务高峰期资源保障问题,开发了智能扩缩容方案,通过流量日历平台整合业务监控与运维数据,利用算法预测业务高峰时的资源需求,并自动执行扩缩容操作。该方案覆盖了考试、节假日和促销活动等多种业务高峰场景,通过九个阶段的业务流程实现从事件预判到复盘的全流程管理。
在业务流程方面,系统支持热点事件录入,根据事件类型和业务涨幅预估高峰期业务量,调用算法接口预测 CPU 核数,并结合安全阈值计算预估机器数。运维团队根据预估结果创建定时扩缩容任务,使用本地和云上资源执行操作。任务高峰期结束后,进入复盘阶段,分析预测准确率和覆盖率,以改进算法和流程。
算法部分采用神经网络模型,通过分析订单量、QPS、机器型号等影响 CPU 的因素进行训练,考察平均绝对百分比误差(MAPE)和相关性系数等指标。模型离线定时更新,学习高峰事件和近期数据,确保模型的时效性和鲁棒性。同时,系统设置了最大副本数和最小副本数的安全限制,保障机器数预测过低场景下的稳定性。
项目实施后,应用接入数量达到 150 个以上,占比酒店应用总核数 90% 以上,已完成多种重点高峰事件保障。应用预估平均覆盖度为 96%,准确率为 89%。单次事件高峰期节约人工运维效率 3pd/次,年化节约 270pd,相比人工预测资源节省约 20%。
未来,去哪儿网计划进一步拓展智能扩缩容的应用场景,包括实体机/KVM 场景和存储层资源,并提升容量扩容的安全性检测。同时,将继续优化算法,借助 AI 提升业务量预估准确性和业务指标与应用 CPU 的关联性,逐步覆盖公司各业务线,实现全司资源调度智能化。
本文是一份关于大型语言模型(LLM)应用落地实施的手册,作者林然结合自身开发经验,详细介绍了如何系统性地实施基于LLM的应用。文章首先介绍了LLM应用的常见场景,如文本分类、信息抽取、文本生成、对话系统等,并将其分为会话型和任务型两大类。会话型应用以用户输入为核心,输入复杂且涉及对话上下文;任务型应用则以系统数据为输入,输入较为固定,通常采用批处理方式。
在复杂度评估方面,作者将LLM应用划分为L1到L4四个级别,从简单的单轮调用到复杂的自主规划Agent。用户体验风险也是关键考量因素,错误影响和任务失败概率直接影响应用的成功与否。
文章进一步介绍了L3级LLM应用的构建方式,包括架构设计、知识工程、模型优化和迭代优化。架构设计强调任务拆解和检索增强,知识工程涉及构建多种知识库,模型优化则包括Prompt优化和模型微调。迭代优化则通过建立评估指标和记录实验结果来不断改进系统。
最后,文章通过一个具体的Text-to-SQL应用案例,展示了从需求分析、用户体验风险评估、架构设计、知识工程到开发落地及优化的全过程。该项目通过优化架构和知识工程,将Text-to-SQL的准确率从10%提升至90%以上,充分体现了LLM应用落地实施的有效性和潜力。
利用本地运行的语言模型(LLM),如Ollama或LMStudio提供的模型,帮助用户进行深度网络研究,并生成带有引用的研究报告。
RD-Agent 是一个旨在实现AI驱动研发自动化的项目,目前处于预览阶段,其核心目标是简化模型和数据开发流程,为工业研发创造价值。
Vim 激进重构版本,专注于可扩展性和可用性。
大型语言模型(LLMs)后训练方法的深入研究,提供了一个全面的资源库,涵盖了与LLMs后训练方法相关的最具影响力的论文、代码实现、基准测试和资源。
提供AI工程领域深度教程、代码示例和资源,帮助用户学习和实践。
更适合国人体质的油猴教程。
“氛围编程”(Vibe Coding)是由 OpenAI 联合创始人 Andrej Karpathy 提出的一种新型编程方式。它强调开发者无需深入理解代码细节,而是通过 AI 辅助快速实现功能。Karpathy 用此方法在一小时内用 Swift 完成了一个 iOS 应用的开发,展示了其高效性。该方法的核心是让开发者专注于功能效果,而非代码本身,从而大大降低了编程的门槛,使更多人能够参与到软件开发中来。
“氛围编程”正在改变软件开发行业,它推动了编程的民主化,让小团队能够快速开发出产品并创造高收入业务。它还可能改变软件的风格和设计,带来全新的交互模式,并重新定义软件开发的价值链,使软件的价值更依赖于创造力而非单纯的代码能力。
然而,“氛围编程”也存在一些局限性。由于开发者可能不完全理解代码,这可能导致代码质量和可维护性问题,甚至可能引入安全漏洞。此外,该方法目前更适合低风险的个人项目和概念验证工作。尽管如此,“氛围编程”仍为软件开发带来了新的可能性和机遇。
2025-03-24 08:00:00
周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
不知道是不是只有成都这样,天气稍微好一点,公园就密密麻麻的人。茶必须在公园喝,烤肉必须在公园吃,牌也得在公园打。
在2025年GTC大会上,英伟达创始人黄仁勋宣布公司已进入“Agentic AI”时代,强调AI正从生成式向更具推理能力的自主智能体转变。黄仁勋提出“tokens”是AI的核心数据单位,其处理效率和数量成为衡量AI性能的关键。英伟达推出Dynamo操作系统优化AI推理效率,发布专为推理设计的Blackwell Ultra平台,并公布下一代AI芯片Rubin和Feynman的计划。此外,英伟达首次公开其光芯片技术进展,与台积电合作开发硅光子技术,用于数据中心优化,计划推出Spectrum-X和Quantum-X交换机。在机器人领域,英伟达发布GR00T N1模型和Newton物理引擎,通过Omniverse和Cosmos平台生成虚拟数据助力训练。英伟达还与通用汽车合作,利用仿真数据提升自动驾驶体验,展现了其在AI芯片、数据中心、机器人等领域的全面布局和雄心壮志。
JDK 24正式发布,包含24项重大增强功能,涵盖Java语言、API、性能和JDK工具的改进。其中包括语言特性如原始类型模式匹配、灵活的构造函数体、模块导入声明等的预览,以及Stream Gatherers、Class File API等库增强。性能方面有Compact Object Headers等改进,安全库方面引入了量子安全算法。此外,还有对JDK的维护和清理工作,如限制JNI使用、移除32位Windows端口等。
本文详细介绍了域名注册信息查询的两种主要方式——WHOIS和RDAP,以及它们在域名管理、网络安全和隐私保护中的应用和演变。WHOIS是一种传统的查询协议,允许用户通过查询域名注册数据库获取注册人信息、注册时间和到期时间等详情。然而,WHOIS存在格式不统一、国际化支持有限、隐私问题等局限性。RDAP(注册数据访问协议)作为WHOIS的现代替代品,使用HTTP接口返回标准化的JSON数据,具有支持国际化、提供安全访问控制和数据格式标准化等优势。ICANN宣布自2025年1月28日起,RDAP将成为通用顶级域名(gTLD)注册信息的权威来源,取代WHOIS服务。
文章还提供了实践中的注意事项,包括批量查询策略、解析和存储查询结果的方法,以及特殊顶级域名(TLD)的处理策略。此外,介绍了域名监控与安全应用,如域名到期监控系统、域名抢注监控和钓鱼域名检测等。随着RDAP的全面普及和隐私保护的加强,未来域名查询系统将更加高效、安全和符合隐私法规要求。
Netflix每天需要处理1.4亿小时的观看数据,这些数据对于提供个性化推荐和续播功能等用户体验至关重要。然而,随着用户数量的增加和观看行为的复杂化,Netflix面临着存储和检索这些数据的技术挑战。
最初,Netflix选择了Apache Cassandra作为存储解决方案,利用其灵活的数据结构、高写入负载能力和最终一致性支持。Netflix将每个用户的观看历史存储在Cassandra中,并通过“水平分区”将数据分散到多个服务器上以避免单点过载。然而,随着数据量的增加,系统逐渐暴露出性能瓶颈,如过多的SSTables导致读取变慢,以及压缩操作的开销增加。
为了解决性能问题,Netflix引入了EVCache缓存解决方案,将用户的观看历史以压缩格式存储在缓存中,减少了对Cassandra数据库的直接读取。此外,Netflix还采用了压缩存储模型,将观看历史分为“活跃观看历史”(LiveVH)和“压缩观看历史”(CompressedVH),分别针对频繁访问的近期数据和较少访问的旧数据进行优化。
随着Netflix的全球扩张和新功能的推出,如视频预览和多语言支持,数据存储和检索的需求进一步增加。Netflix对其存储架构进行了根本性的重新设计,将观看历史分为三个类别:完整标题播放、视频预览和语言偏好,并为每个类别分配了独立的存储集群。此外,Netflix还根据数据的时效性将存储分为近期集群、过去集群和历史集群,分别针对快速访问、归档和长期存储进行了优化。
Netflix通过多种策略提高了存储效率和数据检索速度。例如,过滤掉短暂的视频预览记录以减少存储开销,将语言偏好数据单独存储以避免重复,以及使用TTL自动删除不必要的记录。在数据检索方面,Netflix通过并行读取和智能拼接不同集群的数据来提高效率。此外,Netflix还引入了数据轮转机制,自动将旧数据移动到适当的存储位置,并通过EVCache缓存层进一步加速数据访问。
通过这些优化措施,Netflix不仅提高了存储效率,还降低了存储成本,改善了数据检索速度,确保了全球数百万用户的优质流媒体体验。
开源的macOS软件集合,旨在收集各种类别的优质macOS软件。项目包含大量软件推荐,涵盖阅读写作工具、开发工具、设计产品、通信工具、音频视频工具等多个领域。
Tree-sitter 是一个解析器生成工具和增量解析库,能够为源代码文件构建具体的语法树,并在源代码编辑时高效地更新语法树。
nginx-proxy 是基于 Docker 容器的自动化 Nginx 反向代理工具,使用 docker-gen 来动态生成 Nginx 的反向代理配置,并在容器启动和停止时重新加载 Nginx 配置。
关于计算机科学(CS)自学指南的介绍。利用开源资源自学的可行性和优势,通过自学让初学者在2-3年内成为掌握多种编程语言和计算机领域知识的全能程序员。
程序语言与编译技术相关资源,包含课程、书籍、论文、项目、博客和会议(论坛)。
这篇文章分享了作者在 Anthropic 公司作为项目管理负责人(DRI)的经验,介绍了如何高效管理大型危机项目。作者强调,项目负责人需全身心投入,每天花 6 小时组织协调,保持专注,避免项目失控。制定详细胜利计划也很关键,它能明确目标、及时发现问题并调整策略。快速运行 OODA 循环(观察、定位、决策、行动)能提高项目效率,项目负责人要投入时间、过度沟通、跟踪问题并频繁重新定位。过度沟通能让团队成员了解项目进展和目标,自主做出高质量决策。当项目规模超过 10 人时,需委派部分管理任务,以清晰、简单、高层次目标为单位,避免重叠。优秀的项目经理应有组织且专注目标,不一定是技术最强者。作者还建议项目负责人享受项目过程,从团队合作中获得成就感。最后,作者提供了一个项目负责人入门工具包,包括每周会议、项目主页、计划、人员分配、Slack 规范、每周更新和回顾会议等,旨在高效推进项目,减少流程和文书工作。这些经验对危机项目和其他类型项目管理都有参考价值。
文章介绍12个有助于简化生活的日常习惯,旨在帮助读者通过逐步改变生活方式来实现更简单、更充实的生活。文章指出,简化生活并非一蹴而就,而是需要时间和持续的努力。习惯研究专家Katy Milkman也提到,改变习惯需要长期坚持,而非短期的30天计划。
文章列举了12个具体的日常习惯,包括:饭后进行短暂散步以调节血糖;记录每日收支以发现消费模式并加以改变;在购买新物品前先利用现有物品;通过清理挑战分阶段清理杂物;限制技术使用以减少对手机的依赖;简化衣橱,定期捐赠不再穿的衣服;避免休闲购物,制定“购买清单”并在购买前等待30天;尝试低成本爱好,如日本的“刺子绣”;每天进行感恩练习,专注于当下;享受生活中的简单乐趣,如早晨制作咖啡、写日记等;加入社群或找一个“简约生活伙伴”以获得支持和责任感;限制新闻消费,减少压力。
文章聚焦于中国职场中年轻人因各种原因进入空窗期的现象及其所面临的困境。空窗期的成因复杂多样,既有主动选择,也有被动无奈。主动离职者多因身体、家庭或对工作强度的不满,而被动离职者则可能因行业不景气或公司裁员。脉脉报告显示,主动辞职待业的比例有所上升,而被动辞职的比例略有下降。
在空窗期中,年轻人的活动方式各异。有人选择休息、旅行,以放松身心;有人尝试旅居或转行做自媒体;还有人继续备考,如公务员、研究生等,试图通过提升学历或职业资格来增加竞争力。然而,空窗期过长会带来诸多问题。求职时,简历上的时间断层常被HR质疑,求职者需面对来自亲友的压力,同时还要应对生活成本的压力,如房租、社保等。前程无忧的调研显示,多数人需要攒够一定金额才敢暂停工作,而房租、社保等生存成本在一线及新一线城市中较高,给空窗期的年轻人带来了较大的经济压力。
文章指出,空窗期的求职者在重新进入职场时,往往面临被压薪甚至找不到工作的困境,这进一步加剧了他们的焦虑。同时,断缴社保可能影响城市落户、购房资格、买车摇号等,其他生存刚需费用也让生活成本居高不下。整体而言,空窗期的年轻人在追求自我价值与适应社会期望之间面临着诸多挑战。
2025-03-17 08:00:00
周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
最近有点疲乏,感觉需要一个长假期来恢复一下情绪。
OpenAI于2025年3月11日发布了一系列新工具,旨在简化智能代理(agents)的开发,帮助开发者和企业构建更可靠、高效的自主任务执行系统。新工具包括Responses API、内置工具(如网络搜索、文件搜索和计算机使用)以及Agents SDK。Responses API结合了Chat Completions的简单性和Assistants API的工具使用能力,支持开发者通过单一调用完成复杂任务。内置工具通过连接现实世界数据提升模型实用性,例如网络搜索在SimpleQA基准测试中准确率达90%。Agents SDK则用于协调单代理或多代理工作流,支持开发者快速构建和部署智能代理系统,已在Coinbase和Box等企业的实际应用中取得成功。OpenAI计划在未来继续扩展这些工具,推动智能代理在各行业的广泛应用。
李飞飞团队推出具身智能新作BRS框架,旨在解决机器人家庭任务中的全身操作问题。研究基于Galaxea R1机器人,通过分析BEHAVIOR-1K基准测试,确定了三项关键全身控制能力:双臂协同、稳定导航和末端执行器的广泛操作性。团队提出两项创新:一是JoyLo,一种低成本全身遥操作接口,利用任天堂Joy-Con控制器实现高效全身控制,具备高数据收集效率和良好的用户体验;二是WB-VIMA学习算法,基于Transformer架构,通过自回归去噪和多模态注意力机制,解决机器人全身协调运动难题,显著提升任务成功率并减少错误。实验表明,BRS在清洁、倒垃圾等家庭任务中表现出色。该框架已开源,为家庭机器人研究提供了重要参考。
文章中分享了使用大型语言模型(LLM)辅助编程的经验。作者认为LLM更像是高级自动补全工具,能够加速开发过程,但需要合理设定期望。LLM的训练截止日期限制了其对代码库的熟悉程度,因此开发者需选择稳定的库。上下文管理是关键,清晰的对话和指令能让LLM更好地生成代码。作者还强调测试LLM生成代码的重要性,并建议利用支持运行代码的工具来快速迭代。
通过具体案例,如使用Claude Code创建展示工具提交历史的页面,作者展示了LLM在快速开发中的优势。LLM的最大价值在于加速想法实现,帮助开发者快速尝试新方案并学习新技能。同时,LLM并不能替代人类的专业知识和直觉,而是增强现有能力的工具。作者还提到“氛围编码”的学习方式,即通过随意提出想法来快速了解LLM的能力和局限性。总之,LLM是开发者强大的辅助工具,能够提升效率并拓展知识边界。
文章主要介绍了由 Anthropic 公司主导发布的 Model Context Protocol(MCP)及其在 AI 应用层开发中的重要性。过去 AI 模型与现有系统集成缓慢,而 MCP 作为一种开放、通用的协议标准,能够使 AI 模型与不同 API 和数据源无缝交互,推动了 AI 应用与现有服务的集成。文章还对比了 Function Calling、AI Agent 和 MCP 三者之间的区别,并详细阐述了 MCP 的工作原理,包括其架构中的 Hosts、Clients、Servers 等部分,以及如何通过创建 MCP Server 来实现 AI Agent 的自动化功能,最后提供了 MCP 的一些资源和使用建议。
Mermaid 是一个基于 JavaScript 的图表工具,它允许用户通过类似 Markdown 的文本定义生成各种图表,如流程图、序列图、甘特图等。
CAMEL是一个强大的开源框架,专注于多智能体系统的研究和开发。它提供了丰富的功能和工具,支持大规模智能体的模拟、数据生成、任务自动化和世界模拟。
Manus开源平替,通用智能体。
自托管指南,涵盖了从基础设置到高级应用的各个方面,包括软件和硬件选择、容器技术、CI/CD、开发工具、网络服务、云存储、数据库管理、远程访问、虚拟化、密码管理、安全措施、监控、备份、归档、家庭服务器、媒体服务器、智能家居自动化、语音助手、视频监控、文本转语音合成、视频和音频处理、播客、有声读物、健康、园艺、地图、书签、照片、过去ebin、笔记记录、时间监控、维基、游戏、基础项目等。
MCP 服务器集合。
一个基于 AI 的 Hacker News 中文播客项目,每天自动抓取 Hacker News 热门文章,通过 AI 生成中文总结并转换为播客内容。