MoreRSS

site iconShawn Weekly | 肖恩技术周刊修改

包含“业界资讯”、“技术博客”、“开源项目”、“工具推荐”和“学习资源”等
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

Shawn Weekly | 肖恩技术周刊的 RSS 预览

肖恩技术周刊(第 53 期):编程的本质

2025-07-14 08:00:00

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

Programs = Algorithms + Data Structures
Algorithm = Logic + Control

编程的本质包括逻辑(Logic)、控制(Control)和数据(Data)。逻辑是问题的本质,控制是解决问题的策略,数据是问题的表现形式。编程范式和程序设计方法主要围绕这三方面工作,因此,有效地分离Logic、Control 和 Data 是写出好程序的关键所在

为了解耦,可以使用状态机、DSL和编程范式等模型、工具和方法。更具体的,面向对象的设计模式是基础思维,C语言是必须学习的语言,C++语言是世界上范式最多的语言,Java 语言是综合能力最强的语言,而 Go 语言则是最适合入门的语言。

——《左耳听风》 陈皓著

## 业界资讯 ### [马斯克Grok-4碾压所有大模型!“比所有博士聪明”,AIME25拿满分](https://www.qbitai.com/2025/07/307398.html#/) ![](https://cdn.jsdelivr.net/gh/shawnxie94/images/images/202507132251512.png)

马斯克的Grok-4模型发布,其在多项基准测试中表现卓越,如AIME25获满分,SAT、GRE近乎满分,还具备强大推理、编程、药物发现等能力。训练量是Grok-2的100倍、Grok-3的10倍,依靠xAI的20万卡计算集群。发布直播中展示了与ChatGPT的语音对话对比,Grok-4明显更胜一筹。未来,Grok系列将推出更多模型,如编程模型、多模态Agent等,且Grok已融入特斯拉固件,将成为擎天柱人形机器人的大脑。

深夜开源首个万亿模型K2,压力给到OpenAI,Kimi时刻要来了?

月之暗面于2025年7月11日晚开源了Kimi K2大模型,包含基础模型Kimi-K2-Base和微调后模型Kimi-K2-Instruct,均可商用,API价格为16元人民币/百万token输出。Kimi K2在多个基准测试中成绩优异,超过一些开源和闭源模型,尤其代码能力突出,被认为是Claude 4 Sonnet的有力开源平替。其训练中引入MuonClip优化器解决训练稳定性问题,采用大规模Agentic数据合成策略解决真实工具交互数据稀缺难题,引入通用强化学习结合自我评价机制,推动强化学习技术向更广泛的应用场景扩展。

技术博客

深度剖析反向代理

深入探讨了反向代理在分布式系统中的核心功能、复杂性及优化策略。反向代理是分布式系统的关键组件,广泛应用于服务网格、负载均衡、边缘代理等场景。其主要功能包括连接管理、HTTP请求解析与头信息操作、服务发现、作为HTTP客户端以及可观察性。

文章重点分析了连接管理的复杂性,尤其是在处理高并发连接时的挑战。传统的阻塞I/O方式在多客户端场景下效率低下,而非阻塞I/O和I/O多路复用技术(如select、poll和epoll)能够显著提升性能。文章还讨论了C10k问题,即如何在单台主机上处理10,000个并发连接,事件驱动架构通过单个事件循环监控I/O状态并分发请求,但存在单线程局限性。随着多核处理器的普及,HAProxy和Nginx等代理软件通过多进程或多线程模型来提升性能,Envoy则利用SO_REUSEPORT特性实现负载均衡。此外,TLS支持和协议多样性也为连接管理带来了新的挑战。

文章最后指出,尽管连接管理是反向代理的基础功能,但在大规模场景下的实现极具挑战性,不同的代理软件通过多种技术优化以适应不同的使用场景,每种方法都有其优缺点,需根据需求谨慎选择。

JavaScript 核心

详细介绍了JavaScript中对象、原型链、构造函数、执行上下文栈、变量对象、激活对象、作用域链、闭包和this值等关键概念。对象是属性的集合,具有单一的原型对象,用于实现继承。原型链通过对象的__proto__属性实现,允许对象共享方法和属性。构造函数用于创建具有特定模式的对象,并自动设置其原型。执行上下文栈管理代码的运行时行为,每个上下文包含变量对象、this值和作用域链。变量对象存储上下文中的变量和函数声明,而激活对象是函数上下文中的变量对象,包含形式参数和arguments对象。作用域链用于查找代码中的标识符,闭包允许函数在父上下文结束后仍然访问父上下文中的变量。this值是一个与执行上下文相关的特殊对象,其值在进入上下文时确定。文章通过示例代码详细解释了这些概念,并提供了进一步阅读的建议。

如何构建智能体

文章通过构建电子邮件代理的案例,详细介绍了从想法到实际部署的六步框架。第一步是定义代理的工作范围并提供具体任务示例,确保任务现实且范围合适。第二步是设计详细的操作流程,明确人类完成任务的步骤。第三步是构建最小可行产品(MVP),专注于最关键的推理任务并设计有效的提示。第四步是将MVP与真实数据和用户输入连接起来,并编写协调逻辑。第五步是进行手动和自动化测试,确保代理在核心用例中表现良好。最后一步是部署、扩展和优化代理,根据用户反馈和实际使用情况进行迭代。文章强调,构建代理不仅是让其运行,而是要通过明确的用例、真实示例的测试和用户反馈来打造有用、可靠的工具。

开源项目

OpenHands:开发智能体

OpenHands(前身为OpenDevin)是一个由人工智能驱动的开源软件开发平台,旨在帮助开发者减少编码工作量并提升开发效率。它能够执行人类开发者可以做的任何任务,包括修改代码、运行命令、浏览网页、调用API等。

p2p:远程桌面软件

p2p 是一个开源的远程桌面软件,基于P2P技术,使用UDT协议,能够绕过大多数防火墙规则,实现两台计算机之间的远程桌面控制和消息发送。

n8n:代码工作流自动化平台

n8n 是一个代码工作流自动化平台,结合了代码灵活性与无代码速度,提供 400+ 集成和原生 AI 能力。用户可以编写 JavaScript/Python 代码、添加 npm 包或使用可视化界面构建自动化工作流,同时支持自托管和云部署。其核心功能包括代码支持、AI 原生平台、完全控制、企业级功能(如高级权限、SSO 和隔离部署)以及活跃社区支持。

学习资源

密码学101

免费面向所有年龄段和技能水平的程序员的密码学入门课程。包含理解完整系统(如SSL/TLS)所需的所有内容,涵盖块密码、流密码、哈希函数等。课程通过实践学习,教授如何利用常见密码学缺陷,如伪造管理员cookie、恢复密码等。

Red Hat 技术写作风格指南

指南旨在为Red Hat的技术文档提供一致的写作风格和语言规范。它涵盖了语法、标点、排版设计、语言选择、清晰简洁的写作技巧以及交叉引用的使用等多方面内容。此外,还包括了一个用法词典,提供了特定术语的正确使用方法和推荐的拼写形式。

Redis 历史版本

Redis创始人antirez提供的早期Redis版本,并讲述了相关的历史和背景。

随便看看

盘古之殇

本文是花厂诺亚方舟实验室员工对盘古大模型研发历程的披露。文章指出,盘古团队在研发过程中面临诸多困境,包括算力有限、架构落后、tokenizer效率低下等问题,导致与国内其他公司的差距逐渐拉大。小模型实验室多次套壳其他模型并冒充盘古模型,严重打击了团队士气,导致大量人才流失。在核心成员的努力下,盘古团队从头训练了第三代模型,包括135B V3(Pangu Ultra),效果与同期竞品相当。然而,花厂内部的繁重流程管理严重拖累了大模型的研发节奏,小模型实验室却不受约束,随意套壳和获取算力资源。作者对花厂内部管理问题和造假行为感到失望和愤怒,决定离职,并希望花厂能吸取教训,真正做好盘古模型,把昇腾打造成世界一流算力。

CPython 即时编译器两年反思:优点、缺点与不足

作者对CPython JIT编译器两年工作的反思。JIT目前是社区驱动的项目,尽管微软裁员影响了团队,但社区建设成果显著,有更多新贡献者加入。追踪式JIT的设计使项目易于教学,团队也积极培养没有编译器背景的人参与。然而,性能方面仍面临挑战。CPython 3.13的JIT速度慢于解释器,3.14虽有改进,但总体仍不理想。媒体对JIT性能的报道存在误解,3.13 JIT很多时候比解释器慢得多,而一些错误的性能数据误导了用户。尽管如此,作者对JIT的未来保持乐观,目前社区正在壮大,新的优化正在推进,可能会在3.15中带来一定的性能提升。作者呼吁更多人参与测试和改进,共同推动JIT的发展。

Stack Overflow 的新时代

2025年7月10日,Stack Overflow在WeAreDevelopers大会上宣布了其新的愿景、使命和产品更新。自2008年成立以来,Stack Overflow经历了云计算、远程工作和人工智能等技术变革。2025年,开发者使用AI工具的比例增加,但对其输出的信任度却在下降。Stack Overflow计划通过提供可信的人类智能层来填补这一信任缺口,致力于成为全球技术爱好者的可靠知识来源。

Stack Overflow简化了品牌架构,将公共平台统称为Stack Overflow,而Stack Overflow Business将包括广告业务、Stack Internal和Stack Data Licensing。新的社区互动功能包括社区活动和聊天,为开发者提供更轻松的交流空间。学习工具方面,Stack Overflow推出了Stackoverflow.ai 和编程挑战,帮助开发者提升技能。企业解决方案方面,Stack Overflow for Teams(现Stack Internal)推出了知识摄取、新的连接器和即将推出的双向MCP服务器功能。此外,Stack Overflow还在探索更新其视觉身份,并邀请全球用户参与投票。

肖恩技术周刊(第 52 期):魔数0x5f3759df

2025-07-07 08:00:00

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

本周开始重看《左耳听风》。上次阅读都是5年前了,那时刚开始工作,太多内容读不懂。这次感觉好很多,能快速get到不少重点,看来这五年没白过。想想左耳朵耗子去世都两年了,他18年写的内容在当前来看还十分有价值,一些趋势的预测也是很准确,真是大牛,可惜了。

其中有一篇讲魔数“0x5f3759df”,初次阅读惊为天人,看了很多遍。该魔数最早出现在 20 世纪 90 年代的 3D 图形编程领域,特别是在经典游戏《雷神之锤 3》(Quake III Arena)的源代码中。在游戏的 3D 渲染过程中,需要频繁计算向量的长度和方向,这涉及到大量的平方根和平方根倒数(即 1/√x)计算。而直接使用标准数学库中的sqrt()函数计算效率较低,因此开发者采用了这个魔数(注意代码中注释 what the fuck? 那行 )来实现快速开平方算法,大幅提升了计算性能。

float Q_rsqrt( float number )
{
    long i;
    float x2, y;
    const float threehalfs = 1.5F;

    x2 = number * 0.5F;
    y  = number;
    i  = * ( long * ) &y; // evil floating point bit level hacking
    i  = 0x5f3759df - ( i >> 1 );  // what the fuck? 
    y  = * ( float * ) &i;
    y  = y * ( threehalfs - ( x2 * y * y ) );  // 1st iteration 
    // 2nd iteration, this can be removed
    // y  = y * ( threehalfs - ( x2 * y * y ) ); 

    return y;
}

它将复杂的浮点运算转化为高效的位操作,体现了算法优化中 “效率与精度平衡” 的智慧。而且其推导过程在当时充满神秘色彩,如今已被数学理论所解释,成为计算机科学中兼具实用性和传奇性的经典案例。想了解整个推导过程可以阅读 魔数0x5f3759df

技术博客

GitOps

GitOps是一种由Weaveworks于2017年提出的云原生应用持续部署方法,通过将基础设施的声明式描述存储在Git仓库中,并利用自动化流程确保生产环境与仓库描述一致,从而实现快速、频繁且可靠的部署。其核心优势包括快速部署、错误恢复、简化凭证管理、自文档化部署以及团队知识共享。GitOps支持推送式和拉取式两种部署策略,分别通过CI/CD工具和操作符实现,后者更安全且能自动纠正环境偏差。GitOps不仅适用于Kubernetes,还支持其他可声明式管理的基础设施,但目前大多数工具以Kubernetes为主。它还提供多应用和多环境管理能力,通过分支区分不同环境。尽管GitOps与DevOps有交集,但GitOps更侧重于技术实现,而DevOps强调文化变革。GitOps并非角色,而是一套实践,开发者可通过现有工具或自定义实践来实现。

人工智能领域没有新观点,只有新的数据集

本文探讨了人工智能进步的真正驱动力,指出AI的重大突破并非来自新想法,而是源于对新数据源的利用。文章回顾了AI发展的四个关键阶段:深度神经网络的兴起(2012年)解锁了ImageNet图像数据库;Transformer架构和大型语言模型(2017-2018年)开启了基于互联网文本的训练时代;基于人类反馈的强化学习(2022年)使模型能够学习人类标注的“好文本”;以及推理能力的提升(2024年)引入了“验证器”数据。作者认为,数据才是AI进步的关键,因为对于给定的数据集,模型性能的上限是固定的。未来AI的突破可能不会来自训练方法的改进,而是来自解锁新的数据源,例如YouTube上的视频数据或机器人收集的物理世界数据。

开源项目

RAG-Anything:统一RAG

RAG-Anything 是一个功能强大的多模态 RAG 系统,能够处理多种文件格式和内容类型。它提供了一个统一的解决方案,适用于需要处理复杂多模态文档的场景。通过其灵活的配置和强大的功能,RAG-Anything 为用户提供了高效的内容处理和查询能力。

mindsdb:人工智能查询引擎

MindsDB 使人类、人工智能、智能体和应用程序能够从分散的大规模数据源中获得高度准确的答案。

nginx-proxy-manager:Nginx管理器

无需深入了解 Nginx 或 Let's Encrypt 就能轻松实现网站的转发和免费 SSL 配置。

工具推荐

中国部分城市地铁线路可视化

展示中国部分城市地铁线路的可视化应用,使用现代 Web 技术栈构建,提供交互式的地铁网络浏览体验。

开源健身指导平台

现代化的开源健身指导平台,旨在帮助用户创建健身计划、跟踪进度,并提供全面的健身动作数据库。

学习资源

数据密集型应用系统设计

《Designing Data-Intensive Application》DDIA中文翻译。

12个构建智能体的原则

介绍了12个构建智能体的原则,用以提高软件的可靠性、可扩展性和可维护性。

机器学习新手入门

微软的《机器学习新手入门》是一个全面且结构化的入门课程,适合初学者系统学习机器学习的基础知识和技能。通过项目导向的学习方法,学生可以在实践中加深对机器学习概念的理解。

随便看看

每个计算机科学专业的学生都应该知道的事

本文为计算机科学专业学生梳理了必备的知识体系,强调构建全面技能的重要性。学生应建立作品集展示项目和成就,而非仅依赖简历。技术沟通能力至关重要,需掌握演示工具和文档撰写技能。在技术层面,学生需掌握Unix哲学、系统管理、多种编程语言、离散数学、数据结构与算法、计算机架构、操作系统、网络、安全、密码学、软件测试、用户体验设计、可视化、并行计算、软件工程、形式化方法、图形学与模拟、机器人学、人工智能、机器学习和数据库等核心领域。这些知识不仅涵盖理论基础,还强调实践能力,如实现编译器、配置操作系统、设计安全系统等。此外,学生还需具备团队协作和版本控制等软件工程技能。这些知识将帮助学生在就业市场中脱颖而出,为未来的职业发展和研究生学习奠定坚实基础,同时为社会贡献高质量的技术解决方案。

AI 构建者手册

这份 2025 年 AI 构建者手册聚焦 AI 产品落地全流程。调研显示,AI 原生企业产品成熟度更高,47% 已规模化,远超 AI 赋能企业的 13%。模型使用上,第三方 API 仍是主流,但高增长企业更倾向微调或自研模型,准确性与成本成选型核心。定价以 “订阅 + 用量 / 结果” 混合模式为主,40% 企业将 AI 功能嵌入高级套餐,未来或向用量定价转型。组织方面,收入超 1 亿美元企业中 61% 设专职 AI 领导,人才短缺致 46% 企业招聘慢。成本上,AI 研发占 R&D 预算 10-20%,API 费用成最难控成本,41% 企业靠开源模型优化。内部应用上,研发与营销是主力场景,编码辅助提升生产力最显著,但 46% 企业难寻合适场景。技术栈中,PyTorch、TensorFlow、LangChain 等成开发核心,NVIDIA 主导推理优化。手册为企业从产品架构到成本管理提供实操框架,助力 AI 商业化落地。

肖恩技术周刊(第 51 期):为何浏览器请求头User-Agent均以Mozilla开头?

2025-06-30 08:00:00

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

浏览器请求头中的 User-Agent 字段之所以均以“Mozilla”开头,主要是出于历史和兼容性的原因。早期 Netscape Navigator 是主流浏览器,其 User-Agent 字段以“Mozilla”开头。当时许多网站会通过检测 User-Agent 字段来判断浏览器类型,并据此提供不同的代码支持。如果字段中没有“Mozilla”,网站可能会拒绝服务或显示错误。

为了兼容这些网站,后来的浏览器(如 Internet Explorer、Chrome、Firefox 等)也在其 User-Agent 字段中保留了“Mozilla”字样。这种格式已成为一种行业标准,许多网站仍然依赖它来判断浏览器类型。浏览器厂商继续沿用这种格式,以避免被网站错误识别或屏蔽,确保网站的兼容性和用户体验。

业界资讯

马斯克切脑全场震撼!插脑只要1.5秒,26年治愈失明,28年全人类变AI

2025年6月28日,马斯克的Neuralink公司发布脑机接口技术进展。目前,七名志愿者已植入设备,可意念玩游戏、控制机械臂。第二代手术机器人1.5秒植入电极,兼容99%人类大脑。未来三年计划:2025年言语皮层植入设备,2026年增加电极帮助盲人重获视觉,2027年多设备植入,2028年实现全脑接口与AI集成。产品包括Telepathy、Blindsight和Deep,分别针对运动障碍、失明和神经系统疾病。技术有望提升人类与计算机交互速率,但也引发安全和伦理担忧。

Google发布开源AI智能体Gemini CLI

Gemini CLI,Google免费开源的 AI 代理工具,可将 Gemini 直接集成到开发者的终端中。它具备轻量级访问 Gemini 的能力,适用于多种任务,如内容生成、问题解决、深度研究和任务管理等。Gemini CLI 与 Google 的 AI 编程助手 Gemini Code Assist 集成,为开发者提供免费的 AI 编程支持。它还具备强大的 AI 功能,如代码理解、文件操作、命令执行和动态故障排除等。此外,Gemini CLI 是完全开源的,可由开发者社区进行改进和扩展。

京东阿里都要发币了,稳定币是智商税吗?

探讨了稳定币的定义、用途及中美对其的态度和推动原因。稳定币是一种币值相对稳定的加密货币,如USDT和USDC,其发行方通过持有高流动性资产(如美债)盈利。稳定币的主要用途是支付,具有快速交易、无需中央机构等优势,尤其在跨境支付中表现出色。然而,其匿名性也带来了监管挑战,如增加反洗钱和反恐怖融资的难度。

美国通过立法规范稳定币,要求100%备兑及反洗钱等措施,旨在巩固美元霸权。稳定币在一些新兴市场受欢迎,且可作为美债的持续买家,支撑美债价值。中国则将稳定币视为防御性选择,此前禁止境内交易虚拟货币,但保留了香港及数字人民币的“口子”。数字人民币可视为人民币稳定币,与稳定币有相似之处,但也存在发行和运营机制上的区别。总体来看,稳定币的发展既带来了机遇,也引发了监管和国际货币格局的变革。

技术博客

可信实验白皮书系列07:高阶实验工具

本文聚焦高阶实验工具,针对单次实验功效不足、假阳性及策略调优等问题,重点解读统合分析和多重比较。统合分析整合多次独立实验结果,通过逆方差加权、分母求和加权、样本量加权等方式,提高实验功效并避免辛普森悖论。多重比较则解决多指标、多实验组带来的假阳性问题,采用二阶段Benjamini-Hochberg方法控制假发现率。

此外,文章还探讨了序贯分析、异质性因果效应估计、多臂老虎机、交错式实验设计等拓展工具,旨在提升实验效率和科学性。未来计划进一步探索和应用这些工具,以更好地应对复杂实验场景,推动实验方法的持续发展。

上下文工程兴起

本文探讨了“上下文工程”的兴起及其重要性。上下文工程是指构建动态系统,为大型语言模型(LLM)提供正确的信息和工具,使其能够合理完成任务。它强调系统性、动态性、提供正确的信息和工具、格式的重要性以及确保LLM能够合理完成任务。随着LLM应用的复杂性增加,上下文工程成为AI工程师的关键技能,与提示词工程不同,它更注重动态数据的处理和整合。

文章指出,LLM出错的常见原因是缺乏正确的上下文,而不是模型本身的问题。上下文工程通过确保LLM获得正确的信息和工具,帮助解决这些问题。LangGraph和LangSmith是两个支持上下文工程的工具。LangGraph提供了高度的可控性,允许开发者精确地管理LLM的输入和输出;LangSmith则通过追踪代理调用和LLM的输入输出,帮助开发者调试和优化上下文。作者认为,随着对上下文工程的关注增加,AI应用将变得更加高效和可靠。

Uber如何削减持续集成成本

本文介绍了Uber如何通过改进其SubmitQueue系统大幅降低CI资源使用并加快等待时间。SubmitQueue是Uber用于高效整合代码变更并保持主分支绿色的系统,但存在资源利用率高和等待时间长的问题。Uber通过引入BLRD(绕过大型差异)和改进概率模型,优化了构建优先级,减少了不必要的构建,提高了资源效率和开发人员生产力。改进后的系统在Go、iOS和Android的大型monorepo中进行了测试,结果显示资源使用减少了53%,等待时间缩短了37%,同时保持了主分支的绿色。

开源项目

BookLore:书籍管理工具

自托管用于管理个人书籍的工具。支持PDF和电子书的浏览、阅读以及阅读进度跟踪,具备智能元数据处理、多用户支持、内置阅读器、OPDS支持、多书籍上传、邮件分享等功能。

code-server:网页VSCode

通过浏览器访问运行在任何机器上的 VS Code,提供基于浏览器的开发环境。它支持在任何设备上进行代码开发,利用云服务器加速任务处理,节省移动设备电量,并支持团队协作和远程开发。

xiaomusic:小爱音箱无限听歌

实现通过小爱音箱播放音乐,支持语音指令控制。使用 yt-dlp 下载音乐,支持多种音乐格式(如 mp3、flac、wav 等),并兼容多种小爱音箱型号。

学习资源

程序员的提示工程实战手册

AI编程助手的输出质量高度依赖于提示词的质量,因此提示工程成为一项必备技能。作者提供了10种提示词技巧,如角色提示、明确上下文、输入/输出示例、迭代式链条等,帮助开发者构建有效的提示词。同时,文章强调了高效代码提示的基础原则,包括提供丰富上下文、明确目标、分解复杂任务等。

在调试、重构和实现新功能的场景中,分别提出了具体的提示模式,例如清晰描述问题、提供最小可复现示例、明确陈述重构目标等。文章还列举了常见的提示反模式及其避免方法,如避免模糊提示、超载提示、忽略AI澄清等。通过这些技巧和模式,开发者可以将AI编程助手从一次性代码生成器转变为真正的结对程序员,提升开发效率和代码质量。

从0开始学习英语语法

为英语学习者提供了一个基于社区的语法学习资源,并结合了实际的学习方法和工具。强调了语法作为学习英语的基础,同时指出语感的培养是提升英语能力的关键。

面向初学者的网页开发教程

微软推出的一门面向初学者的Web开发课程,旨在通过24课、12周的学习,帮助学生掌握Web开发的基础知识和技能。课程内容涵盖JavaScript、CSS和HTML,并结合实际项目,如虚拟温室、浏览器扩展、太空游戏和银行应用程序等,采用项目驱动学习和频繁测验的方式,增强学习的趣味性和知识保留率。

随便看看

人工智能正在使我们的思想趋于同质化

文章探讨了人工智能(如ChatGPT)对人类思维和写作的同质化影响。研究发现,使用ChatGPT时,人们的脑部活动减少,创造力和工作记忆相关连接降低,写作内容趋于标准化和缺乏个性。例如,麻省理工学院的实验表明,使用ChatGPT的学生在写作时脑部活动显著低于其他组,且更倾向于使用常见词汇和观点。康奈尔大学的研究也发现,不同文化背景的用户在使用ChatGPT后,写作内容变得更加相似,且趋向于西方文化规范。这种同质化不仅体现在内容上,还体现在写作风格上。此外,人工智能的平均化输出可能削弱人类的原创性和独特性,甚至强化文化霸权。尽管人工智能提高了创作效率,但其对人类思维和文化多样性的长期影响仍不确定。文章呼吁人们关注这一问题,以避免人类失去独特的创造力和文化身份。

GitHub CEO:尽管人工智能蓬勃发展,手动编码仍然至关重要

GitHub 首席执行官 Thomas Dohmke 强调,尽管人工智能工具在软件开发中日益普及,但保留手动编码技能至关重要。他认为开发者需要能够修改 AI 生成的代码,以避免生产力问题。Dohmke 提出了一种有效的工作流程,即 AI 工具生成代码并提交拉取请求,开发者利用编程技能进行即时调整。他还警告说,过度依赖自动化工具可能会导致效率低下,例如花费过多时间用自然语言解释简单更改,而不是直接编辑代码。此外,Dohmke 讨论了“氛围编码”这一概念,这是由 OpenAI 联合创始人 Andrej Karpathy 提出的,用来描述过度依赖 AI 生成代码的现象。

编写玩具软件是一种乐趣

文章主张编写玩具程序(toy programs)是一种学习编程和重拾编程乐趣的有效方式。作者引用了理查德·费曼的名言“我不能创造的东西,我就不理解”,强调通过实践来深入理解编程的重要性。在AI威胁取代程序员和软件开发日益工业化的背景下,编写玩具程序能帮助开发者保持对编程的热爱。玩具程序遵循80:20原则,即用20%的工作量实现80%的功能,避免过度工程化。作者还分享了自己过去15年尝试过的玩具程序项目列表,包括正则表达式引擎、x86操作系统内核、GameBoy/NES模拟器等,并给出了难度和时间预估,以及一些有用的资源。

肖恩技术周刊(第 50 期):警惕胶水工作

2025-06-23 08:00:00

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

胶水工作指那些通常不那么光鲜亮丽,但对于维持团队或项目顺利运转至关重要的任务。它是幕后工作,能助力他人取得成功,比如整理文档、确保沟通顺畅、新员工入职指引以及处理技术债务等。尽管衔接性工作很有价值,但常常被低估,如果不能与更引人注目的贡献相平衡,还可能阻碍职业发展。毕竟公司不会奖励胶水工作,个人应有策略地去做,针对自己负责的项目,适当的胶水工作可以确保项目成功。

业界资讯

吉利发布雷神 AI 电混 2.0,发动机热效率超越比亚迪,老车主也可 OTA 升级

吉利于 6 月 13 日发布的雷神 AI 电混 2.0 系统,其专用电混发动机热效率达 47.26%,超越比亚迪的 46.06%。该系统最大亮点是「星睿 AI 智能体 2.0」,能通过多维数据实时运算进行能量分配提升节能水平,还能预测机油健康度等建立个性化养护方案,以及实现智能充电推荐、智能过弯辅助等功能。吉利推出雷神 EM-i 和 EM-p 两套动力系统,分别主打节能与强力,老车主可通过 OTA 升级。吉利还预告第四季度将推出搭载第五代醇氢专用发动机的轿车和 SUV 产品,热效率可达 48.15%。

需要写代码?试试在元宝@AI编程

元宝上线了电脑版 AI 编程模式,使用 DeepSeek V3 模型,用户在输入框中 @AI 编程并提需求,左侧提需求,右侧实时展示代码并能在线运行。该模式支持运行多种开发语言,可应用于教学辅助、亲子编程和开发辅助等场景。用户需将元宝电脑版升级到 v2.25 以上版本并切换至 DeepSeek 模型,关闭深度思考,输入 @AI 编程即可开启该模式。

刘强东首次分享做外卖、酒旅的逻辑:京东做所有业务都是为了供应链

京东集团创始人刘强东在访谈中分享了京东做外卖、酒旅等业务的逻辑,强调所有业务围绕供应链展开,核心是降低成本、提高效率和服务品质。京东外卖业务自上线后增长迅猛,3个月内拿下2500万订单,招募超12万名全职骑手,二季度员工总数预计达90万人,创下单季度净增员工纪录。京东外卖通过加大补贴力度,5月日均活跃用户反超美团,刘强东认为,外卖亏损比买流量更划算。他还透露,京东外卖将推出与美团完全不同的商业模式,强调其为长期战略,可能需十年甚至二十年实现。

刘强东还提到京东目前有6个创新项目,包括稳定币。在社会责任方面,京东在疫情期间积极保供,并持续关怀员工,如涨薪和提供五险一金。展望未来,刘强东希望将国内业务交给集团CEO许冉,自己全职投入国际业务,同时强调团队合作的重要性。

技术博客

加一个JVM参数,让系统可用率从95%提高到99.995%

本文针对一个高并发(十万级QPS)、低延迟(毫秒级返回)且频繁进行内存索引切换(约每15分钟一次,索引大小约0.5G)的系统,因索引切换时垃圾回收(GC)压力大导致的系统成功率低至95%的问题,通过JVM参数调优和系统策略优化,逐步将系统成功率提升至99.995%。

在排查过程中,排除了流量激增、外部服务瓶颈和并发锁等因素,最终定位到问题根因是索引切换时产生大量新对象和内存垃圾,导致GC耗时过长,业务线程被暂停,引发超时报错。在优化过程中,通过设置MaxTenuringThreshold=0,将索引复制次数从2次减少为1次,成功率提升至98%。进一步通过分批断流发布和Eden区预热策略,彻底解决了索引切换时的抖动问题,最终实现索引无感切换,系统成功率稳定在99.995%以上。

可信实验白皮书系列06:观察性研究

本文介绍观察性研究方法,包括合成控制法、匹配方法和Causal Impact等。观察性研究适用于无法进行控制实验的场景,如美团到家履约业务。这些方法可帮助消除选择性偏差,科学评估策略效果。合成控制法通过构建合成对照组估计政策因果效应;匹配方法通过平衡协变量分布控制干扰因素;Causal Impact基于贝叶斯结构时间序列模型构建虚拟对照组评估干预效果。文章还介绍了各方法的原理、优缺点及实际案例,并展望了其他拓展方法。

从CPU冒烟到丝滑体验:算法SRE性能优化实战全揭秘

本文分享了算法性能优化方面的实战经验,重点介绍了优化浮点转换、解决垃圾回收(GC)问题和优化响应时间(RT)瓶颈的实践。通过引入Ryu算法和Fast_Float算法,浮点转换性能大幅提升,CPU时间占比从18%降至0.19%,性能提升98%。在GC优化方面,调整JVM参数,避免老年代GC频繁触发,解决了性能抖动问题。在RT优化中,通过分析发现特征读取阶段的IO等待时间过长,中间Proxy层成为瓶颈。未来将采用垂直多副本部署模式去除Proxy,实现去中心化。文章强调性能优化永无止境,分享的实战经验可帮助读者掌握深度性能分析的方法论,避免走弯路。

开源项目

MiniMax-M1:混合注意力推理模型

MiniMax开源了世界上第一个开放权重、大规模的混合注意力推理模型,具有高效推理能力和强大的长文本处理能力,适用于复杂任务和长输入处理。

Kimi-Dev:编程语言模型

Kimi-Dev 是 MoonshotAI 开发的开源编程语言模型,专注于软件工程任务。其 72B 版本在 SWE-bench Verified 基准测试中达到 60.4% 的性能,超越其他开源模型。该模型通过强化学习优化,能够在 Docker 中自动修复代码库问题,并确保测试通过。Kimi-Dev 采用两阶段框架:文件定位和代码编辑,以实现代码修复和测试编写任务。

工具推荐

Epoch AI

Epoch AI专注于研究人工智能的发展轨迹及其对社会的影响。其研究涵盖AI模型、基准测试、训练成本等多个方面。

学习资源

动手学机器学习

包含机器学习基础、参数化模型、非参数化模型、无监督学习。机器学习基础部分涉及两个最简单的机器学习算法——k近邻算法和线性回归,并由此引出机器学习的基本思想。参数化模型和非参数化模型两部分包含了常用的有监督学习模型,包括逻辑斯谛回归、神经网络、决策树等,由浅入深。最后的无监督学习部分关注机器学习的另一大分支,介绍在没有监督信号的场景下如何完成数据建模。

动手学强化学习

动手学习基础篇、动手学习进阶篇和动手学习前沿篇。基础篇关注于 tabular 场景下的 RL,即状态和动作空间都是有限的;进阶篇的内容突破这一限制,考虑连续的状态或动作,会使用到神经网络。最后,在前沿篇介绍强化学习领域一些有趣的方向,以及相对应的前沿算法。

北大数据与智能入门指南

帮助初学者快速熟悉数据管理(Data Management, DM) 和 人工智能(Artificial Intelligence, AI) 等前沿领域,搭建坚实的技术基础。

随便看看

Anthropic:我们如何构建多智能体研究系统

Anthropic团队分享了构建多智能体研究系统的经验。该系统利用多个Claude智能体协同工作,通过主智能体规划研究流程并创建子智能体并行搜索信息,有效处理复杂任务。多智能体系统在动态调整方向、并行处理和扩展性能方面具有显著优势,尤其在处理广度优先查询时表现优异。然而,这种架构消耗token量大,成本较高,且在任务共享上下文或依赖性强的场景下适用性有限。

系统采用“协调者-工作者”模式,主智能体分析用户查询后,生成子智能体探索不同方向,子智能体将信息汇总给主智能体,最终由引文智能体处理文档并返回结果。提示工程是关键,团队通过优化提示,引导智能体合理分工、调整搜索策略,并实现自我改进。评估方面,采用小样本测试、大语言模型评分和人工评估相结合的方式,确保智能体输出的准确性和合理性。

在生产环境中,团队面临智能体有状态、错误累积、调试困难等挑战,通过构建可恢复系统、增加生产环境追踪和采用彩虹部署等方法,确保系统的可靠性和稳定性。尽管存在挑战,多智能体系统在解决复杂问题上展现出巨大潜力,改变了人们处理复杂任务的方式。

OpenAI: 构建 AI 智能体实用指南

AI智能体是一种能够自主执行任务、接管工作流的新兴软件范式,与传统软件有本质区别。它特别适用于复杂决策、难以维护的规则系统和非结构化数据处理等场景。构建智能体需要关注模型、工具和指令三大核心组件,其中模型是推理核心,工具用于与外部世界交互,指令则是行为准则。开发时应从强大模型入手建立性能基准,再优化成本,并遵循模块化设计以提升灵活性和可维护性。

智能体架构设计建议从单一智能体系统开始,逐步演进至多智能体系统,包括主管模式和去中心化模式。安全性是关键,需构建分层防御体系,设置人工监督与干预机制以确保可靠性和可控性。未来,智能体技术将从孤立应用转向相互协作的生态系统,推动业务流程的自动化和智能化变革。

杰弗里・辛顿:我曾试图警告他们,但我们已经失去控制!

“人工智能教父”杰弗里·辛顿对人工智能的担忧和警告。他指出人工智能存在导致人类灭绝的20%风险,分享了自己因直言不讳而被噤声的经历,表达了对参与创造人工智能的后悔,并列举了人工智能目前对人类构成的六大致命威胁。同时,他也提到了人工智能在医疗保健、提高生产力和教育变革方面的潜力。

此外,视频还涉及了欧洲的人工智能法规、网络攻击风险、如何保护自己免受网络攻击、利用人工智能制造病毒、人工智能与腐败选举、人工智能如何创造回音室效应、新技术的监管、是否监管阻碍了与中国竞争、致命自主武器的威胁、人工智能威胁的结合、限制人工智能接管、反思人工智能风险中的工作成果、学生因安全问题离开OpenAI、对人工智能未来的希望、人工智能导致的失业问题、如果肌肉和智力被取代剩下什么、当前人工智能与超级智能的差异、接受人工智能的能力、人工智能可能扩大贫富差距、人工智能为何优于人类、人工智能可能比人类知道更多、人工智能能否复制人类的独特性、机器是否会拥有感情、在谷歌工作、离开谷歌的原因、人们应该对人工智能做些什么、令人印象深刻的家族背景、回顾过去会给出的建议、关于人工智能安全的最后信息、人类幸福的最大威胁等内容。

肖恩技术周刊(第 49 期):消费主义假象

2025-06-16 08:00:00

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

川美2025届毕业设计作品《祷》创作灵感:

鲍曼说:“什么是消费主义?创造你根本不需要的东西,然后让你渴望得到它。消费主义不是关于对欲望满足的承诺,而是关于为了更多欲望、激发更多欲望的承诺。”通过把古典圣母像和现代消费符号结合起来,人们现在就像过去被信仰束缚一样,被无休止的购物和身材标准所控制。用廉价材料的密集堆砌,解构“精致生活”的虚假性,揭露消费社会“物化”的本质:我们在追求“完美”时,其实活成了被数据定义的假人——个体在消费洪流中的主体性丧失。

业界资讯

苹果早期图形界面核心贡献者 Bill Atkinson 去世

苹果公司著名设计师比尔·阿特金森因胰腺癌去世,享年74岁。阿特金森是计算机图形用户界面的先驱,他对个人电脑的发展产生了深远影响。他开发的QuickDraw软件是丽莎和麦金塔电脑的基础,使计算机能够高效显示形状、文本和图像。他还发明了“下拉”菜单和“双击”鼠标手势,极大地简化了计算机操作。阿特金森编写的MacPaint和HyperCard软件,分别作为数字绘图程序和简单的数据库程序,为用户提供了强大的创作工具。MacPaint允许用户精细操作图像,而HyperCard则将文本、图像和视频无缝结合,被认为是万维网的前身。阿特金森曾是神经生物学博士生,后被史蒂夫·乔布斯说服加入苹果公司,他的设计理念和创新为苹果产品奠定了基础,推动了个人电脑从专业工具向大众消费品的转变。

WWDC25 开幕式回顾

6月9日 WWDC25 全球开发者大会开幕,Apple 发布 iOS 26、iPadOS 26 等新系统,推出 Liquid Glass 新设计。该设计为半透明玻璃材质,具反射折射效果,应用于按钮、锁屏等多处,使界面更立体,还新增多彩色调与简约外观,部分 app 也重新设计。

各系统有实用更新:iOS 26 锁屏时间随墙纸缩放,引入空间场景功能,相机和照片 app 界面优化,通讯应用整合标签页,新增通话筛选等功能,Apple Intelligence 整合进多应用。watchOS 26 设计更轻盈,体能训练 app 操作优化,新增 Workout Buddy 等功能,还有单手取消手势。macOS Tahoe 26 实时活动可在菜单栏显示,电话 app 登陆,聚焦搜索支持自然语言操作,推出游戏应用。visionOS 26 小组件可融入空间,自影像更自然。tvOS 26 界面设计更新。iPadOS 26 窗口系统和菜单栏类似 macOS,文件和预览 app 改进,还解锁 “桌面级” 体验新 API 等。

OpenAI 发布 o3-pro,开源模型推迟,奥特曼发长文:温和的奇点

OpenAI 发布的 o3-pro 模型,是o3 的升级版,处理复杂问题能力更强,支持调用 ChatGPT 的全套工具,但响应速度稍慢。它在科学研究、编程、教育和写作场景下优势明显。官方评估显示其在表达清晰度、答案完整性等方面优于 o3 模型。o3-pro 未单独发布系统卡,存在一些功能限制,如不支持临时对话、图像生成等。OpenAI 还宣布 o3 模型价格直降 80%,同时 o3-pro 价格相对较低。此外,OpenAI 与 Alphabet 达成合作协议,引入 Google Cloud 作为额外云服务提供商,以缓解算力压力。OpenAI CEO Sam Altman 表示,预计将在今年夏季晚些时候发布公开权重的开源模型,而非 6 月份。他还发布了个人新博客《温和的奇点》,探讨 AI 发展对人类社会的影响。

技术博客

可信实验白皮书系列05:准实验

本文介绍准实验方法中的双重差分法(DID)及其在美团履约业务中的应用。在美团履约业务中,由于溢出效应、小样本问题以及策略和产品的特殊性,随机对照实验难以实施,因此需要采用准实验方法来评估策略效果。

双重差分法通过比较实验前后实验组和对照组的差异来估计策略效果,能够消除两组之间的固有差异。其评估原理包括传统DID模型、固定效应模型和平行趋势假设合理性检验。文章强调,平行趋势假设是DID模型的关键,通过平行趋势分组可以尽量保障实验组和对照组的合理性。

以美团配送区域优化实验为例,展示了双重差分法的应用。实验通过优化配送区域,降低了运单超出配送区域范围占比,提高了配送效率。此外,文章还探讨了双重差分法的拓展应用,如多时点DID模型、异质性双重差分模型、引入协变量、放宽平行趋势假设以及三重差分法,并介绍了其他准实验方法,如断点回归和中断时间序列分析。

交互式学习常见限流算法(英文)

文章介绍了后端应用中必须采用的速率限制策略及其重要性,还提供了四个常见速率限制算法的交互式应用,方便读者理解和实践。速率限制能防止资源被过度使用,避免资源匮乏,降低服务器托管成本,还能为抵御分布式拒绝服务攻击提供基础保护。

文中详细阐述了四种算法:令牌桶算法,有固定容量的桶,按固定速率添加令牌,请求需获取令牌,允许有突发请求;漏桶算法,像会固定速率漏水的桶,请求进入桶后按恒定速率处理,满了就丢弃,能让请求处理更平稳;固定窗口计数器算法,把时间分成固定窗口,统计窗口内请求数,超过限制就拒绝,简单高效但窗口交界可能有流量峰值;滑动窗口计数器算法,记录请求时间戳,计算过去一段时间内的请求数来判断是否允许,能更精准地限制请求速率。每个算法都配有交互式模拟器,读者可调整参数观察请求处理情况。

所有东西都是bug或问题(英文)

David Boreham回顾了他在硅谷的早期工作经历,探讨了通过“缺陷委员会”高效管理软件项目的方法。这种方法将所有任务(包括新功能、文档问题、性能问题等)都视为缺陷,并通过一个统一的缺陷跟踪系统(如BugSplat)进行管理。该系统基于四个关键原则:所有任务都视为缺陷;缺陷记录模式固定且一致;每个缺陷只分配给一个人;查询功能强大且灵活。这些原则使得项目管理高效且透明。

然而,作者指出现代项目管理工具(如GitHub Issues)在实现这些原则方面存在不足。GitHub Issues缺乏全面的任务管理功能,模式过于简单且缺乏一致性,允许将缺陷分配给多人,且查询功能有限。作者认为,这些不足使得使用GitHub Issues单独管理项目变得困难。他建议通过改进开源项目(如Gitea)来弥补这些缺陷,并分享了他们在Gitea中添加优先级排序功能的实践。文章最后呼吁关注这一领域的进展,期待回归高效管理软件项目的方式。

工具推荐

用FLUX Kontext解决一切图片问题

文章提到的各种用法:

  • 给图片去水印,各种复杂水印都能解决
  • 优化自己照片上身体的瑕疵,比如瘦脸、瘦腿、瘦肚子、让自己的肌肉变大
  • 一键生成电商商品展示图,如果想要展示朋友送的礼物也可以用
  • 去掉景区照片里面各种无关的其他游客,让你独享整个风景
  • 将真实照片转换成各种动漫风格,或者反过来
  • 修改海报或者图片上的文字
  • 修改图片上的任何小的元素,比如让自己戴上墨镜或者更换餐桌上的甜点
  • 给图片更换背景,让自己在快速时空旅行
  • 将多张图片的元素整合到一张图片里面,比如让一张图片的模特拿上另一张图的产品

AI 可编程工作流平台

oomol studio是一个可编程工作流平台,通过直观的视觉交互轻松连接代码片段和api服务,帮助用户缩短从想法到产品的距离。它通过自由组合节点,灵活构建结构化与非结构化数据,原生支持使用python/js处理数据并生成图表,且内置丰富的ai功能节点和大模型api,可以通过自由组合这些节点来构建现代化的ai数据分析工作流。开发人员可通过oomol将视频处理库封装为可调参数的功能节点,内容创作者,如抖音用户,能通过拖放创建音视频处理工作流,自动化完成多语言字幕等任务。

学习资源

黄大年茶思屋

黄大年茶思屋是一个线上开放科学与技术交流平台,旨在打破物理边界,提供学术热点、论文分享、专利搜索、学术会议、数学难题揭榜、科技赛事、开源生态、数据集等多元服务。平台聚焦学术探索与思辨,不涉及非科学话题,鼓励用户就科学与技术展开交流与合作,由华为软件技术有限公司运营。

Anthropic交互式提示工程教程

帮助用户学习如何在Claude(Anthropic的人工智能模型)中设计最佳提示(prompts)的互动教程。

随便看看

什么是熵?(英文)

本文深入探讨了熵的概念,从信息论和统计力学两个角度进行分析。在信息论中,熵由香农提出,用于量化信息的不确定性,表示系统状态所需的预期比特数。例如,公平硬币的熵为1比特,而公平8面骰子的熵为3比特。当结果概率不相等时,熵会降低。

在统计力学中,熵与系统的微观状态和宏观状态相关。宏观状态是系统的整体描述,微观状态是满足宏观状态的具体配置。例如,一个盒子中有10个球,如果所有球都在左边,熵为0;如果左右各有5个球,熵更高,因为有更多微观状态。熵的计算依赖于所选择的微观状态,不同的选择会导致不同的熵值,但相对熵的差异在微观状态均匀增加时保持不变。

熵与时间的关系也备受关注。尽管微观物理定律是时间可逆的,但宏观世界中熵似乎总是增加。这是因为高熵的宏观状态有更多的微观状态与之对应。例如,一杯茶中加入牛奶后,牛奶会扩散混合,因为这种高熵状态有更多的微观配置。熵的增加还与宇宙的初始低熵状态有关,这被称为“过去假设”,从低熵状态开始,系统自然会向高熵状态演化,从而产生了时间的箭头。

最后,文章指出熵并非总是代表“无序”,而是一个主观概念,依赖于人类的感知和上下文。熵是给定宏观状态下微观状态的数量,量化了我们对系统微观配置的不确定性。

肖恩技术周刊(第 48 期):周刊一岁啦!

2025-06-09 08:00:00

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

开篇图

去年6月8日发布了周刊第一期,感觉一晃一年就过去了。除了今年四月实在忙不过来断更了几期,整体上还算坚持的不错。写周刊给我带来了大量的收获,不仅能掌握业界时事和发展动态,扩展技术视野,同时写周刊也能强迫自己思考,锻炼写作和动手能力(还是捣鼓了不少东西)。

除去最早探索的几期外,周刊按照现在的格式也写了近40期了,逐渐出现边际效应。表现在信息源收敛,内容留存价值降低,且渐渐有了为了留存而留存的迹象。因此近期也会思考并对格式进行一些调整,毕竟有名言:“这世上唯一不变的就是变化”。

周刊最核心的目的是信息留存,且要保证在有限的时间内完成减少周末负担,因此也只能做一些微调。目前基本想法是删去没营养的开篇图和个人新鲜事分享,增加类似“每周金句”、“知识点++”、“特别推荐”等小节,并对当前留存内容格式进行调整,让内容更精一些。

业界资讯

Cursor 1.0发布

Cursor 1.0版本发布,带来多项新功能和改进。包括BugBot自动代码审查、Background Agent全面开放、Jupyter Notebook支持、Memories记忆功能、MCP一键安装和OAuth支持、更丰富的聊天响应以及新的设置和仪表盘界面。

全球 App Store 助力开发者更上一层楼,在 2024 年促成 1.3 万亿美元开发者营业额和销售额

2024 年,全球 App Store 促成 1.3 万亿美元开发者营业额和销售额,其中超 90% 归开发者所有。数字商品和服务、实体商品和服务、app 内广告三大类消费增长强劲。App Store 为开发者提供全球发行平台,支持多种货币和税务管理。Apple 为开发者提供多种工具、技术支持和培训项目,助力其提升 app 和业务。

技术博客

可信实验白皮书系列03:随机对照实验

文章首先介绍了随机对照实验的基础知识,包括其重要性、可交换性与SUTVA假设等。接着,文章分析了随机对照实验在实际应用中面临的挑战,如公平性问题、溢出效应、小样本量问题等,并提出了普通随机分组与完全随机分组两种分组方法以应对不同场景。文章还详细讨论了实验评估中的统计陷阱,如分配机制陷阱、多重比较陷阱等,并介绍了CUPED方法及其在连续型指标和比率型指标中的应用,以提高实验功效。此外,文章提出了分层随机分组、配对随机分组和协变量自适应分组等方法,以进一步保证实验的同质性。针对溢出效应问题,文章介绍了区域溢入溢出效应模型和随机饱和实验两种解决方案。最后,文章展望了未来的研究方向,包括重随机化、CACE估计、CUPAC、MLRATE、STATE等方法的应用,并强调了随机对照实验在业务决策中的重要性。

可信实验白皮书系列04:随机轮转实验

文章介绍了随机轮转实验的设计方法、分组机制、评估原理及拓展应用。随机轮转实验通过在不同时间段切换实验组与对照组模式,解决AB实验中的空间溢出效应和样本量不足问题。文中详细介绍了三种实验方法:抛硬币随机轮转、完全随机轮转和配对随机轮转。抛硬币随机轮转通过伯努利试验随机分配实验单元,适用于独立实验个体较多或时间片较短的场景;完全随机轮转可确保实验组和对照组天数相等或接近,适用于样本量较小的情况;配对随机轮转通过减少天之间差异,提高检测灵敏度,但可能仍存在轻微溢出效应。此外,文章还探讨了异常场景处理、小时级轮转下的携带效应以及其他轮转实验设计。通过这些方法,可以有效解决AB实验中的空间溢出效应和样本量不足问题,提高实验的准确性和效率。

开源项目

mem0:AI记忆层

Mem0旨在为AI助手和代理提供智能记忆层,以实现个性化AI交互。它具有多级记忆、开发者友好等核心能力,适用于AI助手、客户支持、医疗保健等多个领域。Mem0支持多种LLM,并提供托管平台和自托管包两种部署方式。

amis:前端低代码框架

百度开源的前端低代码框架 Amis,允许通过 JSON 配置生成各种后台页面,从而极大减少开发成本,甚至无需了解前端开发知识。

随便看看

日本科学家研发兼容所有血型的人造血液(英文)

日本科学家开发出一种适用于所有血型的人工血液。该人工血液由过期捐赠血液中的血红蛋白制成,包裹在保护壳中形成稳定的无病毒人造红细胞。它无需血型匹配测试,可在室温下保存两年,冷藏下保存五年,远超捐赠红细胞的42天保存期。2022年开始的小规模研究显示,志愿者接受注射后虽有轻微副作用,但生命体征无显著变化。目前试验已扩大剂量,若无副作用,将转为检验治疗效果和安全性,目标是2030年左右投入实际使用。同时,东京大学的教授也在开发另一种人工氧载体,动物实验结果令人鼓舞,正准备开展人体试验。

趋势——人工智能(英语)

Mary Meeker 发布了 340 页的《趋势——人工智能》报告,强调 AI 技术发展速度史无前例,其变革步伐和范围远超以往技术革命。报告通过八个核心主题,辅以大量图表和数据,阐述了 AI 带来的深刻变革,包括开发者数量激增、用户和使用量增长迅猛、资本支出急剧膨胀、模型训练成本高企与推理成本骤降、商业模式面临挑战、竞争激烈、AI 与物理世界加速融合、驱动全球互联网用户增长进入新阶段以及对工作变革的影响等。