MoreRSS

site iconShawn Weekly | 肖恩技术周刊修改

包含“业界资讯”、“技术博客”、“开源项目”、“工具推荐”和“学习资源”等
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

Shawn Weekly | 肖恩技术周刊的 RSS 预览

肖恩技术周刊(第 55 期):手机发展史

2025-07-28 08:00:00

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

从早期的摩托罗拉等有独特设计的手机到如今的智能手机,显示屏越来越大,逐渐吞噬了边框、前置扬声器、键盘和主页按钮。虽然通过显示屏上打孔实现前置摄像头的保留,但像耳机插孔、红外发射器、可更换外壳、可拆卸电池等特性都已消失,当前手机外观设计趋于单调乏味

业界资讯

阿里千问3推理模型重磅更新,比肩Gemini-2.5 pro、o4-mini

2025年7月25日,阿里巴巴开源的千问3推理模型性能大幅提升,成为全球最强开源模型,可比肩Gemini-2.5 pro、o4-mini等顶尖闭源模型。千问3推理模型支持256K上下文长度,在知识、逻辑推理、编程、数学、人类偏好对齐、创意写作、多语言能力等核心能力上表现卓越。

同时,阿里巴巴的AI编程模型Qwen3-Coder在代码能力及Agent调用能力方面取得重大突破,登顶HuggingFace模型总榜冠军。借助Qwen3-Coder,程序员的工作效率大幅提升,生成一个品牌官网最快只需5分钟。该模型开源后受到硅谷科技圈的高度关注和赞誉。

截至目前,阿里巴巴已开源300余款通义大模型,通义千问衍生模型突破14万个,成为全球第一的开源模型家族。未来三年,阿里巴巴计划投入3800亿元升级全栈AI能力,持续推动AI技术的发展和应用。

Google Gemini AI在国际数学奥林匹克竞赛中夺得金牌

Google Gemini AI在国际数学奥林匹克竞赛中以35分(满分42分)的成绩夺得金牌。该模型通过端到端自然处理,利用文本输入生成清晰、精确的数学证明。其技术优势在于升级版“双子座深度思考”,融合并行思维,可同时探索多种解决方案路径。Gemini完成竞赛任务耗时4.5小时,虽计算成本高昂,但展现了强大的推理和数据处理能力。Google计划向Gemini Ultra订阅用户推出Deep Think模型,每月收费249.99美元,以提供更高的使用率。

技术博客

入局AI Infra:程序员必须了解的AI系统设计与挑战知识

文章深入探讨了人工智能基础设施(AI Infra)与传统基础设施的区别,并为程序员提供了如何将传统技术栈和方法论复用到AI系统架构设计的建议。文章从硬件、软件、模型训练和推理四个维度拆解了AI Infra面临的挑战。硬件方面,强调从CPU为中心到GPU为中心的转变,以及“AI大型机”架构的兴起,未来可能出现“AI去NVIDIA化”。软件方面,介绍了PyTorch作为深度学习框架的重要性,以及GPU编程和Python编程在AI中的关键作用。模型训练方面,讨论了存储和算力的挑战,包括模型并行和通信计算重叠等策略。模型推理方面,着重介绍了降低延时和提高吞吐量的方法,如CUDA Graph、KV Cache和连续批处理等。文章指出,AI Infra的演进将推动硬件和软件的深度融合,同时也为程序员带来了新的机遇和挑战。

小红书JDK升级带来10%整体性能提升,这份升级指南收好了!

小红书中间件团队成功推动Java业务从JDK8升级至RedJDK11或RedJDK17,通过技术手段高效完成JDK架构升级。升级后,整体性能提升10%以上,GC开销降低50%,基本消除Java服务的oom、crash等稳定性风险,并通过春节活动和618大促的实战检验。升级JDK可从成本、稳定性和标准化等方面带来巨大收益。小红书通过统一管控JDK产品生态,解决了Java服务的性能与稳定性问题,推动业务发展。团队采用“JDK兼容性改造—标准化执行—特例针对性升级”模式,解决复杂生产环境中的升级难点,包括兼容性问题、优化改造、依赖版本升级等。最终,小红书在各团队配合下,成功推动百万CPU规模的Java服务升级,取得CPU性能提升、稳定性增强和架构提升等多方面收益。

AI 智能体的上下文工程:构建 Manus 的经验教训

本文分享了构建AI智能体Manus时在上下文工程方面的经验教训。在早期NLP领域,模型需要长时间微调和评估,而BERT和GPT等模型的出现开启了“上下文学习”的新时代。Manus团队决定通过上下文工程来实现快速迭代和与底层模型的正交关系。

文章强调了KV缓存命中率的重要性,指出保持提示词前缀稳定、避免修改上下文以及明确标记缓存断点是提高缓存命中率的关键。同时,Manus采用掩蔽而非移除工具的方式,通过上下文感知的logits processor来提高动作选择的准确性。此外,Manus将文件系统作为终极上下文,通过按需读写文件解决上下文长度限制和信息丢失问题。文章还提到,Manus通过创建并逐步更新待办事项列表来引导注意力,避免目标偏离,并保留失败的尝试,让模型从错误中学习。最后,作者提醒警惕“少样本学习”陷阱,通过引入多样性打破模式,避免思维定式。

最后指出上下文工程对智能体系统至关重要,它定义了智能体的行为方式,包括运行速度、恢复能力和扩展潜力。Manus通过反复重写和真实世界测试学到这些教训,希望这些经验能帮助其他开发者避免痛苦的迭代。

开源项目

chatwiki:智能问答系统

开箱即用的基于企业私有知识库的LLM大语言模型的智能客服机器人问答系统,支持私有化部署。

RustScan:端口扫描工具

RustScan是一个现代的端口扫描工具,以快速、智能和高效著称。它能在3秒内扫描所有65k端口,支持多种脚本语言(Python、Lua、Shell),并能自动将结果导入Nmap。

CasaOS:个人云系统

CasaOS是一个开源的个人云系统,提供低成本的数据协作解决方案。它支持多种硬件和操作系统,具有友好的用户界面,无需编码或填写表格即可操作。

工具推荐

大模型定价查询

展示了Google、OpenAI、Anthropic和Xai等提供商的多种LLM模型的当前定价,包括每百万token的输入和输出成本。

AGI-Eval:模型评测

AGI-Eval是一个专注于评估人工智能模型能力的平台,提供评测榜单、人机竞赛、数据集贡献等功能,旨在推动人工智能技术的发展和应用。

免费在线拼图工具

一款完全免费且强大的在线拼图制作工具,提供布局拼图和长图拼接两种模式,所有操作均在本地完成,保证用户隐私。无需登录,无水印,支持高清下载。

学习资源

图解大模型算法

图解大模型和强化学习的相关知识,包括技术全景图、大模型基础、微调技术、优化技术、强化学习基础、策略优化架构及衍生算法、RLHF与RLAIF、逻辑推理能力优化以及大模型基础拓展等多个方面,旨在帮助读者系统地了解大模型和强化学习的原理、训练算法、优化方法等,内容丰富全面。

Game Boy 游戏卡带工作原理

详细介绍了如何从零开始制作Game Boy卡带,包括其工作原理和制作过程。Game Boy因其简单、便携、无需破解即可开发软件等特点而备受青睐。卡带的核心组件包括ROM、RAM和内存银行控制器(MBC),其中MBC通过切换内存段实现对大容量ROM和RAM的访问。为了制作可重写的卡带,可以使用闪存代替ROM,并通过卡带闪存器(如GBxCartRW)将数据写入闪存。文章还探讨了如何在卡带上实现MBC功能,包括使用FPGA、CPLD或微控制器等方法,并解决了闪存协议与MBC协议之间的冲突。此外,文章讨论了数据持久化策略(如使用电池支持的SRAM或非易失性FRAM)以及电压转换和电源问题。最后,文章还提到卡带上可以添加其他硬件组件(如LED、Wi-Fi模块),并通过特定地址范围实现软件与硬件的通信。

Anthropic官方教程

Anthropic官方教程资源。

随便看看

黑客通过弱密码搞垮了一家有 158 年历史的公司

文章讲述了英国一家拥有158年历史的运输公司KNP因员工使用弱密码被黑客入侵,导致数据被加密、系统被锁,最终因无力支付高达500万英镑的赎金而倒闭,700名员工失业。KNP曾认为其IT系统符合行业标准且购买了网络攻击保险,但仍然遭受重创。此类勒索软件攻击在英国呈上升趋势,2024年约有19000起,赎金通常高达数百万英镑,且约三分之一的公司选择支付赎金。

英国国家网络安全中心(NCSC)和国家犯罪局(NCA)正努力应对网络犯罪,但犯罪手段日益复杂,甚至包括通过电话欺骗获取系统访问权限。政府考虑禁止公共机构支付赎金,并要求私营公司报告攻击事件。KNP的负责人Paul Abbott呼吁企业重视网络安全,建立类似“网络MOT”的保护机制,但许多公司为避免损失选择沉默并支付赎金。网络犯罪已成为严重的国家安全威胁,企业和政府需加强应对措施。

谷歌浏览器 SSL 绕过秘籍

本文探讨了Chrome浏览器中用于绕过SSL错误的“thisisunsafe”代码。在Chrome的SSL错误页面输入“thisisunsafe”即可绕过错误加载页面。这一功能最初于2014年以“danger”为关键词引入,后于2015年改为“badidea”,2018年1月更新为“thisisnotsafe”,同年1月又改为Base64编码的“dGhpc2lzdW5zYWZl”,以降低滥用风险,但功能未变,且仍存在于最新版Chromium中。

SSL错误是严重的安全问题,不应被忽视。Google曾研究如何减少用户绕过SSL警告的行为,建议开发者使用更安全的替代方法,如Chrome标志或命令行标志来绕过SSL错误。尽管HTTPS的强制实施对网络安全有积极影响,但向用户解释SSL错误的风险以及为何不应忽视这些错误,仍然是一个挑战。文章最后探讨了浏览器在保护用户安全方面的责任,以及这种强制措施对用户自由访问网络的影响。

维萨和万事达:全球支付双寡头

本文探讨了Visa和Mastercard在全球支付处理市场的双头垄断地位。两者占据全球支付处理市场90%的份额(不包括中国),总市值约8500亿美元。Visa和Mastercard的起源可追溯至1950年代,它们通过先发优势、限制性合同以及与主要银行的合作,巩固了市场地位。其竞争优势包括网络效应、银行分销和高度可扩展性。

然而,近年来,Visa和Mastercard面临诸多挑战。大型商家如亚马逊因交易费用过高而抵制Visa信用卡;印度的RuPay等国家支付处理器凭借更低的费用迅速崛起;金融科技公司推出的数字钱包和“先买后付”服务也正在改变支付格局。此外,监管机构对市场竞争的关注也在增加,Visa和Mastercard可能需要调整其商业模式。

未来,Visa和Mastercard需要适应新技术(如区块链和数字货币)并应对监管变化。支付市场的格局将取决于监管机构如何应对新兴技术及市场竞争问题,Visa和Mastercard能否成功适应这些变化将决定其未来地位。

肖恩技术周刊(第 54 期):芯片简史

2025-07-21 08:00:00

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

最近在读《芯片简史》,非常推荐!全书用 60 余年芯片进化的大叙事,串起科学原理、工程狂想、商业暗战与人性挣扎,既是一本技术史,也是一份数字时代的生存指南。

业界资讯

OpenAI发布ChatGPT agent

7 月 18 日,OpenAI 推出 ChatGPT Agent,ChatGPT Agent 是一款具备虚拟计算机能力的 AI 工具,能够代表用户完成多步骤、复杂任务。该代理由 OpenAI 全新模型驱动,可访问文本浏览器、视觉浏览器与终端,通过强化学习完成诸如查看日程、规划家庭早餐、生成商业分析报告等任务,且支持用户在执行过程中调整需求,例如更改餐厅类型等。

Agent 整合了 Operator 与 Deep Research 两大平台的技术优势,适用于自动化办公、网购、日程安排等多种场景。目前已向 Pro、Plus 与 Team 用户推送,企业与教育版本将于今夏稍后开放。

为确保安全,Agent 在执行如预订或发送邮件等不可逆操作前会请求用户确认,并对财务交易设置限制。此外,OpenAI 引入了「观察模式」以提升操作透明度,并启用了针对生物与化学等高风险能力的防护机制,以应对模型能力增强带来的潜在风险。

技术博客

利用 Finch 解锁金融洞察:Uber的对话式数据AI智能体

Uber开发了一款名为Finch的会话式AI数据代理工具,集成于Slack,旨在简化财务团队的数据检索流程。传统数据访问方式涉及复杂的SQL查询和跨平台操作,效率低下且容易出错。Finch通过自然语言处理技术,将用户的自然语言查询转化为结构化的数据检索,提供实时、安全且准确的财务洞察。

Finch的核心优势包括:自然语言接口,用户可在Slack中直接提问;对Uber特定财务术语的理解;自查询代理功能,自动选择最佳数据源并执行SQL查询;内置安全和访问控制,确保数据安全;以及自动导出数据至Google Sheets,方便进一步分析。其架构基于模块化设计,结合了生成式AI、检索增强生成(RAG)和自查询代理技术,确保高效、准确的数据检索。

Finch通过优化SQL查询、并行任务执行和预取机制,提升了查询速度和系统可扩展性。此外,Finch还通过持续评估和基准测试,确保其准确性和可靠性。未来,Finch计划进一步扩展与Uber FinTech系统的集成,支持更多用户意图,并引入人工验证机制以提升关键决策的准确性。

腾讯 Oceanus 开创云原生流计算弹性新纪元

文章介绍了腾讯Oceanus在云原生流计算弹性方面的创新技术,旨在解决实时计算中资源浪费、超用及分布不均衡等问题。Oceanus通过主动式机器学习预测、跨层原地资源调整机制和标准异常解决流程,实现云原生流服务的自动化垂直弹性伸缩。具体而言,Oceanus利用多维指标和机器学习模型(如LightGBM)进行资源需求预测,结合特征工程和在线学习增强模型效果;通过Flink、Kubernetes和JVM的跨层调整机制,实现资源动态调整而无需重启服务;并设计标准化异常处理流程,快速检测、诊断并解决弹性扩缩异常。在腾讯大数据生产环境中,Oceanus显著提升了资源利用率(CPU利用率从20%提升至60%,内存利用率从45%提升至70%),并大幅降低了不稳定事件(降低近70%)。未来,腾讯将继续优化Oceanus的弹性能力,推动云原生流计算技术向智能化、全自动化发展。

流媒体背后:网飞三年直播历程

回顾了Netflix过去三年在直播领域的发展历程。从最初的喜剧特别节目开始,逐步扩展到数百场直播活动,涵盖喜剧、体育赛事和WWE等。详细介绍了Netflix直播架构的四个关键支柱:专用广播设施、基于云的冗余转码和封装管道、通过Open Connect CDN扩展内容分发以及优化直播播放体验。

此外,Netflix通过云服务协调直播流程,实时监控系统和用户体验,并从实践中总结了广泛测试、定期实践、观众预测、优雅降级、重试策略和应急计划等关键经验教训。尽管已经取得显著进展,但Netflix表示其直播之旅才刚刚开始,未来将继续扩展直播内容和提升用户体验。

开源项目

ODH:浏览器词典插件

在线词典助手是一个Chrome插件。用于浏览网页时查询在线词典,并将查询内容显示在单词旁的小弹窗里。

opencode:终端编码智能体

AI编码助手,专注于终端使用。

markitdown:文档转Markdown工具

MarkItDown是一个轻量级的Python工具,专注于将文件转换为Markdown格式,同时保留文档结构和内容。它支持多种文件格式,包括PDF、PowerPoint、Word、Excel、图像(EXIF元数据和OCR)、音频(EXIF元数据和语音转录)、HTML、基于文本的格式(CSV、JSON、XML)、ZIP文件(迭代内容)、YouTube URL和EPub等。它特别适用于与LLM(如OpenAI的GPT-4o)一起使用,因为这些模型通常能够很好地理解和生成Markdown格式的文本。

工具推荐

交互式世界天气图

交互式世界天气图,通过雨量、风力、温度、压力等交互式地图探索当前天气并查看所在位置的天气预报。可以跟踪台风和风暴发展、监测野火和烟雾,查看近乎实时更新的卫星图像。

学习资源

电子屏幕是如何工作的?

文章深入探讨了屏幕的发展历程与工作原理。早期的阴极射线管(CRT)显示器通过电子束击中荧光粉点发光,奠定了像素显示的基础。然而,CRT体积大、功耗高,逐渐被现代显示技术取代。现代显示技术主要分为LCD和OLED两种。LCD采用背光源,通过液晶层调节光的强度和颜色,具有亮度高、成本低的优点,但对比度较低、视角较窄。OLED则是自发光技术,每个像素独立发光,无需背光源,具有出色的对比度、低功耗和快速响应时间,但亮度有限且有机材料寿命较短。制造商通过技术改进,如提高光提取效率和结合量子点滤光片,来提升OLED的性能。下一代显示技术包括串联OLED和MicroLED,其中串联OLED通过堆叠面板提高亮度和寿命,MicroLED则以更高的亮度和更长的使用寿命为特点,但目前仍面临成本和像素密度的挑战。

随便看看

创始人分享Django框架的起源

Simon Willison为庆祝Django 20周年而发表的回顾性博客文章,内容围绕Django的起源、早期开发历程以及他个人使用Django构建的一些项目。文章提到,Django最初由Simon和Adrian Holovaty在2003年开发,目的是为了快速开发新闻网站,他们放弃了PHP,选择了Python,并在Lawrence Journal World工作期间逐步构建了这个框架。Simon还分享了他使用Django构建的一些项目,包括6 News Lawrence网站、Lawrence.com的重写版本,以及在《卫报》的数据新闻项目等。此外,他提到了个人项目Django People和Wildlife Near You,以及他和妻子Natalie共同开发的Lanyrd项目,后者最终被Eventbrite收购。文章最后,Simon总结了Django的核心价值——让开发者能够快速构建和发布项目。

关于 OpenAI 的一些思考

文章是作者离开OpenAI后的反思。他见证了公司从1000多人增长到3000多人的快速扩张,OpenAI以快速决策、自下而上的创新和精英主义为文化特点,内部主要通过Slack沟通,采用单一代码库,主要用Python开发。

作者参与了Codex项目,这是一个仅用7周就从想法变为实际产品的编程AI智能体。团队成员包括工程师、研究员、设计师等,他们共同努力,最终成功发布产品。Codex采用异步形式,用户启动任务后,AI智能体在自己的环境中运行并返回PR结果。

作者认为加入OpenAI是其最好的决定之一,他在这里学习到很多,并与优秀的人一起工作。他认为OpenAI是实现通用人工智能(AGI)的领先竞争者之一。

当你感到AI编程无所不能时,也许正站在“愚昧之巅”

探讨了AI在软件开发和应用变革中的作用。作者认同AI推动了产品设计走向半开放式,加速了产品原型的开发效率,并强调使用AI仍需清晰逻辑,否则可能引发更多问题。然而,对于AI捕捉用户需求、SEO自动化、研发与测试角色模糊化以及内容自动化生产等观点,他认为这些趋势虽有一定合理性,但仍存在局限性和不确定性。

作者还反驳了一些过于乐观的预测,如普通开发者不会因AI而被淘汰,高质量代码无法仅靠逻辑文档生成,PRD撰写需多方协作,以及通才无法取代专才等。他指出,软件开发的速度不仅取决于编程效率,还受限于软件工程范式和基础设施。文章最后展望未来,认为上述变化趋势将在未来5年逐渐显现,但并非所有变化都会立刻发生。作者提醒读者,AI的“蜜月期”容易让人产生过度乐观的错觉,应理性看待AI带来的变革。

肖恩技术周刊(第 53 期):编程的本质

2025-07-14 08:00:00

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

Programs = Algorithms + Data Structures
Algorithm = Logic + Control

编程的本质包括逻辑(Logic)、控制(Control)和数据(Data)。逻辑是问题的本质,控制是解决问题的策略,数据是问题的表现形式。编程范式和程序设计方法主要围绕这三方面工作,因此,有效地分离Logic、Control 和 Data 是写出好程序的关键所在

为了解耦,可以使用状态机、DSL和编程范式等模型、工具和方法。更具体的,面向对象的设计模式是基础思维,C语言是必须学习的语言,C++语言是世界上范式最多的语言,Java 语言是综合能力最强的语言,而 Go 语言则是最适合入门的语言。

——《左耳听风》 陈皓著

## 业界资讯 ### [马斯克Grok-4碾压所有大模型!“比所有博士聪明”,AIME25拿满分](https://www.qbitai.com/2025/07/307398.html#/) ![](https://cdn.jsdelivr.net/gh/shawnxie94/images/images/202507132251512.png)

马斯克的Grok-4模型发布,其在多项基准测试中表现卓越,如AIME25获满分,SAT、GRE近乎满分,还具备强大推理、编程、药物发现等能力。训练量是Grok-2的100倍、Grok-3的10倍,依靠xAI的20万卡计算集群。发布直播中展示了与ChatGPT的语音对话对比,Grok-4明显更胜一筹。未来,Grok系列将推出更多模型,如编程模型、多模态Agent等,且Grok已融入特斯拉固件,将成为擎天柱人形机器人的大脑。

深夜开源首个万亿模型K2,压力给到OpenAI,Kimi时刻要来了?

月之暗面于2025年7月11日晚开源了Kimi K2大模型,包含基础模型Kimi-K2-Base和微调后模型Kimi-K2-Instruct,均可商用,API价格为16元人民币/百万token输出。Kimi K2在多个基准测试中成绩优异,超过一些开源和闭源模型,尤其代码能力突出,被认为是Claude 4 Sonnet的有力开源平替。其训练中引入MuonClip优化器解决训练稳定性问题,采用大规模Agentic数据合成策略解决真实工具交互数据稀缺难题,引入通用强化学习结合自我评价机制,推动强化学习技术向更广泛的应用场景扩展。

技术博客

深度剖析反向代理

深入探讨了反向代理在分布式系统中的核心功能、复杂性及优化策略。反向代理是分布式系统的关键组件,广泛应用于服务网格、负载均衡、边缘代理等场景。其主要功能包括连接管理、HTTP请求解析与头信息操作、服务发现、作为HTTP客户端以及可观察性。

文章重点分析了连接管理的复杂性,尤其是在处理高并发连接时的挑战。传统的阻塞I/O方式在多客户端场景下效率低下,而非阻塞I/O和I/O多路复用技术(如select、poll和epoll)能够显著提升性能。文章还讨论了C10k问题,即如何在单台主机上处理10,000个并发连接,事件驱动架构通过单个事件循环监控I/O状态并分发请求,但存在单线程局限性。随着多核处理器的普及,HAProxy和Nginx等代理软件通过多进程或多线程模型来提升性能,Envoy则利用SO_REUSEPORT特性实现负载均衡。此外,TLS支持和协议多样性也为连接管理带来了新的挑战。

文章最后指出,尽管连接管理是反向代理的基础功能,但在大规模场景下的实现极具挑战性,不同的代理软件通过多种技术优化以适应不同的使用场景,每种方法都有其优缺点,需根据需求谨慎选择。

JavaScript 核心

详细介绍了JavaScript中对象、原型链、构造函数、执行上下文栈、变量对象、激活对象、作用域链、闭包和this值等关键概念。对象是属性的集合,具有单一的原型对象,用于实现继承。原型链通过对象的__proto__属性实现,允许对象共享方法和属性。构造函数用于创建具有特定模式的对象,并自动设置其原型。执行上下文栈管理代码的运行时行为,每个上下文包含变量对象、this值和作用域链。变量对象存储上下文中的变量和函数声明,而激活对象是函数上下文中的变量对象,包含形式参数和arguments对象。作用域链用于查找代码中的标识符,闭包允许函数在父上下文结束后仍然访问父上下文中的变量。this值是一个与执行上下文相关的特殊对象,其值在进入上下文时确定。文章通过示例代码详细解释了这些概念,并提供了进一步阅读的建议。

如何构建智能体

文章通过构建电子邮件代理的案例,详细介绍了从想法到实际部署的六步框架。第一步是定义代理的工作范围并提供具体任务示例,确保任务现实且范围合适。第二步是设计详细的操作流程,明确人类完成任务的步骤。第三步是构建最小可行产品(MVP),专注于最关键的推理任务并设计有效的提示。第四步是将MVP与真实数据和用户输入连接起来,并编写协调逻辑。第五步是进行手动和自动化测试,确保代理在核心用例中表现良好。最后一步是部署、扩展和优化代理,根据用户反馈和实际使用情况进行迭代。文章强调,构建代理不仅是让其运行,而是要通过明确的用例、真实示例的测试和用户反馈来打造有用、可靠的工具。

开源项目

OpenHands:开发智能体

OpenHands(前身为OpenDevin)是一个由人工智能驱动的开源软件开发平台,旨在帮助开发者减少编码工作量并提升开发效率。它能够执行人类开发者可以做的任何任务,包括修改代码、运行命令、浏览网页、调用API等。

p2p:远程桌面软件

p2p 是一个开源的远程桌面软件,基于P2P技术,使用UDT协议,能够绕过大多数防火墙规则,实现两台计算机之间的远程桌面控制和消息发送。

n8n:代码工作流自动化平台

n8n 是一个代码工作流自动化平台,结合了代码灵活性与无代码速度,提供 400+ 集成和原生 AI 能力。用户可以编写 JavaScript/Python 代码、添加 npm 包或使用可视化界面构建自动化工作流,同时支持自托管和云部署。其核心功能包括代码支持、AI 原生平台、完全控制、企业级功能(如高级权限、SSO 和隔离部署)以及活跃社区支持。

学习资源

密码学101

免费面向所有年龄段和技能水平的程序员的密码学入门课程。包含理解完整系统(如SSL/TLS)所需的所有内容,涵盖块密码、流密码、哈希函数等。课程通过实践学习,教授如何利用常见密码学缺陷,如伪造管理员cookie、恢复密码等。

Red Hat 技术写作风格指南

指南旨在为Red Hat的技术文档提供一致的写作风格和语言规范。它涵盖了语法、标点、排版设计、语言选择、清晰简洁的写作技巧以及交叉引用的使用等多方面内容。此外,还包括了一个用法词典,提供了特定术语的正确使用方法和推荐的拼写形式。

Redis 历史版本

Redis创始人antirez提供的早期Redis版本,并讲述了相关的历史和背景。

随便看看

盘古之殇

本文是花厂诺亚方舟实验室员工对盘古大模型研发历程的披露。文章指出,盘古团队在研发过程中面临诸多困境,包括算力有限、架构落后、tokenizer效率低下等问题,导致与国内其他公司的差距逐渐拉大。小模型实验室多次套壳其他模型并冒充盘古模型,严重打击了团队士气,导致大量人才流失。在核心成员的努力下,盘古团队从头训练了第三代模型,包括135B V3(Pangu Ultra),效果与同期竞品相当。然而,花厂内部的繁重流程管理严重拖累了大模型的研发节奏,小模型实验室却不受约束,随意套壳和获取算力资源。作者对花厂内部管理问题和造假行为感到失望和愤怒,决定离职,并希望花厂能吸取教训,真正做好盘古模型,把昇腾打造成世界一流算力。

CPython 即时编译器两年反思:优点、缺点与不足

作者对CPython JIT编译器两年工作的反思。JIT目前是社区驱动的项目,尽管微软裁员影响了团队,但社区建设成果显著,有更多新贡献者加入。追踪式JIT的设计使项目易于教学,团队也积极培养没有编译器背景的人参与。然而,性能方面仍面临挑战。CPython 3.13的JIT速度慢于解释器,3.14虽有改进,但总体仍不理想。媒体对JIT性能的报道存在误解,3.13 JIT很多时候比解释器慢得多,而一些错误的性能数据误导了用户。尽管如此,作者对JIT的未来保持乐观,目前社区正在壮大,新的优化正在推进,可能会在3.15中带来一定的性能提升。作者呼吁更多人参与测试和改进,共同推动JIT的发展。

Stack Overflow 的新时代

2025年7月10日,Stack Overflow在WeAreDevelopers大会上宣布了其新的愿景、使命和产品更新。自2008年成立以来,Stack Overflow经历了云计算、远程工作和人工智能等技术变革。2025年,开发者使用AI工具的比例增加,但对其输出的信任度却在下降。Stack Overflow计划通过提供可信的人类智能层来填补这一信任缺口,致力于成为全球技术爱好者的可靠知识来源。

Stack Overflow简化了品牌架构,将公共平台统称为Stack Overflow,而Stack Overflow Business将包括广告业务、Stack Internal和Stack Data Licensing。新的社区互动功能包括社区活动和聊天,为开发者提供更轻松的交流空间。学习工具方面,Stack Overflow推出了Stackoverflow.ai 和编程挑战,帮助开发者提升技能。企业解决方案方面,Stack Overflow for Teams(现Stack Internal)推出了知识摄取、新的连接器和即将推出的双向MCP服务器功能。此外,Stack Overflow还在探索更新其视觉身份,并邀请全球用户参与投票。

肖恩技术周刊(第 52 期):魔数0x5f3759df

2025-07-07 08:00:00

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

本周开始重看《左耳听风》。上次阅读都是5年前了,那时刚开始工作,太多内容读不懂。这次感觉好很多,能快速get到不少重点,看来这五年没白过。想想左耳朵耗子去世都两年了,他18年写的内容在当前来看还十分有价值,一些趋势的预测也是很准确,真是大牛,可惜了。

其中有一篇讲魔数“0x5f3759df”,初次阅读惊为天人,看了很多遍。该魔数最早出现在 20 世纪 90 年代的 3D 图形编程领域,特别是在经典游戏《雷神之锤 3》(Quake III Arena)的源代码中。在游戏的 3D 渲染过程中,需要频繁计算向量的长度和方向,这涉及到大量的平方根和平方根倒数(即 1/√x)计算。而直接使用标准数学库中的sqrt()函数计算效率较低,因此开发者采用了这个魔数(注意代码中注释 what the fuck? 那行 )来实现快速开平方算法,大幅提升了计算性能。

float Q_rsqrt( float number )
{
    long i;
    float x2, y;
    const float threehalfs = 1.5F;

    x2 = number * 0.5F;
    y  = number;
    i  = * ( long * ) &y; // evil floating point bit level hacking
    i  = 0x5f3759df - ( i >> 1 );  // what the fuck? 
    y  = * ( float * ) &i;
    y  = y * ( threehalfs - ( x2 * y * y ) );  // 1st iteration 
    // 2nd iteration, this can be removed
    // y  = y * ( threehalfs - ( x2 * y * y ) ); 

    return y;
}

它将复杂的浮点运算转化为高效的位操作,体现了算法优化中 “效率与精度平衡” 的智慧。而且其推导过程在当时充满神秘色彩,如今已被数学理论所解释,成为计算机科学中兼具实用性和传奇性的经典案例。想了解整个推导过程可以阅读 魔数0x5f3759df

技术博客

GitOps

GitOps是一种由Weaveworks于2017年提出的云原生应用持续部署方法,通过将基础设施的声明式描述存储在Git仓库中,并利用自动化流程确保生产环境与仓库描述一致,从而实现快速、频繁且可靠的部署。其核心优势包括快速部署、错误恢复、简化凭证管理、自文档化部署以及团队知识共享。GitOps支持推送式和拉取式两种部署策略,分别通过CI/CD工具和操作符实现,后者更安全且能自动纠正环境偏差。GitOps不仅适用于Kubernetes,还支持其他可声明式管理的基础设施,但目前大多数工具以Kubernetes为主。它还提供多应用和多环境管理能力,通过分支区分不同环境。尽管GitOps与DevOps有交集,但GitOps更侧重于技术实现,而DevOps强调文化变革。GitOps并非角色,而是一套实践,开发者可通过现有工具或自定义实践来实现。

人工智能领域没有新观点,只有新的数据集

本文探讨了人工智能进步的真正驱动力,指出AI的重大突破并非来自新想法,而是源于对新数据源的利用。文章回顾了AI发展的四个关键阶段:深度神经网络的兴起(2012年)解锁了ImageNet图像数据库;Transformer架构和大型语言模型(2017-2018年)开启了基于互联网文本的训练时代;基于人类反馈的强化学习(2022年)使模型能够学习人类标注的“好文本”;以及推理能力的提升(2024年)引入了“验证器”数据。作者认为,数据才是AI进步的关键,因为对于给定的数据集,模型性能的上限是固定的。未来AI的突破可能不会来自训练方法的改进,而是来自解锁新的数据源,例如YouTube上的视频数据或机器人收集的物理世界数据。

开源项目

RAG-Anything:统一RAG

RAG-Anything 是一个功能强大的多模态 RAG 系统,能够处理多种文件格式和内容类型。它提供了一个统一的解决方案,适用于需要处理复杂多模态文档的场景。通过其灵活的配置和强大的功能,RAG-Anything 为用户提供了高效的内容处理和查询能力。

mindsdb:人工智能查询引擎

MindsDB 使人类、人工智能、智能体和应用程序能够从分散的大规模数据源中获得高度准确的答案。

nginx-proxy-manager:Nginx管理器

无需深入了解 Nginx 或 Let's Encrypt 就能轻松实现网站的转发和免费 SSL 配置。

工具推荐

中国部分城市地铁线路可视化

展示中国部分城市地铁线路的可视化应用,使用现代 Web 技术栈构建,提供交互式的地铁网络浏览体验。

开源健身指导平台

现代化的开源健身指导平台,旨在帮助用户创建健身计划、跟踪进度,并提供全面的健身动作数据库。

学习资源

数据密集型应用系统设计

《Designing Data-Intensive Application》DDIA中文翻译。

12个构建智能体的原则

介绍了12个构建智能体的原则,用以提高软件的可靠性、可扩展性和可维护性。

机器学习新手入门

微软的《机器学习新手入门》是一个全面且结构化的入门课程,适合初学者系统学习机器学习的基础知识和技能。通过项目导向的学习方法,学生可以在实践中加深对机器学习概念的理解。

随便看看

每个计算机科学专业的学生都应该知道的事

本文为计算机科学专业学生梳理了必备的知识体系,强调构建全面技能的重要性。学生应建立作品集展示项目和成就,而非仅依赖简历。技术沟通能力至关重要,需掌握演示工具和文档撰写技能。在技术层面,学生需掌握Unix哲学、系统管理、多种编程语言、离散数学、数据结构与算法、计算机架构、操作系统、网络、安全、密码学、软件测试、用户体验设计、可视化、并行计算、软件工程、形式化方法、图形学与模拟、机器人学、人工智能、机器学习和数据库等核心领域。这些知识不仅涵盖理论基础,还强调实践能力,如实现编译器、配置操作系统、设计安全系统等。此外,学生还需具备团队协作和版本控制等软件工程技能。这些知识将帮助学生在就业市场中脱颖而出,为未来的职业发展和研究生学习奠定坚实基础,同时为社会贡献高质量的技术解决方案。

AI 构建者手册

这份 2025 年 AI 构建者手册聚焦 AI 产品落地全流程。调研显示,AI 原生企业产品成熟度更高,47% 已规模化,远超 AI 赋能企业的 13%。模型使用上,第三方 API 仍是主流,但高增长企业更倾向微调或自研模型,准确性与成本成选型核心。定价以 “订阅 + 用量 / 结果” 混合模式为主,40% 企业将 AI 功能嵌入高级套餐,未来或向用量定价转型。组织方面,收入超 1 亿美元企业中 61% 设专职 AI 领导,人才短缺致 46% 企业招聘慢。成本上,AI 研发占 R&D 预算 10-20%,API 费用成最难控成本,41% 企业靠开源模型优化。内部应用上,研发与营销是主力场景,编码辅助提升生产力最显著,但 46% 企业难寻合适场景。技术栈中,PyTorch、TensorFlow、LangChain 等成开发核心,NVIDIA 主导推理优化。手册为企业从产品架构到成本管理提供实操框架,助力 AI 商业化落地。

肖恩技术周刊(第 51 期):为何浏览器请求头User-Agent均以Mozilla开头?

2025-06-30 08:00:00

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

浏览器请求头中的 User-Agent 字段之所以均以“Mozilla”开头,主要是出于历史和兼容性的原因。早期 Netscape Navigator 是主流浏览器,其 User-Agent 字段以“Mozilla”开头。当时许多网站会通过检测 User-Agent 字段来判断浏览器类型,并据此提供不同的代码支持。如果字段中没有“Mozilla”,网站可能会拒绝服务或显示错误。

为了兼容这些网站,后来的浏览器(如 Internet Explorer、Chrome、Firefox 等)也在其 User-Agent 字段中保留了“Mozilla”字样。这种格式已成为一种行业标准,许多网站仍然依赖它来判断浏览器类型。浏览器厂商继续沿用这种格式,以避免被网站错误识别或屏蔽,确保网站的兼容性和用户体验。

业界资讯

马斯克切脑全场震撼!插脑只要1.5秒,26年治愈失明,28年全人类变AI

2025年6月28日,马斯克的Neuralink公司发布脑机接口技术进展。目前,七名志愿者已植入设备,可意念玩游戏、控制机械臂。第二代手术机器人1.5秒植入电极,兼容99%人类大脑。未来三年计划:2025年言语皮层植入设备,2026年增加电极帮助盲人重获视觉,2027年多设备植入,2028年实现全脑接口与AI集成。产品包括Telepathy、Blindsight和Deep,分别针对运动障碍、失明和神经系统疾病。技术有望提升人类与计算机交互速率,但也引发安全和伦理担忧。

Google发布开源AI智能体Gemini CLI

Gemini CLI,Google免费开源的 AI 代理工具,可将 Gemini 直接集成到开发者的终端中。它具备轻量级访问 Gemini 的能力,适用于多种任务,如内容生成、问题解决、深度研究和任务管理等。Gemini CLI 与 Google 的 AI 编程助手 Gemini Code Assist 集成,为开发者提供免费的 AI 编程支持。它还具备强大的 AI 功能,如代码理解、文件操作、命令执行和动态故障排除等。此外,Gemini CLI 是完全开源的,可由开发者社区进行改进和扩展。

京东阿里都要发币了,稳定币是智商税吗?

探讨了稳定币的定义、用途及中美对其的态度和推动原因。稳定币是一种币值相对稳定的加密货币,如USDT和USDC,其发行方通过持有高流动性资产(如美债)盈利。稳定币的主要用途是支付,具有快速交易、无需中央机构等优势,尤其在跨境支付中表现出色。然而,其匿名性也带来了监管挑战,如增加反洗钱和反恐怖融资的难度。

美国通过立法规范稳定币,要求100%备兑及反洗钱等措施,旨在巩固美元霸权。稳定币在一些新兴市场受欢迎,且可作为美债的持续买家,支撑美债价值。中国则将稳定币视为防御性选择,此前禁止境内交易虚拟货币,但保留了香港及数字人民币的“口子”。数字人民币可视为人民币稳定币,与稳定币有相似之处,但也存在发行和运营机制上的区别。总体来看,稳定币的发展既带来了机遇,也引发了监管和国际货币格局的变革。

技术博客

可信实验白皮书系列07:高阶实验工具

本文聚焦高阶实验工具,针对单次实验功效不足、假阳性及策略调优等问题,重点解读统合分析和多重比较。统合分析整合多次独立实验结果,通过逆方差加权、分母求和加权、样本量加权等方式,提高实验功效并避免辛普森悖论。多重比较则解决多指标、多实验组带来的假阳性问题,采用二阶段Benjamini-Hochberg方法控制假发现率。

此外,文章还探讨了序贯分析、异质性因果效应估计、多臂老虎机、交错式实验设计等拓展工具,旨在提升实验效率和科学性。未来计划进一步探索和应用这些工具,以更好地应对复杂实验场景,推动实验方法的持续发展。

上下文工程兴起

本文探讨了“上下文工程”的兴起及其重要性。上下文工程是指构建动态系统,为大型语言模型(LLM)提供正确的信息和工具,使其能够合理完成任务。它强调系统性、动态性、提供正确的信息和工具、格式的重要性以及确保LLM能够合理完成任务。随着LLM应用的复杂性增加,上下文工程成为AI工程师的关键技能,与提示词工程不同,它更注重动态数据的处理和整合。

文章指出,LLM出错的常见原因是缺乏正确的上下文,而不是模型本身的问题。上下文工程通过确保LLM获得正确的信息和工具,帮助解决这些问题。LangGraph和LangSmith是两个支持上下文工程的工具。LangGraph提供了高度的可控性,允许开发者精确地管理LLM的输入和输出;LangSmith则通过追踪代理调用和LLM的输入输出,帮助开发者调试和优化上下文。作者认为,随着对上下文工程的关注增加,AI应用将变得更加高效和可靠。

Uber如何削减持续集成成本

本文介绍了Uber如何通过改进其SubmitQueue系统大幅降低CI资源使用并加快等待时间。SubmitQueue是Uber用于高效整合代码变更并保持主分支绿色的系统,但存在资源利用率高和等待时间长的问题。Uber通过引入BLRD(绕过大型差异)和改进概率模型,优化了构建优先级,减少了不必要的构建,提高了资源效率和开发人员生产力。改进后的系统在Go、iOS和Android的大型monorepo中进行了测试,结果显示资源使用减少了53%,等待时间缩短了37%,同时保持了主分支的绿色。

开源项目

BookLore:书籍管理工具

自托管用于管理个人书籍的工具。支持PDF和电子书的浏览、阅读以及阅读进度跟踪,具备智能元数据处理、多用户支持、内置阅读器、OPDS支持、多书籍上传、邮件分享等功能。

code-server:网页VSCode

通过浏览器访问运行在任何机器上的 VS Code,提供基于浏览器的开发环境。它支持在任何设备上进行代码开发,利用云服务器加速任务处理,节省移动设备电量,并支持团队协作和远程开发。

xiaomusic:小爱音箱无限听歌

实现通过小爱音箱播放音乐,支持语音指令控制。使用 yt-dlp 下载音乐,支持多种音乐格式(如 mp3、flac、wav 等),并兼容多种小爱音箱型号。

学习资源

程序员的提示工程实战手册

AI编程助手的输出质量高度依赖于提示词的质量,因此提示工程成为一项必备技能。作者提供了10种提示词技巧,如角色提示、明确上下文、输入/输出示例、迭代式链条等,帮助开发者构建有效的提示词。同时,文章强调了高效代码提示的基础原则,包括提供丰富上下文、明确目标、分解复杂任务等。

在调试、重构和实现新功能的场景中,分别提出了具体的提示模式,例如清晰描述问题、提供最小可复现示例、明确陈述重构目标等。文章还列举了常见的提示反模式及其避免方法,如避免模糊提示、超载提示、忽略AI澄清等。通过这些技巧和模式,开发者可以将AI编程助手从一次性代码生成器转变为真正的结对程序员,提升开发效率和代码质量。

从0开始学习英语语法

为英语学习者提供了一个基于社区的语法学习资源,并结合了实际的学习方法和工具。强调了语法作为学习英语的基础,同时指出语感的培养是提升英语能力的关键。

面向初学者的网页开发教程

微软推出的一门面向初学者的Web开发课程,旨在通过24课、12周的学习,帮助学生掌握Web开发的基础知识和技能。课程内容涵盖JavaScript、CSS和HTML,并结合实际项目,如虚拟温室、浏览器扩展、太空游戏和银行应用程序等,采用项目驱动学习和频繁测验的方式,增强学习的趣味性和知识保留率。

随便看看

人工智能正在使我们的思想趋于同质化

文章探讨了人工智能(如ChatGPT)对人类思维和写作的同质化影响。研究发现,使用ChatGPT时,人们的脑部活动减少,创造力和工作记忆相关连接降低,写作内容趋于标准化和缺乏个性。例如,麻省理工学院的实验表明,使用ChatGPT的学生在写作时脑部活动显著低于其他组,且更倾向于使用常见词汇和观点。康奈尔大学的研究也发现,不同文化背景的用户在使用ChatGPT后,写作内容变得更加相似,且趋向于西方文化规范。这种同质化不仅体现在内容上,还体现在写作风格上。此外,人工智能的平均化输出可能削弱人类的原创性和独特性,甚至强化文化霸权。尽管人工智能提高了创作效率,但其对人类思维和文化多样性的长期影响仍不确定。文章呼吁人们关注这一问题,以避免人类失去独特的创造力和文化身份。

GitHub CEO:尽管人工智能蓬勃发展,手动编码仍然至关重要

GitHub 首席执行官 Thomas Dohmke 强调,尽管人工智能工具在软件开发中日益普及,但保留手动编码技能至关重要。他认为开发者需要能够修改 AI 生成的代码,以避免生产力问题。Dohmke 提出了一种有效的工作流程,即 AI 工具生成代码并提交拉取请求,开发者利用编程技能进行即时调整。他还警告说,过度依赖自动化工具可能会导致效率低下,例如花费过多时间用自然语言解释简单更改,而不是直接编辑代码。此外,Dohmke 讨论了“氛围编码”这一概念,这是由 OpenAI 联合创始人 Andrej Karpathy 提出的,用来描述过度依赖 AI 生成代码的现象。

编写玩具软件是一种乐趣

文章主张编写玩具程序(toy programs)是一种学习编程和重拾编程乐趣的有效方式。作者引用了理查德·费曼的名言“我不能创造的东西,我就不理解”,强调通过实践来深入理解编程的重要性。在AI威胁取代程序员和软件开发日益工业化的背景下,编写玩具程序能帮助开发者保持对编程的热爱。玩具程序遵循80:20原则,即用20%的工作量实现80%的功能,避免过度工程化。作者还分享了自己过去15年尝试过的玩具程序项目列表,包括正则表达式引擎、x86操作系统内核、GameBoy/NES模拟器等,并给出了难度和时间预估,以及一些有用的资源。

肖恩技术周刊(第 50 期):警惕胶水工作

2025-06-23 08:00:00

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

胶水工作指那些通常不那么光鲜亮丽,但对于维持团队或项目顺利运转至关重要的任务。它是幕后工作,能助力他人取得成功,比如整理文档、确保沟通顺畅、新员工入职指引以及处理技术债务等。尽管衔接性工作很有价值,但常常被低估,如果不能与更引人注目的贡献相平衡,还可能阻碍职业发展。毕竟公司不会奖励胶水工作,个人应有策略地去做,针对自己负责的项目,适当的胶水工作可以确保项目成功。

业界资讯

吉利发布雷神 AI 电混 2.0,发动机热效率超越比亚迪,老车主也可 OTA 升级

吉利于 6 月 13 日发布的雷神 AI 电混 2.0 系统,其专用电混发动机热效率达 47.26%,超越比亚迪的 46.06%。该系统最大亮点是「星睿 AI 智能体 2.0」,能通过多维数据实时运算进行能量分配提升节能水平,还能预测机油健康度等建立个性化养护方案,以及实现智能充电推荐、智能过弯辅助等功能。吉利推出雷神 EM-i 和 EM-p 两套动力系统,分别主打节能与强力,老车主可通过 OTA 升级。吉利还预告第四季度将推出搭载第五代醇氢专用发动机的轿车和 SUV 产品,热效率可达 48.15%。

需要写代码?试试在元宝@AI编程

元宝上线了电脑版 AI 编程模式,使用 DeepSeek V3 模型,用户在输入框中 @AI 编程并提需求,左侧提需求,右侧实时展示代码并能在线运行。该模式支持运行多种开发语言,可应用于教学辅助、亲子编程和开发辅助等场景。用户需将元宝电脑版升级到 v2.25 以上版本并切换至 DeepSeek 模型,关闭深度思考,输入 @AI 编程即可开启该模式。

刘强东首次分享做外卖、酒旅的逻辑:京东做所有业务都是为了供应链

京东集团创始人刘强东在访谈中分享了京东做外卖、酒旅等业务的逻辑,强调所有业务围绕供应链展开,核心是降低成本、提高效率和服务品质。京东外卖业务自上线后增长迅猛,3个月内拿下2500万订单,招募超12万名全职骑手,二季度员工总数预计达90万人,创下单季度净增员工纪录。京东外卖通过加大补贴力度,5月日均活跃用户反超美团,刘强东认为,外卖亏损比买流量更划算。他还透露,京东外卖将推出与美团完全不同的商业模式,强调其为长期战略,可能需十年甚至二十年实现。

刘强东还提到京东目前有6个创新项目,包括稳定币。在社会责任方面,京东在疫情期间积极保供,并持续关怀员工,如涨薪和提供五险一金。展望未来,刘强东希望将国内业务交给集团CEO许冉,自己全职投入国际业务,同时强调团队合作的重要性。

技术博客

加一个JVM参数,让系统可用率从95%提高到99.995%

本文针对一个高并发(十万级QPS)、低延迟(毫秒级返回)且频繁进行内存索引切换(约每15分钟一次,索引大小约0.5G)的系统,因索引切换时垃圾回收(GC)压力大导致的系统成功率低至95%的问题,通过JVM参数调优和系统策略优化,逐步将系统成功率提升至99.995%。

在排查过程中,排除了流量激增、外部服务瓶颈和并发锁等因素,最终定位到问题根因是索引切换时产生大量新对象和内存垃圾,导致GC耗时过长,业务线程被暂停,引发超时报错。在优化过程中,通过设置MaxTenuringThreshold=0,将索引复制次数从2次减少为1次,成功率提升至98%。进一步通过分批断流发布和Eden区预热策略,彻底解决了索引切换时的抖动问题,最终实现索引无感切换,系统成功率稳定在99.995%以上。

可信实验白皮书系列06:观察性研究

本文介绍观察性研究方法,包括合成控制法、匹配方法和Causal Impact等。观察性研究适用于无法进行控制实验的场景,如美团到家履约业务。这些方法可帮助消除选择性偏差,科学评估策略效果。合成控制法通过构建合成对照组估计政策因果效应;匹配方法通过平衡协变量分布控制干扰因素;Causal Impact基于贝叶斯结构时间序列模型构建虚拟对照组评估干预效果。文章还介绍了各方法的原理、优缺点及实际案例,并展望了其他拓展方法。

从CPU冒烟到丝滑体验:算法SRE性能优化实战全揭秘

本文分享了算法性能优化方面的实战经验,重点介绍了优化浮点转换、解决垃圾回收(GC)问题和优化响应时间(RT)瓶颈的实践。通过引入Ryu算法和Fast_Float算法,浮点转换性能大幅提升,CPU时间占比从18%降至0.19%,性能提升98%。在GC优化方面,调整JVM参数,避免老年代GC频繁触发,解决了性能抖动问题。在RT优化中,通过分析发现特征读取阶段的IO等待时间过长,中间Proxy层成为瓶颈。未来将采用垂直多副本部署模式去除Proxy,实现去中心化。文章强调性能优化永无止境,分享的实战经验可帮助读者掌握深度性能分析的方法论,避免走弯路。

开源项目

MiniMax-M1:混合注意力推理模型

MiniMax开源了世界上第一个开放权重、大规模的混合注意力推理模型,具有高效推理能力和强大的长文本处理能力,适用于复杂任务和长输入处理。

Kimi-Dev:编程语言模型

Kimi-Dev 是 MoonshotAI 开发的开源编程语言模型,专注于软件工程任务。其 72B 版本在 SWE-bench Verified 基准测试中达到 60.4% 的性能,超越其他开源模型。该模型通过强化学习优化,能够在 Docker 中自动修复代码库问题,并确保测试通过。Kimi-Dev 采用两阶段框架:文件定位和代码编辑,以实现代码修复和测试编写任务。

工具推荐

Epoch AI

Epoch AI专注于研究人工智能的发展轨迹及其对社会的影响。其研究涵盖AI模型、基准测试、训练成本等多个方面。

学习资源

动手学机器学习

包含机器学习基础、参数化模型、非参数化模型、无监督学习。机器学习基础部分涉及两个最简单的机器学习算法——k近邻算法和线性回归,并由此引出机器学习的基本思想。参数化模型和非参数化模型两部分包含了常用的有监督学习模型,包括逻辑斯谛回归、神经网络、决策树等,由浅入深。最后的无监督学习部分关注机器学习的另一大分支,介绍在没有监督信号的场景下如何完成数据建模。

动手学强化学习

动手学习基础篇、动手学习进阶篇和动手学习前沿篇。基础篇关注于 tabular 场景下的 RL,即状态和动作空间都是有限的;进阶篇的内容突破这一限制,考虑连续的状态或动作,会使用到神经网络。最后,在前沿篇介绍强化学习领域一些有趣的方向,以及相对应的前沿算法。

北大数据与智能入门指南

帮助初学者快速熟悉数据管理(Data Management, DM) 和 人工智能(Artificial Intelligence, AI) 等前沿领域,搭建坚实的技术基础。

随便看看

Anthropic:我们如何构建多智能体研究系统

Anthropic团队分享了构建多智能体研究系统的经验。该系统利用多个Claude智能体协同工作,通过主智能体规划研究流程并创建子智能体并行搜索信息,有效处理复杂任务。多智能体系统在动态调整方向、并行处理和扩展性能方面具有显著优势,尤其在处理广度优先查询时表现优异。然而,这种架构消耗token量大,成本较高,且在任务共享上下文或依赖性强的场景下适用性有限。

系统采用“协调者-工作者”模式,主智能体分析用户查询后,生成子智能体探索不同方向,子智能体将信息汇总给主智能体,最终由引文智能体处理文档并返回结果。提示工程是关键,团队通过优化提示,引导智能体合理分工、调整搜索策略,并实现自我改进。评估方面,采用小样本测试、大语言模型评分和人工评估相结合的方式,确保智能体输出的准确性和合理性。

在生产环境中,团队面临智能体有状态、错误累积、调试困难等挑战,通过构建可恢复系统、增加生产环境追踪和采用彩虹部署等方法,确保系统的可靠性和稳定性。尽管存在挑战,多智能体系统在解决复杂问题上展现出巨大潜力,改变了人们处理复杂任务的方式。

OpenAI: 构建 AI 智能体实用指南

AI智能体是一种能够自主执行任务、接管工作流的新兴软件范式,与传统软件有本质区别。它特别适用于复杂决策、难以维护的规则系统和非结构化数据处理等场景。构建智能体需要关注模型、工具和指令三大核心组件,其中模型是推理核心,工具用于与外部世界交互,指令则是行为准则。开发时应从强大模型入手建立性能基准,再优化成本,并遵循模块化设计以提升灵活性和可维护性。

智能体架构设计建议从单一智能体系统开始,逐步演进至多智能体系统,包括主管模式和去中心化模式。安全性是关键,需构建分层防御体系,设置人工监督与干预机制以确保可靠性和可控性。未来,智能体技术将从孤立应用转向相互协作的生态系统,推动业务流程的自动化和智能化变革。

杰弗里・辛顿:我曾试图警告他们,但我们已经失去控制!

“人工智能教父”杰弗里·辛顿对人工智能的担忧和警告。他指出人工智能存在导致人类灭绝的20%风险,分享了自己因直言不讳而被噤声的经历,表达了对参与创造人工智能的后悔,并列举了人工智能目前对人类构成的六大致命威胁。同时,他也提到了人工智能在医疗保健、提高生产力和教育变革方面的潜力。

此外,视频还涉及了欧洲的人工智能法规、网络攻击风险、如何保护自己免受网络攻击、利用人工智能制造病毒、人工智能与腐败选举、人工智能如何创造回音室效应、新技术的监管、是否监管阻碍了与中国竞争、致命自主武器的威胁、人工智能威胁的结合、限制人工智能接管、反思人工智能风险中的工作成果、学生因安全问题离开OpenAI、对人工智能未来的希望、人工智能导致的失业问题、如果肌肉和智力被取代剩下什么、当前人工智能与超级智能的差异、接受人工智能的能力、人工智能可能扩大贫富差距、人工智能为何优于人类、人工智能可能比人类知道更多、人工智能能否复制人类的独特性、机器是否会拥有感情、在谷歌工作、离开谷歌的原因、人们应该对人工智能做些什么、令人印象深刻的家族背景、回顾过去会给出的建议、关于人工智能安全的最后信息、人类幸福的最大威胁等内容。