2025-02-23 11:20:00
MCP (Model Context Protocol,模型上下文协议) 是由 Anthropic 在 2024 年底推出的一种开放协议,它通过提供一种标准化的接口,旨在通过标准化的接口实现大语言模型 (LLM) 与外部数据源及工具的无缝集成。 最初推出时,仅有 Claude 的桌面应用支持,市场反响平平,且不乏质疑之声。但近期,随着诸多 AI 编辑器 (如 Cursor、Windsurf,甚至 Cline 等插件) 纷纷加入对 MCP 的支持,其热度逐渐攀升,已然展现出成为事实标准的潜力。本文将帮助你快速了解 MCP 是什么、它的功能,以及笔者对未来的预测与展望。 三分钟看懂 MCP LLM 的模型参数蕴含丰富的通用知识,但通常无法掌握以下两类信息: LLM 无法访问你的专属内容,例如文件系统中的文件、数据库里的订单,或私有 wiki 和笔记中的文本。 若无法联网,LLM 也无法获取实时信息,例如当前股价、最新财报、明日天气预报或前沿科技新闻。 此外,LLM 的核心功能是生成 token 和提供答案,因此它无法直接执行一些精细且需操作的具体任务,这也不是当...
2025-02-11 21:25:00
DeepSeek 给国内带来的 AI 普及和升级还在持续,虽然对于 AI 从业者和一些一直关注前沿的科技工作者来说,不论是传统 LLM 还是推理模型都不是什么太新鲜的概念了,但是对于行业外的长辈和小辈,或者是专注点刚被吸引到 AI 的业内人士来说,DeepSeek,特别是 DeepSeek-R1 的出现和爆火,可能是他们第一次真正在生活和工作里认真地接触和使用 AI。 可最近在和很多朋友交流的过程中,我也发现了大家 (其实有时候也包括我自己) 对推理式模型存在着一些常见的误解。本来其实这些疑问也可以通过询问 AI 得到解答,但是我还是把它们整理汇总一下放在这里,一方面为新接触 AI 的小伙伴们提供参考,另一方面也算是为给这个世界提供一些语料。 对比推理模型和通用模型 最常见的一个现象,就是大家都倾向于无脑点上“深度思考 (R1)”。其实这个行为有待商榷。 推理式模型一定比通用模型好吗? 不一定。它们有各自擅长的方向,无脑使用推理模型并不可取。 比如 OpenAI o1 和 DeepSeek-R1 这样的推理模型,在数学、逻辑、代码等可以明确定义正确与否的领域,表现远超...
2025-01-30 23:15:00
DeepSeek R1 的横空出世,如同在人工智能竞赛场中引爆了一颗中子弹,其冲击波正重塑着全球 AI 产业的权力版图。近期全球科技界围绕这一事件的讨论持续升温:从冯骥在社交媒体上将 R1 定义为 “国运级别的科技成果” 的激情宣言,到 OpenAI 与微软联合指控数据违规的博弈;从 nature 盛赞其“重新定义AI普惠化可能”的技术突破,到 Anthropic CEO 亲自撰文贬损其技术价值并鼓吹硬件禁运。这场多维度的攻防战,早已超越了单纯的技术讨论,而演变为一场围绕科技话语权的战略博弈。 在这场 AI “登月竞赛”中,DeepSeek 通过开源策略完成了一次漂亮的战略突围。当 R1 不仅开源还开放了包含思考链的模型蒸馏权限时,实质上是将 AI 时代的“技术火种”播撒给了整个生态。这种“普罗米修斯式”的技术民主化,正在引发链式反应:昔日垄断巨头从容尽失地被迫从技术神殿走下,转而诉诸地缘政治与贸易管制等非技术手段。这种战略转向本身,恰是中国 AI 产业突破技术封锁的生动注脚。历史总是惊人地循环往复:六十年前,美苏太空竞赛最终以阿波罗计划改写人类文明史收场,甚至开启了苏联解体的...
2024-12-13 10:00:00
去年因懒癌发作,没能写年终总结。事后回想,错失了一次宝贵的记录机会,实在懊悔。于是今年决定提早起笔,希望能趁着头脑中的理性还没被假期的欢愉冲散之前,能把一些有印象有意义的内容刻印下来,也方便今后某天心血来潮时能够回顾。 随意聊几个今年生活里遇到的话题吧,包含的内容可能比较杂乱,想法也比较主观,但是都算是当下这个时间点从自己角度展开的一些观察和想法。当然,最后再照惯例列一列书评游戏番剧推荐啥的,以供参考… 总结 关于职业和未来发展 在职场摸爬滚打也已经十多个年头了。我自己一向自认是没什么进取心,得过且过的类型。正好这几年也遇上疫情,长期在家工作,不幸养成了只要能划水就坚决不努力的糟糕特质,所以不管在职级上还是实际的成果上,其实这两年都没取得什么太大进步。很多时候也就只能用“我取得了绝佳的 work life balance”来自我安慰。 要说感悟的话,相比于以前,自己做事的风格显然改变了许多:以前更多的是追求快速,而现在更喜欢追求全盘考虑和稳重。我曾自己调侃过,十年前一晚上能解三个 issue,而现在三晚上能搞定一个 issue 就不错了。一方面可能是随着年纪增长,普...
2024-11-11 20:00:00
在程序的开发和运行过程中,人往往是最不可靠的环节:一个不小心,逻辑错误(也就是 bug!)可能会悄然保留下来并进入最终的产品。与此相对,编译器要可靠得多。如果程序中存在错误,编译器通常会直接阻止生成产品。Swift 拥有非常强大的类型系统,通过它,我们可以尝试将一些运行时的逻辑“封装”到类型系统中,从而在编译期提前发现潜在的问题和错误。这种依靠类型系统来“保存”逻辑的设计方式可以称为类型状态。 一个简单例子:端到端加密 定义和使用 这个例子源自实际工作的需求。假设我们需要设计一个客户端之间的消息系统,并支持端到端加密:也就是说,这些消息可能包含用户的隐私敏感内容。在用户设备上,这些消息可以以明文形式显示,但一旦需要离开用户设备、发送到服务端(并进一步传递到另一个目标客户端),则必须加密。如果错误地将未加密的信息发送出去,可能会带来安全隐患,甚至损害用户的信任。 一个“简洁”的设计思路是设计一个带有状态的 Message,它包含文本并用一个状态来表示是否已加密: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 struct Message { e...