2024-12-21 00:00:45
2024-12-21 (每周六发布)
我是Versun, 这里是54321周刊.
查看过往内容: 54321.versun.me
I. tldraw computer
tldraw新推出的无限画布可视化编程AI工具,后端使用谷歌的Gemini API,交互方式很有创意,充分利用了模型的多模特能力,极大降低了AI Agent/Flow的制作
II. 谷歌发布 Veo 2 和 Imagen 3 模型
Veo 2是视频生成模型,可生成4k分辨率、8秒的视频,可在VideoFX体验
Imagen 3是图像生成模型,支持图片到图片的输出,可在官方的Whisk上体验
III. GitHub 推出免费版 Copilot
免费版每月可使用 2000 次代码补全,模型只能使用 Claude 3.5 Sonnet 和 GPT-4o(付费版本有o1),仅限 50 条Copilot Chat的聊天信息
IV. 英伟达推出 Jetson 二代
Jetson Orin Nano Super,性能提高了 1.7 倍,处理能力增强了 70%,内存增加了 50%,价格仅为上一代产品的一半(售价$249),主要面向小型公司和业余爱好者
V. 2024年我们最喜欢的故事
来自Colossal的编辑们,精选了2024年的艺术作品,都非常有创意有趣
I. aicmt
这是我新开发的命令行小工具,一个AI驱动的Git提交助手,不仅能自动生成提交信息,还能自动分析代码变更,并根据最佳实践将其拆分为多个结构良好的提交
II. OpenAuth
一个基于 OAuth 2.0 标准的集中式身份验证服务工具,适用于 Web 应用程序、移动应用程序、单页面应用程序、应用程序接口或第三方客户端,目前处于测试阶段。支持自部署,也可以嵌入到现有应用程序中
III. Surf
来自Flipboard的一个应用,目的是帮助用户发现和探索整个联邦世界(Fediverse)的信息源,目前正在内测,看起来体验很不错。
IV. Kortex
新的All In One笔记软件,专为创作者开发的第二大脑工具
I. 如何实现人生中最伟大的复出
挺浓的一篇鸡汤,但味道还不错
II. 更喜欢随意丢弃的代码而不是设计文档
“先把代码搞得一团糟,然后再想办法收拾残局,这可能是最有效的设计方式。” “对于开发人员来说,PR 是最好的文档形式之一”
III. 如何看待时间
这篇文章深入探讨了编程领域中“时间”概念的复杂性。对于非程序员而言,它揭示了时间管理的挑战远比表面所见更为复杂。而对于程序员,它则提供了一套精心总结的最佳实践,旨在帮助他们规避软件中与时间相关的逻辑错误。
I. CoRecursive
一个关于软件的播客,每期都会分享一个软件其背后的故事,很有意思,同时还提供了文字稿
II. Free Programming Books
汇总了非常多的电子书、课程、podcast、视频等,并且有中文分区
I. Weekly Wisereads | [rss]
来自Readwise的周刊,每周都会推荐一些值得阅读的文章和书籍,也会推荐相关订阅。
以上就是本期的全部内容啦! 感谢阅读
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
如果您喜欢本周刊, 可以通过以下方式来支持它:
本周刊采用 CC BY-SA 4.0 许可协议进行许可。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
2024-12-14 00:00:47
2024-12-14 (每周六发布)
我是Versun, 这里是54321周刊.
查看过往内容: 54321.versun.me
I. 树莓派500发布
树莓派键盘型计算机第二代,采用与 Raspberry Pi 5 相同的四核 64 位 Arm 处理器和 RP1 I/O 控制器,提供双 4K 显示输出,$90起售
II. 值得关注的AI类更新:
III. 2024 年最令人惊讶的科技产品
rest of world发布了2024 年最令人惊讶的科技产品,比如印度的电动三轮车、中国的黑神话游戏等,挺有意思的
IV. 谷歌发布量子芯片Willow
该芯片是目前最先进的量子芯片,在一项基准测试中,只用了不到5分钟就完成了一项计算,而这项计算需要当今最快的超级计算机花费10^25年的计算时间。
如果你和我一样对量子计算没有概念,可以看看谷歌的科普文:了解量子计算的工作原理
V. 英国禁止垃圾食品在日间电视播放广告
英国政府为了减少儿童肥胖的数量,将在2025年10月开始,禁止在日间电视播放垃圾食品的广告,该类广告只能在晚9点后播出
I. screenshot-to-code
一款使用 AI 将屏幕截图/交互视频、原型和 Figma 设计转换为简洁实用的代码的简单工具,目前支持大部分的前端框架,非常强大
II. Pimalaya
使用Rust编写,运行在终端上的邮件客户端
III. Countless
在线工具,可以对比查看目前几乎所有的人工智能模型的上下文长度和对应价格,很方便。还有一个之前介绍过的,评测性能的网站:Artificial Analysis也非常好用
IV. Oils Shell
使用Python编写,编译为C++的Shell工具,兼容bash脚本。官方的初衷:为什么要创建新的 Unix Shell?
I. 如何成为一名人工智能工程师?
简要的概述了人工智能工程师是做什么的,需要什么技能,有哪些领域需要该职位,以及你适合该职位吗?
II. 70% 的问题:人工智能辅助编码的真相
AI可以快速的完成 70% 的编程目标,但最后的 30% 却是一个痛苦的打地鼠游戏过程。
该文章分析了目前人工智能辅助编码的问题,以及提出了相关的实施建议,很有参考价值
III. Markdown 的诅咒
虽然 Markdown 的功能很强大,但它也限制了更丰富的表达方式,因此作者认为创建了Code Hike以尝试在易用性和表达丰富性上达到平衡。
I. Parlance Education
关于LLMs的学习资源,主要涉及RAG、评估、应用、微调和提示工程
II. The Design Sprint
来自谷歌的产品验证方案,这是一个为期5天的流程,通过设计、原型开发和与客户测试,来验证一个创意是否值得投入资源
I. Python Weekly [rss]
由 Rahul Chaudhary 策划的周刊,他还策划了 Programmer Weekly [rss] 和 Founder Weekly [rss] 都挺不错
以上就是本期的全部内容啦! 感谢阅读
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
如果您喜欢本周刊, 可以通过以下方式来支持它:
2024-12-07 00:00:05
2024-12-07 (每周六发布)
我是Versun, 这里是54321周刊.
查看过往内容: 54321.versun.me
I. AWS re:Invent 2024 大会
此次大会除了推出一堆新的AWS服务和更新外,最重要的是推出了Nova多模态模型, 按大小分为 Micro, Lite, Pro, Premier四种,Micro只能处理文本,其它3个版本均能处理视频、图像和文本,其中 Premier 将于2025年初推出。
同时还推出了Nova Canvas(图像生成模型)和Nova Reel(视频生成模型(6 秒))。未来将继续推出语音到语音和全能(any-to-any)模型。
最后希望Amazon能优化密钥的创建流程,至今我依旧无法成功获取到可用的密钥并设置正确的权限。。
II. ChatGPT Pro
OpenAI正式推出了 o1 和 o1 pro 模型和新的 ChatGPT Pro 订阅,$200/月,可无限制使用ChatGPT(包括新发布的o1全系列模型)
III. 一粒盐大小的相机
研究人员开发出一种名为元光学照相机,只有一粒盐的大小,比传统摄像机小 50 万倍,却能拍摄出同等质量的图像。
IV. OpenWrt One正式发布
为了庆祝OpenWrt 20周年,其项目在今年年初的时候就预热要推出OpenWrt One,到了年底总算正式发布,开始在AliExpress上售卖,带外壳的版本89美金。
配置:联发科MT7981B SoC,MT7976C wifi、1 GB DDR4 RAM、128 MiB SPI NAND + 4 MiB SPI NOR 闪存、两个网口(2.5G 和 1G)、1x USB 2.0、用于 NVMe SSD 或类似设备的 M.2 2042 以及 mikroBUS 扩展头,可通过POE或USB-C供电(12V USB-PD)
V. 下一个Perplexity是什么样的?
目前在RAG生产邻域,Perplexity无疑是王者,但这周发现有2个公司正在细化RAG搜索邻域:exa和Diffbot
其做法是将搜索到的网页进行过滤清理和预处理,返回的结果直接是表格或者图谱化的数据,并非是简单文字总结和链接,很适合数据类的搜索,比如“AI类的初创公司有哪些”,“与xxx类似的网站”等等
I. Pigsty
开箱即用、本地优先的 PostgreSQL 发行版,开源 RDS,可以很方便的通过网页进行设置、操作和扩展关系型数据库
II. dozzle
一款小型轻量级,基于 Web 界面,用于监控 Docker 日志的工具。它不存储任何日志文件,仅用于实时监控容器日志。
III. Langflow
面向开发人员的低代码工具, 用于构建人工智能代理和工作流,类似Dify
IV. Steel
一款开源浏览器 API,用于构建即时网络代理和浏览器自动化工具
I. 微调 NLP 变压器以实现任务自动化
非常直白的一篇模型微调的全过程,可以一窥模型微调的大门,同时也非常赞同作者的观点:为重复性的任务微调小型模型,而不是使用大型的通用模型
II. 揭秘DeepSeek:一个更极致的中国技术理想主义故事
这是一篇DeepSeek创始人梁文锋的深度访谈,很多见解挺有意思
III. Rust 与 Go 的对决
作者从各方面比较了Rust和Go语言
I. Swebok V4.0
软件工程知识体系 (SWEBOK) 第 4 版已发布,提供了软件工程领域的全面知识框架,涵盖了软件开发的各个方面。
II. TryEngineering
由IEEE主导的一个组织,旨在帮助老师或家长使培养下一代技术创新者。提供了很多面向儿童的STEM课程和资源
I. TLDR: [rss]
科技新闻日报,主要内容是关于初创企业、技术和编程相关
以上就是本期的全部内容啦! 感谢阅读
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
如果您喜欢本周刊, 可以通过以下方式来支持它:
2024-11-30 00:00:53
2024-11-30 (每周六发布)
我是Versun, 这里是54321周刊.
查看过往内容: 54321.versun.me
本周刊100期啦!!!感谢一路陪伴!!!
我为此写了一篇博文《百期周刊小结》,欢迎阅读
I. Anthropic推出模型上下文协议(MCP)
该协议旨在为大型语言模型(LLMs)与其他应用程序的交互提供标准接口,使应用程序能够给模型提供工具、资源(上下文内容)和可供模型使用的参数化提示。比如可以实现LLM读取和写入sqlite数据库等操作,采用该标准简单明了的架构,允许开发人员通过 MCP 服务器公开数据,或构建可以连接到这些服务器的应用
II. “基建狂魔”要用榫卯工艺在月球盖房?专访“中国超级泥瓦匠”
这是央视面对面节目的一个专访文稿,公布了目前我国在月球上基建的研究情况,挺有意思
III. MacOS 版 ChatGPT 新增 Work with功能
在 ChatGPT 聊天栏中可以选择一个支持的应用程序,获取该程序内指定的内容做为上下文插入到当前的聊天中,交互形式很新颖。目前支持主流的代码编辑器和终端。
IV. Llama Impact黑客马拉松
这是最近刚结束的黑客马拉松,有Meta主办,旨在使用Llama 3.2 模型来解决公共服务上的问题(医疗保健、清洁能源和社会流动性方面),因为项目都是面向社会问题进行的,所以都很有创意和实际意义。
V. 新加坡如何成为自动驾驶汽车的理想试验场
自从2014年推出智能国家的倡议后,新加坡在自动驾驶汽车的测试与应用上发展的非常快,一个重要的原因是新加坡拥有明确的指导方针,不像美国和中国的立法往往因城市、州或省而异。
毕马威对各国将无人驾驶技术融入交通系统的能力进行了评级,发布了自动驾驶汽车准备指数,其中新加坡在包括美国和中国在内的 30 个国家中排名第一
I. Bananas
使用 WebRTC 实现端到端的屏幕共享工具
II. Terminal3d
可以在终端查看 3D 模型的工具
III.WikiChat
一种改进的 RAG,通过从语料库中检索数据,以减少大型语言模型的幻觉
IV. Ant Design X
来自阿里巴巴蚂蚁团队开发的 AI 界面框架,提供了很多组件和开箱即用的模型集成,完成度很高
I. 制造焦虑:自我完善如何成为自我毁灭的开始
“不知何故,这种无休止的奋斗已成为美德的同义词。拼搏文化重新塑造了我们的思维,让我们将休息视为道德上的失败。什么都不做——仅仅是存在——似乎违反了某种不成文的生产力法则”
“你从来不是问题。系统是。世界是。再多的自我提升也无法改变这一点。也许是时候停止试图修复自己,开始试着原谅自己。”
II. 人格盆地
人格盆地是一种用于推理人格形成因素的心理模型,从机器学习/深度学习的角度解释了人格的形成和固化过程,非常有意思,强烈建议阅读
III. AWS S3 与 Cloudflare R2 的比较
深度评测了S3和R2存储服务,可做为不错的参考
I. 1个数据集,100种可视化
使用一个简单的数据集,展示了数据可视化的多样性和复杂性,以及如何利用有限的可视化属性来讲述不同的故事。
每个可视化图表都有对应的解释和使用场景,很有参考价值
II. Kaggle Learn
个人认为这是除了DeepLearning.AI以外最好的数据科学/人工智能学习网站,免费、成体系且质量很高
I. 阮一峰的网络日志: [rss]
阮一峰大佬的《科技爱好者周刊》对我影响深远,因此我选择在第100期,也是订阅推荐的首期,来表达我的感激与敬意。
以上就是本期的全部内容啦! 感谢阅读
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
如果您喜欢本周刊, 可以通过以下方式来支持它:
2024-11-23 00:00:54
2024-11-23 (每周六发布)
我是Versun, 这里是54321周刊.
查看过往内容: 54321.versun.me
I. Surf
由Deta推出的集浏览器、文件管理器和人工智能助手于一身的“浏览器”?概念非常新颖和激进,它可以保存任何你浏览的东西,然后通过AI帮你整理,当你需要的时候只需问AI就行了。所有数据均在本地。
Arc的浏览器公司的新愿景或许就是这样的?
II. Oasis
一个游戏模型,可以实时生成类似 Minecraft 的游戏,玩家在游戏中的所有画面都由模型实时生成的,目前还只是一个概念验证,模型权重是公开的
III. Mirror: LLM驱动的示例编程语言
一种很有趣的编程语言,用户提供想要结果的示例,然后由LLM来生成可执行的js代码,即面向示例的编程语言。Mirror 是人工智能如何融入传统编程语言的概念证明
IV. Mistral聊天机器人Le Chat
Mistral 为其免费网络聊天机器人 Le Chat 添加了图像生成、网络搜索和互动"画布"功能,以便于ChatGPT/Claude Chat竞争
V. Deep Sea
展示了海面下的世界,只需向下滚动,就能看到不同深度的生物。它一直延伸到挑战者深渊,这是海平面以下 10924 米的海洋最深处,人类于 1960 年到达这个深度,比登月早了大约 9 年
I. better-auth
适用于 TypeScript 的最全面的身份验证框架
II. Pieces
AI编码助理工具,特色是以后台服务 + IDE插件的形式运行,它可以捕捉从浏览器到集成开发环境的所有上下文,拥有长期记忆,支持对接本地 LLMs,可离线运行。
III. Deep Fake Transformers
Mozilla近期刚推出的AI生成文本检测工具,旨在识别人工智能生成的文本,该工具还可以检测亚马逊购物网站上的虚假评论。
IV. TinyTroupe
来自微软的 LLM 多代理角色模拟工具,用于增强想象力和业务洞察力。这是一个实验性的 Python 库,可以模拟具有特定性格、兴趣和目标的人。这些人工代理(TinyPersons)可以倾听我们和彼此的声音,做出回复,并在模拟的TinyWorld环境中继续生活
I. Python 依赖关系管理是一场灾难
非常详细的介绍了依赖管理、以及目前Python生态的复杂性和遗留问题;还介绍了目前主流的Python依赖和环境管理工具的优缺点
II. 我的工作时限是 5 年。少于5年就是损失
"我不做任何我不愿意投入五年时间的事情。不做我半年后就会厌倦的项目,不做半心半意的捞钱计划。如果我看不到自己至少能坚持 5-7 年,我就不会去做。我相信长久之计"
III. 你为什么不善于反馈
教你在工作中,如何正确的对别人提出建议,而不会触怒对方。用一句话总结:将你的建议淡化目的性,并给出具体的解决方案,使用帮助的心态而不是指责的态度
I. Boot Dev
一个专注于后端开发教学的网站,将RPG游戏元素融入了学习过程,是你的学习不再枯燥无味
II. 使用初中数学从零开始理解 LLMs
只要你知道加法和乘法运算,则通过这篇教程,就可以理解 LLM 的内部工作原理
I. 个人项目没有截止日期。如果没有截止日期的外部压力,我们很容易陷入完美主义的陷阱。我们会发现自己总是在无休止地调整和改进,总是在追逐难以捉摸的 "完美 "解决方案。具有讽刺意味的是,这种对完美的追求往往会导致不完美的结果--或者根本没有结果。
在职场中,最后期限迫使我们分清轻重缓急,做出务实的决定。但在个人项目中,无限时间的奢侈可能会成为一种诅咒,让我们有理由在微小的细节上花费数小时、数天甚至数周的时间,而实际上,这些细节对项目的整体成功或实用性几乎没有影响。
这就严酷地提醒我们,有时候,"足够好"才是真正的完美,尤其是当我们根本没有完成项目时。(via)
以上就是本期的全部内容啦! 感谢阅读
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
如果您喜欢本周刊, 可以通过以下方式来支持它:
2024-11-16 00:00:26
2024-11-16 (每周六发布)
我是Versun, 这里是54321周刊.
查看过往内容: 54321.versun.me
I. Cascade
Codeium推出Cascade人工智能IDE,对标Cursor,但AI集成的更彻底,不仅可以自动编辑文件,还可以运行命令和更强大的上下文管理。具体的功能介绍可以看这里
II. 现在可通过 OpenAI 库访问Gemini模型
谷歌现在支持使用OpenAI库来访问Gemini模型了,这是不是说明OpenAI接口已成为某种意义上的标准了
III. LG 推出可伸缩显示屏
该款可伸缩显示屏,其最大伸缩幅度可达50%,这种显示屏可以 "自由变换成任何形状",也就是说,你可以随意拉伸、折叠或扭曲它,而不会损坏它。LG 表示,由于使用了微小的微型 LED 光源(最多 40 微米),显示屏的耐用性得到了提高,可以拉伸超过 10,000 次
IV. DeepL推出实时语音翻译功能
推出2个产品:集成在Teams里的DeepL Voice for Meetings、DeepL Voice for Conversations(OS和Android应用)
V. 兔子洞:IMG_0416
2009 年至 2012 年间,苹果 iPhone 和 iPod Touch 增加了一个名为"发送到 YouTube "的功能,用户可直接从照片应用上传视频到 YouTube(默认使用"IMG_XXXX"命名),时至今日,这样的视频仍有数百万之多,你可以通过这些独一无二的视频,一窥完全陌生的人的生活。
I. Convex
提供了用于全栈应用开发的后端即服务(backend-as-a-service)工具,使用Rust编写,可取代数据库、服务器功能、调度、存储、矢量搜索等。
它包括一套客户端库,可与前端应用深度集成,提供完全一致的缓存和开箱即用的实时更新
II. Spin
一个Rust编写的开源框架,用于使用 WebAssembly 构建和运行可组合的云微服务。它旨在成为入门 WebAssembly 微服务的最简单方法
III. Emoji-Fallback.js
可在不支持表情符号的设备上使用表情符号图像替换 Emoji 字符,并在需要时使用 Twemoji 替换图像表情符号
IV. Jujutsu
与 Git 兼容的版本控制系统,优化了很多git命令,简单快速易用
I. 我希望有人告诉我关于 Postgres 的事情
介绍了一些实用的 Postgres 技巧和窍门
II. 人工智能的长尾
来自Contrary的研究报告,研究了人工智能的长尾效应,即人工智能对各行各业非人工智能公司的影响
III. 我如何在大型科技公司交付项目
阐述了作者交付项目的经验,一些观点对独立开发者或公司的项目管理员都很有用。
“进行专业、简洁的沟通,不要让他们追着你问最新情况:在某个地方发布每日或每周主题”
“无论你正在构建什么,都要让尽可能多的人看到”
I. icones
汇集了Material Design、Feather 和 Font Awesome 等流行图标库,共20万多个图标,免费开源
II. Common Corpus
由法国人工智能实验室PleIAs发布的通用语料库(Common Corpus)是目前最大的开放式许可文本数据集,包含超过2万亿个词块
I. 如果一艘船不知道该驶去哪个港口,那么任何方向吹来的风都不会是顺风 --《塞涅卡道德书简》
以上就是本期的全部内容啦! 感谢阅读
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
如果您喜欢本周刊, 可以通过以下方式来支持它: