MoreRSS

site iconafoo | 王福强修改

连续创业者,20多年互联网与金融技术经验,前阿里巴巴高级技术专家,现福强科技CEO,分享技术、管理、商业和AI知识。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

afoo | 王福强的 RSS 预览

KVectors 向量数据库基本成型!

2025-08-22 00:00:00

KVectors 向量数据库基本成型! -王福强的个人博客:一个架构士的思考与沉淀

KVectors 向量数据库基本成型!

王福强

2025-08-22


从这个月初(2025年8月初)开始筹划和编写KVectors的第一行代码,今天用Sift的一百万向量数据集对AnnIndexVectorCollection做了个简单的测试(10亿那个数据集太大,我这2019年的老MacbookPro肚量不够,放不下🤣),怎么说呢?

构建索引的速度出乎我的意料,可能之前也没有具体的标准,反正不到六分钟, 100万向量就压缩和索引完成:

我在设计构建索引的触发方法上添加了webhook支持, 这样,大数据集的索引构建可以异步在后台跑,跑完了可以选择发个通知,同时,为了省事,也可以直接上线构建完成的新索引(生产环境建议验证索引后再手动enable新索引):

def buildFullIndexAsync(enableAfterBuildSuccess: Boolean = true, webhook: Option[URL] = None): CompletableFuture[Void]

反而查询结果更出乎我意料,mmd,居然 100+ 毫秒的时延, 不应该啊! 虽然我也没怎么正经的做性能测试:

想了下才发现问题在哪儿,原来是每个查询向量的加载牵扯了文件系统的IO,而我把这些时间也给平均进去了,怪不得呢…(果然没正经做测试😂)

至此, KVectors分别支持了三大类Vector Collections:

  • InMemoryNoIndexVectorCollection
  • GeneralNoIndexVectorCollection
  • AnnIndexVectorCollection

基本满足了测试、小数据量以及大规模向量数据的索引与相似性检索需求。

KVectors的定位就是只做向量数据库:

之所以定位就是因为,我始终认为大模型与算力的生意是大厂拼杀大战场,跟SMB没啥关系,SMB要么做AI应用,要么就找个能抓住的点。

另外,为什么用Java/Scala写呢?

也是因为Java Vector API经历了七八轮incubator,也该进入正式发布了,基于Java Vector API,我们可以充分利用现代CPU的SIMD特性,极大加快向量相似性计算。

除此之外, KVecvtors还用了一些业界比较先进的思想和实践,比如HNSW和DiskANN算法

这其实也是为啥我能不到一个月就搞定这个产品原型的原因了,站在了巨人的肩膀上🤪

希望后面可以让KVectors在智能客服、知识库、推荐系统等场景发光发热。


 ██╗  ██╗ ██╗   ██╗ ███████╗  ██████╗ ████████╗  ██████╗  ██████╗  ███████╗
 ██║ ██╔╝ ██║   ██║ ██╔════╝ ██╔════╝ ╚══██╔══╝ ██╔═══██╗ ██╔══██╗ ██╔════╝
 █████╔╝  ██║   ██║ █████╗   ██║         ██║    ██║   ██║ ██████╔╝ ███████╗
 ██╔═██╗  ╚██╗ ██╔╝ ██╔══╝   ██║         ██║    ██║   ██║ ██╔══██╗ ╚════██║
 ██║  ██╗  ╚████╔╝  ███████╗ ╚██████╗    ██║    ╚██████╔╝ ██║  ██║ ███████║
 ╚═╝  ╚═╝   ╚═══╝   ╚══════╝  ╚═════╝    ╚═╝     ╚═════╝  ╚═╝  ╚═╝ ╚══════╝

Make Java Great Again!




「福强私学」来一个?

「福强私学」, 一部沉淀了个人成长、技术与架构、组织与管理以及商业上的方法与心法的百科全书。

footer img for kb.afoo.me

开天窗,拉认知,订阅「福报」,即刻拥有自己的全模态人工智能。

订阅「福报」
Copyright © 王福强个人版权所有 - Since 2004 (Everything is homebrewed with Pandoc and Markdown, little Scala also included.)

职业生涯真的有策略可循吗?

2025-08-19 00:00:00

职业生涯真的有策略可循吗? -王福强的个人博客:一个架构士的思考与沉淀

职业生涯真的有策略可循吗?

王福强

2025-08-19


今天有老总谈到他职业生涯一段经历,被女领导穿小鞋,干了8个月走人的经历

同样资深老炮儿魏博就很赞赏,觉得职业生涯后期就应该采取保守策略

嗯,怎么说呢?

其实,很多总结真没啥意义。

你会发现

你的每一段短期经历的总结其实都是狭隘的

假如你认同我之前说的,企业一大,职场就是一个黑暗森林

那就很自然的可以理解,去他喵的策略和道理,其实到最后都只看你遇到一个什么样的人!

遇到从小就有安全感的上司,TA才不care你靠专业上位这种事儿,甚至于TA也很清楚,专业能力再强,跟升职也没必然联系,所以,这种人是不会给你穿小鞋儿的;

但假如你遇到一个没有安全感的人,那给你穿小鞋的概率就陡增了,尤其是看重拿结果的企业和上司,你专业能力强,TA 专业能力弱,这时候专业能力就有可能成为被攻击的点,虽然这tmd跟专业能力也没啥关系🤣

关系这东西是包含三个因素的:

  1. node1
  2. edge
  3. node2

啥? 你不知道我在说啥? 嘿嘿,其实我在用图论举例:

每个人作为自己的主节点,在一段关系里只能把控自己一端,而另一段在别人那里,TA也对这段关系同样施加影响,所以,除非你这个节点的权重和影响力足够大,否则,弱势的一方很多时候是被影响的, 这其实也是很多人被穿小鞋儿很不忿的原因,因为自己处在弱势一端。

遇到好的节点(领导),TA给你施加的是好的影响,反之,则是穿小鞋儿的影响🤣

只不过,这个好的判断标准,其实,还是从弱势节点视角出发判断的,至于对方节点施加影响的初衷到底是什么,其实,只有对方节点自己知道🤪

另外:

糟糕的环境会把普通人变坏、阴毒:所以不能指望人,要指望制度、文化[得意]

其实,读过我的《极简管理课》 的同学都知道,制度和文化,其实原本就是环境的一部分,而环境,也是人塑造的。

老板的价值观,其实就是企业的价值观,老板想要塑造什么环境,自然会选择什么样的制度来塑造它,也会选择塑造什么样的企业文化来巩固它。




「福强私学」来一个?

「福强私学」, 一部沉淀了个人成长、技术与架构、组织与管理以及商业上的方法与心法的百科全书。

footer img for kb.afoo.me

开天窗,拉认知,订阅「福报」,即刻拥有自己的全模态人工智能。

订阅「福报」
Copyright © 王福强个人版权所有 - Since 2004 (Everything is homebrewed with Pandoc and Markdown, little Scala also included.)

高端的‘师’材,往往只需要最朴素的碰认

2025-08-16 00:00:00

高端的‘师’材,往往只需要最朴素的碰认 -王福强的个人博客:一个架构士的思考与沉淀

高端的‘师’材,往往只需要最朴素的碰认

王福强

2025-08-16


“高端的食材往往只需要最朴素的烹饪方式”

哦,不好意思,走错片场了…

下面才是主片场…


很多年前,嗯,真的是很多年前,某科技公司CTO(后来做了CEO,再后来,退休了)在加入某个组织后,表达了自己之前孤独的感受,加入了匹配的组织,才发现还有那么多通行者,原来自己并不孤独。

小强有一天来找老强,说他工作上遇到瓶颈了,应该怎么办?

老强推荐他加入了一个社群,后面就很少听到小强的抱怨了,发现他玩得不亦乐乎。

啥? 你也想加入?

那你得先有个心理准备,虽然这个社区不像前面CTO加入的那个组织那样,年费一万左右来筛选会员,但也不是对要加入的成员没有要求的…

阿难对佛祖说:“我喜欢上了一女子。”

佛祖问阿难:“你有多喜欢这女子?”

阿难说:“我愿化身石桥,受那五百年风吹,五百年日晒,五百年雨淋,只求她从桥上经过。”

佛祖继续问道:“会有多喜欢,可是一见钟情便倾心一世,可是不问回报而付出等待。”

佛祖又说:“阿难,某日等那女子从桥上经过,那也便只是经过了,此刻你已化身成了石桥,注定只与风雨厮守。这一切你都明白,仍旧只为那场遇见而甘受造化之苦。阿难,你究竟有多喜欢那从桥上经过的女子,令你舍身弃道,甘受情劫之苦。”

当然了,五百年的门槛有点儿高,除了王九他哥,可能极少有人能够得着500年的门槛…

好在,假如你真想要加入这个社群,只要有五年的相关专业领域背景就可以了:

如果你有5年以上架构设计经验,渴望找到能聊透技术、共破难题的伙伴,不妨试试迈出这一步:

对,这个社区就是腾讯云的架构师同盟。

扫描下方二维码,提交你的技术履历,经审核通过后,就能正式加入这个汇聚行业精英的圈子。

当然,我没决策权,只有举荐权 1,老…老架一路,就只能帮别人举荐举荐了🤪

年轻的架构师才俊们,你们才是架构师的未来!

技术的道路上,最珍贵的是同频者的陪伴。

在腾讯云架构师技术同盟,有人与你并肩拆解复杂问题,有人与你分享前沿思考,有人与你一起把技术影响力做大。

如果你也想告别「技术孤独」,和一群懂技术、敢创新的架构师同行,我们在这里等你~~~

来一起把技术聊透,把难题攻克,把路走宽!

高端的(架构)师材,只有这里才能碰撞和认识


  1. “在察举制的体制下,到了东汉后期,那些郡国地方官员,几乎完全把持了举荐人才的权力。就算是皇帝,也只能从他们举荐的人才中,进行下一步的挑选任命。”↩︎




「福强私学」来一个?

「福强私学」, 一部沉淀了个人成长、技术与架构、组织与管理以及商业上的方法与心法的百科全书。

footer img for kb.afoo.me

开天窗,拉认知,订阅「福报」,即刻拥有自己的全模态人工智能。

订阅「福报」
Copyright © 王福强个人版权所有 - Since 2004 (Everything is homebrewed with Pandoc and Markdown, little Scala also included.)

福强的本周AI热点回顾与简评

2025-08-15 00:00:00

福强的本周AI热点回顾与简评 -王福强的个人博客:一个架构士的思考与沉淀

福强的本周AI热点回顾与简评

王福强

2025-08-13


关注「福强私学」,紧跟AI前沿。

AI 理论

看到一个”最近寻径”的算法突破,没细看。

AI 模型

GLM-4.5V

上一个牛逼的国产视觉模型是Qwen 2.5VL

GLM-4.5V模型也是视觉模型

反馈不错。

Claude Sonnet 4 开始支持1M tokens 上下文

最早100万tokens上下文的是 Google Gemini,现在, Claude Sonnet 4也支持了。

Jan-v1

开源的4B模型,使用场景主要面向web搜索与深度研究(Deep research)

据说SimpleQA的准确度达到91% (对标Perplexity Pro)

该模型基于Qwen3-4B-Thinking,针对推理与工具使用进行了微调。

Gemma3 270M

Google 新推出 Gemma3 270M,大模型里的小模型, 主要面向轻量级设备, 500兆内存就能跑, 如果你有装Ollama,直接 ollama run gemma3:270m 就可以了。

与之对应的是千问的0.6B模型:

AI 产品

v0.dev这周免费

搞活动呗,不过,当你看到这篇文字的时候,像试试也没戏了😂

LEANN

UC伯克利, CUHK, AWS 和 UC Davis 的研究者新推出的轻量级向量数据库,

号称是最小的向量数据库,面向个人设备。

LEANN这个名字应该是LE+ANN这么拆,我一开始以为是LEAN + N这么拆🤣

我还没细看

这周更多在准备培训的demo和ppt了

但感觉福强正在开发的 KVectors 向量数据库也可以在它这个领域发挥同样的作用,LEANN是python, KVectors是java,首先性能层面KVectors应该更有优势,另外就是结合 DiskANN 和 HNSW 这两个ANN索引算法, KVectors 应该也可以在ANN索引层面不输这个新产品吧? 不过,KVectors本月刚开始开发,刚完成不需要索引的VectorCollection多种类型的实现,AnnVectorCollection是下个阶段的实现重点。

Open Lovable

又一个对标已有商业产品的开源产品,可以直接复制已有网站。

不过搭建和依赖对普通用户来说可能费点儿劲, 而且,瞅了眼,都是依赖海外的大模型。

https://github.com/mendableai/open-lovable

AI Infra(AI基础设施)

Spring AI 发布 1.0.1

详情参考: https://spring.io/blog/2025/08/08/spring-ai-1

Oracle 🤝 Gemini

Oracle云上可以访问Gemini服务了。

AI 相关推荐阅读

暂无,本周准备培训的交付物料,没空儿…




「福强私学」来一个?

「福强私学」, 一部沉淀了个人成长、技术与架构、组织与管理以及商业上的方法与心法的百科全书。

footer img for kb.afoo.me

开天窗,拉认知,订阅「福报」,即刻拥有自己的全模态人工智能。

订阅「福报」
Copyright © 王福强个人版权所有 - Since 2004 (Everything is homebrewed with Pandoc and Markdown, little Scala also included.)

福强的本周AI热点回顾与简评

2025-08-09 00:00:00

福强的本周AI热点回顾与简评 -王福强的个人博客:一个架构士的思考与沉淀

福强的本周AI热点回顾与简评

王福强

2025-08-04


关注「福强私学」,紧跟AI前沿。

AI 理论

暂无

AI 模型

Qwen-Image

千问发了个开源图像生成的模型,重点突出文字海报的本地特色文字生成能力。

  • https://qwenlm.github.io/blog/qwen-image/
  • https://huggingface.co/Qwen/Qwen-Image

gpt-oss

OpenAI 这回真的Open了两个模型, gpt-oss 120b和20b

各大平台和 AI IDE 跟进都挺快,刚发布就都支持了🤣

另外,他们还顺道开放了使用的Reponse format: https://github.com/openai/harmony

Claude Opus 4.1

有用户经常反映说 Claude 4 降智了, 这次Claude 发布的Opus 4.1反而跟之前的模型差不多 🤣

Genie 3

Google发布了新的世界模型Genie 3, 继李飞飞开辟世界模型(World Model)赛道之后,这个赛道也开始卷了🤣

dots.ocr

小红书发了一个VLM模型dots.ocr

GPT-5

OpenAI本周也发布了让人期盼已久的GPT-5模型, https://openai.com/gpt-5/

不过,可能是创始人给大家的预期太高,反响反而没那么高。🤣

AI 产品

Flow Maker

基于节点的产品很多了,LlamaIndex又发布了一个Flow Maker

可以帮助用户可视化的方式构建Agent程序。

Gemini Storybook

Gemini Storybook 可以生成儿童绘本故事书

只要描述要生成的故事,它就会给你生出一套角色一致性和风格都不错的故事绘本。

还支持音频和自动播放。

中文除了音频不支持,文字和插画都支持。

groq-cli

groq也发布了一个AI CLI客户端 groq-cli

NOTE

是groq,不是grok。 grok是马斯克家的AI产品, groq是海外一家AI服务提供商(MaaS)。

另外, qwen-cli开放了每天2000个免费请求的权益,还是靠免费策略拉人头啊,否则活跃度估计上不去😂

KVectors

夹带私货啦~

KVectors是本周新起的坑儿,即 Vector Store from Keevol(.cn)

一个用纯Java(scala)实现的向量存储数据库, 只专注于语意相似性搜索。

Make Java Great Again 🤣

从开始的7s打到200+ms,回头看看能不能进一步压缩到20ms左右…

压倒10ms以下,我就可以对外吹牛逼了,跟头部产品对标,🤪, 比如milvus

感觉上更nb的硬件,可能还有更大的压榨空间

AI Infra(AI基础设施)

Github Models开放了一个免费的聚合API服务

为所有Github Models上的模型开放了一个兼容OpenAI API的Endpoint:

import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://models.github.ai/inference/chat/completions",
  apiKey: process.env.GITHUB_TOKEN  // or any PAT with models:read
});

const res = await openai.chat.completions.create({
  model: "openai/gpt-4o",
  messages: [{ role: "user", content: "Hi!" }]
});
console.log(res.choices[0].message.content);

在项目没有起量之前,基本上等于免费使用。

比如我用Scala写个代码测试如下:

val req = OpenAIPayloadBuilder.build("openai/gpt-4o", "tell me a joke")
val response = OpenAIClient("https://models.github.ai/inference/chat/completions", System.getenv("GITHUB_MODEL_ACCESS_TOKEN"), req)
println(JsonPath.getString(new JsonObject(response), "$.choices[0].message.content"))

获得的响应内容挺有意思,分享给大家:

Why don’t skeletons fight each other?

Because they don’t have the guts! 😄

更多详情:https://github.blog/ai-and-ml/llms/solving-the-inference-problem-for-open-source-ai-projects-with-github-models/

AI 相关推荐阅读




「福强私学」来一个?

「福强私学」, 一部沉淀了个人成长、技术与架构、组织与管理以及商业上的方法与心法的百科全书。

footer img for kb.afoo.me

开天窗,拉认知,订阅「福报」,即刻拥有自己的全模态人工智能。

订阅「福报」
Copyright © 王福强个人版权所有 - Since 2004 (Everything is homebrewed with Pandoc and Markdown, little Scala also included.)

万两黄金不卖道,十字街头送路人

2025-07-29 00:00:00

万两黄金不卖道,十字街头送路人 -王福强的个人博客:一个架构士的思考与沉淀

万两黄金不卖道,十字街头送路人

王福强

2025-07-29


“万两黄金不卖道,十字街头送路人”

出自道教典籍《太上感应篇》,原文为“万两黄金不卖道,一字街头送路人”。

这句话的字面意思是:即使有万两黄金,也不会出卖“道”(真理或道义);而在街头巷尾,却愿意将“道”无偿分享给路人。

🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️

所以,道教在现实中一直被佛教压着打也是可以理解的。

佛教迎合人性,

道教却要逆人性。

而逆人性这事儿,只能对自己,不能对别人。

你倒是觉得一句话值万两黄金,还愿意免费送

但你有没有想过, 免费的东西从来没人会珍惜?

假如你的道真的值万两黄金,你就应该卖万两,免费做甚?

难道真要像阿傩伽叶说的那样,饿死后人?




「福强私学」来一个?

「福强私学」, 一部沉淀了个人成长、技术与架构、组织与管理以及商业上的方法与心法的百科全书。

footer img for kb.afoo.me

开天窗,拉认知,订阅「福报」,即刻拥有自己的全模态人工智能。

订阅「福报」
Copyright © 王福强个人版权所有 - Since 2004 (Everything is homebrewed with Pandoc and Markdown, little Scala also included.)