KVectors 向量数据库基本成型！

2025-08-22 00:00:00

KVectors 向量数据库基本成型！ -王福强的个人博客：一个架构士的思考与沉淀

KVectors 向量数据库基本成型！

王福强

2025-08-22

从这个月初（2025年8月初）开始筹划和编写KVectors的第一行代码，今天用Sift的一百万向量数据集对AnnIndexVectorCollection做了个简单的测试（10亿那个数据集太大，我这2019年的老MacbookPro肚量不够，放不下🤣），怎么说呢？

构建索引的速度出乎我的意料，可能之前也没有具体的标准，反正不到六分钟， 100万向量就压缩和索引完成：

我在设计构建索引的触发方法上添加了webhook支持，这样，大数据集的索引构建可以异步在后台跑，跑完了可以选择发个通知，同时，为了省事，也可以直接上线构建完成的新索引（生产环境建议验证索引后再手动enable新索引）：

def buildFullIndexAsync(enableAfterBuildSuccess: Boolean = true, webhook: Option[URL] = None): CompletableFuture[Void]

反而查询结果更出乎我意料，mmd，居然 100+ 毫秒的时延，不应该啊！虽然我也没怎么正经的做性能测试：

想了下才发现问题在哪儿，原来是每个查询向量的加载牵扯了文件系统的IO，而我把这些时间也给平均进去了，怪不得呢…（果然没正经做测试😂）

至此， KVectors分别支持了三大类Vector Collections:

InMemoryNoIndexVectorCollection
GeneralNoIndexVectorCollection
AnnIndexVectorCollection

基本满足了测试、小数据量以及大规模向量数据的索引与相似性检索需求。

KVectors的定位就是只做向量数据库：

之所以定位就是因为，我始终认为大模型与算力的生意是大厂拼杀大战场，跟SMB没啥关系，SMB要么做AI应用，要么就找个能抓住的点。

另外，为什么用Java/Scala写呢？

也是因为Java Vector API经历了七八轮incubator，也该进入正式发布了，基于Java Vector API，我们可以充分利用现代CPU的SIMD特性，极大加快向量相似性计算。

除此之外， KVecvtors还用了一些业界比较先进的思想和实践，比如HNSW和DiskANN算法

这其实也是为啥我能不到一个月就搞定这个产品原型的原因了，站在了巨人的肩膀上🤪

希望后面可以让KVectors在智能客服、知识库、推荐系统等场景发光发热。


 ██╗  ██╗ ██╗   ██╗ ███████╗  ██████╗ ████████╗  ██████╗  ██████╗  ███████╗
 ██║ ██╔╝ ██║   ██║ ██╔════╝ ██╔════╝ ╚══██╔══╝ ██╔═══██╗ ██╔══██╗ ██╔════╝
 █████╔╝  ██║   ██║ █████╗   ██║         ██║    ██║   ██║ ██████╔╝ ███████╗
 ██╔═██╗  ╚██╗ ██╔╝ ██╔══╝   ██║         ██║    ██║   ██║ ██╔══██╗ ╚════██║
 ██║  ██╗  ╚████╔╝  ███████╗ ╚██████╗    ██║    ╚██████╔╝ ██║  ██║ ███████║
 ╚═╝  ╚═╝   ╚═══╝   ╚══════╝  ╚═════╝    ╚═╝     ╚═════╝  ╚═╝  ╚═╝ ╚══════╝

Make Java Great Again！

>>>>>> 更多阅读 <<<<<<

到底是在彰显什么？

中国企业自建GPT服务的三款开源可商用模型

SpringCloud与K8S谁与争锋？

「福强私学」来一个？

「福强私学」, 一部沉淀了个人成长、技术与架构、组织与管理以及商业上的方法与心法的百科全书。

福强老师的 AI 通识课

开天窗，拉认知，订阅「福报」，即刻拥有自己的全模态人工智能。

职业生涯真的有策略可循吗？

2025-08-19 00:00:00

职业生涯真的有策略可循吗？ -王福强的个人博客：一个架构士的思考与沉淀

职业生涯真的有策略可循吗？

王福强

2025-08-19

今天有老总谈到他职业生涯一段经历，被女领导穿小鞋，干了8个月走人的经历

同样资深老炮儿魏博就很赞赏，觉得职业生涯后期就应该采取保守策略

嗯，怎么说呢？

其实，很多总结真没啥意义。

你会发现

你的每一段短期经历的总结其实都是狭隘的

假如你认同我之前说的，企业一大，职场就是一个黑暗森林

那就很自然的可以理解，去他喵的策略和道理，其实到最后都只看你遇到一个什么样的人！

遇到从小就有安全感的上司，TA才不care你靠专业上位这种事儿，甚至于TA也很清楚，专业能力再强，跟升职也没必然联系，所以，这种人是不会给你穿小鞋儿的；

但假如你遇到一个没有安全感的人，那给你穿小鞋的概率就陡增了，尤其是看重拿结果的企业和上司，你专业能力强，TA 专业能力弱，这时候专业能力就有可能成为被攻击的点，虽然这tmd跟专业能力也没啥关系🤣

关系这东西是包含三个因素的：

node1
edge
node2

啥？你不知道我在说啥？嘿嘿，其实我在用图论举例：

每个人作为自己的主节点，在一段关系里只能把控自己一端，而另一段在别人那里，TA也对这段关系同样施加影响，所以，除非你这个节点的权重和影响力足够大，否则，弱势的一方很多时候是被影响的，这其实也是很多人被穿小鞋儿很不忿的原因，因为自己处在弱势一端。

遇到好的节点（领导），TA给你施加的是好的影响，反之，则是穿小鞋儿的影响🤣

只不过，这个好的判断标准，其实，还是从弱势节点视角出发判断的，至于对方节点施加影响的初衷到底是什么，其实，只有对方节点自己知道🤪

另外：

糟糕的环境会把普通人变坏、阴毒:所以不能指望人，要指望制度、文化[得意]

其实，读过我的《极简管理课》的同学都知道，制度和文化，其实原本就是环境的一部分，而环境，也是人塑造的。

老板的价值观，其实就是企业的价值观，老板想要塑造什么环境，自然会选择什么样的制度来塑造它，也会选择塑造什么样的企业文化来巩固它。

>>>>>> 更多阅读 <<<<<<

如何拥有犀利的思维？

公司研究院的诅咒

终于成行的丽江之旅(2)

「福强私学」来一个？

「福强私学」, 一部沉淀了个人成长、技术与架构、组织与管理以及商业上的方法与心法的百科全书。

福强老师的 AI 通识课

开天窗，拉认知，订阅「福报」，即刻拥有自己的全模态人工智能。

高端的‘师’材，往往只需要最朴素的碰认

2025-08-16 00:00:00

高端的‘师’材，往往只需要最朴素的碰认 -王福强的个人博客：一个架构士的思考与沉淀

高端的‘师’材，往往只需要最朴素的碰认

王福强

2025-08-16

“高端的食材往往只需要最朴素的烹饪方式”

哦，不好意思，走错片场了…

下面才是主片场…

很多年前，嗯，真的是很多年前，某科技公司CTO（后来做了CEO，再后来，退休了）在加入某个组织后，表达了自己之前孤独的感受，加入了匹配的组织，才发现还有那么多通行者，原来自己并不孤独。

小强有一天来找老强，说他工作上遇到瓶颈了，应该怎么办？

老强推荐他加入了一个社群，后面就很少听到小强的抱怨了，发现他玩得不亦乐乎。

啥？你也想加入？

那你得先有个心理准备，虽然这个社区不像前面CTO加入的那个组织那样，年费一万左右来筛选会员，但也不是对要加入的成员没有要求的…

阿难对佛祖说：“我喜欢上了一女子。”

佛祖问阿难：“你有多喜欢这女子？”

阿难说：“我愿化身石桥，受那五百年风吹，五百年日晒，五百年雨淋，只求她从桥上经过。”

佛祖继续问道：“会有多喜欢，可是一见钟情便倾心一世，可是不问回报而付出等待。”

佛祖又说：“阿难，某日等那女子从桥上经过，那也便只是经过了，此刻你已化身成了石桥，注定只与风雨厮守。这一切你都明白，仍旧只为那场遇见而甘受造化之苦。阿难，你究竟有多喜欢那从桥上经过的女子，令你舍身弃道，甘受情劫之苦。”

当然了，五百年的门槛有点儿高，除了王九他哥，可能极少有人能够得着500年的门槛…

好在，假如你真想要加入这个社群，只要有五年的相关专业领域背景就可以了：

如果你有5年以上架构设计经验，渴望找到能聊透技术、共破难题的伙伴，不妨试试迈出这一步：

对，这个社区就是腾讯云的架构师同盟。

扫描下方二维码，提交你的技术履历，经审核通过后，就能正式加入这个汇聚行业精英的圈子。

当然，我没决策权，只有举荐权 ¹，老…老架一路，就只能帮别人举荐举荐了🤪

年轻的架构师才俊们，你们才是架构师的未来！

技术的道路上，最珍贵的是同频者的陪伴。

在腾讯云架构师技术同盟，有人与你并肩拆解复杂问题，有人与你分享前沿思考，有人与你一起把技术影响力做大。

如果你也想告别「技术孤独」，和一群懂技术、敢创新的架构师同行，我们在这里等你~~~

来一起把技术聊透，把难题攻克，把路走宽！

高端的（架构）师材，只有这里才能碰撞和认识。

“在察举制的体制下，到了东汉后期，那些郡国地方官员，几乎完全把持了举荐人才的权力。就算是皇帝，也只能从他们举荐的人才中，进行下一步的挑选任命。”↩︎

>>>>>> 更多阅读 <<<<<<

“A Scala Code Trick for Converting Type

二十年目睹中国ToB软件之怪现状

华东互联网+技术峰会回顾

「福强私学」来一个？

「福强私学」, 一部沉淀了个人成长、技术与架构、组织与管理以及商业上的方法与心法的百科全书。

福强老师的 AI 通识课

开天窗，拉认知，订阅「福报」，即刻拥有自己的全模态人工智能。

福强的本周AI热点回顾与简评

2025-08-15 00:00:00

福强的本周AI热点回顾与简评 -王福强的个人博客：一个架构士的思考与沉淀

福强的本周AI热点回顾与简评

王福强

2025-08-13

关注「福强私学」，紧跟AI前沿。

AI 理论

看到一个”最近寻径”的算法突破，没细看。

AI 模型

GLM-4.5V

上一个牛逼的国产视觉模型是Qwen 2.5VL

GLM-4.5V模型也是视觉模型

反馈不错。

Claude Sonnet 4 开始支持1M tokens 上下文

最早100万tokens上下文的是 Google Gemini，现在， Claude Sonnet 4也支持了。

Jan-v1

开源的4B模型，使用场景主要面向web搜索与深度研究（Deep research）

据说SimpleQA的准确度达到91% （对标Perplexity Pro）

该模型基于Qwen3-4B-Thinking，针对推理与工具使用进行了微调。

Gemma3 270M

Google 新推出 Gemma3 270M，大模型里的小模型，主要面向轻量级设备， 500兆内存就能跑，如果你有装Ollama，直接 ollama run gemma3:270m 就可以了。

与之对应的是千问的0.6B模型：

AI 产品

v0.dev这周免费

搞活动呗，不过，当你看到这篇文字的时候，像试试也没戏了😂

LEANN

UC伯克利, CUHK, AWS 和 UC Davis 的研究者新推出的轻量级向量数据库，

号称是最小的向量数据库，面向个人设备。

LEANN这个名字应该是LE+ANN这么拆，我一开始以为是LEAN + N这么拆🤣

我还没细看

这周更多在准备培训的demo和ppt了

但感觉福强正在开发的 KVectors 向量数据库也可以在它这个领域发挥同样的作用，LEANN是python， KVectors是java，首先性能层面KVectors应该更有优势，另外就是结合 DiskANN 和 HNSW 这两个ANN索引算法， KVectors 应该也可以在ANN索引层面不输这个新产品吧？不过，KVectors本月刚开始开发，刚完成不需要索引的VectorCollection多种类型的实现，AnnVectorCollection是下个阶段的实现重点。

Open Lovable

又一个对标已有商业产品的开源产品，可以直接复制已有网站。

不过搭建和依赖对普通用户来说可能费点儿劲，而且，瞅了眼，都是依赖海外的大模型。

https://github.com/mendableai/open-lovable

AI Infra（AI基础设施）

Spring AI 发布 1.0.1

详情参考： https://spring.io/blog/2025/08/08/spring-ai-1

Oracle 🤝 Gemini

Oracle云上可以访问Gemini服务了。

AI 相关推荐阅读

暂无，本周准备培训的交付物料，没空儿…

>>>>>> 更多阅读 <<<<<<

前端开发简史(How Frontend Dev. Evolves)

我为什么要做瞎子摸象的践行者

CSTS Internal Online Training Notes

「福强私学」来一个？

「福强私学」, 一部沉淀了个人成长、技术与架构、组织与管理以及商业上的方法与心法的百科全书。

福强老师的 AI 通识课

开天窗，拉认知，订阅「福报」，即刻拥有自己的全模态人工智能。

福强的本周AI热点回顾与简评

2025-08-09 00:00:00

福强的本周AI热点回顾与简评 -王福强的个人博客：一个架构士的思考与沉淀

福强的本周AI热点回顾与简评

王福强

2025-08-04

关注「福强私学」，紧跟AI前沿。

AI 理论

暂无

AI 模型

Qwen-Image

千问发了个开源图像生成的模型，重点突出文字海报的本地特色文字生成能力。

https://qwenlm.github.io/blog/qwen-image/
https://huggingface.co/Qwen/Qwen-Image

gpt-oss

OpenAI 这回真的Open了两个模型， gpt-oss 120b和20b

各大平台和 AI IDE 跟进都挺快，刚发布就都支持了🤣

另外，他们还顺道开放了使用的Reponse format： https://github.com/openai/harmony

Claude Opus 4.1

有用户经常反映说 Claude 4 降智了，这次Claude 发布的Opus 4.1反而跟之前的模型差不多 🤣

Genie 3

Google发布了新的世界模型Genie 3，继李飞飞开辟世界模型（World Model）赛道之后，这个赛道也开始卷了🤣

dots.ocr

小红书发了一个VLM模型dots.ocr

GPT-5

OpenAI本周也发布了让人期盼已久的GPT-5模型， https://openai.com/gpt-5/

不过，可能是创始人给大家的预期太高，反响反而没那么高。🤣

AI 产品

Flow Maker

基于节点的产品很多了，LlamaIndex又发布了一个Flow Maker

可以帮助用户可视化的方式构建Agent程序。

Gemini Storybook

Gemini Storybook 可以生成儿童绘本故事书

只要描述要生成的故事，它就会给你生出一套角色一致性和风格都不错的故事绘本。

还支持音频和自动播放。

中文除了音频不支持，文字和插画都支持。

groq-cli

groq也发布了一个AI CLI客户端 groq-cli

NOTE

是groq，不是grok。 grok是马斯克家的AI产品， groq是海外一家AI服务提供商（MaaS）。

另外， qwen-cli开放了每天2000个免费请求的权益，还是靠免费策略拉人头啊，否则活跃度估计上不去😂

KVectors

夹带私货啦～

KVectors是本周新起的坑儿，即 Vector Store from Keevol(.cn)

一个用纯Java（scala）实现的向量存储数据库，只专注于语意相似性搜索。

Make Java Great Again 🤣

从开始的7s打到200+ms，回头看看能不能进一步压缩到20ms左右…

压倒10ms以下，我就可以对外吹牛逼了，跟头部产品对标，🤪，比如milvus

感觉上更nb的硬件，可能还有更大的压榨空间

AI Infra（AI基础设施）

Github Models开放了一个免费的聚合API服务

为所有Github Models上的模型开放了一个兼容OpenAI API的Endpoint：

import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://models.github.ai/inference/chat/completions",
  apiKey: process.env.GITHUB_TOKEN  // or any PAT with models:read
});

const res = await openai.chat.completions.create({
  model: "openai/gpt-4o",
  messages: [{ role: "user", content: "Hi!" }]
});
console.log(res.choices[0].message.content);

在项目没有起量之前，基本上等于免费使用。

比如我用Scala写个代码测试如下：

val req = OpenAIPayloadBuilder.build("openai/gpt-4o", "tell me a joke")
val response = OpenAIClient("https://models.github.ai/inference/chat/completions", System.getenv("GITHUB_MODEL_ACCESS_TOKEN"), req)
println(JsonPath.getString(new JsonObject(response), "$.choices[0].message.content"))

获得的响应内容挺有意思，分享给大家：

Why don’t skeletons fight each other?

Because they don’t have the guts! 😄

更多详情：https://github.blog/ai-and-ml/llms/solving-the-inference-problem-for-open-source-ai-projects-with-github-models/

AI 相关推荐阅读

From Prompt to Code Part 1: Inside the Gemini CLI’s Execution Engine

>>>>>> 更多阅读 <<<<<<

别轻易给人建议！

一个十年创业者的酸甜苦辣

Chrome浏览器让你欲罢不能的三个小技巧

「福强私学」来一个？

「福强私学」, 一部沉淀了个人成长、技术与架构、组织与管理以及商业上的方法与心法的百科全书。

福强老师的 AI 通识课

开天窗，拉认知，订阅「福报」，即刻拥有自己的全模态人工智能。

万两黄金不卖道，十字街头送路人

2025-07-29 00:00:00

万两黄金不卖道，十字街头送路人 -王福强的个人博客：一个架构士的思考与沉淀

万两黄金不卖道，十字街头送路人

王福强

2025-07-29

“万两黄金不卖道，十字街头送路人”

出自道教典籍《太上感应篇》，原文为“万两黄金不卖道，一字街头送路人”。

这句话的字面意思是：即使有万两黄金，也不会出卖“道”（真理或道义）；而在街头巷尾，却愿意将“道”无偿分享给路人。

🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️🗯️

所以，道教在现实中一直被佛教压着打也是可以理解的。

佛教迎合人性，

道教却要逆人性。

而逆人性这事儿，只能对自己，不能对别人。

你倒是觉得一句话值万两黄金，还愿意免费送

但你有没有想过，免费的东西从来没人会珍惜？

假如你的道真的值万两黄金，你就应该卖万两，免费做甚？

难道真要像阿傩伽叶说的那样，饿死后人？

>>>>>> 更多阅读 <<<<<<

35+岁了还在一线写代码有错吗？

什么是保理业务？

MidJourney与Stable Diffusion到底应该怎么选？

「福强私学」来一个？

「福强私学」, 一部沉淀了个人成长、技术与架构、组织与管理以及商业上的方法与心法的百科全书。

福强老师的 AI 通识课

开天窗，拉认知，订阅「福报」，即刻拥有自己的全模态人工智能。

afoo | 王福强的 RSS 预览

KVectors 向量数据库基本成型！

王福强

「福强私学」来一个？

职业生涯真的有策略可循吗？

王福强

「福强私学」来一个？

高端的‘师’材，往往只需要最朴素的碰认

王福强

「福强私学」来一个？

福强的本周AI热点回顾与简评

王福强

AI 理论

AI 模型

GLM-4.5V

Claude Sonnet 4 开始支持1M tokens 上下文

Jan-v1

Gemma3 270M

AI 产品

v0.dev这周免费

Open Lovable

AI Infra（AI基础设施）

Spring AI 发布 1.0.1

Oracle 🤝 Gemini

AI 相关推荐阅读

「福强私学」来一个？

福强的本周AI热点回顾与简评

王福强

AI 理论

AI 模型

Qwen-Image

gpt-oss

Claude Opus 4.1

Genie 3

dots.ocr

GPT-5

AI 产品

Flow Maker

Gemini Storybook

groq-cli

KVectors

AI Infra（AI基础设施）

Github Models开放了一个免费的聚合API服务

AI 相关推荐阅读

「福强私学」来一个？

万两黄金不卖道，十字街头送路人

王福强

「福强私学」来一个？

该作者的社会化媒体