2025-06-08 11:38:02
我最近更新了自己开发的 Obsidian 插件 Personal Assistant,关于这次更新的主要特性,简单来说,它能让 Obsidian 笔记库变成一个“本地私有版 ChatGPT”,帮助使用者阅读、总结、基于笔记内容问答等,这让 Obsidian 变成了个人专属的知识助理,这篇文章就分享这个插件的新功能以及我自己的使用体验。
P.S. 这个插件适合对 Obsidian 有一定了解,正在探索 AI+效率工具并且注重自己笔记安全的小伙伴~
Personal Assistant 插件的原理是利用了 RAG(检索增强生成) 技术,把你自己的 Obsidian vault 构建成一个可以“召回+生成”的智能知识库,配合大型语言模型(LLM),你就拥有了一个真正理解你笔记的 AI 助手。
🌟 核心功能有三个:
ChatGPT
一样问笔记库的问题总之,它真的让“写完的笔记能活起来”✨。
下面我用几个视频介绍一下插件基本用法:
P.S. 向量知识库初始化的性能问题:
如果你对技术原理感兴趣,简单解释一下:
RAG(Retrieval-Augmented Generation)是一种结合“信息检索 + 文本生成”的 AI 模式。
Personal Assistant 会实时的将 Obsidian 笔记进行 text embedding 向量化,LLM 在做知识问答的时候,它会先从你的笔记中根据语义相关性、MMR等算法检索相关知识库片段,把这些片段交给大语言模型去理解并生成回答或内容。
所以,它比“纯生成”更可信、更贴近你自己写过的内容,也更像是你“第二大脑”的延伸!
插件还融合了 Obsidian 原生的「知识图谱」结构,会在检索时自动考虑笔记间的链接、上下文和引用关系,真正做到“用结构化知识召回内容”。
也就是说,你不仅可以问“这是什么”,还可以问“它和哪些笔记有关”,特别适合信息密集型的笔记用户。
Personal Assistant 插件在每次生成的最后会附上引用的 Obsidian Vault 中笔记记录,方便用户在回顾 Obsidian 中记录的知识。
GitHub 项目地址(持续更新中,欢迎提交 issue 或 PR):
👉 https://github.com/edonyzpc/personal-assistant
Obsidian 插件安装(官网地址):
👉 https://obsidian.md/plugins?id=personal-assistant
✨ 如果你已经在用 Obsidian,但总觉得笔记写了就沉底了,不太会“复用”;
✨ 或者你想要一个属于自己的、不上传自己内容也能用的 AI 助手;
✨ 又或者你对 AI + Obsidian 知识管理特别感兴趣;
✨ 如果你已经用上了,欢迎来松烟阁一起交流使用体验和玩法 💬;
✨ 如果你想尝试但不太懂配置,我也可以写一篇新手配置指南,欢迎在 GitHub 留下 issue;
持续更新中,欢迎关注我,一起探索 Obsidian x AI 的更多可能!
2025-05-18 22:07:25
一个月前随着OpenAI o3的发布,社交媒体上兴起了「根据图片找位置」的潮流,举个简单的例子(来源:NanYi):
一开始我不以为意,我觉得只要能解析图片中Exif信息足够了,不是什么黑科技,直到我看了一下o3的分析过程:
这个分析方法代表着没有metadata的图片也能精确分析得到结果,除了惊讶模型分析推理能力之外,我觉得更加让我惊艳的地方是图片和文字的信息对齐和协同能力 —— 大模型的多模态能力已经不仅仅局限于输入上的多模态支持了。
于是我萌生了一个大胆的想法:作为没有AI算法背景的人打算借助AI工具弄清楚这里的黑科技。
Multi-Modal 多模态已经不陌生了,但是o3这种多种模态输入信息的联动(对齐)到底是归属哪个范畴,需要先识别出来。经过简单的搜索引擎的检索,发现「弥合不同模态之间的语义差距并确保其表示的有效对齐是Multi-Modal Token需要解决的范畴」。
有了关键信息就比较方便了,分别用「Multi-Modal Token」、「多模态token」、「多模态令牌」等关键词进行检索,发现有大量的论文是做相关研究的。
这么复杂且并非自己熟悉的学术领域,自己一篇论文一篇论文的研究肯定是不可能了,直接上手段 Gemini Deep Research。
目前各家大模型基本陆续都推出了 Deep Research 的功能,我个人还是觉得Gemini的更好用,应该归功于Google多年的搜索引擎技术上的积累。
对于不太熟悉的领域,我需要快速的建立对快内容的认知,于是关于Multi-Modal Token结构化的介绍就是第一步了:
这是Gemini最后给出的分析报告:多模态token研究结构化介绍 - Google Docs
简单对比一下国内几个大模型的 Research 结果方便直观比较:
Gemini Deep Research给出的报告比较专业,对于非AI算法专业的我来说比较艰深难懂的,为了初步建立该领域的认识,我不需要完全能够读懂专业报告,所以我的做法就是将该报告作为大模型的多模态输入,让大模型帮我整理出适合我的理解的内容,主要的步骤:
在研究过程中,还可以充分借助AI编程工具(Cursor、Cline等)进行小工具和小任务的快速实现。我
在将Gemini Research报告作为附件,进行个性化研究的时候,为了节约token消耗,同时可以让大模型准确的识别报告中引用的资料来源方便查询和校准,我需要对markdown做一下footnote的格式处理,具体来说包括:
面对这个需求,首先我知道用awk等字符串处理工具肯定可以完成上面的需求,另外我自己并不能熟练地写正则表达式,所以我直接用IDE中的编程Agent帮助解决:
2025-05-11 00:01:23
开始技术细节之前,关于有声书想多絮叨两句(也算是一种产品需求分析):
基于上述的分析,打算用MCP Servers + LLM实现将电子书转换为有声书的小工具,使用方式很简单在AI交互框中输入“将xxx目录中xxx转为成音频”,这样我就拥有了一个低配版的喜马拉雅,将任意自己喜欢电子书变成自己和家人喜欢的有声书了。
具体实现比较简单,详细可以参考demo代码在GitHub仓库中 MCP agents,实现过程中我觉得比较有意思的两个细节可以分享一下:
我在进行demo测试的时候,用的是海明威的「老人与海」的英文版(约4万字),markitdown mcp调用之后返回大约6万字的markdown文本,正常情况下ReAct Agent会将mcp返回的内容作为LLM的上下文message进行下一轮的任务输入,此时就碰到问题了,明显超出了Qwen的上下文token限制(30,720),此时会直接导致Agent任务执行失败。
再回来分析markitdown mcp调用的结果,ReAct Agent并不需要大模型进行文本处理,所以我们只需要Agent直接返回mcp的结果即可。非常敬佩langchain(langraph)框架,这种细节需求场景都能覆盖到,虽然它饱受诟病。话不多说,直接上代码:
async def convert_epub_to_markdown(self, query: str) -> str:
messages = [{"role": "user", "content": query}]
available_tools = []
# Load tools from all sessions
for session in self.sessions:
tools = await load_mcp_tools(self.sessions[session])
available_tools.extend(tools)
if session == "markitdown-mcp":
# enforce a tool output from an agent avoiding any additional text the the agent adds after the tool call
for tool in tools:
tool.return_direct = True
# logger.debug("Available tools:", available_tools[0])
# Initial Qwen API call
agent = create_react_agent(self.qwen, available_tools)
response = await agent.ainvoke({"messages": query})
# Detailed processing of tool calls if you use other LLM, e.g. Claude
self.__md_str = response["messages"][-1].content
return response["messages"][-1].content
Cosyvoice LLM模型有一个限制,在进行文本转语音的时候发送的文本长度不得超过2000字符,这名相不满足「老人与海」有声书转换的要求,为此根据模型max length限制,我将超长文本按照语义和格式进行分割,然后批量进行语音转换。
def split_text(self, text: str, max_length: int = 2000) -> list:
splitter = MarkdownTextSplitter(chunk_size=max_length, chunk_overlap=0)
return splitter.split_text(text)
def exec():
# ...省略一些代码
await client.connect_to_mcp_server("markitdown-mcp")
# await client.connect_to_mcp_server("filesystem-mcp")
response = await client.convert_epub_to_markdown(
"把文件`/Users/edony/Downloads/hemingway-old-man-and-the-sea.epub`转换为markdown格式,大模型不要处理任何markdown,直接输出全部原文"
)
# split_text method
chunks = client.split_text(response, max_length=2000)
batch_size = 10
batch = math.ceil(len(chunks) / batch_size)
for i in range(batch):
sub_chunks = chunks[i * batch_size : (i + 1) * batch_size]
await client.synthesis_text_to_speech_using_asyncio(sub_chunks, i)
logger.info(len(chunks))
2025-05-07 23:05:56
本文讨论了MCP(大模型与工具连接的通用协议)和Agent技术之间的区别及联系。虽然MCP解决了大模型调用工具的问题,但并未解决理解用户真实意图、规划合理任务、阶段化螺旋式任务执行以及自动执行等问题。相比之下,Agent通过记忆、多轮交流、验证和动态调整等机制来更准确地理解和实现用户目标。文章还提到了MCP与Agent的关系,指出MCP可以提升Agent在工具调用层面的能力,但Agent是一个包含调度系统、执行系统和感知系统的综合体系。此外,文章提到未来可能需要一种新的协议架构来标准化不同厂商Agent之间的交互,并预测随着Agent网络的发展,将形成一个自决策自执行的社会网络。
文章讨论了远程办公的利弊,尤其是在后疫情时代。作者刘润指出,尽管远程办公在疫情期间流行起来,并且有很多明显的好处,比如节省通勤时间、提高某些员工的工作效率等,但它也增加了沟通的成本,减少了团队之间的互动和创造力。因此,许多公司开始取消远程办公模式,要求员工返回办公室工作。文章最后提到,真正的创造力往往来源于人与人之间的频繁互动。
原文链接:我其实并不看好远程办公
本文探讨了现代人的焦虑与困境,以及如何从中国传统智慧中找到解药。作者赵昱鲲指出,我们这一代人具有“西方脑、中国心”的特点,导致在面对心理问题时产生额外的冲突。他强调,人生的意义并非单纯通过科学可以解答,而是需要通过实际行动和内心感受来实现。中国文化中的整体性思维、辩证型思维、正面情感以及对现实生活的重视,为解决现代人的心理问题提供了有效的方法。
原文链接:人生的意义是什么?这是我听过最好的答案
说实话我自己就是90后小镇青年在大学毕业后来到大城市工作的,随着2016年美团王兴提出“互联网依靠PC网民及移动互联网用户快速增长的人口红利期已过”,互联网进入了“下半场”,我就知道,我可能是上了最后一班时代的快车
往后的世代,并不是说机会就完全没有,而是当时代从巨大的增量变成存量竞争,意味着市面上存在“跃迁”的机会总量更少,且获得相同机会需要付出的努力要更多,所以为什么你会发现后来职场充斥了内卷、PUA、35岁歧视等乱象...
有人说现在也有很多创新的机会啊,比如AI,但你要知道,至少当前AI的机会和绝大多数普通人是没关系的,比如在AI行业内最引以为豪的就是效能的提升,据说一个AI团队但凡超过40人,在业内都是要被笑话的
所以,在这个“青黄不接”的期间,作为背井离乡来大城市打工的普通人,如果还在用上一代的生活理念来指导你自己,很可能就会被“大城市”吃干抹净,比如陷入“中产返贫”三件套
所以,建议你可以考虑参考以下6个生活建议:
1,存钱,尽可能多存,有多少存多少
我曾数次分享过很多金融界大师给年轻人的建议,比如世界最大的对冲基金之一桥水的创始人达利欧和著名投资人吉姆·罗杰斯,都是建议年轻人要存钱
“要存钱,尽你所能去多存钱,尤其在你年轻的时候。”,“要考虑你的储蓄,想想你有多少存款。思考这个问题的最好方式是想一想我每个月花多少钱?我已经存了多少钱?重视你的储蓄。因为储蓄就是自由和安全。”
2,用存的钱来购买资产
存钱不是最终目的,因为钱会“变毛”,持有现金是为了购买资产,而买资产的第一原则是不要亏损(巴菲特),你需要购买足够好的资产来避免被通货膨胀吃掉,并且接受“慢慢变富”(巴菲特X2)
我个人是在5-10年的维度主要定投黄金和红利资产来抵抗通胀(我个人的想法不构成任何建议),而你也需要找到适合你自己的资产
要知道,赚钱效能是分不同等级的,最高的是资产,其次是土地,再次才是劳动
3,远离会让你亏钱的东西
巴菲特老爷子说投资最重要的原则只有两个,第一是不要亏钱,第二是永远记住第一条原则。现在最可能会让你亏钱的幻觉是什么?是别人告诉你的让你觉得“应该”有的东西,那些到手就贬值的东西,以下列举部分,你可以不同意,也可以评论补充:
市面上99%的房子、非顶级的中低端奢侈品、汽车为主的非必要大件、高溢价潮牌、大部分主动投资类基金、迷信海外学历尤其以就业为目的、不合适的人生伴侣…
那什么会让你绝对不亏呢?其实你肉身来到“大城市”,这里最“值钱”的是你身边那些有趣、励志、经历丰富的朋友,记住,你认识了谁,和谁在一起,才是不论你身处大城市还是老家,都能记住一辈子的财富
“人的本质,是他一切社会关系的总和。”
4,充分利用时间杠杆投资自己
每个人的财富可以相差1万倍,但时间都只有24个小时,而且没有任何办法再次补充。如果你想缩小和巨富们的差距,就只能在公平的赛场和他们竞争,也就是“24小时”这个赛场
他们24小时可以赚1亿美金,但只能读1本书,你24小时只能赚100美金,但你也能读1本书。对普通人来讲,比钱更珍贵的其实就是你的时间,你每天节省下来的时间花在什么地方,很大程度上累积起来的作用,会比加薪更能改变你的生活轨迹
现在停下刷短视频的手,把你的“碎片时间”积累起来,培养你自己的技能,升级思维
5,成功一个能独立生存的公民
我们从小受的教育很大一部分目的就是把你我这样的普通人,培养成一个合格的打工人,这是工业时代的教育形式,它的目的并不是让你成为一个具有独立思考能力,能独立处理自己生活问题的公民
所以真的进入社会后,对于社会运转的基本底层规律,例如法律、医学、经济金融…你如果不是学相关专业,基本是一无所知的,甚至很多相关专业的学生也只是一知半解。所以这些内容你得自己花时间补起来
我就亲眼见过普通人在自己权益遭受侵害时是多么不知所措的,就像徐峥的《逆行人生》扮演的外卖员那样,被车撞倒后第一时间想到的还是赶紧去“干活”,而不是如何维护和保护好自己
6,保持健康比任何事都重要
当时代拔足狂奔的高速发展期过去,各种冲突和乱象都会爆发。但你永远要记住,在任何决策中,身体健康都是第一位的。只要你坚持待在牌桌上,上帝总会重新发牌
举个极端的例子,司马懿不就是靠熬死了曹家三代人最终才有机会建立了晋朝…
记住,生一次大病就可能让你返贫,而且会极大降低你的生活幸福度,尤其是年轻人,不要等真的发生了你才知道健康的优先级
“好好吃饭,坚持锻炼,睡个好觉,几乎能带你走出生活中的任何困境。”
原文链接:怎样避免成为【喂养一线城市】的饲料 说实话我自己就是90后 - 即刻App
亲密关系中的背叛不只包括出轨,忽视需求、违背承诺等也可能构成背叛,即“依恋伤害”。依恋伤害指在关键时刻感受到的被抛弃或背叛,可能源于看似微不足道的小事,对个人和关系产生负面影响,如颠覆对关系的看法、怀疑自我价值等。修复依恋伤害需双方共同努力,包括理解和表达情绪、重建信任。情绪聚焦疗法(EFT)可有效解决此类问题,重建更成熟的信任。
原文链接:亲密关系中,不是只有“出轨”才叫背叛
2025-05-02 11:55:23
语录(凭借记忆复述,没有任何公司敏感数据)
- 其实很多事情,做的时候不去想过回报,只是相信这是需要去做的,坚持去做,有一天结出的果实,会让我们无比感动。
- 很多人都在担心,AI在带来好处的同时,会对人类社会有超越想象的破坏力。而我是一个坚定的人类相信者,我相信在人与机器的竞争中,人类一定是最后的胜利者。你解决不了,一定有人解决得了;我们这代人解决不了,下一代一定有人能解决得了。
- 前几年,人跟AlphaGo下围棋的时候,很多人觉得很沮丧,连围棋都下不过机器。其实这很正常,围棋就是为人类设计,因为你会下臭棋,因为你会生气,这才是下棋的乐趣,干嘛要跟机器去比谁下围棋下得好。人类要学会的不是与机器抗争,而是去驾驭好AI,用好AI,把AI变成人类的朋友、伙伴,而不是敌人。
- AI是智能,智能是改变世界的工具,而我一直相信,人类拥有机器和动物不具备的,那就是智慧,而智慧是改变智能的思想。智能来自于大脑,而智慧来自于心脏。更何况今天人类对自己大脑的使用还不到7%,明天的AI也许会部分取代或者超越今天人类的智力和很多的能力,但我还是相信无法超越人类的智慧。
- 我们应该帮助人类活得更好、活得更久。我们不是去追求让机器像人,而是让机器去理解人类,像人类一样去思考,做人类做不到的事情。我们应该让机器去破解生命的密码,帮助人类战胜疾病,我相信人类的生命,寿命的长度和质量一定会因为AI有巨大的突破,熬过十年,我们可能就对癌症说拜拜。
- 科技要给每一个普通人的生活带来变革,要让每一个普通的人有尊严。
- 所谓的高科技,绝不仅是征服星辰大海,更应该呵护人间烟火。
我对阿里的印象是刚入职看到几句话:
先叠个甲:当下的阿里系有诸多争议,甚至招人痛恨。我承认它的不完美,在痛苦的日常工作会对所谓的「阿里味道」心生厌恶和难忍谩骂。总而言之,这篇文章是一段关于自己人生5年的记忆和感慨,无意做「脑袋」、「屁股」相关的口舌之争。
为什么有这篇文章,可能是因为自己很久很久没有被富有人格魅力的领导者的一段公开(半公开)演讲鼓舞到了,马老师不愧是当年的商界领袖,风采依旧。
出于工作的压力,关于这5年的记忆和思考大多离散,索性这篇文章就「意识流」一些,笔随心动,想到哪里算哪里:
先写到这里吧,后面保持更新!
2025-04-24 23:21:00
这年头,破边的不要太多。破产后的几点建议:
1.千万不要睡天桥、大街、网吧、公园
2.过夜就去机场大厅,这里不仅有地方睡觉,还供应热水,手机充电甚至连无线网都可以
3.睡醒了直接去麦当劳,找个别人喝剩的咖啡杯,然后去前台无限续杯
4.中午在附近找一家酒店,很多房间退完房门都是开着的,找个没人的房间就能冲个热水澡
5.下午可以去海底捞吃免费的小零食,晚上去盒马超市无限试吃,等服务员将没卖完的面包丢掉时,你就直接打包带走
6.肚子饿了就去肯德基吃别人剩下的汉堡薯条可乐鸡块
7.洗衣服,直接用酒店自助洗衣服,携程四钻的,都有自助洗衣机,带洗衣液,洗完还有烘干机,晚上一般都没啥人用。
原文链接:这年头,破边的不要太多。破产后的几点建议: 1. 千万不要 - 即刻App
HongKongDoll,愚人节露脸了,还蛮可爱的
原文链接:HongKongDoll,愚人节露脸了,还蛮可爱的 - 即刻App
原文链接:整理的微信读书上值得反复看的 10 本书 - 即刻App
本文详细介绍了MCP(Model Context Protocol,模型上下文协议)的背景、意义以及具体实现。文章指出,尽管AI技术发展迅速,但AI应用与已有系统的集成进展缓慢。MCP的出现打破了这一局面,通过提供一个开放、通用且被广泛接受的标准协议,使得AI可以更好地与现有的服务和系统进行集成。文中提到了一些MCP的具体应用案例,包括Cursor MCP、Windsurf MCP等,并对比了Function Calling、AI Agent和MCP三者的区别。此外,文章还提供了如何创建和使用MCP服务器的指南,推荐了一些官方和社区资源。最后,作者强调了MCP对于开发者生态的好处,即服务商可以根据MCP开放自己的API和能力,而开发者则可以通过开源项目快速构建强大的AI应用。
原文链接:MCP 终极指南
说点“街头智慧”
之前在国外,朋友送了一条gucci皮带,但是尺码不合适,这次回来他带回来做调整。
去之前男朋友碎碎念,不知道国内专柜认不认,也没有购买记录什么的,还是国外版。
我说,你别管这些,直接进去,说,“我有一条你家的皮带,但是尺码大了,需要裁剪,能做吗?”
不要用请求式的语气,不用商量,不用讨论,因为你是付钱购买服务,就问他能不能做就行了。 14 0
原文链接:说点“街头智慧” 之前在国外,朋友送了一条gucci皮带, - 即刻App
这篇文档是关于提示工程(Prompt Engineering)的白皮书,介绍了如何通过设计高质量的提示来引导大型语言模型(LLM)生成准确的输出。主要内容包括:
总之,这篇白皮书为读者提供了全面的提示工程技术指南,帮助他们更好地理解和应用这些技术。
原文链接:Google 官方提示工程 (Prompt Engineering)白皮书
这篇文章讲述了中国女演员汤唯的职业生涯和个人生活的转折点。故事从她参加李安导演的电影试镜开始,这次经历成为她演艺事业的一个重要起点。26岁时,她在李安导演的新片《色,戒》中饰演女主角王佳芝,这部电影不仅改变了她的职业轨迹,也极大地影响了她的个人生活。
文章通过回顾汤唯的成长背景——单亲家庭长大,与母亲关系亲密,并提及她父亲对她的影响以及童年时期的生活环境。在她成为一名著名演员后,汤唯继续寻求自我成长,不断学习新的知识和技能,即便面对迷茫和不确定性时也不放弃探索自我的机会。这段时期包括出国学习英语、莎士比亚戏剧等。
文中还介绍了汤唯作为女性,在追求艺术创作的同时如何处理个人生活与工作的平衡。特别是她结婚生子后的改变,这使她重新审视了自己对于幸福的定义以及对待工作的方式。随着岁月流逝,汤唯逐渐找到了属于自己的定位:既不过度追逐名利场中的虚幻光芒,也不完全沉溺于私人世界里;而是试图在这两者之间找到一种和谐状态。
此外,文章还探讨了汤唯如何看待自己的表演风格及未来发展方向。即使已经成为了一位成功且受尊敬的女演员,她仍希望能够进一步突破自我,在保持原有魅力的基础上尝试不同类型的角色,以丰富自己的演艺生涯。通过一系列作品如《晚秋》、《黄金时代》等,汤唯展现了不同于以往“天涯孤女”形象的多面性。
总之,这篇文章描绘了一个关于寻找自我价值并最终实现重生的故事。通过对汤唯个人经历及其内心世界的细腻描写,向读者呈现了一位复杂而真实的女性形象,反映了现代女性艺术家面临的挑战与抉择。
原文链接:特写 | 汤唯重生
文章主要分析了特朗普发布的“对等关税行政令”的内容和意图。刘润认为,特朗普的目的是通过这一行政令来彻底改变现有的国际贸易体系,尤其是针对美国长期存在的贸易逆差问题。以下是文章的主要内容总结:
总之,特朗普的行政令旨在通过单边行动打破现有的国际贸易体系,重塑一个更加有利于美国的新世界秩序。他的目的不仅仅是解决贸易逆差问题,更是要彻底颠覆现有的国际经济规则。
原文链接:刘润:特朗普的目的,是拆庙
本文探讨了如何使AI生成的文章看起来更像出自人类之手,主要从以下四个方面给出建议:
总之,虽然AI能够辅助写作过程,但最终文章的灵魂仍需由作者自己赋予。
原文链接:如何去除文章的AI味道-月光博客