2025-04-25 10:59:27
受Dan Shipper启发,也分享下我当前的模型堆栈。
AI带来的新世界是「非零和」的🌳
2025-04-24 17:38:53
妈的 Gemini 2.5 Pro 代码潜力无限啊
针对性优化了一下我的提示词,看看这动画和这个排版
是不是有苹果的味道了,还有这个数据可视化
2025-04-23 18:24:19
非程序员,目前用的AI 编程工作流
需求分析/技术方案阶段:
1、gpt需求分析:
首先发散(7个维度):和gpt充分沟通7个维度:用户,场景,当前痛点,当前方案,频度,广度,深度,然后生成尽可能多的功能点需求
其次收敛(33原则):按照每次开发最多只做3个核心需求,每个功能最多只做3个功能点
2、gpt生成文档:prd.md / erd.md / todolist.md(供 Cursor 用)
产品需求文档 prd.md
工程结构和数据结构设计文档 erd.md
开发代办列表 todolist.md
正式开发阶段:
3、Cursor 执行开发任务 1,严格按 todolist.md 开始, 每完成一个任务后同时更新todolist.md 和cursorlog.md
4、Cursor开发过程中,第一次要输入详细prompt,后续可以简化,每个任务开发完成后做2件事情
a,观察todolist和cursorlog是否正常更新,没有就是跑偏了,立刻回滚,然后输入详细prompt重新生成。
b,如果todolist和cursorlog正常更新,则做一下测试,验证当前完成的开发是否符合产品预期,如果符合就继续开发下一个任务,否则就回去改bug。
直到全部完成
5、全部完成后,需要的话,可以把代码打包丢给gpt,让它做code review,再看要不要继续优化下
6、全部跑通后 输出 Changelog + Git 封版
今天回归第一天,看到前面有评论提到这个,正好说下我目前用的办法
还在持续迭代中,如果有更好的方式,求大佬不吝指点
2025-04-23 10:44:21
没想到我新的提示词更适配 Gemini 2.5 Pro 而不是 Claude
早上给群友的特斯拉财报分析文档做了个网页,太漂亮了
非常惊艳
2025-04-22 22:17:31
经常做自媒体的小伙伴们,水印移除一直是图片处理的难题,最近在 GitHub 又发现一款完全开源免费的 AI 水印移除工具:WatermarkRemover-AI。
经常做自媒体的小伙伴们,水印移除一直是图片处理的难题,最近发现一款完全开源免费的 AI 水印移除工具:WatermarkRemover-AI。
主要功能
• 支持多图批量处理:支持单张图片或整个文件夹批量去水印
• 提供精准水印识别:基于微软Florence-2视觉大模型,可识别各种样式水印
• 上下文感知修复:使用 LaMa inpainting 模型,实现“原图级”上下文感知图像填补
• 灵活配置支持:可设置水印最大尺寸、透明度灵敏度,适配不同图片
• 多格式输出:支持导出为 .png / .webp / .jpg
• GUI + 命令行双模式:提供图形界面操作和 CLI 脚本
• 无需 GPU 支持:在普通笔记本也能流畅运行,轻量级推理
GitHub:github.com/D-Ogi/WatermarkRemover-AI
2025-04-17 14:46:32
o3测试
视觉推理能力大幅增强
😅已经能从照片推理地点和拍摄时间了
科幻片!
询问照片几几年拍摄的整个推理思路:
1.先是分析推理思路,推理出出租车涂装是关键的信息点
2.引用Python的Pillow库对照片进行裁剪放大
3.有自我纠正,分析分辨率过低导致坐标有误,重新裁剪
4.对比出租车的涂装和推测的年代是否一致
5.提取出租车的色值验证猜想
6.通过电线杆分析建筑是否已经完工,结合出租车涂装的信息,最终推测出最后的年份。
😅福尔摩斯复活了也要拜师
这一系列的推理和Tools调用行云流水且速度极快,看来OpenAI是要将模型即应用践行到底了,Agent刚大火,生存位又进一步被挤压,可能还是走隐私、长期记忆这个位置更保险。
2025-04-16 11:58:43
昨天晚上去koji@杨远骋Koji 在上海漕河泾的AI Hacker House,参加小红书开发者大会之后的线下party,氛围太好了!
认识了很多有趣的小伙伴!很荣幸「启师傅AI客厅」略微参与了一下party的筹备工作!
这次AI聚会,良渚代表团儿的人数竟然超过了杭州代表团儿 哈哈哈
这个场地也超赞,湖边的独栋大house,外面的草坪可以随时席地而坐。
看得我好想回来给良渚的乡亲们搞一个这样的AI场地!!