2025-08-12 08:00:00
在注册海外账户或申请 API(如 Telegram 的 api_id/api_hash)时,如果出现莫名的「ERROR」,很可能是平台将你识别为 “VPN/数据中心”流量,从而触发了风控。 此时,可以使用 Cloudflare WARP 获取更像“家用宽带”的出口 IP,从而提升通过率。
重要提示 Cloudflare WARP 不是“科学上网”工具,免费版的带宽和可用性一般,不建议作为常用 VPN。 它更适合在访问风控严格的网站时临时使用,完成操作后及时关闭。
Cloudflare WARP 基于 WireGuard 协议工作,让你的网络流量经过 Cloudflare 节点中转,获得更“干净”、更接近普通家庭网络的出口 IP。 在 Windows、macOS、Android、iOS 等平台都可以一键连接,使用体验接近普通 VPN,但更适合解决特定的风控问题。
下载并安装 WARP 客户端:前往 https://one.one.one.one 下载并安装 Cloudflare 1.1.1.1(WARP) 客户端。
切换到 WARP 模式:打开应用,将模式切换为 WARP,然后点击连接按钮。
申请 Telegram API:使用浏览器的无痕/隐私模式访问 https://my.telegram.org/apps,登录账户并申请 api_id 与 api_hash。
遇到 ERROR 时切换出口 IP:如果仍提示 ERROR,可在 WARP 客户端点击“断开/重新连接”,更换出口 IP 后再刷新页面重试。
小贴士 同一账号在短时间内多次失败可能触发额外风控,建议等待几小时后再尝试。
使用 ipdata 查询当前 IP 信息,重点查看 TRUST SCORE:
2025-08-08 08:00:00
封面图片拍摄于今年六月的新疆禾木。到了那,我才发现天能有多蓝,中午可以清晰的看见月亮。
https://afterburnout.co/p/ai-promised-to-make-us-more-efficient
人工智能工具本应释放我们的时间,但它们增加了我们的认知负荷,降低了我们的工作效率。 这种模式在各项研究中是一致的:人工智能工具创造了一种效率的错觉,同时经常使系统更努力地工作,而不是更智能。个人开发人员感觉更快,但团队交付速度更慢。人们报告说节省了时间,但组织发现协调成本增加。 即使生产力确实提高了,“在相同的时间内完成两倍的工作”——不是减少工作,只是在相同的时间里塞进更多的工作。我们不应该试图在相同的时间内做更多的工作;我们不应该以提高时间效率为目标,这样我们就不必每周工作 60+ 小时。
我们是不是过于追求效率,反而导致自己的生活失衡了?
https://colton.dev/blog/curing-your-ai-10x-engineer-imposter-syndrome/
10 倍的生产力意味着十倍的结果,而不是十倍的代码行。这意味着您过去在一个季度内发货,现在只需一周半即可发货。这些数字应该会让最真实的人工智能信徒停下来。传统上需要 3 个月的工作中的产品构思、故事点协商、错误修复、代码审查、等待部署、测试和 QA 的数量现在在 7 个工作日内完成?为此,这些瓶颈中的每一个都必须提高 10 倍的生产力。 LLM 产生的东西通常是损坏的、产生幻觉的或低于代码库标准的。这些错误的频率随着代码库的大小而增加。发生这种情况时,您必须重新提示,这可能会立即解决问题,或者可能会浪费大量时间。或者你可以自己进去修复代码。但随后你又回到了区区 1 倍的工程师身份,如果你已经习惯了 vibe 编码而忘记了如何编码 ,也许会更糟。
这篇文章戳破了 AI 生产力论的面具。如果你有相同的纠结,值得细读。
https://lambdaland.org/posts/2025-08-04_artifical_inanity/
我假设作者选择他们所用的词是有原因的,并且每个句子都是为了传达作者希望我理解的东西。 LLM 或类似生成文本时,此模式将失败。当我以为自己正在阅读真实的文本时,阅读草率的文本是令人筋疲力尽的:由于我对幻觉或无关紧要的事物没有警惕,所以每一个看似不合时宜的短语都会让我想知道为什么这个短语会在那里 ,以及我错过了什么 ,而实际上,这样的问题是格式不正确的:那只是一个偶然创作的短语, 听起来不错,但实际上根本没有太多意图。 缺乏意图是阅读人工智能如此令人反感的原因。在我们需要关心和关注的一切背后,都需要有一个人类的意图——人类的意志和人类的关怀。
我习惯用 AI 来修改文章的语法,但总会删掉其中一半的内容。除了废话过多外,更重要的是,我们往往忘了 AI 的生成原理是随机拼接。随机生成的内容,你会喜欢看?
http://gemini.google.com/gem/storybook
只需描述您能想象到的任何故事,Gemini 就会生成一本 10 页的插画书。英文支持语音阅读。可以用来给儿童讲故事,帮将简笔画、照片变成故事书。
2025-08-05 08:00:00
今天在听中岛美雪的演唱会时,发现视频里内置了字幕。相比我之前用 Whisper 转写出来的版本,原生字幕肯定要准确得多。于是我开始找工具,希望能把这些内嵌字幕提取出来。试了好几款之后,最终脱颖而出的是 —— Subtitle Edit。
Subtitle Edit 是一款功能强大的开源字幕编辑器,适用于字幕的提取、编辑、格式转换与翻译等多种场景。它支持多种视频与字幕格式,并内置 OCR 字符识别、语音转写、时间轴同步等实用功能。
最新版可在 GitHub 发布页 获取,或通过 国内镜像 下载。支持 Windows,部分 Linux 系统可通过 Mono 兼容运行。
启动软件后,点击菜单栏的“文件”(File) -> “打开”(Open),选择你想提取字幕的视频文件。
如果视频中包含多个字幕轨道,Subtitle Edit 会弹出窗口供你选择需要提取的那一条。
若视频字幕为图像格式(如 DVD 的 VobSub 或蓝光的 PGS 字幕),软件会提示你进行“光学字符识别”(OCR)。此时建议选择 Paddle OCR 引擎,并根据字幕语言进行设置。点击「开始 OCR」后进行识别,完成后点击右侧的「确定」按钮。
🚀 小提示:对于中文、日文等非拉丁字符,Paddle OCR 的识别效果明显优于 Tesseract 等传统引擎;后者更适用于英文字幕。
字幕提取后,你可以在主界面中查看字幕文本与对应的时间轴。点击“文件”(File) -> “另存为”(Save as),在保存类型中选择所需格式。
除了基础的字幕提取功能,Subtitle Edit 还提供了丰富的扩展能力,适用于更复杂的字幕编辑与翻译需求。
当视频中没有字幕轨道时,可以通过“工具”(Tools) -> “语音识别”(Audio to text)自动生成字幕。Subtitle Edit 支持多种识别引擎:
用户可选择语言或启用自动识别,支持断点恢复、每句字幕自动分段等配置。
在已有字幕的基础上,Subtitle Edit 支持一键翻译所有字幕内容,可通过“翻译”菜单调用主流翻译引擎,如:Google Translate、DeepL、Yandex 等。你还可以选择手动逐句翻译,适合需要逐句优化语序的场景。
如果你需要批量的字幕翻译体验或使用ai翻译字幕,可以使用我开源的 Subtitle Translator 工具。 该工具支持批量上传字幕,调用多个翻译 API,并可选择中英对照、断句模式、自定义输出格式等,适合字幕组、译者和内容创作者使用。
Subtitle Edit 提供多种对齐和修正工具,帮助字幕更精确地贴合音视频内容:
.srt
、.ass
、.sub
、.vtt
等可切换为“波形图”或“频谱图”视图,辅助进行精确的起止时间调整。非常适合精修口型同步字幕或歌词字幕。
.mks
格式(容器文件),而非可读的字幕文本。Windows 11 实时字幕:
Win + Ctrl + L
Chrome 浏览器实时字幕(Live Caption):
这类实时字幕和翻译功能,可以理解为一种轻量级的本地 Whisper。对于英文内容,识别效果已经相当不错;在其他语言环境下,也能生成字幕,只是准确度较差。
2025-04-24 08:00:00
HandBrake 是一款功能强大的开源视频转换工具,支持 Linux、macOS 和 Windows 系统。它可以将已有的视频文件转换为在手机、电视盒子、游戏机、电脑或浏览器等多种设备上兼容的格式。支持的视频格式广泛,包括普通摄像机拍摄、屏幕录制以及蓝光源等。
我个人收藏了不少蓝光电影资源,但在 Emby 中无法直接播放。将资源迁移至云盘后,更是连在线播放都成问题。因此,我决定使用 HandBrake 将这些资源重新压缩为支持软字幕的 MKV 格式,以便在不同设备间更好地播放和管理。
打开 HandBrake 后,点击左上角的“打开源(Open Source)”按钮。可选择以下方式导入视频:
导入后,程序会自动分析视频内容,识别出音频轨道、字幕轨道等元数据。
切换到“字幕(Subtitles)”标签页后,点击“轨道(Tracks)” > 添加所有剩余字幕轨道。
常见设置建议如下:
以下为字幕选项的详细说明:
| 选项 | 说明 | 建议设置 | |
2024-10-23 08:00:00
当我第一次接触 AI 生成图像时,我发现生成的图像往往与我想象的场景不符。原因大多是因为提示词描述不精准。作为非英语母语的人,我在描述场景时往往用母语的思维方式,但有时会导致完全不同的结果。因此,我设计了 IMGPrompt —— 帮助不懂英语的人也能精准地生成完美的 AI 图像,甚至 AI 视频。这个工具旨在让每个人,无论是什么语言背景,都能轻松创建 AI 作品!
IMGPrompt 是专为 Stable Diffusion、Midjourney、DALL·E 和 FLUX 打造的 AI 图像提示词编辑器,界面简洁直观,使用户能够轻松地查看并组合所需的提示词文本。每个提示词都附有中文翻译,用户仅需通过点击或输入关键词,即可快速选取或组合,从而大大简化了文生图提示词输入。
IMGPrompt 提供基于用户输入的关键词(支持中英等 14 种语言)的智能推荐,自动建议相关提示词,帮助用户快速找到合适的表达,节省创作时间,提升创作效率。
内置免费的翻译功能可以将任意语言的提示词转换为英文,确保生成的提示词适用于不同的 AI 工具。这让用户在多语言环境下使用 IMGPrompt 更加便捷,减少因语言障碍造成的困扰。
此功能允许用户快速替换提示词中的颜色词,为创作增添多样性和趣味性,激发创作灵感,帮助用户探索更多的创作方向。
在界面顶部,你会看到“选择对象”和“选择属性”两个区域。点击相应的标签(如“人物”、“表情”、“动作”等)来缩小提示词的范围,从而帮助你更准确地选择所需提示词。
在“选择标签”区域,你将看到不同颜色的标签,每个标签显示的是英文提示词及其母语翻译。点击所需标签时,它们会自动添加到提示词文本框中,方便快速选取。
在右侧的提示词文本框中,你可以直接编辑或输入自定义提示词。请使用逗号分隔不同的提示词,系统将自动处理标签化的操作。
IMGPrompt 会根据你的输入自动匹配相关提示词并进行智能推荐。点击智能推荐标签,即可插入相应提示词。如果最后一个提示词匹配到提示词库中的内容,它将以打勾的绿色标签形式显示。
IMGPrompt 支持网页、客户端、Docker 部署,旨在简化 AI 图像生成的提示词创作过程。通过直观的界面和丰富的提示词库,它能帮助你更快速、更精确地表达创意想法。无论你是 AI 艺术创作的新手还是专业人士,IMGPrompt 都将是你强大的创作助手。
2024-08-14 08:00:00
Markdown 是我日常使用最频繁的文本格式,但现有的翻译工具往往难以保持其原有格式。因此,我开发了 md-translator,一个专为 Markdown 优化的翻译工具,旨在 精准翻译文本的同时保持格式完整。其翻译机制类似于字幕翻译器,详细参数可参考 说明文档。
在开发 md-translator 之前,我测试过以下工具,但由于各自的局限性,未能满足我的需求,这里简单记录它们的特点,供参考。
所有翻译内容都会缓存在本地,以提高重复翻译时的速度。如果需要重新翻译,可以点击 “重置翻译缓存” 按钮。
md-translator 目前已支持解析以下 Markdown 语法,并在翻译时保持格式: