MoreRSS

site iconLearnData 开源笔记修改

迷信新工具、新方法,勇于尝试新鲜事物,热衷于研究开源软件和心理学理论,定期分享探索成果。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

LearnData 开源笔记的 RSS 预览

Cloudflare WARP:获取海外纯净 IP 的简便方法(注册海外服务必备)

2025-08-12 08:00:00

在注册海外账户或申请 API(如 Telegram 的 api_id/api_hash)时,如果出现莫名的「ERROR」,很可能是平台将你识别为 “VPN/数据中心”流量,从而触发了风控。 此时,可以使用 Cloudflare WARP 获取更像“家用宽带”的出口 IP,从而提升通过率。

重要提示 Cloudflare WARP 不是“科学上网”工具,免费版的带宽和可用性一般,不建议作为常用 VPN。 它更适合在访问风控严格的网站时临时使用,完成操作后及时关闭。

Cloudflare WARP 是什么?

Cloudflare WARP 基于 WireGuard 协议工作,让你的网络流量经过 Cloudflare 节点中转,获得更“干净”、更接近普通家庭网络的出口 IP。 在 Windows、macOS、Android、iOS 等平台都可以一键连接,使用体验接近普通 VPN,但更适合解决特定的风控问题。

解决 Telegram API 申请 ERROR 的步骤

  1. 下载并安装 WARP 客户端:前往 https://one.one.one.one 下载并安装 Cloudflare 1.1.1.1(WARP) 客户端。

  2. 切换到 WARP 模式:打开应用,将模式切换为 WARP,然后点击连接按钮。

  3. 申请 Telegram API:使用浏览器的无痕/隐私模式访问 https://my.telegram.org/apps,登录账户并申请 api_id 与 api_hash。

  4. 遇到 ERROR 时切换出口 IP:如果仍提示 ERROR,可在 WARP 客户端点击“断开/重新连接”,更换出口 IP 后再刷新页面重试。

小贴士 同一账号在短时间内多次失败可能触发额外风控,建议等待几小时后再尝试。

如何检查 IP 质量

使用 ipdata 查询当前 IP 信息,重点查看 TRUST SCORE

  • 分数高 → 更可能顺利通过平台风控
  • 分数低/标记为高风险 → 可能仍会被拒绝
得分样例,这个 IP 属于高危,大概率无法通过
得分样例,这个 IP 属于高危,大概率无法通过

005 | 减少 AI 带来的焦虑

2025-08-08 08:00:00

封面图片拍摄于今年六月的新疆禾木。到了那,我才发现天能有多蓝,中午可以清晰的看见月亮。

文章

人工智能承诺提高效率,但它却让我们工作得更辛苦

https://afterburnout.co/p/ai-promised-to-make-us-more-efficient

人工智能工具本应释放我们的时间,但它们增加了我们的认知负荷,降低了我们的工作效率。 这种模式在各项研究中是一致的:人工智能工具创造了一种效率的错觉,同时经常使系统更努力地工作,而不是更智能。个人开发人员感觉更快,但团队交付速度更慢。人们报告说节省了时间,但组织发现协调成本增加。 即使生产力确实提高了,“在相同的时间内完成两倍的工作”——不是减少工作,只是在相同的时间里塞进更多的工作。我们不应该试图在相同的时间内做更多的工作;我们不应该以提高时间效率为目标,这样我们就不必每周工作 60+ 小时。

我们是不是过于追求效率,反而导致自己的生活失衡了?

人工智能并没有让工作效率提高 10 倍

https://colton.dev/blog/curing-your-ai-10x-engineer-imposter-syndrome/

10 倍的生产力意味着十倍的结果,而不是十倍的代码行。这意味着您过去在一个季度内发货,现在只需一周半即可发货。这些数字应该会让最真实的人工智能信徒停下来。传统上需要 3 个月的工作中的产品构思、故事点协商、错误修复、代码审查、等待部署、测试和 QA 的数量现在在 7 个工作日内完成?为此,这些瓶颈中的每一个都必须提高 10 倍的生产力。 LLM 产生的东西通常是损坏的、产生幻觉的或低于代码库标准的。这些错误的频率随着代码库的大小而增加。发生这种情况时,您必须重新提示,这可能会立即解决问题,或者可能会浪费大量时间。或者你可以自己进去修复代码。但随后你又回到了区区 1 倍的工程师身份,如果你已经习惯了 vibe 编码而忘记了如何编码 ,也许会更糟。

这篇文章戳破了 AI 生产力论的面具。如果你有相同的纠结,值得细读。

缺乏意图是导致阅读LLM生成的文本令人疲惫的原因

https://lambdaland.org/posts/2025-08-04_artifical_inanity/

我假设作者选择他们所用的词是有原因的,并且每个句子都是为了传达作者希望我理解的东西。 LLM 或类似生成文本时,此模式将失败。当我以为自己正在阅读真实的文本时,阅读草率的文本是令人筋疲力尽的:由于我对幻觉或无关紧要的事物没有警惕,所以每一个看似不合时宜的短语都会让我想知道为什么这个短语会在那里 ,以及我错过了什么 ,而实际上,这样的问题是格式不正确的:那只是一个偶然创作的短语, 听起来不错,但实际上根本没有太多意图。 缺乏意图是阅读人工智能如此令人反感的原因。在我们需要关心和关注的一切背后,都需要有一个人类的意图——人类的意志和人类的关怀。

我习惯用 AI 来修改文章的语法,但总会删掉其中一半的内容。除了废话过多外,更重要的是,我们往往忘了 AI 的生成原理是随机拼接。随机生成的内容,你会喜欢看?

应用

Gemini 创建个人插图故事书

http://gemini.google.com/gem/storybook

只需描述您能想象到的任何故事,Gemini 就会生成一本 10 页的插画书。英文支持语音阅读。可以用来给儿童讲故事,帮将简笔画、照片变成故事书。

Subtitle Edit:万能字幕编辑器

2025-08-05 08:00:00

今天在听中岛美雪的演唱会时,发现视频里内置了字幕。相比我之前用 Whisper 转写出来的版本,原生字幕肯定要准确得多。于是我开始找工具,希望能把这些内嵌字幕提取出来。试了好几款之后,最终脱颖而出的是 —— Subtitle Edit。

Subtitle Edit 是一款功能强大的开源字幕编辑器,适用于字幕的提取、编辑、格式转换与翻译等多种场景。它支持多种视频与字幕格式,并内置 OCR 字符识别、语音转写、时间轴同步等实用功能。

最新版可在 GitHub 发布页 获取,或通过 国内镜像 下载。支持 Windows,部分 Linux 系统可通过 Mono 兼容运行。

字幕提取

1. 打开视频文件

启动软件后,点击菜单栏的“文件”(File) -> “打开”(Open),选择你想提取字幕的视频文件。

2. 选择字幕轨道

如果视频中包含多个字幕轨道,Subtitle Edit 会弹出窗口供你选择需要提取的那一条。

3. (可选)进行 OCR 识别(适用于图像字幕)

若视频字幕为图像格式(如 DVD 的 VobSub 或蓝光的 PGS 字幕),软件会提示你进行“光学字符识别”(OCR)。此时建议选择 Paddle OCR 引擎,并根据字幕语言进行设置。点击「开始 OCR」后进行识别,完成后点击右侧的「确定」按钮。

🚀 小提示:对于中文、日文等非拉丁字符,Paddle OCR 的识别效果明显优于 Tesseract 等传统引擎;后者更适用于英文字幕。

OCR 示例
OCR 示例

4. 保存为所需格式

字幕提取后,你可以在主界面中查看字幕文本与对应的时间轴。点击“文件”(File) -> “另存为”(Save as),在保存类型中选择所需格式。

其他功能

除了基础的字幕提取功能,Subtitle Edit 还提供了丰富的扩展能力,适用于更复杂的字幕编辑与翻译需求。

语音转写

当视频中没有字幕轨道时,可以通过“工具”(Tools) -> “语音识别”(Audio to text)自动生成字幕。Subtitle Edit 支持多种识别引擎:

  • Whisper(推荐,效果最优,支持多语言识别)
  • Vosk(轻量级本地模型,适合资源受限环境)

用户可选择语言或启用自动识别,支持断点恢复、每句字幕自动分段等配置。

字幕翻译功能

在已有字幕的基础上,Subtitle Edit 支持一键翻译所有字幕内容,可通过“翻译”菜单调用主流翻译引擎,如:Google Translate、DeepL、Yandex 等。你还可以选择手动逐句翻译,适合需要逐句优化语序的场景。

如果你需要批量的字幕翻译体验或使用ai翻译字幕,可以使用我开源的 Subtitle Translator 工具。 该工具支持批量上传字幕,调用多个翻译 API,并可选择中英对照、断句模式、自定义输出格式等,适合字幕组、译者和内容创作者使用。

字幕同步与修正

Subtitle Edit 提供多种对齐和修正工具,帮助字幕更精确地贴合音视频内容:

  • 自动根据音频波形对齐字幕时间
  • 快速统一字幕偏移(正向或负向延迟)
  • 修改帧率(用于从不同源转换视频)
  • 检测并修复字幕重叠、间隔过短、过长等问题

字幕格式批处理

  • 支持常见字幕格式互转:如 .srt.ass.sub.vtt
  • 支持 UTF-8、ANSI、Unicode 等多种编码转换
  • 提供批量文本替换、去空字幕行、规范化字幕格式等自动化操作

精修同步字幕

可切换为“波形图”或“频谱图”视图,辅助进行精确的起止时间调整。非常适合精修口型同步字幕或歌词字幕。

常见误区说明

  • MKVToolNix 并不能直接导出文本字幕:尽管有些 AI 推荐该工具提取 MKV 字幕,但实际上它输出的是 .mks 格式(容器文件),而非可读的字幕文本。
  • HandBrake 不支持字幕提取:该工具适用于视频转码与压制,但无法直接提取字幕。

拓展:实时生成字幕

  1. Windows 11 实时字幕:

    • 快捷键:Win + Ctrl + L
    • 适用于系统层面的视频、音频播放,能够在屏幕上直接显示字幕。
  2. Chrome 浏览器实时字幕(Live Caption):

    • 开启方式:进入浏览器 设置 → 无障碍 → 实时字幕,打开后在观看网页视频时会自动生成字幕。并可实时翻译为其他语言。

这类实时字幕和翻译功能,可以理解为一种轻量级的本地 Whisper。对于英文内容,识别效果已经相当不错;在其他语言环境下,也能生成字幕,只是准确度较差。

HandBrake:将蓝光电影批量压制为 MKV

2025-04-24 08:00:00

HandBrake 是一款功能强大的开源视频转换工具,支持 Linux、macOS 和 Windows 系统。它可以将已有的视频文件转换为在手机、电视盒子、游戏机、电脑或浏览器等多种设备上兼容的格式。支持的视频格式广泛,包括普通摄像机拍摄、屏幕录制以及蓝光源等。

我个人收藏了不少蓝光电影资源,但在 Emby 中无法直接播放。将资源迁移至云盘后,更是连在线播放都成问题。因此,我决定使用 HandBrake 将这些资源重新压缩为支持软字幕的 MKV 格式,以便在不同设备间更好地播放和管理。

操作说明

1. 导入视频源

打开 HandBrake 后,点击左上角的“打开源(Open Source)”按钮。可选择以下方式导入视频:

  • 直接选择单个视频文件;
  • 导入整个 BDMV 文件夹(HandBrake 会自动识别主电影);
  • 实测可加载映射为 cd2 路径的 115 网盘本地资源。

导入后,程序会自动分析视频内容,识别出音频轨道、字幕轨道等元数据。

2. 设置字幕轨道

切换到“字幕(Subtitles)”标签页后,点击“轨道(Tracks)” > 添加所有剩余字幕轨道

常见设置建议如下:

  • 主语言字幕:不勾选 Burn In,可勾选 Default;
  • 强制外语字幕(如英语电影中的西班牙语对白):
    • 勾选 Burn In(烧录字幕);
    • 同时勾选 Forced Only(仅提取强制字幕);

以下为字幕选项的详细说明:

| 选项 | 说明 | 建议设置 | |

IMGPrompt:图片提示词生成器

2024-10-23 08:00:00

当我第一次接触 AI 生成图像时,我发现生成的图像往往与我想象的场景不符。原因大多是因为提示词描述不精准。作为非英语母语的人,我在描述场景时往往用母语的思维方式,但有时会导致完全不同的结果。因此,我设计了 IMGPrompt —— 帮助不懂英语的人也能精准地生成完美的 AI 图像,甚至 AI 视频。这个工具旨在让每个人,无论是什么语言背景,都能轻松创建 AI 作品!

IMGPrompt 是专为 Stable Diffusion、Midjourney、DALL·E 和 FLUX 打造的 AI 图像提示词编辑器,界面简洁直观,使用户能够轻松地查看并组合所需的提示词文本。每个提示词都附有中文翻译,用户仅需通过点击或输入关键词,即可快速选取或组合,从而大大简化了文生图提示词输入。

界面说明
界面说明

特色功能

智能推荐功能

IMGPrompt 提供基于用户输入的关键词(支持中英等 14 种语言)的智能推荐,自动建议相关提示词,帮助用户快速找到合适的表达,节省创作时间,提升创作效率。

智能推荐示范
智能推荐示范

翻译功能

内置免费的翻译功能可以将任意语言的提示词转换为英文,确保生成的提示词适用于不同的 AI 工具。这让用户在多语言环境下使用 IMGPrompt 更加便捷,减少因语言障碍造成的困扰。

翻译展示
翻译展示

随机换色功能

此功能允许用户快速替换提示词中的颜色词,为创作增添多样性和趣味性,激发创作灵感,帮助用户探索更多的创作方向。

界面说明

1. 选择提示词范围

在界面顶部,你会看到“选择对象”和“选择属性”两个区域。点击相应的标签(如“人物”、“表情”、“动作”等)来缩小提示词的范围,从而帮助你更准确地选择所需提示词。

界面说明
界面说明

2. 浏览和插入提示词

在“选择标签”区域,你将看到不同颜色的标签,每个标签显示的是英文提示词及其母语翻译。点击所需标签时,它们会自动添加到提示词文本框中,方便快速选取。

3. 编辑提示词和推荐

在右侧的提示词文本框中,你可以直接编辑或输入自定义提示词。请使用逗号分隔不同的提示词,系统将自动处理标签化的操作。

IMGPrompt 会根据你的输入自动匹配相关提示词并进行智能推荐。点击智能推荐标签,即可插入相应提示词。如果最后一个提示词匹配到提示词库中的内容,它将以打勾的绿色标签形式显示。

4. 使用常用功能

  • 快速插入:点击“肖像光线”和“常用润色”按钮,快速插入常用的提示词。
  • 否定提示:通过“否定提示词”按钮复制常用的否定提示词,帮助优化图像生成结果。
  • 翻译:点击“翻译”按钮,可以将任意语言的提示词转换为英文,确保在不同的 AI 工具中兼容,帮助非英语用户解决语言障碍问题。
  • 随机换色:使用此功能随机替换提示词中的颜色词,激发创意灵感。

5. 复制结果与清空

  • 复制结果:完成编辑后,点击“复制结果”按钮,将生成的提示词复制到剪贴板,方便直接粘贴到你选择的 AI 图像生成工具中。
  • 清空和重置:点击“清空”按钮,快速清除所有已选择的标签和输入的提示词,以便重新开始编辑。

结语

IMGPrompt 支持网页、客户端、Docker 部署,旨在简化 AI 图像生成的提示词创作过程。通过直观的界面和丰富的提示词库,它能帮助你更快速、更精确地表达创意想法。无论你是 AI 艺术创作的新手还是专业人士,IMGPrompt 都将是你强大的创作助手。

md-translator:专为 Markdown 优化的翻译工具

2024-08-14 08:00:00

Markdown 是我日常使用最频繁的文本格式,但现有的翻译工具往往难以保持其原有格式。因此,我开发了 md-translator,一个专为 Markdown 优化的翻译工具,旨在 精准翻译文本的同时保持格式完整。其翻译机制类似于字幕翻译器,详细参数可参考 说明文档

为什么开发 md-translator?

在开发 md-translator 之前,我测试过以下工具,但由于各自的局限性,未能满足我的需求,这里简单记录它们的特点,供参考。

  • GT4T:支持 Markdown 批量翻译,用户可将整个文件夹拖入 GT4T 文件翻译器,自动翻译其中的所有 Markdown 文件。然而,该工具只能商用,即使添加自定义 API,仍要求付费,因此对个人用户不太友好。
  • Markdown Docs Translator:一款开源免费的 Markdown 翻译工具,基于网页版接口进行翻译。然而,翻译速度较慢,且在长文本处理中容易发生中断。

使用说明

本地缓存机制

所有翻译内容都会缓存在本地,以提高重复翻译时的速度。如果需要重新翻译,可以点击 “重置翻译缓存” 按钮。

Markdown 元素支持

md-translator 目前已支持解析以下 Markdown 语法,并在翻译时保持格式:

  • **FrontMatter 元数据(