关于 Ein Verne

软件工程师,开源爱好者,Linux用户和vimer开发者。

RSS 地址: https://blog.einverne.info/feed.xml

请复制 RSS 到你的阅读器,或快速订阅到 :

Ein Verne RSS 预览

升级 Mastodon 从 4.1.19 至 4.2.x

1970-01-01 08:00:00

记录一下 Mastodon 实例维护,为 4.1.19 升级至 4.2.x 的过程。因为之前的版本还在 4.1.x 所以先按照官方的教程升级到了 4.1.19 最新的版本,然后开始研究如何跨版本升级,之前已经成功将 Mastodon 从 V3 升级到了 V4 版本,我大致猜测应该也差不多,但是为了数据安全起见,还是做了好充分的备份。

自托管的开源视频分享平台 MediaCMS

1970-01-01 08:00:00

MediaCMS 是一个现代化的开源的视频和媒体 CMS,使用 Django 和 React 实现。

使用 pyVideoTrans 自动进行视频翻译及配音

1970-01-01 08:00:00

前两天分享过一款通过 macOS 本地芯片实时生成字幕的 [[YPlayer]] 播放器,也分享过通过 [[MemoAI]] 来生成双语字幕,后来来发现了一款叫做 Fig Player 的播放器,也可以通过 Whisper 模型来生成双语字幕,但是这一些工具的底层原理基本上都是通过 OpenAI 发布的 Whisper,以及其衍生的模型来完成音频转字幕的,这一个过程叫做 Transcript,但是今天要介绍一个更加强大的工具 [[pyVideoTrans]],这一款开源,免费的项目完全实现了上述所有的产品的功能,并且更加强大。

通过聆听的方式看论文 Google Illuminate

1970-01-01 08:00:00

Illuminate by Google 是 Google 发布的一个创新工具,将复杂的学术研究论文转变成简短的音频对话形式。

iPhone 重启之后照片丢失及解决方案

1970-01-01 08:00:00

昨天手机选择照片的时候一直都是转圈,怎么都选不出来,索性就重启了一下手机,但是没想到的是重启完手机,我发现最近的照片全部都找不到了,8 月 31 号之后的所有照片在我的本地相册中全部找不到了,最后一张照片就是 10 多天前拍摄的了,大叫不好。

利用 macOS 的 LiveText 轻松复制视频文字实现观看韩综

1970-01-01 08:00:00

前两天我录制了一期视频讲述如何通过 MemoAI 这样的语音转文字的应用来自动通过音频转写文字,然后变成字幕来观看韩综《思想验证区域:The community》,其实那一期视频主要是为了介绍软件应用的,所以就以我正在观看的韩综做了一个例子,但是其实制作字幕的时候我也知道,这一个综艺比较特殊,因为其中有很长的一段「讨论」,里面的参与者是通过匿名在线聊天室的方式录制的,所以整个综艺会有相当长的一段时间是没有人说话,而是大家都在打字进行辩论的!那么语音转文字就变得鸡肋了。所以这个地方字幕组也是非常辛苦,需要将视频中的字幕一个个取出来然后进行翻译叠加到视频里面。

OpenAI 的 Whisper 以及相关模型和项目

1970-01-01 08:00:00

自动语音识别技术 (Automatic Speech Recognition,简称 ASR)最近得到了非常大的提升,这个技术允许计算机通过识别语音将其转录成文本,在日常生活中有着非常广泛的应用,比如各类语音助手,Siri,Google Now ,Alex 等等。 另外还有一项技术是通过文字生成语音(Text to Speech,简称 TTS),这一项技术在前两年听书的时候经常会用到,但是之前的语音合成的效果非常不好,但是这两年的发展越来越听不出来是机器了。

信银国际大湾区双币信用卡开卡及使用

1970-01-01 08:00:00

信银国际大湾区双币信用卡是中信香港(信银国际)发行的一张双币信用卡,专为经常往返大湾区的人士设计,支持人民币和港币签账。

MemoAI 一款跨平台的语音视频转文字工具

1970-01-01 08:00:00

MemoAI 是一款 AI 驱动的音频,视频转文字的工具,集成了高精度的语音识别技术,能够处理多语言的语音转文本,并且支持翻译成多语种字幕。

关于懒猫微服的一点想法

1970-01-01 08:00:00

这两天在 X 上看到一款非常有趣的产品「懒猫微服」,简单的了解了一下,定位是一款微型家用服务器。因为产品定位比较特殊,我也非常感兴趣,所以就做了一点点购买前的小小总结。顺便也给自己理一理思路,是否值得购买。