2024-10-23 08:00:00
当我第一次接触 AI 生成图像时,我发现生成的图像往往与我想象的场景不符。原因大多是因为提示词描述不精准。作为非英语母语的人,我在描述场景时往往用母语的思维方式,但有时会导致完全不同的结果。因此,我设计了 IMGPrompt —— 帮助不懂英语的人也能精准地生成完美的 AI 图像,甚至 AI 视频。这个工具旨在让每个人,无论是什么语言背景,都能轻松创建 AI 作品!
IMGPrompt 是专为 Stable Diffusion、Midjourney、DALL·E 和 FLUX 打造的 AI 图像提示词编辑器,界面简洁直观,使用户能够轻松地查看并组合所需的提示词文本。每个提示词都附有中文翻译,用户仅需通过点击或输入关键词,即可快速选取或组合,从而大大简化了文生图提示词输入。
根据用户输入的关键词(支持中英文),IMGPrompt 提供智能推荐,自动建议相关的提示词,帮助用户快速找到合适的词汇,节省创作时间,提升创作效率。
内置免费的翻译功能可以将任意语言的提示词转换为英文,确保生成的提示词适用于不同的 AI 工具。这让用户在多语言环境下使用 IMGPrompt 更加便捷,减少因语言障碍造成的困扰。
此功能允许用户快速替换提示词中的颜色词,为创作增添多样性和趣味性,激发创作灵感,帮助用户探索更多的创作方向。
在界面顶部,你将看到“选择对象”和“选择属性”两个部分。点击相应标签(如“人物”、“表情”、“动作”等)来缩小提示词范围。
在“选择标签”区域,你会看到不同颜色的标签。每个标签显示英文提示词及其中文翻译。点击所需标签,它们会自动添加到提示词文本框中。
在右侧的提示词文本框中,你可以直接编辑或输入自定义提示词,使用逗号分隔不同提示词,系统会自动进行标签化处理。
IMGPrompt 的提示词资源来源于网络搜集、promptoMANIA 以及 sd-webui-prompt-all-in-one,去重后整理了近五千条图像提示词。
如果你想为自己增加提示词,可以自部署,可以使用 IMGPrompt 数据转换器,将自定义提示词转换为 IMGPrompt 格式。并将其保存在 src/app/prompt-custom.json
。它也适合管理专业提示词和多种数据编辑场景。
虽然不同的文生图应用对图像提示词的处理有所差异,但基本规则相似:
beautiful forest background, desert!!, (((sunset)))
会优先体现“desert”和“sunset”这两个元素。括号内的加权数字(如 (masterpiece:1.5)
)则用于指定细节的重要性,多重括号也具有类似效果。{blue hair:white hair:0.3}
表示蓝发和白发的组合,其中蓝发占比为 0.3。mountain | tree:-10
,其中 tree:-10
指定树的权重极低。IMGPrompt 支持网页、客户端、Docker 部署,旨在简化 AI 图像生成的提示词创作过程。通过直观的界面和丰富的提示词库,它能帮助你更快速、更精确地表达创意想法。无论你是 AI 艺术创作的新手还是专业人士,IMGPrompt 都将是你强大的创作助手。
2024-08-14 08:00:00
Markdown 是我最常用的文本格式,经常需要翻译为其他语言。基于此需求,我开发了 md-translator 工具。此工具特别针对 Markdown 语法进行了优化,旨在在不改变文本格式的情况下实现翻译。其翻译机制与字幕翻译器相似,详细参数说明可参考 subtitle-translator 说明。
以下问题之前曾出现,但未再重现,待后续修复:
-空格
应被识别为 list,但未被识别;目前所有翻译将缓存在本地,如果不希望使用缓存翻译,可以点击重置按钮。
2024-07-05 08:00:00
封面图片摄于法国南部的泉水镇 (Fontaine de Vaucluse),时间是二月。洞穴看似浅显,但深入镜头,可见泉水幽深无底。据说,历经十六次探测,仍未能精确测量出泉眼深度。
https://fellerts.no/projects/kintsugi.php
作者采用日本传统艺术“金继”(Kintsugi),修复了他特别的、已经破碎的咖啡杯,并分享了他在修复过程中的学习和体验。Kintsugi 是一种用金或银粉突出修复缝隙的古老日本艺术,它不仅修复了物品,还赞美了其历史和不完美。
修复后的杯子真的很漂亮,准备之后有机会试试。
https://www.solidot.org/story?sid=78452
研究报告显示,自 2022 年 11 月 ChatGPT 问世以来,写作与编程自由职业者需求下降 21%。自动化易行领域,如写作、软件开发,职位空缺减少 21%;数据录入、社交媒体后期制作减少 13%;图像生成任务,包括平面设计与 3D 建模,相关职位减少 17%。
这是否也是经济下滑的因素之一?
https://www.solidot.org/story?sid=78599
工信部宣布,将制定脑机接口标准,正筹备脑机接口标准化技术委员会。委员会成立后,将围绕脑电采集、信号处理、反馈等环节,制定输入输出接口、数据处理、编解码算法等标准。此举标志着中国在脑机接口领域,将从学术研究转向更具针对性的研发。
中国的脑机接口技术,或许即将迎来突破。
这两天发现一个久未使用的手机号,曾用它注册过微信,如今却无法登录。尝试用该号码搜索微信账号,发现该号码已经被绑定在一个不认识的微信号上。尝试用之前的好友辅助登录,但没有任何效果,不确定是不是因为那个微信号已经重新注册了,与我没有关系。但手机卡一直在身边,不清楚怎么绑定在对方身上的。
最后,我用这个手机号重新注册了一个账号。注册过程中,微信提示「此号码已绑定另一微信」。我无视了这个警告,继续注册后,成功创建了新账号。不过,之前账号的信息自然都没有了。
尝试了 Discord、Tele、Ntfy 等多种消息通知工具,但它们各自存在一些问题,如通知服务器不稳定、通知应用未打开等。在国内,使用微信获取通知可能是最方便且最可靠的方式。与之相比,其他消息通知工具容易被错过,而微信能确保消息的送达。
微信提供了两种类型的消息通知:
企业微信应用:配置较为复杂,适合拥有专业开发团队的企业。在配置过程中,需要固定 IP 和备案域名,还需要获取有效期为两小时的 access token 进行授权(通过缓存可以减少请求次数)。具体操作指南和详细信息,可参考:获取 access_token和企业微信推送详解。
企业微信群机器人(WeCom):使用相对简单。只需以个人身份注册一个企业微信账号,并在注册时声明为公司名义。注册后,无需进行认证,只需邀请两位朋友加入,组建一个内部群。若不希望使用额外的小号或让他人加入群聊,可向两位朋友发送邀请,无需要求他们点击加入链接。发送邀请后,群聊即成功创建。创建群聊后,可以将这两位朋友移除,这样你就拥有了一个专属的、仅用于接收通知的群组。
如果想在个人微信中接收企业微信的消息,可进入企业微信管理后台,在「我的企业」>「微信插件」中找到并分享二维码。该二维码有效期为 7 天,通过微信扫码后即可实现跨平台消息通知。
2024-06-27 08:00:00
近年来,随着在线视频的兴起,国外热门影视作品的翻译多由视频平台完成,而原本活跃的字幕组则逐渐淡出人们的视野。然而,对于冷门视频和自制视频的字幕需求却未能得到有效满足,导致未配字幕的视频数量持续增加。为解决这一问题,可以用 Whisper 工具为这些生肉视频自动生成字幕,并通过翻译接口将其翻译成中文。具体操作步骤可参考文章:找不到字幕?Whisper 让不懂外语的你也能看懂日剧。
针对市面上字幕翻译工具存在的翻译速度慢、不支持批量处理、需人工干预等问题,我开发了一款免费且功能全面的字幕翻译工具——subtitle-translator。该工具支持.srt、.ass、.vtt 格式的多语言字幕文件转换,具备秒级翻译速度,大幅提高翻译效率。我已成功转录超过 500 个视频,翻译后的字幕文件可在whisper-subtitles 查看。
2024-06-27 08:00:00
在处理文本时,经常需要用到简繁转换。然而,网络上排名前三的简繁转换工具均会将原文本发送至第三方服务商进行转换,这可能引发隐私问题。因此,我基于 opencc-js 构建了一个本地的简繁转换工具。相比之下, opencc无法在客户端运行,故未被选用。
成品:https://tools.newzone.top/chinese-conversion
本文档暂未完成,后续将进行补充。
部分词汇的简繁转换可能存在问题,欢迎在下方留言,我将添加对特例的支持。
待更新功能:
2024-04-26 08:00:00
封面图拍摄于四月的敦煌月牙泉。那里的沙子极为细软,攀登沙山非常不易,我登顶便直接躺下,不想再动。直到日落前夕,温度骤降,我们才不得不离开。
https://www.henrikkarlsson.xyz/p/go
在 AlphaGo 推出前,职业围棋选手的表现似乎已经达到了一个瓶颈,没有再有所提高。然而,AI 促使人类重新评估他们的动作和启发式,并放弃弱启发式。结果,职业围棋选手的表现得到了显著提高,并且变得更加创造力。这表明,人工智能可以促进人类技能的发展,并使人们变得更加创造力。
https://edition.cnn.com/2021/09/24/health/how-to-boost-metabolism-wellness/index.html
静息代谢从 20 岁到 60 岁保持稳定,此后每年下降不到 1%。新陈代谢的降低,与生活方式和锻炼方式密切相关。
https://www.afterbabel.com/p/phone-based-childhood-cause-epidemic
文章指出,社交媒体的增长与青少年心理健康问题有明显关联。研究显示,频繁使用社交媒体的青少年,自杀率和抑郁症发病率较高。此外,社交媒体使用还可能降低他们的自尊和幸福感。文章还讨论了社交媒体如何影响青少年的身体形象和自尊心,以及如何影响青少年的睡眠质量。
建议在高中之前,不为孩子提供智能手机或开设社交媒体账户。父母可以选择为孩子提供翻盖手机或智能手表。
diffoscope 是一个用于对文件、存档和目录进行深入比较的工具,支持压缩包、ISO、PDF 等。它能够递归解包多种类型的存档,并将各种二进制格式转换为更易读的形式以进行比较。
https://chromewebstore.google.com/detail/elmo-your-ai-web-copilot/ipnlcfhfdicbfbchfoihipknbaeenenm
Elmo 是一款免费的多语言 AI 网络助手插件,无需注册或使用 GPT/OpenAI 账户即可使用。它能为用户提供摘要、解答问题和扩展知识等功能。
相比于 Kimi Chat 无法处理某些网页,Elmo 不受外网限制。不过,如果文章过长,Elmo 可能只会总结文章的前半部分。
在选择构建工具时,尽管 Vite 在开发中提供快速的热重载和原生 ES 模块支持,但我在 LearnData 博客部署中遇到了一些问题。
使用 Vite 时,每次更新都需要重新构建并替换绝大部分文件,而 Webpack 则只更新改动部分。在实际操作中,使用 Vite 更新一篇文章需要 12 分钟,而 Webpack 只需要 6 分钟。因此,出于效率考虑,我选择了 Webpack。
每次写文章后,我都会让 AI 检查错误和优化语法。然而,与专业编辑相比,AI 仍有不小的差距。
以我的 SSL 证书续签文章为例,人类编辑能精确指出文章中的具体问题,如内容不符、知识错误和对新手不友好等,这些反馈帮助我清晰地识别并改进错误。而 AI 往往提供看似合理但实际效果有限的建议,缺乏针对性和深度,有时甚至与文章的初衷不符。此外,AI 总会输出一堆正确性的废话,每次我都要删掉一半的输出。
因为宝宝太小,我们请了一位阿姨帮忙照顾。起初,阿姨既能带宝宝又能帮忙做家务,一切似乎变得更容易。但她的加入也让生活受到了一些限制,我们夫妻的自由不如以前。
后来,阿姨因乳腺有肿块需要手术,我只好把宝宝送回老家,由父母照看,并请了另一位住家阿姨。
我和妻子回归二人世界后,感觉自由多了,也能更好地按照时间表生活。可能我就是自私的父母吧。