Logo

site icon开源服务指南

用中文推荐优质开源项目,让开发者更容易找到趁手的开源工具。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

开源服务指南 RSS 预览

把视频配音翻译成另一种语言:自动添加字幕 | 开源日报 No.428

2024-11-21 07:35:54

Featured image of post 把视频配音翻译成另一种语言:自动添加字幕 | 开源日报 No.428

Melkeydev/go-blueprint

Github Repo StarsLicense: `MIT`Language: `Unknown`

demo-picture-of-go-blueprint

go-blueprint 是一个命令行工具,允许用户快速创建具有相应结构的 Go 项目,并与流行的 Go 框架集成。 该项目解决了快速搭建和配置 Go 项目的问题,使开发者能够专注于应用程序的实际代码。

  • 易于设置和安装
  • 自动建立完整的 Go 结构
  • 支持多种流行框架(如 Gin、Fiber 等)
  • 提供数据库支持(Mysql、Postgres 等)
  • 可选高级功能,如 CI/CD 工作流程、Websocket 和 Docker 配置

netease-youdao/EmotiVoice

Github Repo StarsLicense: `Apache-2.0`Language: `Unknown`

cover

EmotiVoice 是一个强大的现代开源文本转语音引擎,支持多种声音和情感合成。 该项目解决了用户在文本转语音时对情感表达和多样化声音的需求。

  • 支持英语和中文,提供超过 2000 种不同的声音
  • 具备情感合成能力,可以生成快乐、兴奋、悲伤、生气等多种情绪的语音
  • 提供易于使用的网页界面以及批量生成结果的脚本接口
  • 支持通过 HTTP API 进行快速调用,并提供 13,000 次免费调用机会
  • 不断更新与社区反馈互动,计划增加更多语言支持

milanm/DotNet-Developer-Roadmap

Github Repo StarsLicense: `Apache-2.0`Language: `Unknown`

demo-picture-of-DotNet-Developer-Roadmap

DotNet-Developer-Roadmap 是一个为不同资历水平的 .NET 开发者提供全面学习路径的指南。 该项目旨在帮助开发者明确下一步学习内容,避免追逐流行趋势而迷失方向。

  • 提供按资历等级划分的 .NET 学习路线图
  • 包含丰富的学习资源链接,便于深入理解各个概念
  • 适合初级、中级和高级开发者,涵盖基础到专家级知识
  • 提供 PDF 下载版本和简化版,以满足不同需求
  • 强调对 .NET 生态系统及其运行时环境的理解

nz-m/SocialEcho

Github Repo StarsLicense: `MIT`Language: `Unknown`

demo-picture-of-SocialEcho

SocialEcho 是一个社交网络平台,具备自动内容审核和基于上下文的身份验证系统。 该项目解决了社交媒体中内容管理和用户安全性的问题。

  • 自动化内容审核系统,利用多种自然语言处理 API 进行过滤
  • 基于上下文的身份验证,提高用户账户安全性
  • 用户角色分明,包括管理员、版主和普通用户
  • 提供常见社交功能,如创建个人资料、发布帖子、评论及点赞等
  • 设备管理功能,允许用户直接在平台上管理登录设备

jianchang512/pyvideotrans

Github Repo StarsLicense: `GPL-3.0`Language: `Unknown`

demo-picture-of-pyvideotrans

pyvideotrans 是一个视频翻译配音工具,能够将一种语言的视频翻译为另一种语言并添加字幕和配音。 该项目解决了多语言视频内容的创建与传播问题,使得用户可以轻松地将视频内容转换为不同的语言版本。

  • 自动翻译视频并生成对应字幕和配音
  • 支持多种语音识别及合成 API
  • 批量处理功能,包括批量合并、格式转换等
  • 提供丰富的文字翻译支持,包括多个主流在线服务
  • 允许自定义 TTS 服务器,灵活性高
  • 支持从 YouTube 下载视频以及提取背景音乐

优质机器学习库推荐与资源汇总 | 开源日报 No.427

2024-11-20 07:35:10

Featured image of post 优质机器学习库推荐与资源汇总 | 开源日报 No.427

ml-tooling/best-of-ml-python

Github Repo StarsLicense: `CC-BY-SA-4.0`Language: `Unknown`

cover

best-of-ml-python 是一个排名列表,汇集了优秀的机器学习 Python 库,每周更新。 该项目解决了用户寻找高质量机器学习库的难题,提供了一份经过精心策划和分类的资源清单。

  • 包含 920 个开源项目,总计 4.7M 颗星
  • 按照项目质量评分自动排序
  • 涵盖 34 个类别,包括数据可视化、自然语言处理、图像数据等
  • 欢迎社区贡献,可以提交问题或拉取请求进行更新
  • 提供订阅新闻通讯以获取最新动态和趋势项目信息

goniszewski/grimoire

Github Repo StarsLicense: `MIT`Language: `Unknown`

demo-picture-of-grimoire

Grimoire 是一个为巫师们设计的书签管理器。 它帮助用户轻松存储和整理他们的书签,解决了混乱无序的问题。

  • 轻松添加和组织书签
  • 创建独立用户账户,每个账户拥有自己的书签、分类和标签
  • 支持模糊搜索功能
  • 支持标签和分类管理
  • 从网站获取元数据并本地存储,必要时更新
  • 可以在书签到中添加个人笔记
  • 提供集成 API 以从其他来源添加书签
  • 夜间模式支持
  • 官方浏览器扩展“grimoire companion”提升生产力

luosiallen/latent-consistency-model

Github Repo StarsLicense: `MIT`Language: `Unknown`

demo-picture-of-latent-consistency-model

latent-consistency-model 是一个用于生成高分辨率图像的模型,旨在通过少量推理步骤实现高效合成。 该项目解决了在生成图像时需要较长推理时间的问题,使得用户能够快速获得高质量的图像输出。

  • 支持低步数推理以加速高分辨率图像合成
  • 提供多种演示和社区支持,方便用户交流与贡献
  • 集成于多个流行框架(如 Hugging Face、Diffusers 等),易于使用
  • 兼容 Windows/Linux 系统,并提供本地运行选项
  • 新增实时和图片到图片(Img2Img)功能,提高灵活性与应用场景

OpenGVLab/DragGAN

Github Repo StarsLicense: `NOASSERTION`Language: `Unknown`

demo-picture-of-DragGAN

DragGAN 是一个非官方实现的交互式图像生成模型,允许用户通过点对点操作来操控生成的图像。 该项目解决了在生成图像时如何进行直观和灵活的编辑的问题,使得用户能够更轻松地调整和修改输出结果。

  • 支持在线演示及本地部署,兼容 Windows、macOS 和 Linux。
  • 提供简单易用的 GUI 界面以控制生成过程。
  • 集成 StyleGAN2-ada,实现更高质量与多样化的图像输出。
  • 允许自定义图片上传并支持 GAN 反演功能。
  • 定期更新版本以修复 bug 并提升性能。

SevaSk/ecoute

Github Repo StarsLicense: `MIT`Language: `Unknown`

cover

Ecoute 是一个实时转录工具,能够为用户的麦克风输入和扬声器输出提供实时转录文本,并基于对话生成建议回复。 该程序解决了在对话中获取即时反馈和建议响应的问题,从而提升沟通效率。

  • 实时转录用户的麦克风输入和扬声器输出
  • 利用 OpenAI 的 GPT-3.5 生成上下文相关的回复
  • 支持多种语言,提高了转录速度与准确性
  • 简单易用,适合 Windows 系统环境设置

2 分钟构建网页爬虫:0 基础轻松完成! | 开源日报 No.426

2024-11-19 07:36:00

Featured image of post 2 分钟构建网页爬虫:0 基础轻松完成! | 开源日报 No.426

getmaxun/maxun

Github Repo StarsLicense: `AGPL-3.0`Language: `Unknown`

demo-picture-of-maxun

maxun 是一个免费的开源无代码网页数据提取平台。 该项目解决了用户在没有编程知识的情况下,快速构建自定义机器人以自动化数据抓取的问题。

  • 支持快速训练机器人,仅需 2 分钟即可开始自动抓取网页。
  • 提供多种数据捕获方式,包括列表、文本和截图。
  • 适合各种网站的数据提取需求,如电商产品信息等。
  • 开源且可自托管,用户可以根据需要进行定制。

chronark/highstorm

Github Repo StarsLicense: `AGPL-3.0`Language: `Unknown`

cover

highstorm 是一个开源事件监控工具。 该项目旨在提供高效的事件监控解决方案,以便用户能够轻松管理和分析其应用程序中的事件数据。

  • 支持多种第三方服务集成,如数据库和身份验证
  • 提供详细的安装和配置指南,易于上手
  • 具备时间序列数据库支持,适合处理动态数据

huggingface/alignment-handbook

Github Repo StarsLicense: `Apache-2.0`Language: `Unknown`

demo-picture-of-alignment-handbook

alignment-handbook 是一个提供稳健配方的项目,用于将语言模型与人类和 AI 偏好对齐。

  • 提供了一系列稳健的训练配方,涵盖整个流程
  • 支持继续预训练、有监督微调、以及与 DPO 和 ORPO 对齐的有监督微调
  • 提供了复制 Zephyr 7B 等模型的配方
  • 包含脚本来训练和评估模型,并支持分布式训练全模型权重
  • 正在编写指南,解释 DPO 等方法如何工作,并分享实践中收集人类偏好时所学到的经验。

idurar/idurar-erp-crm

Github Repo StarsLicense: `AGPL-3.0`Language: `Unknown`

demo-picture-of-idurar-erp-crm

idurar-erp-crm 是一款基于先进的 MERN 栈(Node.js / Express.js / MongoDb / React.js)构建的开源 ERP/CRM 会计发票软件。 该程序解决了企业在管理发票、客户和支付等方面的复杂性问题。

  • 提供全面的发票管理、支付管理和报价管理功能
  • 支持客户信息管理,提升用户体验
  • 基于 Ant Design 框架,界面友好且易于使用
  • 完全开源,可用于个人或商业用途,无需费用
  • 自托管企业版本可用,便于灵活部署

Codium-ai/pr-agent

Github Repo StarsLicense: `Apache-2.0`Language: `Unknown`

demo-picture-of-pr-agent

pr-agent 是一个基于人工智能的工具,用于自动化拉取请求的分析、反馈和建议。 该程序旨在高效地审查和处理拉取请求,提供 AI 驱动的反馈与建议。

  • 提供自动化的代码审核和问题识别
  • 支持多种接口运行,包括 CLI 和 PR 评论
  • 能够根据 Jira 或 GitHub 票据增强 PR 反馈
  • 自动记录接受的代码建议,便于历史跟踪与学习
  • 允许用户自定义标签生成以满足项目需求

高性能可观察性数据管道:轻松追踪日志与访问指标 | 开源日报 No.425

2024-11-18 07:35:56

Featured image of post 高性能可观察性数据管道:轻松追踪日志与访问指标 | 开源日报 No.425

vectordotdev/vector

Github Repo StarsLicense: `MPL-2.0`Language: `Unknown`

demo-picture-of-vector

Vector 是一个高性能的可观察性数据管道。 它解决了用户在收集、转换和路由日志与指标时面临的数据管理挑战。

  • 高性能,速度比其他替代方案快 10 倍
  • 可靠性强,基于 Rust 构建
  • 统一平台,可处理日志、指标和即将推出的追踪数据
  • 降低总可观察性成本,并支持无缝切换供应商
  • 提升数据质量与洞察力,改善整体可观察性表现

radix-ui/themes

Github Repo StarsLicense: `MIT`Language: `Unknown`

demo-picture-of-themes

themes 是一个优化了快速开发、易于维护和可访问性的开源组件库。

  • 为快速开发提供优化的组件
  • 简单易用,方便维护
  • 支持无障碍功能

ChaoningZhang/MobileSAM

Github Repo StarsLicense: `Apache-2.0`Language: `Unknown`

demo-picture-of-MobileSAM

MobileSAM 是一个旨在为移动应用和其他平台提供轻量级的图像分割解决方案的项目。 该程序通过替换原始 SAM 中重量级的图像编码器,使得图像分割过程更快、更高效,特别适合移动设备使用。

  • 支持 ONNX 模型导出,便于在各种设备上测试。
  • 使用轻量级 Tiny-ViT 编码器,大幅提升处理速度(每张图片约 12ms)。
  • 保持与原始 SAM 相同的数据处理流程,易于迁移和适配。
  • 提供多种基于 MobileSAM 的项目示例,如快速掩膜细化、浏览器演示等。
  • 在 CPU 上运行良好,并且有计划推出更多功能的新版本。

ramon-victor/freegpt-webui

Github Repo StarsLicense: `GPL-3.0`Language: `Unknown`

cover

freegpt-webui 是一个使用 GPT 3.5/4 的聊天 Web UI。无需 API 密钥。

  • 使用 GPT 3.5/4 进行聊天
  • 用户友好的界面
  • 完全免费
  • 可在多个平台上测试和修改
  • 支持 Docker 镜像部署

princeton-nlp/tree-of-thought-llm

Github Repo StarsLicense: `MIT`Language: `Unknown`

demo-picture-of-tree-of-thought-llm

tree-of-thought-llm 是一个用于大型语言模型的思维问题解决方案的实现。 该项目旨在通过树状思维方法提升大型语言模型在复杂问题上的解决能力。

  • 提供了对“Tree of Thoughts”论文的官方实现,包括代码、提示和模型输出。
  • 支持多种任务设置,用户可以轻松添加新任务。
  • 采用 BFS 算法进行有效的问题求解,适用于游戏和创意写作等场景。
  • 允许灵活配置生成和评估方法,以满足不同需求。
  • 包含实验结果日志,便于复现研究成果。

Windows/Linux 按键统一 Mac 风格:多系统操作再无障碍 | 开源日报 No.424

2024-11-17 07:35:56

Featured image of post Windows/Linux 按键统一 Mac 风格:多系统操作再无障碍 | 开源日报 No.424

rbreaves/kinto

Github Repo StarsLicense: `GPL-2.0`Language: `Unknown`

demo-picture-of-kinto

Kinto 是一个为 Linux 和 Windows 提供 Mac 风格快捷键的工具。 该程序解决了在不同操作系统中使用统一快捷键的问题,使用户能够无缝地进行复制和粘贴操作。

  • 支持 Linux 和 Windows 系统,提供一致的 Mac 风格快捷键体验
  • 通过 xkeysnail(Linux)和 Autohotkey(Windows)实现功能
  • 包含系统托盘和简单安装向导,便于用户快速设置
  • 实验性支持 VNC 功能,适用于远程桌面连接
  • 安装过程简便,只需一行命令即可完成安装

udlbook/udlbook

Github Repo StarsLicense: `NOASSERTION`Language: `Unknown`

cover

udlbook 是一本关于深度学习的书籍,由 Simon J.D. Prince 编写。 该书旨在帮助读者理解深度学习的基本概念和技术。

  • 提供深入浅出的深度学习知识
  • 包含丰富的实例和应用场景
  • 适合初学者及有一定基础的人士阅读

PWhiddy/PokemonRedExperiments

Github Repo StarsLicense: `MIT`Language: `Unknown`

demo-picture-of-PokemonRedExperiments

这个项目是一个使用强化学习训练智能体玩宝可梦红色版的开源项目。

  • 可以通过调整 ep_length 变量来增加游戏运行时间
  • 通过编辑 agent_enabled.txt 可以暂停 AI 在游戏中的输入
  • 提供了用于跟踪训练进度和比较不同运行结果的 notebook 工具

williamyang1991/Rerender_A_Video

Github Repo StarsLicense: `NOASSERTION`Language: `Unknown`

demo-picture-of-Rerender_A_Video

Rerender_A_Video 是一个官方的 PyTorch 实现,用于零样本文本引导视频到视频翻译。

  • Temporal consistency: 通过跨帧约束实现低级别时间一致性。
  • Zero-shot: 无需训练或微调。
  • Flexibility: 兼容各种模型(如 ControlNet、LoRA)以进行定制化翻译。

NVlabs/neuralangelo

Github Repo StarsLicense: `NOASSERTION`Language: `Unknown`

demo-picture-of-neuralangelo

Neuralangelo 是官方实现的 “Neuralangelo: 高保真神经表面重建”(CVPR 2023)。

  • 提供高保真神经表面重建功能
  • 基于 Imaginaire 库构建
  • 支持 Docker 环境和 conda 环境安装
  • 可通过命令行控制配置参数和日志记录功能