Hacker News 音频技术 - 2025-06-25
1. 我用8200万参数神经网络模型打造本地TTS插件——土豆级设备也能运行
作者: pinguy | 发布于: 2025-06-21 13:05
2. Kyutai STT——专为实时使用优化的语音转文本工具
作者: ajuhasz | 发布于: 2025-06-19 21:12
3. Show HN:简易文本转语音辅助沟通应用
开发者分享了一个近期完成的项目,已进入可分享状态,并表示开发过程充满乐趣。
作者: SubzeroCarnage | 发布于: 2025-06-18 16:45
4. Chatterbox AI:实时语音克隆与文本转语音生成器
作者: gregzeng95 | 发布于: 2025-06-18 09:41
5. 语音合成工具Chatterbox
作者: pinter69 | 发布于: 2025-06-11 20:23
6. Speaches:基于faster-whisper的TTS/STT模型本地API服务器
作者: rob | 发布于: 2025-06-11 14:14
7. ChatterBox TTS 命令行工具
作者: init0 | 发布于: 2025-06-09 23:39
8. Show HN:我开发了一个基于OpenAI的文本转语音平台
作者: egretfx | 发布于: 2025-06-09 08:35
9. Chatterbox TTS 命令行工具
作者: init0 | 发布于: 2025-06-09 06:32
10. Bland.ai 文本转语音引擎
作者: kaonwarb | 发布于: 2025-06-04 20:25
11. Chatterbox TTS - 免费高级文本转语音AI
作者: MxcAlex | 发布于: 2025-06-03 17:00
12. Show HN: Bolna AI – 开源语音AI代理,支持可插拔LLM、TTS和ASR
Bolna是一个开源平台,帮助开发者快速构建端到端语音对话代理,支持自定义LLM、电话系统、转录模型和语音合成工具。
作者: xan_ps007 | 发布于: 2025-06-03 11:25
13. Show HN: Chatterbox-TTS-Server——开源TTS新模型的简易网页界面
开发了Chatterbox TTS的封装工具,支持长文本自动分块、网页界面语音克隆,提供Web UI和API接口,使该TTS模型更易用于实际应用。
作者: devnen | 发布于: 2025-05-31 17:02
14. Chatterbox:Resemble AI推出的生产级开源TTS模型
作者: maxloh | 发布于: 2025-05-31 13:26
15. 打破语言壁垒——迈向生产级印地语语音识别的关键一步
作者: renus | 发布于: 2025-05-29 16:00
16. Chatterbox——开源文本转语音模型
作者: vyrotek | 发布于: 2025-05-28 20:12
17. TTS:文本/PDF/对话转音频转换器
作者: innovatorved | 发布于: 2025-05-26 13:40
18. Show HN: KVoiceWalk – 基于随机游走算法的Kokoro TTS语音克隆系统
开发者探索通过直接操作风格张量为Kokoro语音合成系统创建新声音,开发了结合Resemblyzer相似度评分和音频特征差异的评估机制,使用加权调和均值优化搜索,将相似度从70%提升至90%。
作者: robviren | 发布于: 2025-05-21 15:07
19. 本地微调TTS模型
作者: handfuloflight | 发布于: 2025-05-19 21:14
20. 如何为语音助手选择语音转文字服务提供商?
作者: whoami_nr | 发布于: 2025-05-18 19:22