hacker_news_audio_tech_2025-06-25

Hacker News 音频技术 - 2025-06-25

1. 我用8200万参数神经网络模型打造本地TTS插件——土豆级设备也能运行

作者: pinguy | 发布于: 2025-06-21 13:05


2. Kyutai STT——专为实时使用优化的语音转文本工具

作者: ajuhasz | 发布于: 2025-06-19 21:12


3. Show HN:简易文本转语音辅助沟通应用

开发者分享了一个近期完成的项目,已进入可分享状态,并表示开发过程充满乐趣。

作者: SubzeroCarnage | 发布于: 2025-06-18 16:45


4. Chatterbox AI:实时语音克隆与文本转语音生成器

作者: gregzeng95 | 发布于: 2025-06-18 09:41


5. 语音合成工具Chatterbox

作者: pinter69 | 发布于: 2025-06-11 20:23


6. Speaches:基于faster-whisper的TTS/STT模型本地API服务器

作者: rob | 发布于: 2025-06-11 14:14


7. ChatterBox TTS 命令行工具

作者: init0 | 发布于: 2025-06-09 23:39


8. Show HN:我开发了一个基于OpenAI的文本转语音平台

作者: egretfx | 发布于: 2025-06-09 08:35


9. Chatterbox TTS 命令行工具

作者: init0 | 发布于: 2025-06-09 06:32


10. Bland.ai 文本转语音引擎

作者: kaonwarb | 发布于: 2025-06-04 20:25


11. Chatterbox TTS - 免费高级文本转语音AI

作者: MxcAlex | 发布于: 2025-06-03 17:00


12. Show HN: Bolna AI – 开源语音AI代理,支持可插拔LLM、TTS和ASR

Bolna是一个开源平台,帮助开发者快速构建端到端语音对话代理,支持自定义LLM、电话系统、转录模型和语音合成工具。

作者: xan_ps007 | 发布于: 2025-06-03 11:25


13. Show HN: Chatterbox-TTS-Server——开源TTS新模型的简易网页界面

开发了Chatterbox TTS的封装工具,支持长文本自动分块、网页界面语音克隆,提供Web UI和API接口,使该TTS模型更易用于实际应用。

作者: devnen | 发布于: 2025-05-31 17:02


14. Chatterbox:Resemble AI推出的生产级开源TTS模型

作者: maxloh | 发布于: 2025-05-31 13:26


15. 打破语言壁垒——迈向生产级印地语语音识别的关键一步

作者: renus | 发布于: 2025-05-29 16:00


16. Chatterbox——开源文本转语音模型

作者: vyrotek | 发布于: 2025-05-28 20:12


17. TTS:文本/PDF/对话转音频转换器

作者: innovatorved | 发布于: 2025-05-26 13:40


18. Show HN: KVoiceWalk – 基于随机游走算法的Kokoro TTS语音克隆系统

开发者探索通过直接操作风格张量为Kokoro语音合成系统创建新声音,开发了结合Resemblyzer相似度评分和音频特征差异的评估机制,使用加权调和均值优化搜索,将相似度从70%提升至90%。

作者: robviren | 发布于: 2025-05-21 15:07


19. 本地微调TTS模型

作者: handfuloflight | 发布于: 2025-05-19 21:14


20. 如何为语音助手选择语音转文字服务提供商?

作者: whoami_nr | 发布于: 2025-05-18 19:22