hacker_news_audio_tech_2025-06-25

Hacker News 音频技术 - 2025-06-25

_{作者: pinguy | 发布于: 2025-06-21 13:05}

_{作者: ajuhasz | 发布于: 2025-06-19 21:12}

开发者分享了一个近期完成的项目，已进入可分享状态，并表示开发过程充满乐趣。

_{作者: SubzeroCarnage | 发布于: 2025-06-18 16:45}

_{作者: gregzeng95 | 发布于: 2025-06-18 09:41}

_{作者: pinter69 | 发布于: 2025-06-11 20:23}

_{作者: rob | 发布于: 2025-06-11 14:14}

_{作者: init0 | 发布于: 2025-06-09 23:39}

_{作者: egretfx | 发布于: 2025-06-09 08:35}

_{作者: init0 | 发布于: 2025-06-09 06:32}

_{作者: kaonwarb | 发布于: 2025-06-04 20:25}

_{作者: MxcAlex | 发布于: 2025-06-03 17:00}

Bolna是一个开源平台，帮助开发者快速构建端到端语音对话代理，支持自定义LLM、电话系统、转录模型和语音合成工具。

_{作者: xan_ps007 | 发布于: 2025-06-03 11:25}

开发了Chatterbox TTS的封装工具，支持长文本自动分块、网页界面语音克隆，提供Web UI和API接口，使该TTS模型更易用于实际应用。

_{作者: devnen | 发布于: 2025-05-31 17:02}

_{作者: maxloh | 发布于: 2025-05-31 13:26}

_{作者: renus | 发布于: 2025-05-29 16:00}

_{作者: vyrotek | 发布于: 2025-05-28 20:12}

_{作者: innovatorved | 发布于: 2025-05-26 13:40}

开发者探索通过直接操作风格张量为Kokoro语音合成系统创建新声音，开发了结合Resemblyzer相似度评分和音频特征差异的评估机制，使用加权调和均值优化搜索，将相似度从70%提升至90%。

_{作者: robviren | 发布于: 2025-05-21 15:07}

_{作者: handfuloflight | 发布于: 2025-05-19 21:14}

_{作者: whoami_nr | 发布于: 2025-05-18 19:22}