(比什凯克,2025年11月3日,卡巴尔通讯社)吉尔吉斯斯坦正式发布首个可传达情感语调的吉尔吉斯语语音合成模型。
据高新技术园消息,该模型由 Nineninesix 与 “阿克勒艾(Акылай)”项目团队联合开发,目前已向公众开放测试,可应用于私营及公共部门的各类科技产品。
该模型能够生成具备语调变化和情感色彩的自然语音,标志着吉尔吉斯语在数字化语音技术领域迈出重要一步,为本地化语音服务、智能助理及教育类应用的诞生奠定基础。
模型的主要功能与应用场景:
- 在产品与原型中使用开源的吉尔吉斯语语音引擎;
- 建立吉尔吉斯语语音客服和智能语音助理系统;
- 开发自适应学习系统与教育内容朗读功能;
- 提升数字环境对特殊群体用户的可访问性;
- 用于吉尔吉斯语内容的语音播报与本地化制作。
这一创新将形成完整的吉尔吉斯语语音技术生态链,扩大该语言在数字产品中的使用范围。
模型支持实时语音生成,可在普通显卡上运行。以消费级显卡测试结果为例:
- 在 RTX 3060 上接近实时(约0.5倍速);
- 在 RTX 4080 上可实现更快速度(约0.2倍速)。
开发团队指出,该系统经过优化,可在中低端设备上运行,显著降低技术门槛。
项目负责人表示,开放的 Kani TTS 生态系统将加速吉尔吉斯语语音服务的发展——从政府部门的语音交互界面到本地企业的定制化语言解决方案,都将因此受益。
项目团队:
- 开发者: 乌兰别克·阿卜杜拉扎科夫、杰尼斯·帕夫洛夫、努尔苏尔坦·巴卡绍夫。
- 项目支持: 吉尔吉斯共和国高新技术园。
🔗 在线测试模型:https://huggingface.co/spaces/nineninesix/KaniTTS-Kyrgyz
⬇️ 下载模型:https://huggingface.co/nineninesix/kani-tts-400m-ky