2024-12-05
起来!别让自己退化成了一条下贱的爬虫。——艾米莉·勃朗特《呼啸山庄》
github:
https://github.com/k2-fsa/sherpa-onnx
文档:
sherpa-onnx — sherpa 1.3 documentation
介绍
使用下一代 Kaldi 和 onnxruntime 进行语音转文本、文本转语音、说话人分类和 VAD,无需互联网连接。支持嵌入式系统、Android、iOS、Raspberry Pi、RISC-V、x86_64 服务器、websocket 服务器/客户端、C/C++、Python、Kotlin、C#、Go、NodeJS、Java、Swift、Dart、JavaScript、Flutter、Object Pascal、拉撒路,鲁斯特
该存储库支持在本地运行以下功能
- 语音转文本(即 ASR);支持流式传输和非流式传输
- 文本转语音(即 TTS)
- 说话人分类
- 说话人识别
- 说话人验证
- 口语识别
- 音频标记
- VAD(例如silero-vad )
- 关键词发现
在以下平台和操作系统上:
- x86、
x86_64
位 ARM、64 位 ARM(arm64、aarch64)、RISC-V(riscv64) - Linux、macOS、Windows、openKylin
- 安卓、WearOS
- iOS系统
- 鸿蒙操作系统
- NodeJS
- 网络组装
- 树莓派
- RV1126
- 荔枝Pi4A
- 愿景五2
- 旭日X3派
- 爱芯派
- etc
使用以下 API
- C++、C、Python、Go、
C#
- Java、Kotlin、JavaScript
- 斯威夫特、铁锈
- Dart、对象帕斯卡
Huggingface 空间的链接
您可以访问以下 Huggingface 空间来尝试 sherpa-onnx,而无需安装任何东西。您所需要的只是一个浏览器。
预构建 Android APK 的链接
您可以在下表中找到此存储库的预构建 Android APK
预构建 Flutter APP 的链接
预建 Lazarus APP 的链接
预训练模型的链接
一些预训练的 ASR 模型(流式传输)
一些预训练的 ASR 模型(非流式传输)
有用的链接
- 文档: sherpa-onnx — sherpa 1.3 documentation
- Bilibili 演示视频: 新一代Kaldi-哔哩哔哩_bilibili
如何联系我们
请参阅 Social groups — sherpa 1.3 documentation 适用于新一代 Kaldi微信交流群和QQ 交流群。
使用 sherpa-onnx 的项目
语音API
基于FastAPI的流式ASR和TTS
腾讯会议摸鱼工具 TMSpeech
使用 C# 中的流式 ASR 和图形用户界面。
Video demo in Chinese: 【开源】Windows实时字幕软件(网课/开会必备)
lol互动助手
它使用 sherpa-onnx 的 JavaScript API 以及Electron
Video demo in Chinese: 爆了!炫神教你开打字挂!真正影响胜率的英雄联盟工具!英雄联盟的最后一块拼图!和游戏中的每个人无障碍沟通!