起来!别让自己退化成了一条下贱的爬虫。——艾米莉·勃朗特《呼啸山庄》

github:

https://github.com/k2-fsa/sherpa-onnx

文档:

sherpa-onnx — sherpa 1.3 documentation

介绍

使用下一代 Kaldi 和 onnxruntime 进行语音转文本、文本转语音、说话人分类和 VAD,无需互联网连接。支持嵌入式系统、Android、iOS、Raspberry Pi、RISC-V、x86_64 服务器、websocket 服务器/客户端、C/C++、Python、Kotlin、C#、Go、NodeJS、Java、Swift、Dart、JavaScript、Flutter、Object Pascal、拉撒路,鲁斯特

该存储库支持在本地运行以下功能

  • 语音转文本(即 ASR);支持流式传输和非流式传输
  • 文本转语音(即 TTS)
  • 说话人分类
  • 说话人识别
  • 说话人验证
  • 口语识别
  • 音频标记
  • VAD(例如silero-vad )
  • 关键词发现

在以下平台和操作系统上:

使用以下 API

  • C++、C、Python、Go、 C#
  • Java、Kotlin、JavaScript
  • 斯威夫特、铁锈
  • Dart、对象帕斯卡

Huggingface 空间的链接

您可以访问以下 Huggingface 空间来尝试 sherpa-onnx,而无需安装任何东西。您所需要的只是一个浏览器。

预构建 Android APK 的链接

您可以在下表中找到此存储库的预构建 Android APK

预构建 Flutter APP 的链接

预建 Lazarus APP 的链接

预训练模型的链接

一些预训练的 ASR 模型(流式传输)

一些预训练的 ASR 模型(非流式传输)

有用的链接

如何联系我们

请参阅 Social groups — sherpa 1.3 documentation 适用于新一代 Kaldi微信交流群QQ 交流群

使用 sherpa-onnx 的项目

语音API

基于FastAPI的流式ASR和TTS

腾讯会议摸鱼工具 TMSpeech

使用 C# 中的流式 ASR 和图形用户界面。

Video demo in Chinese: 【开源】Windows实时字幕软件(网课/开会必备)

lol互动助手

它使用 sherpa-onnx 的 JavaScript API 以及Electron

Video demo in Chinese: 爆了!炫神教你开打字挂!真正影响胜率的英雄联盟工具!英雄联盟的最后一块拼图!和游戏中的每个人无障碍沟通!