Назад към всички

aliyun-asr

// Pure Aliyun ASR skill for voice message transcription, supports multiple channels including Feishu

$ git log --oneline --stat

stars:1,933

forks:367

updated:March 4, 2026

SKILL.mdreadonly

SKILL.md Frontmatter

namealiyun-asr

descriptionPure Aliyun ASR skill for voice message transcription, supports multiple channels including Feishu

metadata[object Object]

阿里云语音识别 (Aliyun ASR) 技能

纯语音识别，无语音合成 - 这是一个专门为OpenClaw设计的轻量级阿里云语音识别技能，只做一件事：将语音消息转换为文本。

🎯 核心功能

✅ 纯ASR识别: 只进行语音到文本的转换，不生成任何语音回复
✅ 多通道支持: 支持飞书(Feishu)、Telegram、WhatsApp等所有OpenClaw支持的语音消息通道
✅ 自动集成: 无需额外配置，语音消息自动被识别并作为文本消息处理

⚙️ 快速配置

1. 阿里云准备

开通智能语音交互(NLS) 服务
在RAM控制台创建子用户并分配 AliyunNLSFullAccess 权限
在NLS控制台创建应用，获取 AppKey

2. 配置文件

创建配置文件 /root/.openclaw/aliyun-asr-config.json:

{
  "access_key_id": "your-access-key-id",
  "access_key_secret": "your-access-key-secret",
  "app_key": "your-app-key",
  "region": "cn-shanghai"
}

3. 安全设置

chmod 600 /root/.openclaw/aliyun-asr-config.json

🚀 使用方法

自动模式（推荐）

用户向任何支持的通道发送语音消息
OpenClaw自动调用此技能识别语音内容
识别的文本作为用户消息传递给AI
AI生成纯文本回复（不是语音）

🔧 技术细节

依赖: requests (Python包)
支持格式: MP3, WAV, OGG, FLAC, AMR, OPUS
API区域: 默认 cn-shanghai（可配置）

🛡️ 安全与合规

无数据存储: 语音数据不存储在本地
最小权限: 使用RAM子账号，避免主账号密钥
配置分离: 敏感信息与代码完全分离

💡 开发规范

此技能严格遵循以下开发准则：

✅ 完全符合开源skills的配置要求
✅ 完全符合当地的法律法规要求
✅ 未开发或未实现的功能，不包含在源码中
✅ 本地测试代码，测试用例不包含在源码中
✅ 密钥/认证隐私信息，不包含在源代码中