注:当前项目为 Serverless Devs 应用,由于应用中会存在需要初始化才可运行的变量(例如应用部署地区、函数名等等),所以不推荐直接 Clone 本仓库到本地进行部署或直接复制 s.yaml 使用,强烈推荐通过
s init ${模版名称}
的方法或应用中心进行初始化,详情可参考部署 & 体验 。
音频提取+鉴权
使用该项目,您需要有开通以下服务并拥有对应权限:
服务/业务 | 权限 | 相关文档 |
---|---|---|
函数计算 | AliyunFCFullAccess | 帮助文档 计费文档 |
免责声明:
本项目会将模型下载到NAS,并且使用函数计算的GPU实例,模型的大小会影响文件存储占用以及函数执行时间,需根据情况具验证模型下载及加载所产生的费用。
- 🔥 通过 Serverless 应用中心 , 该应用。
- 通过 Serverless Devs Cli 进行部署:
- 安装 Serverless Devs Cli 开发者工具 ,并进行授权信息配置 ;
- 初始化项目:
s init start-audio-extraction-auth -d start-audio-extraction-auth
- 进入项目,并进行项目部署:
cd start-audio-extraction-auth && s deploy -y
本案例基于阿里云函数计算FC,支持将提取音频中的文件,并进行请求级别鉴权,采用预先设置token方式。
本案例默认使用huggingface中openai/whisper-base模型进行提取,当然你也可以替换该模型,使用huggingface中Automatic Speech Recognition分类下的模型
通过Serverless开发平台使用本案例,您将具备以下优势: 1、自带鉴权功能,支持用户安全访问 2、一键拉起huggingface对应的模型,用户不需要关心模型的下载开箱即用
只支持POST请求
POST /
鉴权:需要再header中添加token, header= {"token":"123456"}
参数 | 类型 | 是否必须 | 描述 |
---|---|---|---|
input | string | 是 | 音频文件链接 |
参数 | 类型 | 描述 |
---|---|---|
data | object | |
data.text | string | 音频内容 |
import requests
import json
url = "http://huggingface-audio-gir1.fcv3.1041759428116431.cn-shanghai.fc.devsapp.net"
headers = {"token":"123456"}
s = json.dumps({
"input": "https://sd-api-demo.oss-cn-beijing.aliyuncs.com/public/1.flac",
})
r = requests.post(url, data=s, headers=headers)
output = r.json()
{
"data": {
"text": "He hoped there would be stew for dinner, turnips and carrots and bruised potatoes and fat mutton pieces to be ladled out in thick, peppered flour-fatten sauce."
}
}
该案例涉及到使用huggingface模型,由于国内网络不同,采用huggingface镜像站模型数据
您如果有关于错误的反馈或者未来的期待,您可以在 Serverless Devs repo Issues 中进行反馈和交流。如果您想要加入我们的讨论组或者了解 FC 组件的最新动态,您可以通过以下渠道进行:
微信公众号:serverless |
微信小助手:xiaojiangwh |
钉钉交流群:33947367 |