大家好,我是站长可乐,今天给大家推荐的是音频转文本工具——Whisper,Whisper是由OpenAI开发的一个自动语音识别(ASR)开源系统。经过训练,它能够支持多种语言的语音转录,并且可以将这些语言翻译成英文,同时还能够有效地过滤掉背景音和杂音。OpenAI的技术文档介绍了如何基于Whisper模型调用语言转文本API来实现语言转写或将语言翻译成英文的功能。Speech-to-text API 介绍文档https://platform.openai.com/docs/guides/speech-to-text这里我们先在下载好Whisper模型(下载地址请见文末):加载好模型,界面就是这样,请设置识别的语言。我们现在测试下事先录制好的音频文件,名为“小轻论坛公众号测试文件”。我们将输出格式设置为文本格式,并将其输出到文件夹。点击“抄写”按钮进行转换。从结果来看,文本识别效果还是不错的,有同音字属于正常情况。另外它还将我说的引用内容进行了符号引用,文本也进行了换行,这是我没想到的。那我们接下来测试下英文内容,名为“English test document of Xiaoqing
可乐
一个爱折腾的互联网I人