为什么视频语音识别成文字文字的时候老是出现服务器有点忙

腾讯现在在内测6.0空间 所以系统有時候会有点问题

你对这个回答的评价是

此文首发于我的Jekyll博客:

应该在暑期的时候就有这个想法想把录音转文字,语音转文字甚至是视频转文字

因为有些时候有大段的音频内容,但我只需要其中的几分钟從头开始播放感觉太浪费时间了。

网上有很多收费的解决方案软件比如讯飞就做的不错,安卓端的APP用起来也很方便就是贵了点。

然后峩看到了这个知乎问题:

下面按识别准确率和易用性来排序各个软件

网易见外工作台(推荐)

每天可以免费使用2小时,支持视频翻译语音翻译,语音转写图片翻译,文档翻译

上传录音后等待几分钟,识别结果出来

中文的识别准确率不错:

反正我虽然说我我的转变过程吧,我当时这样的就是因为我在找工作我在研一研二下个月上半学期的时候要找工作,所以我要去频繁的刷这个算法因为我那时候发現我要找的是外企吗?外企的那个侧重角度更偏向于算法数据结构还有一些的系统设计。在当时我的那个项目经历还不是很丰富的时候你要想给面试官一个眼前一亮或者是印象深刻的一个想法的话,其实算法是一个比较性价比高点的事情

优点:网页版直接使用,无需編程基础识别准确率非常高

缺点:每天限制使用2小时

有人推荐Chrome插件:

不用注册,在线实时声音转文字

试了一下,对中文的实时识别效果不错:

要找工作,所以我要去平凡的策略算法.因为我那时候发现我要找的是外企吗,买气的那个特种角度更偏向于算法数据结构一些的系统設计.在当时我的那个项目经历还不是很丰富的时候,你要想给面试官一个眼前一亮或者印象深刻的一个想法的话,其实算法是一个比较轻价比高的一个事情

优点:直接使用,支持实时语音对会议记录的帮助很大,准确性高

有人推荐这个库: 但这个库的原作者一年前就不维護这个库了,现在由一个国人维护:

对中文的识别效果并不好:

反正 我 涮 肉 我 我的 转 亮果厂 吧 ,我 当时 这样的 就是 因为 我的 找工作 我 再 延期 伱 而 下的 上面 学习 的 首要 找工作 索要 去 平方米 川 流 ,你 没有 那时候 发现 我要 找 的 是 外企 吗 ,那个 特种 较多 ,更 偏向 与 结构 ,写 的 系统 设计 ,在 当时 我嘚 那个 项目 经理 还不是 很 丰富 的 时候 ,你 要想 给 面食 馆 一个 眼前 一 亮 或者 印象 深刻 的一个 想法 的话 其实 上海 是一个 比较 性价比 高的 的 事情

IBM和穀歌的接口效果不好的原因是他们把音频切为一段一段进行识别,并不会根据上下文来调整文字准确性自然低。

如果不加@符号会报错:

如果文件大小超过100M会报错:

我要回帖

更多关于 视频语音识别成文字 的文章

 

随机推荐