科大讯飞的录音笔,是黑科技or智商税?

2021-08-02 16:18:23     来源:星空财富

作者:星空财富

现在我可怕别人和我提人工智能了。

因为一般人工智能的产品,到我手里就是人工智障。比如,我家的人工智能扫地机器人,由于它太智障了,已经成了我爸的花盆拖(摊手)。

不过,人工智能在二级市场上还真是蹭热点小能手,有了AI属性不管是定增还是解禁,都不愁没资金眷顾。我的偏见就在于,越是给自己贴上智能标签的,我越想看看这是不是真的智能。这让我对于人工智能一哥科大讯飞(002230),一直抱有一丝疑虑,想去一探究竟。

以前看研报上介绍的最多的就是科大讯飞的语音识别技术,而且在这次对于在线教育行业的整顿中,科大讯飞也成功的参与了教育产业转型升级的浪潮,也让自己的股价涨了不少。但是,众多投资者和我一样,心中一直有一个疑问,明明录音这种功能的实现可以用一个手机APP就可以实现的功能,为何要单独做成一个硬件产品?

这句的潜台词是,难道因为做成硬件可以方便圈钱?

带着这个疑问,本周二(7月20日)我应邀参加了百度百家号与中国科技新闻网联合举办的走进未来公司第一期的活动——走进科大讯飞(002230)。

一、人工智能是个筐,什么场景都能往里装

我理解科大讯飞的核心技术是感知智能(让机器能听会说)和认知智能(让机器会思考),这是软件方面的算法技术,那么,软件和硬件的结合能有多大的想象空间呢?我看研报里更多的是说对于教育培训体系的应用。这次来到科大讯飞的人工智能体验中心,我看到了语音识别技术的场景有如此广泛。

其中有3个场景很打动我:

1. 人工智能主播小晴。这位主播看上去仿佛一位活生生的央视新闻主持人,她可以同时用多国语言播报新闻。现场听上去完全没有违和感,就和活生生的主播说话别无两样;

2. 人工智能课堂。从毕业后不知道多少年都没再坐到教室里了。这次在科大讯飞的智能课堂,我像小学生一样坐在座椅上,看到智能课堂可以根据学生对于知识的掌握情况而出题,不需要学生做大量的题海战术,依旧能有针对性的提升学习成绩,这点还是对于现在的教育改革和减负很有必要的。另外还可以辅助老师批改试卷,特别是自动读作文并且评分,也减轻了教师的工作负担;

3. OCR技术赋能的文秘神器。我们看到屏幕中扫描文件,可以被科大讯飞的神器通过图像扫描,识别图像中的信息,并把信息数据库中进行匹配,找到相关联的其他数据。最神奇的是,可以把这些案例在电脑显示的地图上标注出来。这对于我们平时的调研工作,和一般的文秘工作减少了不少重复性劳动。说明机器真的会认知智能,也就是可以和人一样思考问题。

此外,还有一些我之前就比较能想得到的。

1. 医生看病。把一些常见病通过OCR识别技术先做初步筛查和诊断;

2. 智能音箱操纵家里的窗帘、家电等,这属于智能家居场景。不过市面上的智能音箱比较多,这点我觉得不能算是科大讯飞的特色;

3. 录音笔用在大学讲堂、会议。这种在20年前就有,讯飞的产品有个可以翻转的屏幕,可以一边听英语,一边看汉语翻译,使用上我认为更多的是硬件的设计改观。

其他的功能,比如87种语言同步翻译,这属于词库和算法的优化就不再次赘述。

二、可以戴在手上的录音笔,用处大吗?

与科大讯飞的企业放进行交流。在这之前,发给了每个人一块腕式录音笔。

这东西我乍一看比较像智能手表,但实际上他是一款录音笔。通过下载讯飞极智APP可以和该设备进行关联,实现一边开会一边录音并转录成文字,实现上传云端,并且能翻译成多国语言。我当场测试了一下,我觉得有三点比较神奇:

1. 可以自动对语序进行纠错。在口语交流的场景中,我们难免会出现语序颠倒等问题,这个设备都可以纠正;

2. 可以识别方言。我特别用天津话试了一些,还算是翻译的比较流畅;

3. 可以把一些口语中的停顿语,比如嗯、啊之类的词语做优化。在形成文本的时候把这些词直接就删除了,方便编辑。

这些是基于我现场做的5次测试的结果,此外,我觉得这个产品还有一些可以改进的地方:

1. 在说汉语的同时,夹杂一些专业用语转录的不准确。比如,现场说道的OCR,在录音的时候被识别为“区块链”,显然是不正确的(腕式录音笔适合近场录音,高阶产品不会有这种情况)。科大讯飞的杨猛经理当时告诉我们,这算是语义翻译最难的地方,这里他们应用了卷积神经网络技术,这种技术实际是人工智能里比较高级的算法,能够像人类一样的辨识语言。不过目前我目测这个技术还有提升的空间;

2. 可以转录的时长。我现场看能录5分钟就要重新按一下按键。很多场景5分钟的显示略显不足(据企业方介绍转录在后台仍然进行,只是APP只能显示5分钟);

3. 导入云端后有存储空间限制,也就是类似于icloud,需要续费买空间。这点也不能说是问题,可能是增加用户粘性的一种方式。

三、语音识别到底有多硬核?是智商税吗?

回到本文开头我的那个疑问,明明录音这种功能的实现可以用一个手机APP就可以实现的功能,为何要单独做成一个硬件产品?

这个问题在交流的时候,科大讯飞副总裁李传刚介绍到,因为一般的手机录音软件只是针对近场录音,但专业的录音需要远场录音手机无法实现准确识别转录并且做降噪处理。比如15米这种常见的会议场景,会有不同人发言,可能会有争辩,这时对于秘书、律师等一些专业人员提升工作效率,还是直接用这样的硬件会比较好。

说到底,手机下载一个录音软件,受手机本身的麦克风设计的局限,就不可能和专业的录音笔去比。专业的录音笔会用麦克风阵列,讯飞这边一般是8麦,相互纠音,所以才能提高录音笔的正确率。

当被问及海外市场情况时,李传刚副总裁还介绍到,科大讯飞已经进入日本市场,未来在全球还有4倍的增长空间。目前是400万台,未来全球市场有2000万台的需求。看来这块蛋糕真是又大又圆。

这次科大讯飞一行,对我之前的认知算是一次刷新。不能说人工智能就是一个噱头,它是在发展中的技术。目前录音笔和其他产品确实对我们的生活和工作能起到一定。科大讯飞参会人员介绍目前50%的市场占有率还是不够的,希望两年内能成为全球录音笔市场第一品牌。

我也希望以后吐槽人工智能智障的会越来越少。语音翻译和录音的需求是存在的,公司能否在业绩上一个台阶,最核心的是占领市场的速度,毕竟现在不是大的吃小的,而是快的吃慢的。

以后的产品要是能把那些专业词汇都智能识别,相信会更好的提升效率。

#走进未来公司#


科技新闻传播、科技知识普及 - 中国科技新闻网
关注微信公众号(kjxw001)及微博(中国科技新闻网)
微信公众号
微博

免责声明

中国科技新闻网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。


推荐阅读
已加载全部内容
点击加载更多