对话启英泰伦创始人:三代产品增图像处理模块,合作美的苏宁海尔
芯潮(ID:aichip001)文 | 韦世玮
芯潮9月20日消息,昨日,AI创企启英泰伦发布2代人工智能语音芯片CI110X系列,以及AI语音平台。目前,CI110X系列芯片的首批Alpha客户已超过100家,订单超过10万件,本地语音标准模块售价为14.99元。
一方面,CI110X系列包含CI1102和CI1103两款芯片,集成自研脑神经网络处理器BNPU,内置ARM Cortex-M4F处理器,最高运行频率为160MHz,可支持远场本地语音识别、单麦回声消除和远场降噪等功能。
另一方面,AI语音平台框架包含在线开发、在线支持、在线资料和开发论坛四大内容,可支持在线SDK定制、语音合成、命令词推荐等功能。
会后,智东西还与启英泰伦创始人、董事长兼CTO何云鹏展开了一场独家对话,就启英泰伦目前的核心技术、业务以及对公司未来的规划进行深度探讨。同时,他还透露,启英泰伦已经开始研发拥有图像处理技术的下一代AI芯片。
启英泰伦自2015年成立以来,一直专注开发AI设备端语音芯片和AI算法研究。其在2016年推出的人工智能语音识别芯片CI1006,已于2017年1月实现量产。作为全球首款DNN处理器内核人工智能语音芯片,它拥有高NN算力、高识别率、远距识别、快速响应和超低功耗等特性。
发展至今,启英泰伦已拥有包括BNPU处理器在内的50多项应用专利,其AI语音识别芯片已经和美的、苏宁和海尔等企业达成合作,而客户也主要遍布于华东与华南地区。
一、CI110X:升级至BNPU v2,功耗下降66%
自2016年成功研发本地中文语音训练引擎以来,启英泰伦在算法方面不断加速,至今已研发麦克风阵列算法、声纹识别、本地命令词自学习算法,并于今年3月上线了TTS(语音合成服务系统)。
和不断向上发展的算法不同的是,启英泰伦的产品成本近年来不断降低。其产品成本从2016年AP方案的200人民币,下降到了去年CI1002单mic方案的35人民币。
这家同时集AI芯片、算法、大数据和应用为一体的全技术链企业,它的产品应用已覆盖至家具、家电、照明、音箱和玩具等多个智能家居场景。
不难看出,在追求性价比这件事上,启英泰伦下了很大功夫。也正如何云鹏所说:“更多智能、更低功耗、更低成本,是我们持续努力的三个目标。”
而今天启英泰伦所发布的2代人工智能语音芯片CI110X系列,相比第一代产品,也进一步延续了这一特点。
CI110X系列芯片主要包含CI1102和CI1103两款芯片。总体来说,它比1代CI1006在性能和功耗上都有着较大升级。
性能方面,芯片内置ARM Cortex-M4F处理器,最高运行频率为160MHz,内置512KB SRAM(Static Random-Access Memory,静态随机存取存储器),并新增了语音加速传感器。
同时,它还内置了高性能、低功耗的Audio Codec模块和硬件音频处理模块,能够外接麦克风,实现单芯片远场降噪和回声消除等功能。它还集成UART*3、IIC*1、SPI*2等当前主流的外设接口,可帮助开发者开发低成本的单芯片智能语音离线识别方案。
更重要的是,CI110X系列芯片集成的BNPU也升级到了2代。据何云鹏介绍,BNPV v2与第一代相比,拥有更高的灵活度,不仅可以支持远场本地语音识别和单麦回声消除,还支持语音检测和声纹识别等更多功能。
此外,它还实现了本地+云端无缝识别,在云端扩展更多的应用和内容,并进一步拓展本地词汇语言识别。
与1代AI语音芯片CI1006的100mW至300mW相比,CI110X系列芯片的功耗下降了66%,为35mW至100mW。基于CI110X推出的本地语音标准模块,每套售价仅为14.99人民币。
CI1102和CI1103这两款芯片的区别在于,CI1102支持高性价比的语音识别方案,而CI1103则能在语音识别的基础上拥有更多的算法和智能功能,可利用更多资源进行控制,包括按键、开关、显示屏,甚至是红外信号等控制。
何云鹏还介绍到,CI110X系列除了可应用在智能家居场景外,还进一步拓展到了智慧酒店、智慧汽车、智慧办公和智慧商业这四大领域。
这么看来,启英泰伦的AI芯片布局,无疑正在冲出智能家居领域,向更广泛的AI智能化应用场景进军。
▲启英泰伦创始人、董事长兼CTO何云鹏
二、语音AI平台:4大功能,10分钟即可生成固件
基于当前相关AI语音应用开发难、对开发人员技能要求高等问题,启英泰伦正式推出了语音AI平台,以帮助语音开发者更高效率、更便捷地进行相关语音软件开发。
对此,启英泰伦联合创始人兼总经理高君效则为大家介绍了语音AI平台框架的在线开发、在线支持在线资料以及开发论坛这4大功能。
1、在线开发。主要包含SDK定制、语音固件、语音模型、语音合成和语音测试等功能,不仅支持中英文和可选声学模型,还提供测试标准和自动化测试工具,帮助开发者在10分钟内即可生成可量产固件。
2、在线支持。主要分为命令词推荐和在线QA两个功能,其中命令词推荐拥有数十种常用设备命令词,在线QA能帮助开发者解决软件、硬件和生产等一系列问题。
3、在线资料。主要拥有开发资料、SDK API和应用实例文档,涉及接口说明、程序样例和离在线识别产品应用等多方面信息。
4、开发论坛。该论坛主要分为学术交流、知识库分享和行业信息3个内容,其中知识库包含了专利论文和产品应用等信息。
高君效表示,该语音AI平台是免费向客户开放的,客户只需签署授权使用协议即可获取帐号登录平台,而目前也已有部分客户开始使用。
实际上,启英泰伦推出的语音AI平台,也进一步降低了产品智能化的开发和成本门槛,帮助终端设备的开发者能更高效、更低成本地实现智能化。
▲启英泰伦联合创始人兼总经理高君效
复杂的应用场景、个性化的用户需求、高门槛的技术开发,这些都是启英泰伦在产品研发过程中需要不断突破的难点。
此外,当前市场的语音软件方案开发主要有两套模式。在云端,开发人员在获取SDK后,才能获取网络接口,接着需调用接口开发代码并进行调试,才可生成产品方案。另外在本地,开发者亦要在获取SDK后才能获取声学及语音模型,进行集成应用代码并调试后,才可输出产品方案。
但面对这些,就需要开发者们需要具备一定的技术能力,例如相关软件代码的开发和调试,理解语音识别原理,还需拥有相关的产品开发经验。
而这,也是启英泰伦推出语音AI平台希望能解决的问题。
三、何云鹏:第三代将加入图像处理模块,打通更多场景
“情怀”,这是智东西在与何云鹏在对话过程中,感触最深的一个词。
毕业于电子科技大学微电子专业的他,还拥有中科院半导体物理与半导体器件物理硕士、新加坡国立大学电子工程硕士的学术背景,以及新加坡和美国的工作经历。2001年回国后,他还曾担任海信信芯技术副总裁和长虹IC部门总经理。
值得一提的是,在2004年,他还和团队共同研发了国内第一款高清晰高画质数字视频媒体处理芯片——海信“信芯”(hiview)。
直到2015年,看到家电行业存在着语音交互技术缺口,以及深度神经网络发展风口的何云鹏,毅然选择辞职创业,成立启英泰伦。而公司总部,就位于他的家乡——成都。
“一半是出于情怀。”提及在成都创立启英泰伦的缘由,何云鹏感慨道。
发展至今,启英泰伦在成都的总部已拥有90多名员工,其中研发团队就占了70多人。公司研发团队主要由芯片、算法和应用开发三个部门组成,而芯片和算法两部门打破边界地合作,使得算法技术和芯片研发之间能更加深度地耦合,进一步缩短产品的研发周期。
和产品方案售价一样“省”的,是启英泰伦的研发成本。何云鹏表示,近几年来,公司的研发投入约为5000多万,在整个行业来说处于较低的水平。
4年投入研发5000多万,除了做芯片、算法,还要做大数据,这可行么?启英泰伦用专利数量来告诉你答案。
截至目前,该公司除了核心的BNPU外,还拥有自研的语音处理、语音检测、语音降噪、语音识别和声纹识别等超50项应用专利。
▲启英泰伦在发布会产品体验区展示的机器狗
不可否认,启英泰伦在产品研发上进行了精心地规划。
若说之前,他们产品的主要应用场景是在智能家居领域。而这一次CI110X系列的发布,则是启英泰伦开始将产品布局探入智能汽车和机器人领域的一次尝试。
那么,未来的第三代产品将会是什么呢?何云鹏向智东西爆料,启英泰伦的第三代产品将会加入图像处理模块,进一步打开智能家居外的其他市场,深入智能汽车和机器人领域,并在行业层面也会有所介入。
这并不是纸上谈兵。智东西了解到,启英泰伦的下一代芯片已经在规划图像处理能力,并且在汽车和机器人方面也有专门的布局规划,技术方案和产品方案也已成型。与此同时,整个研发团队已启动半年多。
“从语音方面来说,我们以前主要是使用语音识别,现在不仅加入了声纹识别和声音的多模式化等功能,在未来也将采用更多信号,例如图像和其他传感信号,让我们的AI芯片拥有更多模块。”何云鹏表示。
从间接控制到WiFi模块控制,从语音控制再到内置AI芯片控制,传统家电的智能化一步步走过了这些发展路径。那么,传统家电智能化的下一个突破口将会在哪里?
在何云鹏看来,如今智能家居的应用是多样化的,对家电来说,有些家电并不需要承载内容和应用服务,它们只需像本地识别一样的简单功能即可满足人们需求。此外,还有部分家电场景则需要将本地和云端的功能一并收入囊中。
因此,他认为传统家电智能化的下一步发展则会将这两部分应用越来越多地整合起来。
“未来3到5年的发展我们已经看到了,但看到仅是其中的一半,剩下的一半还需要我们脚踏实地去做出来,至于如何做,那就等未来我们再一一为大家揭晓。”他神秘地笑着说。
▲本文记者与何云鹏合影
结语:AI芯片“落地战”,智能语音芯片面临挑战
从传统家电行业饱和,再到如今传统家电智能化转型的爆发,启英泰伦无疑抓住了当下最为火热的风口之一。
与此同时,人机协同在智能语音方面所面临的应用场景复杂、语言语音差异性大和低成本、低功耗和高性能等方面的技术需求,也给像启英泰伦等国内的AI智能语音芯片创企带来了诸多挑战。
如今,当各家AI芯片创企在打“落地战”的同时,也有学者认为行业即将开始面临洗牌。在未来,谁能真正地出线成为优胜者?时间会告诉我们答案。
评论