语音交互在近年已经慢慢成熟,技术门槛不算太高,但做得出彩依然需要一定的硬实力。相比国内,国外在语音交互应用上起步更早,而且已经诞生了近千万销量的消费级AI产品。 下面介绍一种非常高性价比的方案: 相信各家智能音箱产品着力致力于改善产品“形象”,改善用户体验,如实现唤醒功能、远场景语音交互;这时可以在芯片模块上增加一个叫psram(如:IPS3204J-SQ-SPN)的器件,其目的之一就是要增加语音buffer,而且价格非常便宜,但是对于改善用户体验效果相当棒,让音箱产品整个的场景应用与音质都不再”low",性价比非常之高!! 在搭配psram的基础上,负载智能音箱各种产品场景语音交互应用功能,保证交互音质顺畅,如:实现智能音箱往往需要借助各平台的优势,结合内容商,给智能音箱赋以“灵魂”,最终着力打造几款智能音箱的高频应用(如:快递//租车/外卖/以及其他O2O服务等),让智能音箱丰富场景落地、实现有市场竞争力的方案; 同时,设计上增加PSRAM,也为增加产品功能,比如增加新的协议支持(如DLNA,当然还有其它的),增加产品的可扩展性,提供了灵活可扩展性基础; 可能有些大牛会怀疑psram(如:IPS3204J-SQ-SPN)这个器件是否能兼容一些芯片,I/O脚是否足够?那么,下面就给大家浅谈一下,psram再兼容方面其实完全不会是问题; 1/某些芯片公司是用GPIO来模拟SQPI PSRAM接口的,所以即使psram 32Mb时序上有些特别,兼容上也完全没有问题; 2/其实某些芯片自身会带有codec,但如果用于实现智能音箱的一些功能,如:唤醒功能,则能力和架构不够;使用psram则能解决该问题; 3/PSRAM和某些其他外设,是可以共享接口的。因为PSRAM带有片选功能,同一接口上连接不同外部芯片时,片选可以选择存取那个器件。这就是IO口的复用; 不得不承认,基于屏幕的交互模式已经被发掘得七七八八,而原本被寄予厚望的VR、AR和MR都出现了青黄不接的问题,革新人机交互的重任毫无疑问地落到了语音交互的肩膀上。而智能音箱是个很好的载体和交互中心;关于进一步如何在技术上优化方案与成本,在技术上实现技术壁垒;或者丰富智能音箱的场景应用,在市场上实现市场壁垒;欢迎进一步讨论:(QQ,1103826850) |