
前天测试自己编写的USB驱动程序时候发现从主机到STM32的OUT传输(主机到设备)速率竟然只有最高33KB/S,实在是晕死了。经过研究后发现是驱动程序中设置的PIPE MaxTransferSize参数的关系,原先设置64只能33KB/S,后参考其他USB设备驱动程序的值,设置成了65535,再测试USB OUT的速度,达到了500KB/S,终于解决了驱动程序的瓶颈。不过算下USB 2.0全速的通讯速率是12Mb/S,排除掉CRC、令牌、SOF等等开销怎么也应该不止最大500KB/S啊。到网上看了看,基本上应该能达到600KB/S~700KB/S以上,我现在的速度应该还有很大的提升才是。 9 @! X0 ^+ t1 r- \3 x0 \' _! A 7 V7 E& C6 B( O* j 看看程序,发现 void EP3_OUT_Callback(void)//EP3 OUT的回调函数,当EP3接收到数据时候中断调用该函数 . W2 W2 z: p: x" e5 j5 Y { count_out = GetEPRxCount(ENDP3);//获得接收到的数据长度 , ]* Y* x0 o+ C" z PMAToUserBufferCopy(buffer_out, ENDP3_RXADDR, count_out);//将数据从USB EP3 RX的缓冲区拷贝到用户指定的数组中 SetEPRxValid(ENDP3); //完成拷贝后置有效状态,从而EP3发送ACK主机可以进行下一个数据包的发送 ) f/ I: r* X$ ?. D2 i; q } 7 [) b" l* g# S0 ` 试着将PMAToUserBufferCopy这句注释掉(这样STM32就不处理接收到的数据了)后再测试速度,惊奇地发现速度竟然达到了997KB/S!晚上仔细想了想,数据肯定是要使用的,这个数据拷贝的过程的时间消费总是少不了的;由于通常情况下USB设备BULK数据接收的步骤就是:接收到数据,置NAK->将缓冲区数据拷贝到用户区(用户处理过程)->发ACK通知主机完成了完整的接收可以发送下一个->主机发送下一个,按照以上的步骤USB接收一步步的进行,只要STM32不完成数据处理,状态就一直是NAK,主机就会不停地发送该数据包,浪费了带宽,因此就会导致我上面最大速度500KB/S难以再增加的情况!不甘心啊~~3 g7 `6 J" Z' [+ n0 Q' | 昨天晚上又仔细研究了STM32的技术参考手册的USB章节内容,里面提到BULK可以采用双缓冲机制(PING-PONG)进行处理,正好可以解决上面的情况。双缓冲机制的原理就是分配2块接收缓冲,STM32的用户处理和USB接口可以分别交替占用2个缓冲区,当USB端点接收数据写其中一个缓冲区的时候,用户的应用程序可以同时处理另一个缓冲区,这样缓冲区依次交换占有者,只要用户处理程序在USB端点接收的时间片段内完成处理,就能够完全不影响USB的通讯速度!' B, Q; d" T+ O3 l; X 程序部分修改 ) G% q2 C l2 J; Z1 G i0 P. l( J9 B 一、EP3_OUT的设置修改, 6 n8 S$ t' l* \9 t9 } A //ZYP:修改EP3为BULK双缓冲方式------------------------- SetEPType(ENDP3, EP_BULK); SetEPDoubleBuff(ENDP3); SetEPDblBuffAddr(ENDP3, ENDP3_BUF0Addr, ENDP3_BUF1Addr); SetEPDblBuffCount(ENDP3, EP_DBUF_OUT, VIRTUAL_COM_PORT_DATA_SIZE); ClearDTOG_RX(ENDP3); * |" i A* [3 B7 |6 v: h1 h) U ClearDTOG_TX(ENDP3); ToggleDTOG_TX(ENDP3); 3 D+ i7 [' z8 M: X! ^ SetEPRxStatus(ENDP3, EP_RX_VALID); SetEPTxStatus(ENDP3, EP_TX_DIS); ) p4 C f" E% M+ X& U //------------------------------------------------------ 3 ~( A4 C, x3 T! s6 t7 Y# ]9 l# ` - r1 U$ g W* U! v2 o- u1 B 二、EP3_OUT回调函数的修改 8 P9 `: R* F" X8 ?+ x+ p- M7 c void EP3_OUT_Callback(void) ) ~* ^, S1 c) x. q p8 ^; Z { //ZYP:以下是修改成EP3双缓冲OUT后的处理函数 if (GetENDPOINT(ENDP3) & EP_DTOG_TX)//先判断本次接收到的数据是放在哪块缓冲区的 * t/ A. m( x, @* X( i( X& w5 u2 z { T! I0 r0 u( o; U$ g/ t0 @ FreeUserBuffer(ENDP3, EP_DBUF_OUT); //先释放用户对缓冲区的占有,这样的话USB的下一个接收过程可以立刻进行,同时用户并行进行下面处理 w' Z) [& G! l c count_out = GetEPDblBuf0Count(ENDP3);//读取接收到的字节数 PMAToUserBufferCopy(buffer_out, ENDP3_BUF0Addr, count_out); } else { FreeUserBuffer(ENDP3, EP_DBUF_OUT); 8 A' _% q$ V( V a! L' h8 \8 L count_out = GetEPDblBuf1Count(ENDP3); 3 d& c4 A' A7 F PMAToUserBufferCopy(buffer_out, ENDP3_BUF1Addr, count_out); } * V- o; f' ~% m0 N* h) `1 X; X" i } ; o5 x' S2 x2 b9 S 经过上面的修改,终于解决了STM32在处理接收数据时导致主机等待的情况,用BUS HOUND软件测试了下 / Z2 v$ N$ V: B, |& N 哈哈,这下终于爽了。 , e- r: t! L% X- e' {8 G, l PS:上面的FreeUserBuffer(ENDP3, EP_DBUF_OUT); 这句话的上下位置是关键,如果放到函数的后面,则仍旧会有主机等待STM32处理数据的情况,速度仍然是500KB/S! 把这句话放在拷贝函数的前面的话就真正把双缓冲PING-PONG机制用起来了。大致算了下PMAToUserBufferCopy(buffer_out, ENDP3_BUF1Addr, count_out);这句话当count_out为最大值64的时候STM32执行需要302个周期,72MHZ情况下约4.2微秒执行时间,而USB传输按照12Mb/s的线速度传输64字节的数据至少也得40微秒,因此只要PMAToUserBufferCopy的时间不超过40微秒,就不会导致缓冲区竞争的情况。 出处:alien2006 |
最全USB HID开发资料,悉心整理一个月,亲自测试
实战经验 | 选择USBX模块生成USB CDC ACM无PD的项目
STM32 USB HID键盘例程
刘氓兔的杂谈【001】-片上USB 高速PHY
【经验分享】在进行 USB CDC 类开发时,无法发送 64整数倍的数据
【源码】STLINK-V3MINI 高速USB仿真器,成功改刷【高速CMSIS-DAP】
在线直播|无需编写任何代码即可在STM32上实现USB-C Power Delivery
STM32 USB CDC 虚拟多串口
圈圈发布USB图书第二版有感,以及分享一些我学习USB过程...
USB Audio设计与实现
RE:STM32 USB改双缓冲后,STM32的OUT接收速度到了1MB/S!
{, e+ `* h9 R P: L. T4 A- l
}
RE:STM32 USB改双缓冲后,STM32的OUT接收速度到了1MB/S!
回复:STM32 USB改双缓冲后,STM32的OUT接收速度到了1MB/S!
能否再快一些?