本文public自《STM32F765@216MHz输出I2S试验ES9023P音频听感》链接(https://www.stmcu.org.cn/module/forum/thread-619481-1-1.html) 性能:作者的开发板使用STM32F765VIT6@216MHz,开发板使用3225封装的有源晶振提供25MHz(-+20PPM)的HSE,通过PLL倍频到216MHz,实际测试修改倍频参数,可以将内核时钟超频到270MHz不跑飞(测试时间约40分钟,更高频率或更长测试时间未测试过),就MCU界来说性能已经可以傲视群雄了。 , w; b w h- m! t9 v 想法:那么作者有想法了,开发板有Button、LCD和Audio,是不是可以跑一些多媒体,或者做成交互式娱乐设备。看到网上有跑NES游戏的,细看,实质是通过软件模拟上世纪八九十年代的CPU 6502和外围RAM这些,然后在模拟器上跑NES游戏。 关于6502:仔细了解之后,作者对6502的评价是:伟大。在那个时代,它被用在很多场景下,除了Nintendo的FC,还有乔布斯的早期Apple PC、Commodore的主机、拉斯维加斯赌场的老虎机、早期的国产文曲星,甚至天网的T800系列终结者也都搭载这款CPU(开个玩笑)。一款造就了无数优秀的程序员、带给无数人欢乐的CPU,称之为时代巨著当之无愧。8 Q) Y _/ U: {( G5 g ) H3 s# X% g6 D 回到正题:在开源软件发达的今天,本着站在巨人的肩膀上的心态,作者直接网上找来3款模拟器,包括InfoNES、Neil的6502 emulator和网友ye781205的NES。 a. 首先是InfoNES,主要是新建InfoNES_System.c,并在InfoNES_System.c中实现InfoNES_System.h中的接口;然后适当修改硬件相关的文件InfoNES.c、InfoNES.h、K6502_rw.h,其中包括模拟SRAM的内存实现,在堆中分配内存(注意修改Heap Size),还是以指定首地址的野路子。$ R, B' @% b) \+ M8 {6 V ) L: p/ B# a! T0 H2 Y! H0 q8 Y 作者在开发板上跑InfoNES,FPS大致在9左右@216MHz,这就让人不想继续实现音频了,虽然跳2帧勉强能玩,但看着PPT的效果,还是放弃了。 b. 接着是Neil的6502 emulator,这款模拟器不带音频,源码已经是在stm32f1上移植好了的,作者只需要修改到自己的开发板上,在定时中断里面获取按键填充全局数组JoyPad[0](玩家1)和JoyPad[1](玩家2),在PPU.c中实现NES_LCD_DisplayLine()适配LCD填充和拉伸即可。 从U盘读取NES文件到数组rom_file[ROM_FILE_SIZE]里,然后运行nes_main()启动游戏(ROM_FILE_SIZE宏作者修改为200Kbytes,数组rom_file在Rom_files.c中定义,在rom.h中申明为外部变量)。: g; A, b1 [) s$ E" C 作者实测FPS上30@216MHz,但是没有声音,支持的游戏不多,还是不够完美。 : X' P' e* D4 K c. 最后是openedv网友ye781205的NES,这款NES核心采用汇编实现,正点原子进行了完善,效率很高。作者在网上搜来的源码来自正点原子的工程包,工程运行在stm32f1上面。作者不清楚M7是否向下兼容汇编,带着试一试的心态就开干。具体过程包括:$ ~. d6 R- R, h3 y (1) 在nes_main.c中nes_load(char *pname),实现文件打开、f_stat判断文件大小信息并malloc内存空间给romfile、读取文件到romfile里、nes_load_rom()并初始化之后就通过nes_emulate_frame()启动; (2) 在nes_main.c中nes_set_window()适配LCD显示区域; (3) 在nes_main.c中nes_get_gamepadval()实现按键获取填充全局变量PAData0和PAData1,在6502.s中会使用到;- k) z2 W# h0 U# Q (4) 在nes_ppu.c中scanline_draw()做LCD的像素填充和拉伸4 D4 b% ?: u5 u4 C p, A (5) 在nes_main.c中实现nes_apu_fill_buffer()、nes_sound_open()、nes_sound_close()输出音频/ o L& T( E- t4 q; S) c 7 H# M6 G+ x4 i6 G (6) 在nes_apu.h中调整宏,设置音频采样频率,设置最大帧率限制- F; \* {9 f0 j& q" q# P (7) 修改正点原子自定义的内存管理,改为使用编译器提供的malloc,使用SOC内部SRAM,并将启动代码里面Heap_Size调大些。/ g8 l2 u8 I( \2 [, s 音频方面:作者用wavebuf填充发送buffer中的左右声道(左右相同),16-bit,最后通过DMA由I2S1直出ES9023P,DMA设置为循环模式,字节对齐设置为半字(16-bit),实现HAL_I2S_TxCpltCallback()发送完成回调中设置发送完成标志,在nes_apu_fill_buffer()中判断音频buffer是否发送完成,以此来限制模拟器运行最大帧率。 : c, _' K& s, G" U 帧率:作者实测不加帧率限制,优化LCD刷屏,FPS可以上95@216MHz。如果深入底层针对M7的6级双发射超标量流水线进行优化,并使用L1 Cache应该可以获取更高帧率。( |% b& v- Z5 W; q: j$ @! D 作者将FPS限制在60帧,通过U盘读取nes并运行,实际效果如视频:0 A* L- ]4 L9 l, u# F5 r 如果视频无法播放,请复制链接单独查看(https://v.youku.com/v_show/id_XNDA3MzM4NTYwNA==.html?x&sharefrom=android&sharekey=2e0f402405de533ff6c5cfbdcb930c939)6 w0 J) _$ v' H. B Y9 r 4 x" m# C' F7 R2 }: q% M 作者未使用OS,通过CubeMX建立的标准HAL工程,按照惯例,双手奉上,供大家取用: 【附件,工程压缩包】 (工程为.7z压缩包,下载后请删除多余.zip后缀,再解压)
|
汇编浮点库qfplib移植STM32F769I-DISCO开发板与硬件浮点运算性能测试对比
coremark移植到STM32F769I-DISCO开发板的两种方法
【GUI板免费申请活动】【圣诞GUI】使用F746-DISO基于TouchGFX的圣诞树
刘氓兔的杂谈【001】-片上USB 高速PHY
【合集】STM32F7教程、资料大集合
基于STM32F746G-Discover的扩展电路板
F769 Discovery实现播放U盘音乐的播放器
STM32 VS Code Extension (在Ubuntu上开发STM32,ST官方vscode插件使用指南)
基于STM32F7实现ADC软件触发+轮询采集
基于STM32F7进行ADC采集解决更新问题
同感,我也试了InfoNES,画面卡顿感强烈。。。