32B1H的DSP算力测试与困惑
-
major 在 32B1H的DSP算力测试与困惑 中说:
另外cm7和cm4的dsp模块是一样的,算力表现只和频率有关,cm7对比cm4 cpu算力和dsp对比是有差异的
早先用nxp的rt1021的时候也是测过的。400M主频,放TCM跑,也就2000ms的样子
-
Frankie 在 32B1H的DSP算力测试与困惑 中说:
yxydoctor 分享一下你的这个测试工程,我们来看一下?
uint32 precise_us_time(uint8 mode) { static uint32 count[2]; uint32 temp=0; switch(mode){ case 0: // 开始 count[0] = Gpt_GetTimeElapsed(0); break; case 1: // 停止 count[1] = Gpt_GetTimeElapsed(0); if(count[1] >=count[0]) temp =count[1]-count[0]; else temp = 0xffffffff-(count[0]-count[1]-1); temp = temp/50; // 1us(clk=50M) break; default:break; } return(temp); } #define DTCM_VAR __attribute__((section(".dtcm_data"))) #define ITCM_VAR __attribute__((section(".ramcode"))) uint32 precise_us_time(uint8 mode); uint32_t test_led_count[2]={0}; //DTCM_VAR float32_t DspResult=0.0f; //ITCM_VAR void App_Led1(ULONG thread_input) { uint32 i; while (1){ test_led_count[0]++; Dio_FlipChannel(DioConf_DioChannel_D17_PTE16); /* toggle D17 */ // dsp测试 1.54698824 precise_us_time(0); for(i=0;i<10000;i++){ DspResult = arm_cos_f32(0.678f)+arm_sin_f32(0.876f); } debug_time[0]=precise_us_time(1); tx_thread_sleep(500); } }
-
tcm跑是6800us,否则是5900us。因为tcm会自动屏蔽cache,
所以tcm对提高速度没积极作用,但至少不会更慢才对呀。
定时器是用了一路Gpt -
os心跳是1ms
-
昨天下来我们内部测了一下,
结论:
DSP的性能方面,M7比M4没有50%的提示(COREMARK 不代表DSP性能)
测试:DEVICE Freq Result Comiler S32K344 160M 7191 GCC -O1 YTM32B1HA0 200M 5700 GCC -O1
major 在 32B1H的DSP算力测试与困惑 中说:
另外cm7和cm4的dsp模块是一样的,算力表现只和频率有关,cm7对比cm4 cpu算力和dsp对比是有差异的
-
Frankie 在 32B1H的DSP算力测试与困惑 中说:
Result
请问这个Result是COREMARK分数吗,这个工程能分享一下不。我尝试测试了一下HA的dhrystone。
DMPIS:268 DMIPS/MHZ:1.34
对比S32K3似乎有一些差距,也可能是我dhrystone移植或者优化的问题
下面是我的工程
3df0a944-1258-46fb-b97d-dca604feeaa2-Ptmr_Demo (2).zip
发帖前请查看
帮助没办法联网的电脑使用YCT
帮助改进和优化YT CONFIG TOOL,有机会抽取YTM32B1ME0 EVB哦...