跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
折叠
品牌标识

YunTu Forum

YTMicro.com
  1. 主页
  2. Discussion & Question
  3. YTM32B1H系列
  4. 32B1H的DSP算力测试与困惑

32B1H的DSP算力测试与困惑

已定时 已固定 已锁定 已移动 YTM32B1H系列
20 帖子 5 发布者 332 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • FrankieF 离线
    FrankieF 离线
    Frankie YunTu
    写于 最后由 编辑
    #7

    yxydoctor 分享一下你的这个测试工程,我们来看一下?

    yxydoctorY 1 条回复 最后回复
    0
    • yxydoctorY 离线
      yxydoctorY 离线
      yxydoctor
      在 回复了 Frankie 最后由 编辑
      #8

      Frankie 在 32B1H的DSP算力测试与困惑 中说:

      yxydoctor 分享一下你的这个测试工程,我们来看一下?

      uint32 precise_us_time(uint8 mode)
      {
      	static uint32 count[2];
          uint32 temp=0;
      	switch(mode){
      		case 0:	// 开始
                  count[0] = Gpt_GetTimeElapsed(0); 
      			break;
      		case 1:	// 停止
                  count[1] =  Gpt_GetTimeElapsed(0);           
                  if(count[1] >=count[0]) temp =count[1]-count[0];
                  else                    temp = 0xffffffff-(count[0]-count[1]-1);  
                  temp = temp/50;                                                             // 1us(clk=50M)  
      			break;
      		default:break;
      	}
      	return(temp);
      }
      
      #define DTCM_VAR __attribute__((section(".dtcm_data")))
      #define ITCM_VAR __attribute__((section(".ramcode")))
      
      uint32 precise_us_time(uint8 mode);
      uint32_t test_led_count[2]={0};
      
      //DTCM_VAR 
      float32_t DspResult=0.0f;
      
      
      //ITCM_VAR 
      void App_Led1(ULONG thread_input)
      {
          uint32 i;
          while (1){
              test_led_count[0]++;
              Dio_FlipChannel(DioConf_DioChannel_D17_PTE16); /* toggle D17 */   
              
              // dsp测试 1.54698824
              precise_us_time(0); 
              for(i=0;i<10000;i++){
                  DspResult = arm_cos_f32(0.678f)+arm_sin_f32(0.876f);      
              }        
              debug_time[0]=precise_us_time(1);       
      
              
              
              
      		tx_thread_sleep(500);
          }
      }
      
      1 条回复 最后回复
      0
      • yxydoctorY 离线
        yxydoctorY 离线
        yxydoctor
        写于 最后由 编辑
        #9

        tcm跑是6800us,否则是5900us。因为tcm会自动屏蔽cache,
        所以tcm对提高速度没积极作用,但至少不会更慢才对呀。
        定时器是用了一路Gpt

        1 条回复 最后回复
        0
        • FrankieF 离线
          FrankieF 离线
          Frankie YunTu
          写于 最后由 编辑
          #10

          yxydoctor thread 的心跳是多少,1ms?

          1 条回复 最后回复
          0
          • yxydoctorY 离线
            yxydoctorY 离线
            yxydoctor
            写于 最后由 编辑
            #11

            os心跳是1ms

            1 条回复 最后回复
            0
            • FrankieF 离线
              FrankieF 离线
              Frankie YunTu
              写于 最后由 编辑
              #12

              昨天下来我们内部测了一下,
              结论:
              DSP的性能方面,M7比M4没有50%的提示(COREMARK 不代表DSP性能)
              测试:

              DEVICE Freq Result Comiler
              S32K344 160M 7191 GCC -O1
              YTM32B1HA0 200M 5700 GCC -O1

              major 在 32B1H的DSP算力测试与困惑 中说:

              另外cm7和cm4的dsp模块是一样的,算力表现只和频率有关,cm7对比cm4 cpu算力和dsp对比是有差异的

              yxydoctorY gaoShengG 3 条回复 最后回复
              0
              • yxydoctorY 离线
                yxydoctorY 离线
                yxydoctor
                在 回复了 Frankie 最后由 编辑
                #13

                Frankie
                多谢原厂支持;32H1H属于高端车规MCU,担心水平所限玩不好。加上前期围绕z20k14x做了很多测试工作,所以才测了一下。

                1 条回复 最后回复
                0
                • gaoShengG 在线
                  gaoShengG 在线
                  gaoSheng
                  回复了Frankie 最后由 编辑
                  #14

                  Frankie 在 32B1H的DSP算力测试与困惑 中说:

                  Result

                  请问这个Result是COREMARK分数吗,这个工程能分享一下不。我尝试测试了一下HA的dhrystone。7b328010-7225-49e7-9fb3-7bd3036fd852-9e55b5a355b768469bd60d8930f7656.png

                  DMPIS:268 DMIPS/MHZ:1.34

                  对比S32K3似乎有一些差距,也可能是我dhrystone移植或者优化的问题
                  9496ab08-fd65-4e17-a46a-aea908b87773-d8282b8dcbac661972344f458bd4877.png
                  下面是我的工程
                  3df0a944-1258-46fb-b97d-dca604feeaa2-Ptmr_Demo (2).zip

                  1 条回复 最后回复
                  0
                  • gaoShengG 在线
                    gaoShengG 在线
                    gaoSheng
                    回复了Frankie 最后由 编辑
                    #15

                    Frankie 试了一下coremark Keil优化等级-o3 使用了Cache CoreMark 1.0 : 814.332 请问这个分数是合理的吗
                    a34ad260-b7be-4d53-97a6-d50d67713d41-7f20119344ca4680dec601c891360f1.png

                    跟一个240Mhz的MCU分数相近, 不过内核不同
                    43b05559-24df-4020-b800-9156649c90e5-image.png

                    60f5e58c-1030-469b-b282-73a2eae82a54-Ptmr_Demo _coremark.zip

                    1 条回复 最后回复
                    0
                    • FrankieF 离线
                      FrankieF 离线
                      Frankie YunTu
                      编写于 最后由 编辑
                      #16

                      放心,不会有什么性能问题的

                      gaoShengG 1 条回复 最后回复
                      0
                      • gaoShengG 在线
                        gaoShengG 在线
                        gaoSheng
                        回复了Frankie 最后由 编辑
                        #17

                        Frankie 不是担心性能,是有客户要我们HA的算力参数

                        1 条回复 最后回复
                        0
                        • FrankieF 离线
                          FrankieF 离线
                          Frankie YunTu
                          编写于 最后由 编辑
                          #18

                          测出来和ARM官方给出的数据差不多,没有问题

                          1 条回复 最后回复
                          1
                          • DigaD 离线
                            DigaD 离线
                            Diga
                            编写于 最后由 编辑
                            #19

                            image.png

                            算力单位一般是 CoreMark/MHz,是要除以主频的,开 Cache 的话 4.5 应该是没啥问题的

                            1 条回复 最后回复
                            1
                            • yxydoctorY 离线
                              yxydoctorY 离线
                              yxydoctor
                              编写于 最后由 编辑
                              #20

                              结论趋同, 综合算力相当于一颗240M的M4,但会稍微快一点。

                              开CACHE后,开不开TCM,无明显变化。估计是因为200M的主频不够高。

                              开始打样了,希望一切顺利。

                              1 条回复 最后回复
                              0

                            • 云途论坛规则/Yuntu Forum Rules

                              发帖前请查看

                            • YCT离线License申请流程

                              帮助没办法联网的电脑使用YCT

                            • YT CONFIG TOOL调查问卷

                              帮助改进和优化YT CONFIG TOOL,有机会抽取YTM32B1ME0 EVB哦...

                            • demo
                              11
                              can
                              8
                              lin stack
                              5
                              yt-link
                              5
                              vscode
                              3
                              adc模块
                              2
                              i2c
                              2
                              uuid
                              2
                              Online Users
                              gaoShengG
                              gaoSheng
                              文锐文
                              文锐
                              • 登录

                              • 登录或注册以进行搜索。
                              • 第一个帖子
                                最后一个帖子
                              0
                              • 版块
                              • 最新
                              • 标签
                              • 热门