MDK C++中对内联的极度优化

简介: 先来看看我们SmartIRQ的具体实现 // 智能IRQ,初始化时备份,销毁时还原 class SmartIRQ { public: force_inline SmartIRQ(bool enable = false) { _state = __ge...

先来看看我们SmartIRQ的具体实现

// 智能IRQ,初始化时备份,销毁时还原
class SmartIRQ
{
public:
    force_inline SmartIRQ(bool enable = false)
    {
        _state = __get_PRIMASK();
        if(enable)
            __enable_irq();
        else
            __disable_irq();
    }

    force_inline ~SmartIRQ()
    {
        __set_PRIMASK(_state);
    }
    
private:
    uint _state;
};

在构造的时候备份,然后根据参数决定打开还是关闭中断。
在系统内核时钟里面,关键操作需要关闭中断,最后打开,以免其它中断影响关键操作的原子事务性。

于是我们有:

ulong Time::CurrentTicks()
{
    SmartIRQ irq;

    uint value = (SysTick->LOAD - SysTick->VAL);
    if(SysTick->CTRL & SysTick_CTRL_COUNTFLAG)
    {
        Ticks += SysTick->LOAD;
    }

    return Ticks + value;
}

其中irq在离开作用域时被释放,自动调用SmartIRQ的析构函数,还原了中断状态

因为调用极其频繁,最高可能1us调用一次该函数,于是我们给SmartIRQ的构造和析构都加了force_inline强制使用内联。
总所周知,C++的内联其实就是以空间换时间,把一个函数的代码全部搬出来直接使用,省去了调用、压栈、弹栈、返回等操作。
SmartIRQ的析构函数就罢了,但是构造函数代码量还是有好几行的。
怀着试一试的心态调试该函数,直接观察汇编代码:

0x08000804 B570      PUSH     {r4-r6,lr}
0x08000806 F3EF8210  MRS      r2,PRIMASK
0x0800080A B672      CPSID    I
0x0800080C 4D0B      LDR      r5,[pc,#44]  ; @0x0800083C
0x0800080E 6969      LDR      r1,[r5,#0x14]
0x08000810 69AB      LDR      r3,[r5,#0x18]
0x08000812 1ACC      SUBS     r4,r1,r3
0x08000814 6929      LDR      r1,[r5,#0x10]
0x08000816 2300      MOVS     r3,#0x00
0x08000818 03C9      LSLS     r1,r1,#15
0x0800081A 2900      CMP      r1,#0x00
0x0800081C DA06      BGE      0x0800082C
0x0800081E 6886      LDR      r6,[r0,#0x08]
0x08000820 68C1      LDR      r1,[r0,#0x0C]
0x08000822 696D      LDR      r5,[r5,#0x14]
0x08000824 1975      ADDS     r5,r6,r5
0x08000826 4159      ADCS     r1,r1,r3
0x08000828 6085      STR      r5,[r0,#0x08]
0x0800082A 60C1      STR      r1,[r0,#0x0C]
0x0800082C 6885      LDR      r5,[r0,#0x08]
0x0800082E 68C1      LDR      r1,[r0,#0x0C]
0x08000830 1928      ADDS     r0,r5,r4
0x08000832 4159      ADCS     r1,r1,r3
0x08000834 F3828810  MSR      PRIMASK,r2
0x08000838 BD70      POP      {r4-r6,pc}

MDK C++编译器优化到了极度变态的地步!
不仅仅内联了,SmartIRQ里面有两个分支语句,直接被他省略了其中一个,因为参数true已经确定。
更加变态的是,本来采用SmartIRQ内部私有成员_state保存状态,析构时恢复的,它直接把这个状态保存到寄存器r2里面去,连_state的内存都给省了。

 

我不相信神话,我只相信汗水!我不相信命运,我只相信双手!
相关文章
|
7月前
|
存储 缓存 算法
【C/C++ 性能优化】提高C++程序的缓存命中率以优化性能
【C/C++ 性能优化】提高C++程序的缓存命中率以优化性能
1071 0
|
2月前
|
安全 编译器 程序员
【C++篇】C++类与对象深度解析(六):全面剖析拷贝省略、RVO、NRVO优化策略
【C++篇】C++类与对象深度解析(六):全面剖析拷贝省略、RVO、NRVO优化策略
49 2
|
2月前
|
安全 测试技术 C++
【C++篇】从零实现 C++ Vector:深度剖析 STL 的核心机制与优化2
【C++篇】从零实现 C++ Vector:深度剖析 STL 的核心机制与优化
65 6
|
2月前
|
安全 测试技术 C++
【C++篇】从零实现 C++ Vector:深度剖析 STL 的核心机制与优化1
【C++篇】从零实现 C++ Vector:深度剖析 STL 的核心机制与优化
67 7
|
7月前
|
存储 缓存 算法
高效编程:我们应该了解哪些编译器优化技术?如何做出成熟的优化行为,掌握C++编程中的编译器优化艺术。
高效编程:我们应该了解哪些编译器优化技术?如何做出成熟的优化行为,掌握C++编程中的编译器优化艺术。
438 5
|
6月前
|
存储 安全 编译器
【C++航海王:追寻罗杰的编程之路】引用、内联、auto关键字、基于范围的for、指针空值nullptr
【C++航海王:追寻罗杰的编程之路】引用、内联、auto关键字、基于范围的for、指针空值nullptr
67 5
|
6月前
|
编译器 C++ 开发者
C++一分钟之-返回值优化与Move Semantics
【6月更文挑战第19天】C++的RVO与移动语义提升效率,减少对象复制。RVO是编译器优化,避免临时对象的创建。移动语义通过右值引用和`std::move`转移资源所有权。注意RVO不是总有效,不应过度依赖。使用移动语义时,避免误用`std::move`导致对象无效。示例展示了RVO和移动构造函数的应用。理解并恰当使用这些机制能写出更高效代码。
68 3
|
7月前
|
存储 安全 编译器
【C++】基础知识讲解(引用、内联、auto,基于范围for循环)
【C++】基础知识讲解(引用、内联、auto,基于范围for循环)
47 1
|
7月前
|
消息中间件 算法 Java
C++实时通信优化技术探究
C++实时通信优化技术探究
76 3
|
7月前
|
算法 测试技术 数据处理
【C++ 设计思路】优化C++项目:高效解耦库接口的实战指南
【C++ 设计思路】优化C++项目:高效解耦库接口的实战指南
192 5