rbpf虚拟机-码

简介: 该篇文章是rbpf不同码之间关系和作用的整理。(学习该虚拟机的目的是为了搞懂solana合约的执行方式,solana使用的rbpf是在该虚拟机上进行扩展。)

✨重磅!盹猫的个人小站正式上线啦~诚邀各位技术大佬前来探秘!✨
—— 专为开发者打造的宝藏基地,等你来探索!
这里有:


🔥 硬核技术干货:编程技巧、开发经验、踩坑指南,带你解锁技术新姿势!
🎉 趣味开发日常:代码背后的脑洞故事、工具测评,让技术圈不再枯燥~
💎 独家资源分享:开源项目、学习资料包,助你打怪升级快人一步!


🚀 立即访问 → 盹猫猫的个人小站 ← 点击探索
🌟 说不定这里就有你寻找已久的技术秘籍哦~

Welcome to Code Block's blog

本篇文章主要介绍了
[rbpf虚拟机-码]
❤博主广交技术好友,喜欢我的文章的可以关注一下❤

一、概述

该篇文章是rbpf不同码之间关系和作用的整理。

(学习该虚拟机的目的是为了搞懂solana合约的执行方式,solana使用的rbpf是在该虚拟机上进行扩展。)

二、码的定义

2.1 汇编码

汇编码​(Assembly Code)是 ​汇编语言 的代码形式,它是低级语言的一种,介于高级语言(如 C、C++)和机器码之间。汇编码使用助记符和符号来表示机器指令,比直接使用二进制的机器码更易于人类阅读和编写,但仍然与特定的硬件架构密切相关。

2.2 字节码

字节码​(Bytecode)是一种中间表示形式(Intermediate Representation, IR),它是介于高级语言(如 Java、Python)和机器码之间的一种指令集。字节码通常由虚拟机(如 JVM、Python 解释器)解释执行,或者通过 ​JIT 编译器 动态编译为目标机器的机器码。

2.3 机器码

机器码​(Machine Code)是 ​CPU 直接执行的二进制指令,它是计算机硬件能够理解和执行的最低级语言形式。机器码是编译器或汇编器将高级语言(如 C、C++)或汇编语言翻译为的最终形式,直接在 CPU 上运行。

f68cb6eb673f4393846b79134f0d6333.png

汇编码是语言,字节码是过渡,机器码是最终执行。

三、码样式

3.1 汇编码

常用的x86 是一种变长指令集架构,汇编码通常以助记符表示,指令长度从 1 字节到 15 字节不等
示例 1:将立即数 42 加载到寄存器 eax

mov eax, 42

​解释:

  • mov 是操作码,表示“移动”。
  • eax 是目标寄存器。
  • 42 是立即数。

3.2 字节码

​eBPF 字节码 是 eBPF 程序的中间表示形式,例如下述样式:

let prog = &[
     0xb7, 0x10, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00,
     0x95, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00
];

不同语言的字节码不同,如java虚拟机(JVM),使用自己独有字节码格式:

Compiled from "Example.java"
public class Example {
     
  public Example();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static void main(java.lang.String[]);
    Code:
       0: bipush        10                 // 将常量 10 压入栈
       2: istore_1                         // 存储到局部变量表索引 1(a)
       3: bipush        20                 // 将常量 20 压入栈
       5: istore_2                         // 存储到局部变量表索引 2(b)
       6: iload_1                          // 加载局部变量表索引 1(a)
       7: iload_2                          // 加载局部变量表索引 2(b)
       8: iadd                             // 整数加法
       9: istore_3                         // 存储结果到局部变量表索引 3(c)
      10: getstatic     #2                  // Field java/lang/System.out:Ljava/io/PrintStream;
      13: iload_3                          // 加载局部变量表索引 3(c)
      14: invokevirtual #3                  // Method java/io/PrintStream.println:(I)V
      17: return
}

3.3 机器码

eBPF 机器码是特定于硬件架构的二进制指令,可以直接在 CPU 上运行。
不同架构的机器码完全不同。例如:

  • x86_64 架构的机器码:B8 2A 00 00 00
  • ARM 架构的机器码:E3 A0 00 2A

四、转换代码

4.1 汇编码-字节码(汇编器)

pub fn assemble(src: &str) -> Result<Vec<u8>, String> {
     
    let parsed = (parse(src))?;
    //Ok([Instruction { name: "mov", operands: [Register(0), Integer(0)] }, Instruction { name: "add", operands: [Register(1), Integer(2)] }])
    let insns = (assemble_internal(&parsed))?;

    let mut result: Vec<u8> = vec![];
    for insn in insns {
     
        result.extend_from_slice(&insn.to_array());
    }
    Ok(result)
}

汇编器就要是通过assemble方法,先对指令进行割形成列表,然后通过对不同的op码进行分类后形成对应的字节码数据。

4.2 字节码->汇编码(反汇编器)

pub fn disassemble(prog: &[u8]) {
     
    #[cfg(feature = "std")]
    {
     
        for insn in to_insn_vec(prog) {
     
            println!("{}", insn.desc);
        }
    }

反汇编则通过循环的方式切割字节码指令信息,同样通过op码进行分类转换为对应的字符串信息.

详情请查看文章:rbpf虚拟机-编译与反编译器

4.3 字节码->机器码(JIT即时编译)

  • 设置函数入口,保存寄存器状态,初始化内存指针。
  • 根据 use_mbuff 和 update_data_ptr 的值,处理内存缓冲区(mbuff)和- 数据指针。
  • 分配栈空间,用于存储局部变量和临时数据。
  • 逐条翻译 eBPF 指令为目标机器码,支持多种指令类型(加载、存储、算术运算、跳转等)。
  • -修正跳转指令的目标地址,确保控制流的正确性。
  • -Epilogue(函数出口)​

    五、总结

    通过上述对不同码之间的区分,对各种格式码之间的关系认识更加清晰,同时对不同码之间的转换有了一定了解。

代码来源:rbpf虚拟机
鸣谢: qmonnet 提供的开源代码.

当然,我也会将带有中文注释和自己理解的一些代码上传的我的github页面,感兴趣的朋友可以进行clone查看.

我的GitHub:forked


感谢您的点赞、关注、收藏!

目录
相关文章
|
19天前
|
人工智能 JavaScript Linux
AI龙虾OpenClaw赚钱实战:普通人用AI工具变现方法+阿里云/本地部署+大模型API配置及避坑指南
2026年的AI风口下,真正能让普通人赚到钱的并非动辄融资千万的创业项目,而是像OpenClaw(昵称“龙虾”)这样的开源AI工具。当无数人还在追着AI热点喊口号时,已有一批普通人靠着OpenClaw,在自己熟悉的领域里把技能变成了现金流,把重复劳动换成了高效收益,甚至靠帮别人搭建工具工作流实现了月入上万美金。这些赚钱的人并非技术大神,他们只是找对了工具的使用方式,而OpenClaw的核心价值,从来都不是炫技,而是解决实际问题。
1166 0
|
Android开发 Kotlin JavaScript
Compose 为什么可以跨平台?
Compose 为什么可以跨平台?
1040 0
Compose 为什么可以跨平台?
|
4月前
|
人工智能 达摩院 安全
迈向云+数据中心的国产 CPU 新引擎,龙蜥大会 RISC-V 分论坛回顾一览
本论坛成为高效的技术交流与合作平台,充分展示了 RISC-V 架构在服务器、边缘计算等高性能场景的商业化落地,助力构建开放共赢的算力新生态。
|
4月前
|
Web App开发 JavaScript 前端开发
SpringBoot.跨域处理
跨域指协议、域名、端口不同时的资源请求限制。本文详解CORS解决方案,包括@CrossOrigin注解、全局配置WebMvcConfigurer及Filter拦截器实现,支持指定域名跨域访问,保障前后端分离架构下安全通信。
167 2
|
4月前
|
SQL XML Java
对于 MyBatis Plus 和 MyBatis我们究竟该怎么选择?
MyBatis是轻量级半自动ORM框架,SQL自定义灵活,适合复杂查询;MyBatis Plus在其基础上封装通用CRUD,提升开发效率,支持Lambda与分页插件。两者可混合使用,兼顾效率与灵活性,适用于不同场景。
|
XML Java 数据库连接
MyBatis入门——MyBatis XML配置文件(3)
MyBatis入门——MyBatis XML配置文件(3)
783 6
|
Java 测试技术 应用服务中间件
Spring Boot 配置文件总结
Spring Boot 提供全局配置文件 `application.properties` 和 `application.yml`,用于修改自动配置的默认值。前者使用键值对配置,后者使用缩进和冒号。不同环境(开发、测试、生产)可切换配置文件,通过 `spring.profiles.active` 指定。例如,开发环境端口为4790,测试环境为4791,生产环境为4792。配置示例展示了属性、List、Map定义及引用方法。
471 14
|
存储 JSON Kubernetes
证书管理工具 cfssl 浅尝
证书管理工具 cfssl 浅尝
742 0
|
存储 Prometheus 监控
Linux技术工具:bpftrace介绍
Linux技术工具:bpftrace介绍
758 7
|
存储 关系型数据库 MySQL
MySQL字段的字符类型该如何选择?千万数据下varchar和char性能竟然相差30%🚀
本篇文章来讨论MySQL字段的字符类型选择并深入实践char与varchar类型的区别以及在千万数据下的性能测试
MySQL字段的字符类型该如何选择?千万数据下varchar和char性能竟然相差30%🚀