Rust 2026 经验谈 - FFI 实战：Rust 调用 C

Rust 调用 C 库是系统编程的日常——无论是使用操作系统 API、遗留 C 代码、还是高性能 C 库。FFI（Foreign Function Interface）看似简单（unsafe extern "C" {} + unsafe），但实战中暗藏大量坑：布局不匹配、回调函数桥接、panic 跨边界、字符串传递、枚举表示……本文从 bindgen 到手动绑定，系统总结 Rust 调用 C 的实战经验。

bindgen 自动生成绑定#

基本用法#

bindgen 从 C/C++ 头文件自动生成 Rust FFI 绑定，避免手写 extern "C" 声明：

1
# build-dependencies
2
[build-dependencies]
3
bindgen = "0.70"

1
use std::env;
2
use std::path::PathBuf;
3

4
fn main() {
5
    println!("cargo:rerun-if-changed=wrapper.h");
6

7
    let bindings = bindgen::Builder::default()
8
        .header("wrapper.h")
9
        .parse_callbacks(Box::new(bindgen::CargoCallbacks::new()))
10
        .generate()
11
        .expect("Unable to generate bindings");
12

13
    let out_path = PathBuf::from(env::var("OUT_DIR").unwrap());
14
    bindings
15
        .write_to_file(out_path.join("bindings.rs"))
16
        .expect("Couldn't write bindings!");
17
}

1
#include <sqlite3.h>

1
#![allow(non_upper_case_globals)]
2
#![allow(non_camel_case_types)]
3
#![allow(non_snake_case)]
4

5
mod bindings {
6
    include!(concat!(env!("OUT_DIR"), "/bindings.rs"));
7
}
8

9
use bindings::*;
10

11
unsafe {
12
    let mut db: *mut sqlite3 = std::ptr::null_mut();
13
    let rc = sqlite3_open(b"test.db\0".as_ptr() as *const i8, &mut db);
14
    if rc != SQLITE_OK {
15
        panic!("Failed to open database");
16
    }
17
    sqlite3_close(db);
18
}

bindgen 配置选项#

1
let bindings = bindgen::Builder::default()
2
    .header("wrapper.h")
3
    // 只生成指定符号的绑定
4
    .allowlist_function("sqlite3_.*")
5
    .allowlist_type("sqlite3.*")
6
    .allowlist_var("SQLITE_.*")
7

8
    // 屏蔽不需要的符号
9
    .blocklist_type("__.*")           // 内部类型
10
    .blocklist_function(".*_internal") // 内部函数
11

12
    // 生成 Rust 文档注释
13
    .generate_comments(true)
14

15
    // 处理不透明类型
16
    .opaque_type("sqlite3")           // sqlite3 是不透明指针
17

18
    // 设置默认枚举大小
19
    .default_enum_style(bindgen::EnumVariation::Rust {
20
        non_exhaustive: true,
21
    })
22

23
    // 添加自定义属性
24
    .must_use_type("sqlite3.*")
25

26
    .parse_callbacks(Box::new(bindgen::CargoCallbacks::new()))
27
    .generate()
28
    .expect("Unable to generate bindings");

allowlist / blocklist 策略#

策略一：白名单（推荐）

只生成你需要的符号，减少编译时间和冲突：

1
let bindings = bindgen::Builder::default()
2
    .header("wrapper.h")
3
    .allowlist_function("my_lib_init")
4
    .allowlist_function("my_lib_process")
5
    .allowlist_function("my_lib_cleanup")
6
    .allowlist_type("MyLibConfig")
7
    .allowlist_type("MyLibResult")
8
    .allowlist_var("MY_LIB_VERSION")
9
    .generate()
10
    .unwrap();

策略二：黑名单 + 白名单组合

先生成所有，再屏蔽问题符号：

1
let bindings = bindgen::Builder::default()
2
    .header("wrapper.h")
3
    .blocklist_type("_.*")           // 屏蔽下划线开头的内部类型
4
    .blocklist_function(".*_debug")  // 屏蔽调试函数
5
    .allowlist_type("PublicAPI")     // 确保 PublicAPI 被生成
6
    .generate()
7
    .unwrap();

不透明类型#

当 C 库不暴露结构体定义时，用不透明类型：

1
// C 头文件：只声明，不定义
2
typedef struct sqlite3 sqlite3;

1
// bindgen 生成：不透明类型
2
#[repr(C)]
3
pub struct sqlite3 {
4
    _private: [u8; 0],
5
}
6
// sqlite3 是不完整类型——只能通过指针使用
7
// 不能构造 sqlite3 值，不能访问字段

踩坑：bindgen 生成的类型可能不符合 Rust 惯例#

1
// bindgen 生成：
2
pub type my_lib_error_code_t = u32;
3
pub const MY_LIB_OK: my_lib_error_code_t = 0;
4
pub const MY_LIB_ERR: my_lib_error_code_t = 1;
5

6
// 可能的问题：
7
// 1. 命名不符合 Rust 惯例（snake_case）
8
// 2. 枚举生成为常量而非 enum
9
// 3. 某些 C 特性（bitfields、flexible array member）不支持
10

11
// 变通：在 build.rs 中手动替换
12
let bindings = bindgen::Builder::default()
13
    .header("wrapper.h")
14
    .raw_line("use std::os::raw::c_int;")  // 手动添加行
15
    .generate()
16
    .unwrap();

repr(C) 布局保证与结构体对齐#

repr(C) 的含义#

repr(C) 保证 Rust 结构体使用 C 的布局规则：

字段按声明顺序排列
对齐到最大字段对齐
没有 Rust 特有的重排优化

1
// C 结构体
2
// struct Point {
3
//     int32_t x;
4
//     int32_t y;
5
//     int32_t z;
6
// };
7

8
// Rust 对应
9
#[repr(C)]
10
struct Point {
11
    x: i32,
12
    y: i32,
13
    z: i32,
14
}
15

16
// 不加 repr(C)，Rust 可能重排字段（虽然 i32 不会）
17
// 但对于不同类型字段，重排可能发生

repr(C) vs repr(Rust)#

1
#[repr(C)]
2
struct CLayout {
3
    a: u8,    // offset 0
4
    b: u32,   // offset 4（3 字节 padding）
5
    c: u8,    // offset 8
6
}  // size = 12, align = 4
7

8
#[repr(Rust)]  // 默认
9
struct RustLayout {
10
    a: u8,    // offset 0
11
    b: u32,   // offset 4
12
    c: u8,    // offset 8（或可能重排：a,c 在前，b 在后）
13
}  // size = 12（或可能 8）

结构体对齐的控制#

1
// C: __attribute__((aligned(16)))
2
#[repr(C, align(16))]
3
struct AlignedBuffer {
4
    data: [u8; 64],
5
}
6
assert_eq!(std::mem::align_of::<AlignedBuffer>(), 16);
7

8
// C: #pragma pack(1)
9
#[repr(C, packed)]
10
struct PackedHeader {
11
    magic: u16,
12
    version: u8,
13
    size: u32,  // 未对齐！访问可能 UB
14
}
15
// 注意：packed 结构体中未对齐字段的引用是 UB
16
// 必须通过 copy 访问：
17
let header: PackedHeader = /* ... */;
18
// let size: &u32 = &header.size;  // UB！未对齐引用
19
let size: u32 = header.size;        // OK：copy 出来

联合体#

1
// C union
2
// union Data {
3
//     int32_t as_int;
4
//     float as_float;
5
//     void* as_ptr;
6
// };
7

8
#[repr(C)]
9
union Data {
10
    as_int: i32,
11
    as_float: f32,
12
    as_ptr: *mut std::ffi::c_void,
13
}
14

15
// 访问联合体字段需要 unsafe
16
let mut d = Data { as_int: 42 };
17
unsafe {
18
    println!("as_int: {}", d.as_int);     // OK：最近写入的是 as_int
19
    // println!("as_float: {}", d.as_float);  // UB：未激活字段
20
}

踩坑：padding 中的垃圾数据#

1
#[repr(C)]
2
struct Header {
3
    version: u8,   // 1 字节
4
    // 3 字节 padding
5
    length: u32,   // 4 字节
6
}
7

8
// 如果用 memcmp 比较两个 Header：
9
// padding 中的值未定义，memcmp 可能返回"不等"即使字段相同
10
// 变通：确保 padding 为零
11
let h1 = Header { version: 1, length: 100 };
12
let h2 = Header { version: 1, length: 100 };
13

14
unsafe {
15
    // 不能保证 ptr::eq 或 memcmp 正确
16
    // 用字段比较
17
    assert_eq!(h1.version, h2.version);
18
    assert_eq!(h1.length, h2.length);
19
}

回调函数跨语言#

C 函数指针 → Rust 函数#

1
// C 库
2
typedef void (*callback_t)(int event, void* user_data);
3
void register_callback(callback_t cb, void* user_data);

1
type Callback = extern "C" fn(event: i32, user_data: *mut std::ffi::c_void);
2

3
unsafe extern "C" {
4
    fn register_callback(cb: Callback, user_data: *mut std::ffi::c_void);
5
}
6

7
extern "C" fn my_callback(event: i32, user_data: *mut std::ffi::c_void) {
8
    // 注意：这个函数不能捕获环境！
9
    let ctx = unsafe { &mut *(user_data as *mut Context) };
10
    match event {
11
        1 => ctx.on_connect(),
12
        2 => ctx.on_disconnect(),
13
        _ => {}
14
    }
15
}
16

17
struct Context {
18
    connected: bool,
19
}
20

21
impl Context {
22
    fn on_connect(&mut self) { self.connected = true; }
23
    fn on_disconnect(&mut self) { self.connected = false; }
24
}
25

26
let mut ctx = Box::new(Context { connected: false });
27
unsafe {
28
    register_callback(my_callback, &mut *ctx as *mut Context as *mut std::ffi::c_void);
29
}

C 函数指针 → Rust 闭包桥接#

C 库的回调不能直接接收 Rust 闭包——闭包有捕获环境，不是函数指针。桥接模式：

1
use std::ffi::c_void;
2

3
type CCallback = extern "C" fn(i32, *mut c_void);
4

5
unsafe extern "C" {
6
    fn register_callback(cb: CCallback, user_data: *mut c_void);
7
}
8

9
// 桥接函数
10
extern "C" fn trampoline<F: FnMut(i32)>(event: i32, user_data: *mut c_void) {
11
    let closure = unsafe { &mut *(user_data as *mut F) };
12
    closure(event);
13
}
14

15
fn register_rust_callback<F: FnMut(i32) + 'static>(mut closure: F) {
16
    let boxed = Box::new(closure);
17
    let user_data = Box::into_raw(boxed) as *mut c_void;
18

19
    unsafe {
20
        // SAFETY: trampoline 与 CCallback 签名匹配
21
        // user_data 指向堆上的 F
22
        register_callback(trampoline::<F>, user_data);
23
    }
24

25
    // 注意：user_data 的内存何时释放？
26
    // 需要.unregister_callback() 或在库销毁时释放
27
}

使用：

1
let mut count = 0i32;
2
register_rust_callback(move |event| {
3
    count += 1;
4
    println!("Event {}: count = {}", event, count);
5
});

踩坑：闭包的生命周期#

1
// 错误！闭包引用了栈上的变量
2
fn bad_callback() {
3
    let local = 42;
4
    register_rust_callback(move |_| {
5
        // local 被移动到闭包中——OK
6
        println!("{}", local);
7
    });
8
}
9

10
// 更危险的情况：
11
fn worse_callback() {
12
    let local = vec![1, 2, 3];
13
    let ptr = &local as *const Vec<i32>;
14
    register_rust_callback(move |_| {
15
        // 如果 local 没有被 move 到闭包中，ptr 可能悬垂
16
        // 用 move 捕获是安全的
17
    });
18
}

线程安全回调#

如果 C 库在非 Rust 线程上调用回调，闭包必须是 Send：

1
fn register_thread_safe_callback<F: FnMut(i32) + Send + 'static>(closure: F) {
2
    let boxed = Box::new(closure);
3
    let user_data = Box::into_raw(boxed) as *mut c_void;
4
    // F: Send 保证闭包可以安全地在其他线程执行
5
    unsafe {
6
        register_callback(trampoline::<F>, user_data);
7
    }
8
}

panic 跨 FFI 边界处理#

核心规则：panic 不可跨越 FFI 边界#

如果 Rust 代码 panic 后 unwind 到 C 栈帧——未定义行为。C 代码没有 Rust 的 unwind 机制，unwind 到 C 栈帧等于破坏 C 的栈。

解决方案：catch_unwind#

1
use std::panic::catch_unwind;
2

3
extern "C" fn safe_callback(event: i32, user_data: *mut c_void) {
4
    let result = catch_unwind(|| {
5
        let ctx = unsafe { &mut *(user_data as *mut Context) };
6
        ctx.handle_event(event);  // 可能 panic
7
    });
8

9
    if result.is_err() {
10
        // panic 被捕获，不会越过 FFI 边界
11
        eprintln!("Rust callback panicked! Aborting to avoid UB.");
12
        std::process::abort();  // 或记录日志后忽略
13
    }
14
}

另一方案：panic = abort#

1
[profile.release]
2
panic = "abort"
3

4
# 所有 release 构建中 panic 直接终止，不可能 unwind
5
# 缺点：整个进程终止，不能优雅恢复

extern “C-unwind”（Stable since Rust 1.84）#

1
// extern "C-unwind" 允许 panic 跨 FFI 边界
2
// 如果 C 侧也支持 unwind（如 C++ 的 exception）
3
// Rust 1.84 起稳定
4

5
extern "C-unwind" fn may_panic() {
6
    panic!("oops");
7
}
8
// 如果 C 侧是 C++ 且用 try/catch，可以捕获

踩坑：不是所有 panic 都能被 catch_unwind 捕获#

1
use std::panic::catch_unwind;
2

3
// catch_unwind 不能捕获：
4
// 1. panic = abort 时（直接终止）
5
// 2. std::process::exit()（不是 panic）
6
// 3. 某些 UB 触发前的 panic
7

8
let result = catch_unwind(|| {
9
    // 这会被捕获
10
    panic!("normal panic");
11
});
12
assert!(result.is_err());
13

14
let result2 = catch_unwind(|| {
15
    // 这不会被捕获（如果设了 panic=abort）
16
    // std::process::exit(1);
17
    todo!()
18
});

字符串传递#

CString vs CStr#

类型	所有权	用途
`CString`	拥有	Rust → C（创建 C 字符串）
`CStr`	借用	C → Rust（引用 C 字符串）

Rust → C：CString#

1
use std::ffi::CString;
2

3
let rust_str = "hello world";
4
let c_string = CString::new(rust_str).expect("CString::new failed");
5
// c_string 内部是 "hello world\0"
6

7
// 传递给 C
8
unsafe {
9
    c_function(c_string.as_ptr());
10
}

踩坑一：内嵌 null 字节

1
// CString::new 会拒绝包含 \0 的字符串
2
let bad = CString::new("hello\0world");
3
assert!(bad.is_err());
4

5
// 原因：C 字符串以 \0 结尾，内嵌 \0 会被 C 误认为字符串结束

踩坑二：as_ptr 的生命周期

1
// 错误！c_string 在表达式结束时 Drop，ptr 悬垂
2
// let ptr = CString::new("hello").unwrap().as_ptr();
3
// unsafe { c_function(ptr); }  // UB！ptr 已经失效
4

5
// 正确：保持 CString 存活
6
let c_string = CString::new("hello").unwrap();
7
let ptr = c_string.as_ptr();
8
unsafe { c_function(ptr); }
9
// c_string 在此之后才 Drop

C → Rust：CStr#

1
use std::ffi::CStr;
2

3
unsafe extern "C" {
4
    fn get_string() -> *const i8;
5
}
6

7
let ptr = unsafe { get_string() };
8
if !ptr.is_null() {
9
    let c_str = unsafe { CStr::from_ptr(ptr) };
10
    // c_str 是 &CStr，借用 C 的字符串
11

12
    // 转为 Rust &str（可能失败——不是 UTF-8）
13
    let rust_str: Result<&str, _> = c_str.to_str();
14
    if let Ok(s) = rust_str {
15
        println!("Got: {}", s);
16
    }
17

18
    // 转为 String（总是成功，但会替换非 UTF-8 字节）
19
    let owned = c_str.to_string_lossy().into_owned();
20
}

字节传递：无需 UTF-8#

1
// 如果传递的是任意字节（非字符串），用 *const u8 + 长度
2
unsafe extern "C" {
3
    fn process_bytes(data: *const u8, len: usize);
4
}
5

6
let data = b"arbitrary bytes including \0 null";
7
unsafe {
8
    process_bytes(data.as_ptr(), data.len());
9
}

常见字符串传递模式#

1
use std::ffi::{CString, CStr};
2

3
// 模式一：Rust 分配，Rust 释放
4
fn pass_to_c(s: &str) -> i32 {
5
    let c_str = CString::new(s).unwrap();
6
    unsafe { c_count_chars(c_str.as_ptr()) }
7
}
8

9
// 模式二：C 分配，C 释放
10
fn get_from_c() -> String {
11
    let ptr = unsafe { c_get_string() };
12
    let c_str = unsafe { CStr::from_ptr(ptr) };
13
    let result = c_str.to_string_lossy().into_owned();
14
    unsafe { c_free_string(ptr as *mut i8); }
15
    result
16
}
17

18
// 模式三：C 分配，Rust 释放（需要 C 用 malloc，Rust 用 libc::free）
19
fn take_ownership_from_c() -> String {
20
    let ptr = unsafe { c_get_malloc_string() };
21
    let c_str = unsafe { CStr::from_ptr(ptr) };
22
    let result = c_str.to_string_lossy().into_owned();
23
    unsafe { libc::free(ptr as *mut libc::c_void); }
24
    result
25
}
26

27
// 注意：c_count_chars, c_get_string, c_free_string, c_get_malloc_string
28
// 需要在 unsafe extern "C" {} 中声明（Edition 2024）

常见坑：枚举表示、零大小类型#

坑一：C 枚举的大小不确定#

C 的 enum 大小由编译器决定——可能是 1、2、4、8 字节。Rust 的 enum 默认用最小能容纳的整数。

1
// C
2
enum Status { OK = 0, ERROR = 1, PENDING = 2 };

1
// 错误！Rust enum 可能是 1 字节，C enum 可能是 4 字节
2
#[repr(C)]
3
enum Status {
4
    Ok = 0,
5
    Error = 1,
6
    Pending = 2,
7
}
8

9
// 正确：显式指定大小
10
#[repr(C, i32)]  // 保证是 i32（4 字节）
11
enum Status {
12
    Ok = 0,
13
    Error = 1,
14
    Pending = 2,
15
}
16

17
// 或更安全：用常量 + 类型别名
18
type Status = u32;
19
const STATUS_OK: Status = 0;
20
const STATUS_ERROR: Status = 1;
21
const STATUS_PENDING: Status = 2;

bindgen 的处理：bindgen 默认将 C 枚举生成为常量，避免大小不匹配。

坑二：C 的 bitfield#

1
// C
2
struct Flags {
3
    unsigned int a : 1;
4
    unsigned int b : 3;
5
    unsigned int c : 4;
6
};

1
// bindgen 对 bitfield 的支持有限
2
// 生成的绑定可能无法正确访问 bitfield
3
// 变通：手动实现 getter/setter
4

5
#[repr(C)]
6
struct Flags {
7
    bits: u32,  // 整体存储
8
}
9

10
impl Flags {
11
    fn a(&self) -> u32 { self.bits & 0x1 }
12
    fn b(&self) -> u32 { (self.bits >> 1) & 0x7 }
13
    fn c(&self) -> u32 { (self.bits >> 4) & 0xF }
14

15
    fn set_a(&mut self, val: u32) { self.bits = (self.bits & !0x1) | (val & 0x1); }
16
    fn set_b(&mut self, val: u32) { self.bits = (self.bits & !(0x7 << 1)) | ((val & 0x7) << 1); }
17
    fn set_c(&mut self, val: u32) { self.bits = (self.bits & !(0xF << 4)) | ((val & 0xF) << 4); }
18
}

坑三：零大小类型（ZST）#

Rust 的单元类型 () 是零大小类型（ZST），C 没有对应概念：

1
// Rust ZST
2
struct Empty;  // size = 0, align = 1
3

4
// 如果 C 期望 void* 但 Rust 传递 *const ()：
5
// *const () 是非空指针，但 C 可能对零大小分配有特殊处理

规则：FFI 中不要传递 ZST。如果 C 用 void* 表示”无数据”，用 *mut c_void 的 null 指针。

坑四：C 的 flexible array member#

1
// C99
2
struct Message {
3
    int type;
4
    int length;
5
    char data[];  // flexible array member
6
};

1
// Rust 不支持 flexible array member
2
// 变通：用原始指针 + 手动偏移
3

4
#[repr(C)]
5
struct MessageHeader {
6
    msg_type: i32,
7
    length: i32,
8
    // data 字段不直接表示
9
}
10

11
impl MessageHeader {
12
    fn data_ptr(&self) -> *const u8 {
13
        unsafe {
14
            (self as *const Self as *const u8).add(std::mem::size_of::<MessageHeader>())
15
        }
16
    }
17

18
    fn data_slice(&self) -> &[u8] {
19
        unsafe {
20
            std::slice::from_raw_parts(self.data_ptr(), self.length as usize)
21
        }
22
    }
23
}

坑五：long 的大小不固定#

1
// C 的 long：Windows 4 字节，Linux 64-bit 8 字节
2
// 不要用 i64/i32 对应 C 的 long
3

4
// 正确：用 c_long
5
use std::os::raw::c_long;
6

7
#[repr(C)]
8
struct CStruct {
9
    value: c_long,  // 自动匹配平台
10
}

坑六：函数签名不匹配#

1
// C：int process(const char* input, size_t len)
2
// 错误！
3
unsafe extern "C" {
4
    fn process(input: *const u8, len: u32) -> i32;  // len 类型不对！
5
}
6

7
// 正确
8
unsafe extern "C" {
9
    fn process(input: *const i8, len: usize) -> i32;
10
}
11
// *const i8 对应 const char*
12
// usize 对应 size_t

C 类型到 Rust 类型的对应表：

C 类型	Rust 类型	说明
`char`	`c_char`	平台相关：i8 或 u8
`short`	`c_short`	平台相关
`int`	`c_int`	平台相关
`long`	`c_long`	平台相关
`long long`	`c_longlong`	通常是 i64
`size_t`	`usize`	指针大小的无符号整数
`ssize_t`	`isize`	指针大小的有符号整数
`void*`	`*mut c_void`	原始指针
`const void*`	`*const c_void`	原始指针
`bool`	`bool`（C23 前：`c_int`）	C99 无 bool

实战经验总结#

1. 优先用 bindgen，手写绑定只用于简单场景#

对于超过 10 个函数的 C 库，手写绑定的维护成本极高。

2. 所有 FFI 调用都在 unsafe 块中，且加 SAFETY 注释#

1
unsafe {
2
    // SAFETY: db 来自 sqlite3_open，保证有效
3
    // sql 指向 null-terminated UTF-8 字符串
4
    let rc = sqlite3_exec(db, sql.as_ptr(), None, std::ptr::null_mut(), std::ptr::null_mut());
5
}

3. FFI 函数不 panic#

1
extern "C" fn callback(data: *mut c_void) {
2
    let result = std::panic::catch_unwind(|| {
3
        // 可能 panic 的逻辑
4
    });
5
    if result.is_err() {
6
        std::process::abort();
7
    }
8
}

4. 用 cargo test + Miri 验证 FFI#

1
cargo test
2
cargo +nightly miri test  # 检测 UB

5. CI 中用 C 的 sanitizers#

1
# Address Sanitizer
2
RUSTFLAGS="-Z sanitizer=address" cargo +nightly test
3

4
# Memory Sanitizer
5
RUSTFLAGS="-Z sanitizer=memory" cargo +nightly test

音乐

音乐