关于rust:box关键字有什么作用?

What does the box keyword do?

在Rust中,我们可以使用Box< T >类型在堆上分配内容。 此类型用于安全地抽象指向堆内存的指针。 Box< T >由Rust标准库提供。

我很好奇Box< T >分配的实现方式,因此找到了它的源代码。 这是Box< T >::new的代码(从Rust 1.0开始):

1
2
3
4
5
6
7
8
9
impl< T > Box< T > {
    /// Allocates memory on the heap and then moves `x` into it.
    /// [...]
    #[stable(feature ="rust1", since ="1.0.0")]
    #[inline(always)]
    pub fn new(x: T) -> Box< T > {
        box x
    }
}

实现中的唯一行返回值box xbox关键字在官方文档中没有任何解释。 实际上,它只是在std::boxed文档页面上简短提及。


box x通常使用什么来分配和释放内存?

答案是标有lang项目exchange_malloc用于分配和exchange_free用于释放的函数。您可以在heap.rs#L112和heap.rs#L125的默认标准库中看到它们的实现。

最后,box x语法取决于以下lang项目:

  • box结构上的owned_box封装分配的指针。此结构不需要Drop实现,它是由编译器自动实现的。
  • exchange_malloc分配内存。
  • exchange_free释放先前分配的内存。

使用此no_std示例可以在锈书的lang项目一章中有效地看到这一点:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
#![feature(lang_items, box_syntax, start, no_std, libc)]
#![no_std]

extern crate libc;

extern {
    fn abort() -> !;
}

#[lang ="owned_box"]
pub struct Box< T >(*mut T);

#[lang ="exchange_malloc"]
unsafe fn allocate(size: usize, _align: usize) -> *mut u8 {
    let p = libc::malloc(size as libc::size_t) as *mut u8;

    // malloc failed
    if p as usize == 0 {
        abort();
    }

    p
}
#[lang ="exchange_free"]
unsafe fn deallocate(ptr: *mut u8, _size: usize, _align: usize) {
    libc::free(ptr as *mut libc::c_void)
}

#[start]
fn main(argc: isize, argv: *const *const u8) -> isize {
    let x = box 1;

    0
}

#[lang ="stack_exhausted"] extern fn stack_exhausted() {}
#[lang ="eh_personality"] extern fn eh_personality() {}
#[lang ="panic_fmt"] fn panic_fmt() -> ! { loop {} }

注意,没有为box结构实现Drop吗?好,让我们看看为main生成的LLVM IR:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
define internal i64 @_ZN4main20hbd13b522fdb5b7d4ebaE(i64, i8**) unnamed_addr #1 {
entry-block:
  %argc = alloca i64
  %argv = alloca i8**
  %x = alloca i32*
  store i64 %0, i64* %argc, align 8
  store i8** %1, i8*** %argv, align 8
  %2 = call i8* @_ZN8allocate20hf9df30890c435d76naaE(i64 4, i64 4)
  %3 = bitcast i8* %2 to i32*
  store i32 1, i32* %3, align 4
  store i32* %3, i32** %x, align 8
  call void @"_ZN14Box$LT$i32$GT$9drop.103617h8817b938807fc41eE"(i32** %x)
  ret i64 0
}

同时,按预期调用了allocate(_ZN8allocate20hf9df30890c435d76naaE)以构建boxbox(_ZN14Box$LT$i32$GT$9drop.103617h8817b938807fc41eE)的Drop方法!让我们看一下该方法的IR:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
define internal void @"_ZN14Box$LT$i32$GT$9drop.103617h8817b938807fc41eE"(i32**) unnamed_addr #0 {
entry-block:
  %1 = load i32** %0
  %2 = ptrtoint i32* %1 to i64
  %3 = icmp ne i64 %2, 2097865012304223517
  br i1 %3, label %cond, label %next

next:                                             ; preds = %cond, %entry-    block
  ret void

cond:                                             ; preds = %entry-block
  %4 = bitcast i32* %1 to i8*
  call void @_ZN10deallocate20he2bff5e01707ad50VaaE(i8* %4, i64 4, i64 4)
  br label %next
}

就是这样,在编译器生成的Drop上调用deallocate(ZN10deallocate20he2bff5e01707ad50VaaE)!

注意,即使在标准库上,Drop特征也不是由用户代码实现的。实际上,box有点神奇。


box被标记为不稳定之前,它被用作调用Box::new的简写。但是,始终打算能够分配任意类型(例如Rc)或使用任意分配器。这些都尚未完成,因此对于1.0发行版并没有标记为稳定。这样做是为了防止对所有Rust 1.x支持错误的决定。

作为进一步参考,您可以阅读RFC,该RFC更改了" placement new"语法,并对其进行了选通。


box的作用与Box::new()的作用完全相同-它创建了一个拥有的盒子。

我相信您找不到box关键字的实现,因为当前它已被硬编码以与拥有的框一起使用,并且box类型是一个lang项目:

1
2
3
4
#[lang ="owned_box"]
#[stable(feature ="rust1", since ="1.0.0")]
#[fundamental]
pub struct Box< T >(Unique< T >);

因为它是一个lang项目,所以编译器具有特殊的逻辑来处理其实例化,可以使用box关键字进行链接。

我相信编译器会将框分配委托给alloc::heap模块中的函数。

至于box关键字的功能以及应该做什么,Shepmaster的回答完美地描述了。