678775465c3a19b620edf0325f5c0f0a1bab6e18
[web.git] / personal / _posts / 2018-08-07-stacked-borrows.md
1 ---
2 title: "Stacked Borrows: An Aliasing Model For Rust"
3 categories: internship rust
4 ---
5
6 In this post, I am proposing "Stacked Borrows": A set of rules defining which kinds of aliasing are allowed in Rust.
7 This is intended to answer the question which pointer may be used when to perform which kinds of memory accesses.
8
9 This is a long-standing open question of many unsafe code authors, and also by compiler authors who want to add more optimizations.
10 The model I am proposing here is by far not the first attempt at giving a definition: The model is heavily based on ideas by [@arielb1](https://github.com/nikomatsakis/rust-memory-model/issues/26) and [@ubsan](https://github.com/nikomatsakis/rust-memory-model/issues/28), and of course taking into account the lessons I [learned last year]({% post_url 2017-08-11-types-as-contracts-evaluation %}) when I took my first stab at defining such a model, dubbed ["Types as Contracts"]({% post_url 2017-07-17-types-as-contracts %}).
11
12 <!-- MORE -->
13
14 But before I delve into my latest proposal, I want to briefly discuss a key difference between my previous model and this one:
15 "Types as Contracts" was a fully "validity"-based model, while "Stacked Borrows" is (to some extend) "access"-based.
16
17 ## 1 Validity-based vs. Access-based
18
19 An "access"-based model is one where certain properties -- in this case, mutable references being unique and shared references pointing to read-only memory -- are only enforced when the reference is actually used to *access* memory.
20 In contrast, a "validity"-based model requires these properties to always hold for all references that *could* be used.
21 In both cases, violating a property that the model requires to hold is undefined behavior..
22
23 Essentially, with a validity-based model like "Types as Contracts", the basic idea is that all data is always valid according to the type it is given.
24 Enforcing the restrictions of such a model (e.g., when checking whether a program has undefined behavior) amounts to eagerly checking all reachable data for validity.
25 An access-based model, on the other hand, only requires data to be valid when used.
26 Enforcing it amounts to lazily checking the bare minimum at each operation.
27
28 Validity-based models have several advantages: Eager checking means we can typically identify which code is actually responsible for producing the "bad" value.
29 "All data must always be valid" is also easier to explain than a long list of operations and the kind of restrictions they place upon the data.
30
31 However, in Rust, we cannot talk about references and whether the are valid at their given type without talking about lifetimes.
32 With "Types as Contracts", the exact place where a lifetime ended turned out to be really important.
33 Not only did this make the specification complex and hard to understand; the implementation in [Miri]({% post_url 2017-06-06-MIR-semantics %}) also had to actively work against the compiler's general intention to forget about lifetimes as early as possible.
34 With non-lexical lifetimes, the "end" of a lifetime is not even so clearly defined any more.
35
36 ## 2 Stacking Borrows
37
38 For these reasons, my second proposal makes lifetimes in general and the result of lifetime inference in particular completely irrelevant for whether a program has undefined behavior (UB).
39 This is one of the core design goals.
40
41 If you need some more context on undefined behavior and how it relates to compiler optimizations, I suggest you read [my blog post on this topic]({% post_url 2017-07-14-undefined-behavior %}) first.
42 It's not a long post, and I cannot repeat everything again here. :)
43
44 The central idea of this model (and its precursors by @arielb1 and @ubsan) is that, for every location, we keep track of the references that are allowed to access this location.
45 (I will discuss later just how we keep track of this; for now, let's just assume it can be done.)
46 This forms a stack: When we have an `&mut i32`, we can *reborrow* it to obtain a new reference.
47 That new reference is now the one that must be used for this location, but the old reference it was created from cannot be forgotten: At some point, the reborrow will expire and the old reference will be "active" again.
48 We will have other items on that stack as well, so we will write `Uniq(x)` to indicate that `x` is the unique reference permitted to access this location.
49
50 Let us look at an example:
51 {% highlight rust %}
52 fn demo0(x: &mut i32) -> i32 {
53   // At the beginning of the function, `x` must be the "active" reference
54   // for the 4 locations it points to, meaning `Uniq(x)` is at the top of the stack.
55   // (It's 4 locations because `i32` has size 4.)
56   let y = &mut *x; // Now `Uniq(y)` is pushed onto the stack, as new active reference.
57   // The stack now contains: Uniq(y), Uniq(x), ...
58   *y = 5; // Okay because `y` is active.
59   *x = 3; // This "activates" `x` by popping the stack.
60   // The stack now contains: Uniq(x), ...
61   *y // This is UB! `Uniq(y)` is not on the stack of borrows, so `y` must not be used.
62 }
63 {% endhighlight %}
64 Of course, this example would not compile because the borrow checker would complain.
65 However, in my interpretation, the *reason* it complains is that if it accepted the program, we would have UB in safe code!
66
67 This is worth pondering a bit: The model defines program semantics without taking lifetimes into account, so we can run programs and ask whether they have UB without
68 ever doing lifetime inference or borrow checking (very much unlike "Types as Contracts").
69 One important property, then, is that *if* the program has UB and does not use any unsafe code, the borrow checker must detect this.
70 In some sense, my model defines a dynamic version of the borrow checker *that works without lifetimes*.
71 It turns out that even with non-lexical lifetimes, the borrow structure for a given location is still well-nested, which is why we can arrange borrows in a stack.
72
73 ### 2.1 Raw Pointers
74
75 Let us bypass the borrow checker by adding some unsafe code to our program:
76 {% highlight rust %}
77 fn demo1(x: &mut i32) -> i32 {
78   // At the beginning of the function, `x` must be the "active" reference.
79   let raw = x as *mut _; // Create raw pointer
80   // The stack now contains: Raw, Uniq(x), ...
81   let y = unsafe { &mut *raw }; // Now `y` is pushed onto the stack, as new active reference.
82   // The stack now contains: Uniq(y), Raw, Uniq(x), ...
83   *y = 5; // Okay because `y` is active.
84   *x = 3; // This "activates" `x` by popping the stack twice.
85   *y // This is UB! `Uniq(y)` is not on the stack of borrows, so `y` must not be used.
86 }
87 {% endhighlight %}
88
89 What happens here is that we are casting `x` to a raw pointer.
90 For raw pointers, we cannot really keep track of where and how they have been created -- raw pointers can be safely cast to and from integers, and data could flow arbitrarily.
91 So, when a `&mut` is cast to `*mut` like above, we instead push `Raw` onto the stack, indicating that *any* raw pointer may be used to access this location.
92 (The usual restrictions about address arithmetic across allocations still apply, I am just talking about the borrow checking here.)
93
94 In the next line, we use a raw pointer to create `y`.
95 That is okay because `Raw` is active.
96 As usual when a reference is created, we push it onto the stack.
97 This makes `y` the active reference, so we can use it in the next line.
98 And again, using `x` pops the stack until `x` is active -- in this case, this removes both the `Uniq(y)` and the `Raw`, making `y` unusable and causing UB in the last line.
99
100 Let us look at another example involving raw pointers:
101 {% highlight rust %}
102 fn demo2(x: &mut i32) -> i32 {
103   // At the beginning of the function, `x` must be the "active" reference.
104   let raw = x as *mut _; // Create raw pointer
105   // The stack now contains: Raw, Uniq(x), ...
106   let y = unsafe { &mut *raw }; // Now `y` is pushed onto the stack, as new active reference.
107   // The stack now contains: Uniq(y), Raw, Uniq(x), ...
108   *y = 5; // Okay because `y` is active.
109   unsafe { *raw = 5 }; // Using a raw pointer, so `Raw` gets activated by popping the stack!
110   // The stack now contains: Raw, Uniq(x), ...
111   *y // This is UB! `Uniq(y)` is not on the stack of borrows, so `y` must not be used.
112 }
113 {% endhighlight %}
114 Because raw pointers are tracked on the stack, they have to follow the well-nested structure.
115 `y` was "created from" `raw`, so using `raw` again invalidates `y`!
116 This is exactly in symmetry with the first example where `y` was "created from" `x`, so using `x` again invalidated `y`.
117
118 ### 2.2 Shared References
119
120 For shared references, of course, we do not have a single reference which is the only one with permission to access.
121 The key property we have to model is that shared references point to memory that does not change (assuming no interior mutability is involved).
122 The memory is, so to speak, *frozen*.
123
124 For this purpose, we tag shared references with some kind of "timestamp" indicating *when* it was created.
125 We also have an extra flag for each location storing *since when* the location is frozen.
126 Using a shared reference to access memory is okay if memory has been frozen continuously since the reference was created.
127
128 We can see this in action in the following example:
129 {% highlight rust %}
130 fn demo3(x: &mut i32) -> i32 {
131   // At the beginning of the function, `x` must be the "active" reference.
132   let raw = x as *mut _; // Create raw pointer
133   // The stack now contains: Raw, Uniq(x), ...
134   let y = unsafe { & *raw }; // Now memory gets frozen (recording the timestamp)
135   let _val = *y; // Okay because memory was frozen since `y` was created
136   *x = 3; // This "activates" `x` by unfreezing and popping the stack.
137   let z = unsafe { & *raw }; // Now memory gets frozen *again*
138   *y // This is UB! Memory has been frozen strictly after `y` got created.
139 }
140 {% endhighlight %}
141
142 Shared references with interior mutability do not really have any restrictions in terms of what can happen to memory, so we treat them basically like raw pointers.
143
144 ### 2.3 Recap
145
146 For every location in memory, we keep track of a stack of borrows (`Uniq(_)` or `Raw`), and potentially "top off" this stack by freezing the location.
147 A frozen location is never written to, and no `Uniq` is pushed.
148
149 Whenever a mutable reference is created, a matching `Uniq` is pushed onto the stack for every location "covered by" the reference -- i.e., the locations that would be accessed when the reference is used (starting at where it points to, and going on for `mem::size_of::<T>` many bytes).
150 Whenever a shared reference is created, if there is no interior mutability, we freeze the locations if they are not already frozen.
151 If there is interior mutability, we just push a `Raw`.
152 Whenever a raw pointer is created from a mutable reference, we push a `Raw`.
153 (Nothing happens when a raw pointer is created from a shared reference.)
154
155 A mutable reference `x` is "active" for a location if that location is not frozen and `Uniq(x)` is on top of the stack.
156 A shared reference without interior mutability is active if the location is frozen at least since the location was created.
157 A shared reference with interior mutability is active is `Raw` is on top of the stack.
158
159 Whenever a reference is used to do something (anything), we make sure that it is active for all locations that it covers; this can involve unfreezing and popping the stack.
160 If it is not possible to activate the reference this way, we have UB.
161
162 ## 3 Tracking Borrows
163
164 So far, I have just been assuming that we can somehow keep a connection between a reference like `x` in the code above, and an item `Uniq(x)` on the stack.
165 I also said we are keeping track of when a shared reference was created.
166 To realize this, we need to somehow have information "tagged" to the reference.
167 In particular, notice that `x` and `y` in the first example have the same address.
168 If we compared them as raw pointers, they would turn out equal.
169 And yet, it makes a huge difference if we use `x` or `y`!
170
171 If you read my previous post on [why pointers are complicated](2018-07-24-pointers-and-bytes), this should not come as too much of a surprise.
172 There is more to a pointer, or a reference (I am using these terms mostly interchangeably), than the address in memory that it points to.
173
174 For the purpose of this model, we assume that a value of reference type consists of two parts: An address in memory, and a tag used to store the time when the reference was created.
175 "Time" here is a rather abstract notion, we really just need some counter that we bump up every time a new reference is created.
176 This gives us a unique ID for each mutable reference -- and, as we have seen, for shared references we actually exploit the fact that IDs are handed out in increasing order
177 (so that we can test if a reference was created before or after a location was frozen).
178 So, we can actually treat mutable and shard references uniformly in that both just record, in their tag, the time at which they were created.
179
180 Whenever I said above that we have `Uniq(x)` on the stack, what I really meant is that we have `Uniq(t_x)` on the stack, where `t_x` is some clock value, and that the "tag" of `x` is `t_x`.
181 For the sake of readability, I will continue to use the `Uniq(x)` notation below.
182
183 Since raw pointers are not tracked, we can erase the tag when casting a reference to a raw pointer.
184 This means our tag does not interfere with pointer-integer casts, which means there are a whole bunch of complicated questions we do not have to worry about. :)
185
186 Of course, these tags do not exist on real hardware.
187 But that is besides the point.
188 When *specifying* program behavior, we can work with an ["instrumented machine"]({% post_url 2017-06-06-MIR-semantics %}) that has extra state which is not present on the real machine, as long as we only use that extra state to define whether a program is UB or not:
189 On real hardware, we can ignore programs that are UB (they may just do whatever), so the extra state does not matter.
190
191 Tags are something I wanted to avoid in "Types as Contracts" -- that was one of the initial design constraints I had put upon myself, in the hope of avoiding the trouble coming with "complicated pointers".
192 However, I now came to the conclusion that tagging pointers is a price worth paying if it means we can make lifetimes irrelevant.
193
194 ## 4 Retagging and Barriers
195
196 I hope you now have a clear idea of the basic structure of the model I am proposing: The stack of borrows, the freeze flag, and references tagged with the time at which they got created.
197 The full model is not quite as simple, but it is not much more complicated either.
198 We need two add just two more concepts: Retagging and barriers.
199
200 ### 4.1 Retagging
201
202 Remember that every time we create a mutable borrow, we assign it the current
203 clock values as its tag.  Since the tag can never be changed, this means two
204 different variables can never have the same tag -- right?  Well, unfortunately,
205 things are not so simple: Using
206 e.g. [`transmute_copy`](https://doc.rust-lang.org/stable/std/mem/fn.transmute_copy.html)
207 or a `union`, one can make a copy of a reference in a way that Rust does not
208 even notice.
209
210 Still, we would like to make statements about code like this:
211 {% highlight rust %}
212 fn demo4(x: &mut i32, y: &mut i32) -> i32 {
213   *x = 42;
214   *y = 7;
215   *x // Will load 42! We can optimize away the load.
216 }
217 {% endhighlight %}
218 The trouble is, we cannot prevent the outside world from passing bogus `&mut` that have the same tag.
219 Does this mean we are back to square one in terms of making aliased mutable references UB?
220 Lucky enough, we are not! We have a lot of machinery at our disposal, we just have to tweak it a little.
221
222 What we will do is, every time a reference comes "into" our function (this can be a function argument, but also loading it from memory or getting it as the return value of some other function), we perform "retagging":
223 We change the tags of the mutable references to the current clock value, bumping up the clock after every tag we assign, and then we push those new tags on top of the borrow stack.
224 This way, we can know -- without making any assumptions about foreign code -- that all references have distinct IDs.
225 In particular, two different references can never be both "active" for the same location at the same time.
226
227 With this additional step, it is now easy to argue that `demo4` above is UB when `x` and `y` alias, no matter their initial tag:
228 After using `x`, we know it is active.
229 Next we use and activate `y`, which has to pop `Uniq(x)` as they have distinct tags.
230 Finally, we use `x` again even though it is no longer in the stack, triggering UB.
231 (A `Uniq` is only veer pushed when it is created, so it is never in the stack more than once.)
232
233 ### 4.2 Barriers
234
235 There is one more concept I would like to add: Barriers.
236 The model would make a lot of sense even without barriers -- but adding barriers rules out some more behavior that I do not think we want to allow.
237 It is also needed to explain why we can put the [`noalias` parameter attribute](https://llvm.org/docs/LangRef.html#parameter-attributes) on our functions when generating LLVM IR.
238
239 Consider the following code:
240 {% highlight rust %}
241 fn demo5(x: &mut i32, y: usize) -> i32 {
242   *x = 42;
243   foo(y);
244 }
245
246 fn foo(y: usize) {
247   let y = unsafe { &mut *(y as *mut i32) };
248   *y = 7;
249 }
250 {% endhighlight %}
251 The question is: Can we reorder the `*x = 42;` down to the end of `demo5`?
252 Notice that we are *not* using `x` again, so we cannot assume that `x` is active at the end of `demo5`!
253 This is the usual trouble with access-based models.
254
255 However, someone might conceivably call `demo5` with `y` being `x as *mut _ as usize`, which means reordering could change program behavior.
256 To fix this, we have to make sure that if someone actually calls `demo5` this way, we have UB *even though* `x` is not used again.
257
258 To this end, I propose to turn the dial a little more towards a validity-based model by imposing some extra constraints.
259 We want to ensure that turning the integer `y` into a reference does not pop `x` from the stack and continue executing the program (we want UB instead).
260 This could happen if the stack contained, somewhere, a `Raw`.
261 Remember that we do not tag raw pointers, so when a raw pointer was involved in creating `x`, that `Raw` item will still be on the stack, enabling any raw pointer to be used to access this location.
262 This is sometimes crucial, but in this case, `demo5` should be able to prevent those old historic borrows involved in creating `x` from being activated.
263
264 The idea is to put a "barrier" into the stack of all function arguments when `demo5` gets called, and to make it UB to pop that barrier from the stack before `demo5` returns.
265 This way, all the borrows further down in the stack (below `Uniq(x)`) are temporarily disabled and cannot be activated while `demo5` runs.
266 This means that even if `y` happens to be the memory address `x` points to, it is UB to cast `y` to a reference because the `Raw` item cannot be activated.
267
268 Another way to think about barriers is as follows:
269 The model generally ignores lifetimes and does not know how long they last.
270 All we know is that when a reference is used, its lifetime must be ongoing, so we say that is when we activate the borrow.
271 On top of this, barriers encode the fact that, when a reference is passed as an argument to a function, then its lifetime (whatever it is) extends beyond the current function call.
272 In our example, this means that no borrow further up the stack (these are the borrows with even longer lifetimes) can be used while `demo5` is running.
273
274 A nice side-effect of barriers in combination with renumbering is that even if `demo4` from the previous subsection would not use its arguments at all, it would *still* be UB to call it with two aliasing references:
275 When renumbering `x`, we are pushing a barrier. Renumbering `y` would attempt to activate `Uniq(y)`, but that can only be behind the barrier, so it cannot be activated.
276
277 ## 5 The Model in Code
278
279 Now we have everything together.
280 Instead of giving another recap, I will try to give an alternative, more precise description of the model in the form of pseudo Rust code.
281 This is essentially a draft of the code that will hopefully be in Miri soon, to actually dynamically track the borrow stack and enforce the rules.
282 This is also how I go about developing such models -- I use some form of pseudo-Rust, which I find it easier to be precise in than pure English.
283 Some details have been omitted in the high-level description so far, they should all be in this code.
284
285 If you are only interested in the high-level picture, feel free to skip to the end.
286 The rest of this is more like a specification than an explanatory blog post.
287 The nice thing is that even with the spec, this post is still shorter than the one introducing "Types as Contracts". :)
288
289 ### 5.1 Per-Location Operations
290
291 Imagine we have a type `MemoryByte` storing the per-location information in memory.
292 This is where we put the borrow stack and the information about freezing:
293
294 {% highlight rust %}
295 /// Information about a potentially mutable borrow
296 enum Mut {
297   /// A unique, mutable reference
298   Uniq(Timestamp),
299   /// Any raw pointer, or a shared borrow with interior mutability
300   Raw,
301 }
302 /// Information about any kind of borrow
303 enum Borrow {
304   /// A mutable borrow, a raw pointer, or a shared borrow with interior mutability
305   Mut(Mut),
306   /// A shared borrow without interior mutability
307   Frz(Timestamp)
308 }
309 /// An item in the borrow stack
310 enum BorStackItem {
311   /// Defines which references are permitted to mutate *if* the location is not frozen
312   Mut(Mut),
313   /// A barrier, tracking the function it belongs to by its index on the call stack
314   FnBarrier(usize)
315 }
316
317 struct MemoryByte {
318   borrows: Vec<BorStackItem>, // used as a stack
319   frz_since: Option<Timestamp>,
320   /* More fields, to store the actual value and what else might be needed */
321 }
322 {% endhighlight %}
323
324 Next, we define some per-location operations that we will use later to define what happens when working with references.
325 Below, `assert!` is used for things that should always be true because of interpreter invariants (i.e., Miri will ICE if they fail to hold), and `bail!` is used to indicate that the program has UB.
326
327 {% highlight rust %}
328 impl MemoryByte {
329
330   /// Check if the given borrow may be used on this location.
331   fn check(&self, bor: Borrow) → bool {
332     match bor {
333       Frz(acc_t) =>
334         // Must be frozen at least as long as the `acc_t` says.
335         self.frz_since.map_or(false, |loc_t| loc_t <= acc_t),
336       Mut(acc_m) =>
337         // Raw pointers are fine with frozen locations. This is important because &Cell is raw!
338         (acc_m.is_raw() && self.frozen_since.is_some()) ||
339         self.borrows.last().map_or(false, |loc_itm| loc_itm == Mut(acc_m)),
340     }
341   }
342
343   /// Activate the given existing borrow for this location, fail if that is not possible.
344   fn activate(&mut self, bor: Borrow) {
345     // Do NOT change anything if `bor` is already active -- in particular, if
346     // it is a `Mut(Raw)` and we are frozen.
347     if self.check(bor) { return; }
348     let acc_m = match bor {
349       Frz(acc_t) => bail!("Location should be frozen but it is not"),
350       Mut(acc_m) => acc_m,
351     };
352     // We definitely have to unfreeze this, even if we use the topmost item.
353     self.frozen_since = None;
354     // Pop until we see the one we are looking for.
355     while let Some(itm) = self.borrows.last() {
356       match itm {
357         FnBarrier(_) => {
358           bail!("Trying to activate a borrow that lives behind a barrier");
359         }
360         Mut(loc_m) => {
361           if loc_m == acc_m { return; }
362           self.borrows.pop();
363         }
364       }
365     }
366     bail!("Borrow-to-activate does not exist on the stack");
367   }
368
369   /// Initiate the given (new) borrow for the location.
370   /// This is "pushing to the stack", except that it also handles initiating a `Frz`.
371   fn initiate(&mut self, bor: Borrow) {
372     match bor {
373       Frz(t) => {
374         if self.frozen_since.is_none() {
375           self.frozen_since = Some(t);
376         }
377       }
378       Mut(m) => {
379         if m.is_uniq() && self.frozen_since.is_some() {
380           bail!("Must not initiate Uniq when frozen!");
381         }
382         self.borrows.push(Mut(m));
383       }
384     }
385   }
386
387   /// Reset the borrow tracking for this location.
388   fn reset(&mut self) {
389     if self.borrows.iter().any(|itm| if let FnBarrier(_) = item { true } else { false }) {
390       assert!("Cannot reset while there are barriers");
391     }
392     self.frozen_since = None;
393     self.borrows.clear();
394   }
395   
396 }
397 {% endhighlight %}
398
399 ### 5.2 MIR operations
400
401 Finally, we enhance some MIR operations with bookkeeping, following the model I described above.
402 This is where the code gets more "pseudo" and less Rust. ;)
403
404 For each of these operation, we iterate over all affected locations; let us call the loop variable `loc` of type `MemoryByte`.
405 We also have a variable `tag` with the tag of the pointer we are operating on (loading, or storing, or casting to a raw pointer, ...).
406
407 Moreover, we have a boolean variable `in_unsafe_cell` indicating whether, according to the type of the pointer, the location we are currently working on is covered by an [`UnsafeCell`](https://doc.rust-lang.org/beta/std/cell/struct.UnsafeCell.html).
408 (This realizes the conditions checking whether we have interior mutability or not.)
409 For example, in `&Cell<i32>`, all 4 locations are inside an `UnsafeCell`.
410 However, in `&(i32, Cell<i32>)`, only the last 4 of the 8 covered locations are inside an `UnsafeCell`.
411
412 Finally, given a reference type, a tag, and whether we are inside an `UnsafeCell`, we can compute the matching `Borrow`:
413 Mutable references use `Mut(Uniq(tag))`, shared references in an `UnsafeCell` use `Mut(Raw)` and other shared references use `Frz(tag)`.
414 We use `bor` to refer to the `Borrow` of the pointer we are working on.
415
416 Now we can look at what happens for each operation.
417
418 * Using a raw pointer directly is desugared to creating a shared reference (when reading) or a mutable reference (when writing), and using that. The appropriate steps below apply.
419 * Any time we use a (mutable or shared) reference to access memory, and any time we pass a reference to "the outside world" (passing it to a function, storing it in memory, returning it to our caller; also below structs or enums but not below unions or pointer indirectons), we activate.
420   - `loc.activate(borrow)`.
421 * Any time a *new* reference is created (any time we run an expression `&mut foo` or `&foo`), we (re)borrow.
422   - Bump up the clock, and remember the old time as `new_tag`.
423   - Compute `new_bor` from `new_tag` and the type of the reference being created.
424   - `if loc.check(new_bor) {`
425     * The new borrow is already active! This can happen because a mutable reference can be shared multiple times. We do not do anything else.
426       As a special exception, we do *not* activate `bor` even though it is "used", because that would unfreeze the location!
427
428     `} else {`
429     * We might be creating a reference to a local variable. In that case, `loc.reset()`. Otherwise, `activate(bor)`.
430     * `initiate(new_bor)`
431
432     `}`
433   - Use `new_tag` for the new reference.
434 * Any time a reference is passed to us from "the outside world" (as function argument, loaded from memory, or returned from a callee; also below structs or enums but not below unions or pointer indirectons), we retag.
435   - Bump up the clock, and remember the old time as `new_tag`.
436   - Compute `new_bor` from `new_tag` and the type of the reference being created.
437   - `activate(bor)`.
438   - If this is a function argument coming in: `loc.borrows.push(FnBarrier(stack_height))`.
439   - `initiate(new_bor)`. Note that this is a NOP if `new_bor` is already active -- in particular, if the location is frozen and this is a shared reference with interior mutability, we do *not* push anything on top of the barrier. This is important, because we do not want to push that might unfreeze the location when being activated.
440   - Change reference tag to `new_tag`.
441 * Any time a raw pointer is created from a reference, we might have to do a raw reborrow.
442   - `activate(bor)`.
443   - `initiate(Mut(Raw))`. This is a NOP when coming from a shared reference.
444 * Any time a function returns, we have to clean up the barriers.
445   - Iterate over all of memory and remove the matching `FnBarrier`. This is where the "stack" becomes a bit of a lie, because we also remove barriers from the middle of a stack.<br>
446     This could be optimized by adding an indirection, so we just have to record somewhere that this function call has ended.
447
448
449 If you want to test your own understanding of "Stacked Borrows", I invite you to go back to [Section 2.2 of "Types as Contracts"]({% post_url 2017-07-17-types-as-contracts %}#22-examples) and look at the three examples here.
450 Ignore the `Validate` calls, that part is no longer relevant.
451 These are examples of optimizations we would like to be valid, and in fact all three of them are still valid with "Stacked Borrows".
452 Can you argue why that is the case?
453
454 ## Summary
455
456 I have described (yet) another Rust memory model that defines when a reference may be used to perform which memory operations.
457 The main design constraint of this model is that lifetimes should not matter for program execution.
458 To my own surprise, the model actually ended up being fairly simple, all things considered.
459
460 I think I covered most of the relevant features, though I will have to take a closer look at two-phase borrows and see if they need some further changes to the model.
461
462 Of course, now the big question is whether this model actually "works" -- does it permit all the code we want to permit (does it even permit all safe code), and does it rule out enough code such that we can get useful optimizations?
463 I hope to explore this question further in the following weeks by implementing a dynamic checker to test the model on real code.
464 It is just easier to answer these questions when you do not have to *manually* reevaluate all examples after every tiny change.
465 However, I can always use more examples, so if you think you found some interesting or surprising corner case, please let me know!
466
467 <!-- As always, if you have any questions or comments, feel free to [ask in the forums](). -->