Revisions.
[pintos-anon] / doc / filesys.texi
1 @node Project 4--File Systems, References, Project 3--Virtual Memory, Top
2 @chapter Project 4: File Systems
3
4 In the previous two assignments, you made extensive use of a
5 filesystem without actually worrying about how it was implemented
6 underneath.  For this last assignment, you will fill in the
7 implementation of the filesystem.  You will be working primarily in
8 the @file{filesys} directory.
9
10 You should build on the code you wrote for the previous assignments.
11 However, if you wish, you may turn off your VM features, as they are
12 not vital to making the filesystem work.  (You will need to edit
13 @file{filesys/Makefile.vars} to fully disable VM.)  All of the
14 functionality needed for project 2 (argument passing, syscalls and
15 multiprogramming) must work in your filesys submission.
16
17 On the other hand, one of the particular charms of working on
18 operating systems is being able to use what you build, and building
19 full-featured systems.  Therefore, you should strive to make all the
20 parts work together so that you can run VM and your filesystem at the
21 same time.  Plus, keeping VM is a great way to stress-test your
22 filesystem implementation.
23
24 Your submission should define @code{THREAD_JOIN_IMPLEMENTED} in
25 @file{constants.h} (@pxref{Conditional Compilation}).
26
27 @menu
28 * File System New Code::        
29 * Problem 4-1 Large Files::     
30 * Problem 4-2 File Growth::     
31 * Problem 4-3 Subdirectories::  
32 * Problem 4-4 Buffer Cache::    
33 * File System Design Document Requirements::  
34 * File System FAQ::            
35 @end menu
36
37 @node File System New Code
38 @section New Code
39
40 Here are some files that are probably new to you.  These are in the
41 @file{filesys} directory except where indicated:
42
43 @table @file
44 @item fsutil.c
45 Simple utilities for the filesystem that are accessible from the
46 kernel command line.
47
48 @item filesys.h
49 @itemx filesys.c
50 Top-level interface to the file system.  Please read the long comment
51 near the top of @file{filesys.c}, which introduces some details of the
52 file system code as provided.
53
54 @item directory.h
55 @itemx directory.c
56 Translates file names to inodes.  The directory data structure is
57 stored as a file.
58
59 @item inode.h
60 @itemx inode.c
61 Manages the data structure representing the layout of a
62 file's data on disk.
63
64 @item file.h
65 @itemx file.c
66 Translates file reads and writes to disk sector reads
67 and writes.
68
69 @item lib/kernel/bitmap.h
70 @itemx lib/kernel/bitmap.c
71 A bitmap data structure along with routines for reading and writing
72 the bitmap to disk files.
73 @end table
74
75 Our file system has a Unix-like interface, so you may also wish to
76 read the Unix man pages for @code{creat}, @code{open}, @code{close},
77 @code{read}, @code{write}, @code{lseek}, and @code{unlink}.  Our file
78 system has calls that are similar, but not identical, to these.  The
79 file system translates these calls into physical disk operations.  
80
81 All the basic functionality is there in the code above, so that the
82 filesystem is usable right off the bat.  In fact, you've been using it
83 in the previous two projects.  However, it has severe limitations
84 which you will remove.
85
86 While most of your work will be in @file{filesys}, you should be
87 prepared for interactions with all previous parts (as usual).
88
89 @node File System Synchronization
90 @section Synchronization
91
92 The file system as provided requires external synchronization, that is,
93 callers must ensure that only one thread can be running in the file
94 system code at once.  Your submission should use a more finely granular
95 synchronization strategy.  You will need to consider synchronization for
96 each type of file system object.  The provided code uses the following
97 strategies:
98
99 @itemize @bullet
100 @item
101 The free map and root directory are read each time they are needed for
102 an operation, and if they are modified, they are written back before the
103 operation completes.  Thus, the free map is always consistent from an
104 external viewpoint.
105
106 @item
107 Inodes are immutable in the provided file system, that is, their content
108 never changes between creation and deletion, and furthermore only one
109 copy of an inode's data is maintained in memory at once, even if the
110 file is open in multiple contexts.
111
112 @item
113 File data doesn't have to be consistent because it's just not part of
114 the model.  In Unix and many other operating systems, a read of a file
115 by one process when the file is being written by another process can
116 show inconsistent results: it can show that none, all, or part of the
117 write has completed.  (However, after the write system call returns to
118 its caller, all subsequent readers must see the change.)  Similarly,
119 when two threads write to the same part of a file at the same time,
120 their data may be arbitrarily interleaved.
121
122 External synchronization of the provided file system ensures that reads
123 and writes are fully serialized, but your file system doesn't have to
124 maintain full serialization as long as it follows the rules above.
125 @end itemize
126
127 @node Problem 4-1 Large Files
128 @section Problem 4-1: Large Files
129
130 Modify the file system to allow the maximum size of a file to be as
131 large as the disk.  You can assume that the disk will not be larger
132 than 8 MB.  In the basic file system, each file is limited to a file
133 size of just under 64 kB.  Each file has a header called an index node
134 or @dfn{inode} (represented by @struct{inode}) that is a table of
135 direct pointers to the disk blocks for that file.  Since the inode is
136 stored in one disk sector, the maximum size of a file is limited by
137 the number of pointers that will fit in one disk sector.  Increasing
138 the limit to 8 MB will require you to implement doubly-indirect
139 blocks.
140
141 @node Problem 4-2 File Growth
142 @section Problem 4-2: File Growth
143
144 Implement extensible files.  In the basic file system, the file size
145 is specified when the file is created.  One advantage of this is that
146 the inode data structure, once created, never changes.  In UNIX and
147 most other file systems, a file is initially created with size 0 and
148 is then expanded every time a write is made off the end of the file.
149 Modify the file system to allow this.  As one test case, allow the
150 root directory file to expand beyond its current limit of ten files.
151 Make sure that concurrent accesses to the inode remain properly
152 synchronized.
153
154 The user is allowed to seek beyond the current end-of-file (EOF).  The
155 seek itself does not extend the file.  Writing at a position past EOF
156 extends the file to the position being written, and any gap between the
157 previous EOF and the start of the write must be filled with zeros.  A
158 read past EOF returns zero bytes.
159
160 Writing far beyond EOF can cause many blocks to be entirely zero.  Some
161 file systems allocate and write real data blocks for these implicitly
162 zeroed blocks.  Other file systems do not allocate these blocks at all
163 until they are explicitly written.  The latter file systems are said to
164 support ``sparse files.''  You may adopt either allocation strategy in
165 your file system.
166
167 @node Problem 4-3 Subdirectories
168 @section Problem 4-3: Subdirectories
169
170 Implement a hierarchical name space.  In the basic file system, all
171 files live in a single directory.  Modify this to allow directories to
172 point to either files or other directories.  To do this, you will need
173 to implement routines that parse path names into a sequence of
174 directories, as well as routines that change the current working
175 directory and that list the contents of the current directory.  For
176 performance, allow concurrent updates to different directories, but
177 use mutual exclusion to ensure that updates to the same directory are
178 performed atomically (for example, to ensure that a file is deleted
179 only once).
180
181 Make sure that directories can expand beyond their original size just
182 as any other file can.
183
184 Each process has its own current directory.  When one process starts
185 another with the @code{exec} system call, the child process inherits its
186 parent's current directory.  After that, the two processes' current
187 directories are independent, so that either changing its own current
188 directory has no effect on the other.
189
190 Update the existing system calls so that, anywhere a file name is
191 provided by the caller, an absolute or relative path name may used.
192 Also, implement the following new system calls:
193
194 @table @code
195 @item SYS_chdir
196 @itemx bool chdir (const char *@var{dir})
197 Attempts to change the current working directory of the process to
198 @var{dir}, which may be either relative or absolute.  Returns true if
199 successful, false on failure.
200
201 @item SYS_mkdir
202 @itemx bool mkdir (const char *dir)
203 Attempts to create the directory named @var{dir}, which may be either
204 relative or absolute.  Returns true if successful, false on failure.
205
206 @item SYS_lsdir
207 @itemx void lsdir (void)
208 Prints a list of files in the current directory to @code{stdout}, one
209 per line.
210 @end table
211
212 Also write the @command{ls} and @command{mkdir} user programs.  This
213 is straightforward once the above syscalls are implemented.  In Unix,
214 these are programs rather than built-in shell commands, but
215 @command{cd} is a shell command.  (Why?)
216
217 @node Problem 4-4 Buffer Cache
218 @section Problem 4-4: Buffer Cache
219
220 Modify the file system to keep a cache of file blocks.  When a request
221 is made to read or write a block, check to see if it is stored in the
222 cache, and if so, fetch it immediately from the cache without going to
223 disk.  (Otherwise, fetch the block from disk into cache, evicting an
224 older entry if necessary.)  You are limited to a cache no greater than
225 64 sectors in size.  Be sure to choose an intelligent cache
226 replacement algorithm.  Experiment to see what combination of accessed,
227 dirty, and other information results in the best performance, as
228 measured by the number of disk accesses.  (For example, metadata is
229 generally more valuable to cache than data.)  Document your
230 replacement algorithm in your design document.
231
232 The provided file system code uses a ``bounce buffer'' in @struct{file}
233 to translate the disk's sector-by-sector interface into the system call
234 interface's byte-by-byte interface.  It needs per-file buffers because,
235 without them, there's no other good place to put sector
236 data.@footnote{The stack is not a good place because large objects
237 should not be allocated on the stack.  A 512-byte sector is pushing the
238 limit there.}  As part of implementing the buffer cache, you should get
239 rid of these bounce buffers.  Instead, copy data into and out of sectors
240 in the buffer cache directly.  You will probably need some
241 synchronization to prevent sectors from being evicted from the cache
242 while you are using them.
243
244 In addition to the basic file caching scheme, your implementation
245 should also include the following enhancements:
246
247 @table @b
248 @item write-behind:
249 Instead of always immediately writing modified data to disk, dirty
250 blocks can be kept in the cache and written out sometime later.  Your
251 buffer cache should write behind whenever a block is evicted from the
252 cache.
253
254 @item read-ahead:
255 Your buffer cache should automatically fetch the next block of a file
256 into the cache when one block of a file is read, in case that block is
257 about to be read.
258 @end table
259
260 For each of these three optimizations, design a file I/O workload that
261 is likely to benefit from the enhancement, explain why you expect it
262 to perform better than on the original file system implementation, and
263 demonstrate the performance improvement.
264
265 Note that write-behind makes your filesystem more fragile in the face
266 of crashes.  Therefore, you should
267 periodically write all cached blocks to disk.  If you have
268 @func{timer_sleep} from the first project working, this is an
269 excellent application for it.
270
271 Likewise, read-ahead is only really useful when done asynchronously.
272 That is, if a process wants disk block 1 from the file, it needs to
273 block until disk block 1 is read in, but once that read is complete,
274 control should return to the process immediately while the read
275 request for disk block 2 is handled asynchronously.  In other words,
276 the process will block to wait for disk block 1, but should not block
277 waiting for disk block 2.
278
279 When you're implementing this, please make sure you have a scheme for
280 making any read-ahead and write-behind threads halt when Pintos is
281 ``done'' (when the user program has completed, etc), so that Pintos
282 will halt normally and the disk contents will be consistent.
283
284 @node File System Design Document Requirements
285 @section Design Document Requirements
286
287 As always, submit a design document file summarizing your design.  Be
288 sure to cover the following points:
289
290 @itemize @bullet
291 @item
292 How did you choose to synchronize file system operations?
293
294 @item
295 How did you structure your inodes? How many blocks did you access
296 directly, via single-indirection, and/or via double-indirection?  Why?
297
298 @item
299 How did you structure your buffer cache? How did you perform a lookup
300 in the cache? How did you choose elements to evict from the cache?
301
302 @item
303 How and when did you flush the cache?
304 @end itemize
305
306 @node File System FAQ
307 @section FAQ
308
309 @enumerate 1
310 @item
311 @b{What extra credit opportunities are available for this assignment?}
312
313 @itemize @bullet
314 @item
315 We'll give out extra credit to groups that implement Unix-style
316 support for @file{.} and @file{..} in relative paths in their projects.
317
318 @item
319 We'll give some extra credit if you submit with VM enabled.  If you do
320 this, make sure you show us that you can run multiple programs
321 concurrently.  A particularly good demonstration is running
322 @file{capitalize} (with a reduced words file that fits comfortably on
323 your disk, of course).  So submit a file system disk that contains a
324 VM-heavy program like @file{capitalize}, so we can try it out.  And also
325 include the results in your test case file.
326
327 We feel that you will be much more satisfied with your cs140 ``final
328 product'' if you can get your VM working with your file system.  It's
329 also a great stress test for your FS, but obviously you have to be
330 pretty confident with your VM if you're going to submit this extra
331 credit, since you'll still lose points for failing FS-related tests,
332 even if the problem is in your VM code.
333
334 @item
335 A point of extra credit can be assigned if a user can recursively
336 remove directories from the shell command prompt.  Note that the
337 typical semantic is to just fail if a directory is not empty.
338 @end itemize
339
340 Make sure that you discuss any extra credit in your @file{README}
341 file.  We're likely to miss it if it gets buried in your design
342 document.
343
344 @item
345 @b{What exec modes for running Pintos do I absolutely need to
346 support?}
347
348 You also need to support the @option{-f}, @option{-ci}, @option{-co},
349 and @option{-ex} flags individually, and you need to handle them when
350 they're combined, like this: @samp{pintos -f -ci shell 12345 -ex
351 "shell"}.  Thus, you should be able to treat the above as equivalent to:
352
353 @example
354 pintos -f
355 pintos -ci shell 12345
356 pintos -ex "shell"
357 @end example
358
359 If you don't change the filesystem interface, then this should already
360 be implemented properly in @file{threads/init.c} and
361 @file{filesys/fsutil.c}.
362
363 You must also implement the @option{-q} option and make sure that data
364 gets flushed out to disk properly when it is used.
365
366 @item
367 @b{Will you test our file system with a different @code{DISK_SECTOR_SIZE}?}
368
369 No, @code{DISK_SECTOR_SIZE} is fixed at 512.  This is a fixed property
370 of IDE disk hardware.
371
372 @item
373 @b{Will the @struct{inode} take up space on the disk too?}
374
375 Yes.  Anything stored in @struct{inode} takes up space on disk,
376 so you must include this in your calculation of how many entires will
377 fit in a single disk sector.
378
379 @item
380 @b{What's the directory separator character?}
381
382 Forward slash (@samp{/}).
383 @end enumerate
384
385 @menu
386 * Problem 4-2 File Growth FAQ::  
387 * Problem 4-3 Subdirectory FAQ::  
388 * Problem 4-4 Buffer Cache FAQ::  
389 @end menu
390
391 @node Problem 4-2 File Growth FAQ
392 @subsection Problem 4-2: File Growth FAQ
393
394 @enumerate 1
395 @item
396 @b{What is the largest file size that we are supposed to support?}
397
398 The disk we create will be 8 MB or smaller.  However, individual files
399 will have to be smaller than the disk to accommodate the metadata.
400 You'll need to consider this when deciding your @struct{inode}
401 organization.
402 @end enumerate
403
404 @node Problem 4-3 Subdirectory FAQ
405 @subsection Problem 4-3: Subdirectory FAQ
406
407 @enumerate 1
408 @item
409 @b{What's the answer to the question in the spec about why
410 @command{ls} and @command{mkdir} are user programs, while @command{cd}
411 is a shell command?}
412
413 Each process maintains its own current working directory, so it's much
414 easier to change the current working directory of the shell process if
415 @command{cd} is implemented as a shell command rather than as another
416 user process.  In fact, Unix-like systems don't provide any way for
417 one process to change another process's current working directory.
418
419 @item
420 @b{When the spec states that directories should be able to grow beyond
421 ten files, does this mean that there can still be a set maximum number
422 of files per directory that is greater than ten, or should directories
423 now support unlimited growth (bounded by the maximum supported file
424 size)?}
425
426 We're looking for directories that can support arbitrarily large
427 numbers of files.  Now that directories can grow, we want you to
428 remove the concept of a preset maximum file limit.
429
430 @item
431 @b{When should the @code{lsdir} system call return?}
432
433 The @code{lsdir} system call should not return until after the
434 directory has been printed.  Here's a code fragment, and the desired
435 output:
436
437 @example
438 printf ("Start of directory\n");
439 lsdir ();
440 printf ("End of directory\n");
441 @end example
442
443 This code should create the following output:
444
445 @example
446 Start of directory
447 ...  directory contents ...
448 End of directory
449 @end example
450
451 @item
452 @b{Do we have to implement both absolute and relative pathnames?}
453
454 Yes.  Implementing @file{.} and @file{..} is extra credit, though.
455
456 @item
457 @b{Should @func{remove} also be able to remove directories?}
458
459 Yes.  The @code{remove} system call should handle removal of both
460 regular files and directories.  You may assume that directories can
461 only be deleted if they are empty, as in Unix.
462 @end enumerate
463
464 @node Problem 4-4 Buffer Cache FAQ
465 @subsection Problem 4-4: Buffer Cache FAQ
466
467 @enumerate 1
468 @item
469 @b{We're limited to a 64-block cache, but can we also keep an
470 @struct{inode_disk} inside @struct{inode}, the way the provided code
471 does?}
472
473 The goal of the 64-block limit is to bound the amount of cached file
474 system data.  If you keep a block of disk data---whether file data or
475 metadata---anywhere in kernel memory then you have to count it against
476 the 64-block limit.  The same rule applies to anything that's
477 ``similar'' to a block of disk data, such as a @struct{inode_disk}
478 without the @code{length} or @code{sector_cnt} members.
479
480 That means you'll have to change the way the inode implementation
481 accesses its corresponding on-disk inode right now, since it currently
482 just embeds a @struct{inode_disk} in @struct{inode} and reads the
483 corresponding sector in from disk when it's created.  Keeping extra
484 copies of inodes would be cheating the 64-block limitation that we place
485 on your cache.
486
487 You can store pointers to inode data in @struct{inode}, if you want, and
488 you can store some other small amount of information to help you find
489 the inode when you need it.  Similarly, if you want to store one block
490 of data plus some small amount of metadata for each of your 64 cache
491 entries, that's fine.
492
493 If you look at @func{inode_byte_to_sector}, it uses the
494 @struct{inode_disk} directly without having first read in that sector
495 from wherever it was in the storage hierarchy.  This will no longer
496 work.  You will need to change @func{inode_byte_to_sector} so that it
497 reads the @struct{inode_disk} from the storage hierarchy before using
498 it.
499 @end enumerate