Now that qemu is available on Solaris, don't talk about it being
[pintos-anon] / doc / filesys.texi
1 @node Project 4--File Systems
2 @chapter Project 4: File Systems
3
4 In the previous two assignments, you made extensive use of a
5 file system without actually worrying about how it was implemented
6 underneath.  For this last assignment, you will improve the
7 implementation of the file system.  You will be working primarily in
8 the @file{filesys} directory.
9
10 You may build project 4 on top of project 2 or project 3.  In either
11 case, all of the functionality needed for project 2 must work in your
12 filesys submission.  If you build on project 3, then all of the project
13 3 functionality must work also, and you will need to edit
14 @file{filesys/Make.vars} to enable VM functionality.  You can receive up
15 to 5% extra credit if you do enable VM.
16
17 The tests for project 4 (and later projects) will probably run faster if
18 you use the qemu emulator, e.g.@: via @code{make check
19 PINTOSOPTS='--qemu'}.
20
21 @menu
22 * Project 4 Background::        
23 * Project 4 Requirements::      
24 * Project 4 FAQ::             
25 @end menu
26
27 @node Project 4 Background
28 @section Background
29
30 @menu
31 * File System New Code::        
32 @end menu
33
34 @node File System New Code
35 @subsection New Code
36
37 Here are some files that are probably new to you.  These are in the
38 @file{filesys} directory except where indicated:
39
40 @table @file
41 @item fsutil.c
42 Simple utilities for the file system that are accessible from the
43 kernel command line.
44
45 @item filesys.h
46 @itemx filesys.c
47 Top-level interface to the file system.  @xref{Using the File System},
48 for an introduction.
49
50 @item directory.h
51 @itemx directory.c
52 Translates file names to inodes.  The directory data structure is
53 stored as a file.
54
55 @item inode.h
56 @itemx inode.c
57 Manages the data structure representing the layout of a
58 file's data on disk.
59
60 @item file.h
61 @itemx file.c
62 Translates file reads and writes to disk sector reads
63 and writes.
64
65 @item lib/kernel/bitmap.h
66 @itemx lib/kernel/bitmap.c
67 A bitmap data structure along with routines for reading and writing
68 the bitmap to disk files.
69 @end table
70
71 Our file system has a Unix-like interface, so you may also wish to
72 read the Unix man pages for @code{creat}, @code{open}, @code{close},
73 @code{read}, @code{write}, @code{lseek}, and @code{unlink}.  Our file
74 system has calls that are similar, but not identical, to these.  The
75 file system translates these calls into disk operations.  
76
77 All the basic functionality is there in the code above, so that the
78 file system is usable from the start, as you've seen
79 in the previous two projects.  However, it has severe limitations
80 which you will remove.
81
82 While most of your work will be in @file{filesys}, you should be
83 prepared for interactions with all previous parts.
84
85 @node Project 4 Requirements
86 @section Requirements
87
88 @menu
89 * Project 4 Design Document::   
90 * Indexed and Extensible Files::  
91 * Subdirectories::              
92 * Buffer Cache::                
93 * File System Synchronization::  
94 @end menu
95
96 @node Project 4 Design Document
97 @subsection Design Document
98
99 Before you turn in your project, you must copy @uref{filesys.tmpl, , the
100 project 4 design document template} into your source tree under the name
101 @file{pintos/src/filesys/DESIGNDOC} and fill it in.  We recommend that
102 you read the design document template before you start working on the
103 project.  @xref{Project Documentation}, for a sample design document
104 that goes along with a fictitious project.
105
106 @node Indexed and Extensible Files
107 @subsection Indexed and Extensible Files
108
109 The basic file system allocates files as a single extent, making it
110 vulnerable to external fragmentation, that is, it is possible that an
111 @var{n}-block file cannot be allocated even though @var{n} blocks are
112 free.  Eliminate this problem by
113 modifying the on-disk inode structure.  In practice, this probably means using
114 an index structure with direct, indirect, and doubly indirect blocks.
115 (You are welcome to choose a different scheme as long as you explain the
116 rationale for it in your design documentation, and as long as it does
117 not suffer from external fragmentation.)
118
119 You can assume that the disk will not be larger than 8 MB.  You must
120 support files as large as the disk (minus metadata).  Each inode is
121 stored in one disk sector, limiting the number of block pointers that it
122 can contain.  Supporting 8 MB files will require you to implement
123 doubly-indirect blocks.
124
125 An extent-based file can only grow if it is followed by empty space, but
126 indexed inodes make file growth possible whenever free space is
127 available.  Implement file growth.  In the basic file system, the file
128 size is specified when the file is created.  In most modern file
129 systems, a file is initially created with size 0 and is then expanded
130 every time a write is made off the end of the file.  Your file system
131 must allow this.
132
133 There should be no predetermined limit on the size of a file, except
134 that a file cannot exceed the size of the disk (minus metadata).  This
135 also applies to the root directory file, which should now be allowed
136 to expand beyond its initial limit of 16 files.
137
138 The user is allowed to seek beyond the current end-of-file (EOF).  The
139 seek itself does not extend the file.  Writing at a position past EOF
140 extends the file to the position being written, and any gap between the
141 previous EOF and the start of the write must be filled with zeros.  A
142 read starting from a position past EOF returns no bytes.
143
144 Writing far beyond EOF can cause many blocks to be entirely zero.  Some
145 file systems allocate and write real data blocks for these implicitly
146 zeroed blocks.  Other file systems do not allocate these blocks at all
147 until they are explicitly written.  The latter file systems are said to
148 support ``sparse files.''  You may adopt either allocation strategy in
149 your file system.
150
151 @node Subdirectories
152 @subsection Subdirectories
153
154 Implement a hierarchical name space.  In the basic file system, all
155 files live in a single directory.  Modify this to allow directory
156 entries to point to files or to other directories.
157
158 Make sure that directories can expand beyond their original size just
159 as any other file can.  
160
161 The basic file system has a 14-character limit on file names.  You may
162 retain this limit for individual file name components, or may extend
163 it, at your option.  You must allow full path names to be
164 much longer than 14 characters.
165
166 The current directory is maintained separately for each process.  At
167 startup, the initial process's current directory is the root directory.
168 When one process starts another with the @code{exec} system call, the
169 child process inherits its parent's current directory.  After that, the
170 two processes' current directories are independent, so that either
171 changing its own current directory has no effect on the other.
172
173 Update the existing system calls so that, anywhere a file name is
174 provided by the caller, an absolute or relative path name may used.
175
176 Update the @code{remove} system call so that it can delete empty
177 directories in addition to regular files.  Directories can only be
178 deleted if they do not contain any files or subdirectories.
179
180 Implement the following new system calls:
181
182 @deftypefn {System Call} bool chdir (const char *@var{dir})
183 Changes the current working directory of the process to
184 @var{dir}, which may be relative or absolute.  Returns true if
185 successful, false on failure.
186 @end deftypefn
187
188 @deftypefn {System Call} bool mkdir (const char *@var{dir})
189 Creates the directory named @var{dir}, which may be
190 relative or absolute.  Returns true if successful, false on failure.
191 Fails if @var{dir} already exists or if any directory name in
192 @var{dir}, besides the last, does not already exist.  That is,
193 @code{mkdir("/a/b/c")} succeeds only if @file{/a/b} already exists and
194 @file{/a/b/c} does not.
195 @end deftypefn
196
197 @deftypefn {System Call} void lsdir (void)
198 Prints a list of files in the current directory to @code{stdout}, one
199 per line, in no particular order.
200 @end deftypefn
201
202 We have provided @command{ls} and @command{mkdir} user programs, which
203 are straightforward once the above syscalls are implemented.  In Unix,
204 these are programs rather than built-in shell commands, but
205 @command{cd} is a shell command.
206
207 The @code{pintos} @option{put} and @option{get} commands should now
208 accept full path names, assuming that the directories used in the
209 paths have already been created.  This should not require any extra
210 effort on your part.
211
212 You may support @file{.} and @file{..} for a small amount of extra
213 credit.
214
215 @node Buffer Cache
216 @subsection Buffer Cache
217
218 Modify the file system to keep a cache of file blocks.  When a request
219 is made to read or write a block, check to see if it is in the
220 cache, and if so, use the cached data without going to
221 disk.  Otherwise, fetch the block from disk into cache, evicting an
222 older entry if necessary.  You are limited to a cache no greater than 64
223 sectors in size.
224
225 Be sure to choose an intelligent cache replacement algorithm.
226 Experiment to see what combination of accessed, dirty, and other
227 information results in the best performance, as measured by the number
228 of disk accesses.  For example, metadata is generally more valuable to
229 cache than data.
230
231 You can keep a cached copy of the free map permanently in memory if you
232 like.  It doesn't have to count against the cache size.
233
234 The provided inode code uses a ``bounce buffer'' allocated with
235 @func{malloc} to translate the disk's sector-by-sector interface into
236 the system call interface's byte-by-byte interface.  You should get rid
237 of these bounce buffers.  Instead, copy data into and out of sectors in
238 the buffer cache directly.
239
240 Your cache should be @dfn{write-behind}, that is,
241 keep dirty blocks in the cache, instead of immediately writing modified
242 data to disk.  Write dirty blocks to disk whenever they are evicted.
243 Because write-behind makes your file system more fragile in the face of
244 crashes, in addition you should periodically write all dirty, cached
245 blocks back to disk.  The cache should also be written back to disk in
246 @func{filesys_done}, so that halting Pintos flushes the cache.
247
248 If you have @func{timer_sleep} from the first project working, write-behind is
249 an excellent application.  If you're still using the base
250 implementation of @func{timer_sleep}, be aware that it busy-waits, which
251 is not acceptable here (or elsewhere).  If @func{timer_sleep}'s delays seem too
252 short or too long, reread the explanation of the @option{-r} option to
253 @command{pintos} (@pxref{Debugging versus Testing}).
254
255 You should also implement @dfn{read-ahead}, that is,
256 automatically fetch the next block of a file
257 into the cache when one block of a file is read, in case that block is
258 about to be read.
259 Read-ahead is only really useful when done asynchronously.  That means,
260 if a process requests disk block 1 from the file, it should block until disk
261 block 1 is read in, but once that read is complete, control should
262 return to the process immediately.  The read-ahead request for disk
263 block 2 should be handled asynchronously, in the background.
264
265 @strong{We recommend integrating the cache into your design early.}  In
266 the past, many groups have tried to tack the cache onto a design late in
267 the design process.  This is very difficult.  These groups have often
268 turned in projects that failed most or all of the tests.
269
270 @node File System Synchronization
271 @subsection Synchronization
272
273 The provided file system requires external synchronization, that is,
274 callers must ensure that only one thread can be running in the file
275 system code at once.  Your submission must adopt a finer-grained
276 synchronization strategy that does not require external synchronization.
277 To the extent possible, operations on independent entities should be
278 independent, so that they do not need to wait on each other.
279
280 Operations on different cache blocks must be independent.  In
281 particular, when I/O is required on a particular block, operations on
282 other blocks that do not require I/O should proceed without having to
283 wait for the I/O to complete.
284
285 Multiple processes must be able to access a single file at once.
286 Multiple reads of a single file must be able to complete without
287 waiting for one another.  When writing to a file does not extend the
288 file, multiple processes should also be able to write a single file at
289 once.  A read of a file by one process when the file is being written by
290 another process is allowed to show that none, all, or part of the write
291 has completed.  (However, after the @code{write} system call returns to
292 its caller, all subsequent readers must see the change.)  Similarly,
293 when two processes simultaneously write to the same part of a file,
294 their data may be interleaved.
295
296 On the other hand, extending a file and writing data into the new
297 section must be atomic.  Suppose processes A and B both have a given
298 file open and both are positioned at end-of-file.  If A reads and B
299 writes the file at the same time, A may read all, part, or none of what
300 B writes.  However, A may not read data other than what B writes, e.g.@:
301 if B's data is all nonzero bytes, A is not allowed to see any zeros.
302
303 Operations on different directories should take place concurrently.
304 Operations on the same directory may wait for one another.
305
306 @node Project 4 FAQ
307 @section FAQ
308
309 @table @b
310 @item How much code will I need to write?
311
312 Here's a summary of our reference solution, produced by the
313 @command{diffstat} program.  The final row gives total lines inserted
314 and deleted; a changed line counts as both an insertion and a deletion.
315
316 This summary is relative to the Pintos base code, but the reference
317 solution for project 4 is based on the reference solution to project 3.
318 Thus, the reference solution runs with virtual memory enabled.
319 @xref{Project 3 FAQ}, for the summary of project 3.
320
321 The reference solution represents just one possible solution.  Many
322 other solutions are also possible and many of those differ greatly from
323 the reference solution.  Some excellent solutions may not modify all the
324 files modified by the reference solution, and some may modify files not
325 modified by the reference solution.
326
327 @verbatim
328  Makefile.build       |    5 
329  devices/timer.c      |   42 ++
330  filesys/Make.vars    |    6 
331  filesys/cache.c      |  473 +++++++++++++++++++++++++
332  filesys/cache.h      |   23 +
333  filesys/directory.c  |   99 ++++-
334  filesys/directory.h  |    3 
335  filesys/file.c       |    4 
336  filesys/filesys.c    |  194 +++++++++-
337  filesys/filesys.h    |    5 
338  filesys/free-map.c   |   45 +-
339  filesys/free-map.h   |    4 
340  filesys/fsutil.c     |    8 
341  filesys/inode.c      |  444 ++++++++++++++++++-----
342  filesys/inode.h      |   11 
343  threads/init.c       |    5 
344  threads/interrupt.c  |    2 
345  threads/thread.c     |   32 +
346  threads/thread.h     |   38 +-
347  userprog/exception.c |   12 
348  userprog/pagedir.c   |   10 
349  userprog/process.c   |  332 +++++++++++++----
350  userprog/syscall.c   |  582 ++++++++++++++++++++++++++++++-
351  userprog/syscall.h   |    1 
352  vm/frame.c           |  161 ++++++++
353  vm/frame.h           |   23 +
354  vm/page.c            |  297 +++++++++++++++
355  vm/page.h            |   50 ++
356  vm/swap.c            |   85 ++++
357  vm/swap.h            |   11 
358  30 files changed, 2721 insertions(+), 286 deletions(-)
359 @end verbatim
360
361 @item What extra credit opportunities are available?
362
363 You may implement Unix-style support for @file{.} and @file{..} in
364 relative paths in their projects.
365
366 You may submit with VM enabled.
367
368 @item Can @code{DISK_SECTOR_SIZE} change?
369
370 No, @code{DISK_SECTOR_SIZE} is fixed at 512.  This is a fixed property
371 of IDE disk hardware.
372
373 @item What's the directory separator character?
374
375 Forward slash (@samp{/}).
376 @end table
377
378 @menu
379 * Indexed Files FAQ::           
380 * Subdirectories FAQ::          
381 * Buffer Cache FAQ::            
382 @end menu
383
384 @node Indexed Files FAQ
385 @subsection Indexed Files FAQ
386
387 @table @b
388 @item What is the largest file size that we are supposed to support?
389
390 The disk we create will be 8 MB or smaller.  However, individual files
391 will have to be smaller than the disk to accommodate the metadata.
392 You'll need to consider this when deciding your inode organization.
393 @end table
394
395 @node Subdirectories FAQ
396 @subsection Subdirectories FAQ
397
398 @table @b
399 @item Why is @command{cd} a shell command?
400
401 The current directory of each process is independent.  A @command{cd}
402 program could change its own current directory, but that would have no
403 effect on the shell.  In fact, Unix-like systems don't provide any way
404 for one process to change another's current working directory.
405 @end table
406
407 @node Buffer Cache FAQ
408 @subsection Buffer Cache FAQ
409
410 @table @b
411 @item Can we keep a @struct{inode_disk} inside @struct{inode}?
412
413 The goal of the 64-block limit is to bound the amount of cached file
414 system data.  If you keep a block of disk data---whether file data or
415 metadata---anywhere in kernel memory then you have to count it against
416 the 64-block limit.  The same rule applies to anything that's
417 ``similar'' to a block of disk data, such as a @struct{inode_disk}
418 without the @code{length} or @code{sector_cnt} members.
419
420 That means you'll have to change the way the inode implementation
421 accesses its corresponding on-disk inode right now, since it currently
422 just embeds a @struct{inode_disk} in @struct{inode} and reads the
423 corresponding sector from disk when it's created.  Keeping extra
424 copies of inodes would subvert the 64-block limitation that we place
425 on your cache.
426
427 You can store a pointer to inode data in @struct{inode}, if you want,
428 and you can store other information to help you find the inode when you
429 need it.  Similarly, you may store some metadata along each of your 64
430 cache entries.
431
432 You can keep a cached copy of the free map permanently in memory if you
433 like.  It doesn't have to count against the cache size.
434
435 @func{byte_to_sector} in @file{filesys/inode.c} uses the
436 @struct{inode_disk} directly, without first reading that sector from
437 wherever it was in the storage hierarchy.  This will no longer work.
438 You will need to change @func{inode_byte_to_sector} to obtain the
439 @struct{inode_disk} from the cache before using it.
440 @end table