Test both compressed and uncompressed system files with very long
[pspp] / src / data / casewindow.c
1 /* PSPP - a program for statistical analysis.
2    Copyright (C) 2007 Free Software Foundation, Inc.
3
4    This program is free software: you can redistribute it and/or modify
5    it under the terms of the GNU General Public License as published by
6    the Free Software Foundation, either version 3 of the License, or
7    (at your option) any later version.
8
9    This program is distributed in the hope that it will be useful,
10    but WITHOUT ANY WARRANTY; without even the implied warranty of
11    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12    GNU General Public License for more details.
13
14    You should have received a copy of the GNU General Public License
15    along with this program.  If not, see <http://www.gnu.org/licenses/>. */
16
17 /* This casewindow implementation in terms of an class interface
18    is undoubtedly a form of over-abstraction.  However, it works
19    and the extra abstraction seems to be harmless. */
20
21 #include <config.h>
22
23 #include <data/casewindow.h>
24
25 #include <stdlib.h>
26
27 #include <data/case-tmpfile.h>
28 #include <libpspp/assertion.h>
29 #include <libpspp/compiler.h>
30 #include <libpspp/deque.h>
31 #include <libpspp/taint.h>
32
33 #include "xalloc.h"
34
35 /* A queue of cases. */
36 struct casewindow
37   {
38     /* Common data. */
39     size_t value_cnt;             /* Number of values per case. */
40     casenumber max_in_core_cases; /* Max cases before dumping to disk. */
41     struct taint *taint;          /* Taint status. */
42
43     /* Implementation data. */
44     const struct casewindow_class *class;
45     void *aux;
46   };
47
48 /* Implementation of a casewindow. */
49 struct casewindow_class
50   {
51     void *(*create) (struct taint *, size_t value_cnt);
52     void (*destroy) (void *aux);
53     void (*push_head) (void *aux, struct ccase *);
54     void (*pop_tail) (void *aux, casenumber cnt);
55     bool (*get_case) (void *aux, casenumber ofs, struct ccase *);
56     casenumber (*get_case_cnt) (const void *aux);
57   };
58
59 /* Classes. */
60 static const struct casewindow_class casewindow_memory_class;
61 static const struct casewindow_class casewindow_file_class;
62
63 /* Creates and returns a new casewindow using the given
64    parameters. */
65 static struct casewindow *
66 do_casewindow_create (struct taint *taint,
67                       size_t value_cnt, casenumber max_in_core_cases)
68 {
69   struct casewindow *cw = xmalloc (sizeof *cw);
70   cw->class = (max_in_core_cases
71               ? &casewindow_memory_class
72               : &casewindow_file_class);
73   cw->aux = cw->class->create (taint, value_cnt);
74   cw->value_cnt = value_cnt;
75   cw->max_in_core_cases = max_in_core_cases;
76   cw->taint = taint;
77   return cw;
78 }
79
80 /* Creates and returns a new casewindow for cases with VALUE_CNT
81    values each.  If the casewindow holds more than
82    MAX_IN_CORE_CASES cases at any time, its cases will be dumped
83    to disk; otherwise, its cases will be held in memory. */
84 struct casewindow *
85 casewindow_create (size_t value_cnt, casenumber max_in_core_cases)
86 {
87   return do_casewindow_create (taint_create (), value_cnt, max_in_core_cases);
88 }
89
90 /* Destroys casewindow CW.
91    Returns true if CW was tainted, which is caused by an I/O
92    error or by taint propagation to the casewindow. */
93 bool
94 casewindow_destroy (struct casewindow *cw)
95 {
96   bool ok = true;
97   if (cw != NULL)
98     {
99       cw->class->destroy (cw->aux);
100       ok = taint_destroy (cw->taint);
101       free (cw);
102     }
103   return ok;
104 }
105
106 /* Swaps the contents of casewindows A and B. */
107 static void
108 casewindow_swap (struct casewindow *a, struct casewindow *b)
109 {
110   struct casewindow tmp = *a;
111   *a = *b;
112   *b = tmp;
113 }
114
115 /* Dumps the contents of casewindow OLD to disk. */
116 static void
117 casewindow_to_disk (struct casewindow *old)
118 {
119   struct casewindow *new;
120   new = do_casewindow_create (taint_clone (old->taint), old->value_cnt, 0);
121   while (casewindow_get_case_cnt (old) > 0 && !casewindow_error (new))
122     {
123       struct ccase c;
124       if (!casewindow_get_case (old, 0, &c))
125         break;
126       casewindow_pop_tail (old, 1);
127       casewindow_push_head (new, &c);
128     }
129   casewindow_swap (old, new);
130   casewindow_destroy (new);
131 }
132
133 /* Pushes case C at the head of casewindow CW.
134    Case C becomes owned by the casewindow. */
135 void
136 casewindow_push_head (struct casewindow *cw, struct ccase *c)
137 {
138   if (!casewindow_error (cw))
139     {
140       cw->class->push_head (cw->aux, c);
141       if (!casewindow_error (cw))
142         {
143           casenumber case_cnt = cw->class->get_case_cnt (cw->aux);
144           if (case_cnt > cw->max_in_core_cases
145               && cw->class == &casewindow_memory_class)
146             casewindow_to_disk (cw);
147         }
148     }
149   else
150     case_destroy (c);
151 }
152
153 /* Deletes CASE_CNT cases at the tail of casewindow CW. */
154 void
155 casewindow_pop_tail (struct casewindow *cw, casenumber case_cnt)
156 {
157   if (!casewindow_error (cw))
158     cw->class->pop_tail (cw->aux, case_cnt);
159 }
160
161 /* Copies the case that is CASE_IDX cases away from CW's tail
162    into C.  Returns true if successful, false on an I/O error or
163    if CW is otherwise tainted.  On failure, nullifies case C. */
164 bool
165 casewindow_get_case (const struct casewindow *cw_, casenumber case_idx,
166                      struct ccase *c)
167 {
168   struct casewindow *cw = (struct casewindow *) cw_;
169
170   assert (case_idx >= 0 && case_idx < casewindow_get_case_cnt (cw));
171   if (!casewindow_error (cw))
172     return cw->class->get_case (cw->aux, case_idx, c);
173   else
174     {
175       case_nullify (c);
176       return false;
177     }
178 }
179
180 /* Returns the number of cases in casewindow CW. */
181 casenumber
182 casewindow_get_case_cnt (const struct casewindow *cw)
183 {
184   return cw->class->get_case_cnt (cw->aux);
185 }
186
187 /* Returns the number of values per case in casewindow CW. */
188 size_t
189 casewindow_get_value_cnt (const struct casewindow *cw)
190 {
191   return cw->value_cnt;
192 }
193
194 /* Returns true if casewindow CW is tainted.
195    A casewindow is tainted by an I/O error or by taint
196    propagation to the casewindow. */
197 bool
198 casewindow_error (const struct casewindow *cw)
199 {
200   return taint_is_tainted (cw->taint);
201 }
202
203 /* Marks casewindow CW tainted. */
204 void
205 casewindow_force_error (struct casewindow *cw)
206 {
207   taint_set_taint (cw->taint);
208 }
209
210 /* Returns casewindow CW's taint object. */
211 const struct taint *
212 casewindow_get_taint (const struct casewindow *cw)
213 {
214   return cw->taint;
215 }
216 \f
217 /* In-memory casewindow data. */
218 struct casewindow_memory
219   {
220     struct deque deque;
221     struct ccase *cases;
222   };
223
224 static void *
225 casewindow_memory_create (struct taint *taint UNUSED, size_t value_cnt UNUSED)
226 {
227   struct casewindow_memory *cwm = xmalloc (sizeof *cwm);
228   cwm->cases = deque_init (&cwm->deque, 4, sizeof *cwm->cases);
229   return cwm;
230 }
231
232 static void
233 casewindow_memory_destroy (void *cwm_)
234 {
235   struct casewindow_memory *cwm = cwm_;
236   while (!deque_is_empty (&cwm->deque))
237     case_destroy (&cwm->cases[deque_pop_front (&cwm->deque)]);
238   free (cwm->cases);
239   free (cwm);
240 }
241
242 static void
243 casewindow_memory_push_head (void *cwm_, struct ccase *c)
244 {
245   struct casewindow_memory *cwm = cwm_;
246   if (deque_is_full (&cwm->deque))
247     cwm->cases = deque_expand (&cwm->deque, cwm->cases, sizeof *cwm->cases);
248   case_move (&cwm->cases[deque_push_back (&cwm->deque)], c);
249 }
250
251 static void
252 casewindow_memory_pop_tail (void *cwm_, casenumber case_cnt)
253 {
254   struct casewindow_memory *cwm = cwm_;
255   assert (deque_count (&cwm->deque) >= case_cnt);
256   while (case_cnt-- > 0)
257     case_destroy (&cwm->cases[deque_pop_front (&cwm->deque)]);
258 }
259
260 static bool
261 casewindow_memory_get_case (void *cwm_, casenumber ofs, struct ccase *c)
262 {
263   struct casewindow_memory *cwm = cwm_;
264   case_clone (c, &cwm->cases[deque_front (&cwm->deque, ofs)]);
265   return true;
266 }
267
268 static casenumber
269 casewindow_memory_get_case_cnt (const void *cwm_)
270 {
271   const struct casewindow_memory *cwm = cwm_;
272   return deque_count (&cwm->deque);
273 }
274
275 static const struct casewindow_class casewindow_memory_class =
276   {
277     casewindow_memory_create,
278     casewindow_memory_destroy,
279     casewindow_memory_push_head,
280     casewindow_memory_pop_tail,
281     casewindow_memory_get_case,
282     casewindow_memory_get_case_cnt,
283   };
284 \f
285 /* On-disk casewindow data. */
286 struct casewindow_file
287   {
288     struct case_tmpfile *file;
289     casenumber head, tail;
290   };
291
292 static void *
293 casewindow_file_create (struct taint *taint, size_t value_cnt)
294 {
295   struct casewindow_file *cwf = xmalloc (sizeof *cwf);
296   cwf->file = case_tmpfile_create (value_cnt);
297   cwf->head = cwf->tail = 0;
298   taint_propagate (case_tmpfile_get_taint (cwf->file), taint);
299   return cwf;
300 }
301
302 static void
303 casewindow_file_destroy (void *cwf_)
304 {
305   struct casewindow_file *cwf = cwf_;
306   case_tmpfile_destroy (cwf->file);
307   free (cwf);
308 }
309
310 static void
311 casewindow_file_push_head (void *cwf_, struct ccase *c)
312 {
313   struct casewindow_file *cwf = cwf_;
314   if (case_tmpfile_put_case (cwf->file, cwf->head, c))
315     cwf->head++;
316 }
317
318 static void
319 casewindow_file_pop_tail (void *cwf_, casenumber cnt)
320 {
321   struct casewindow_file *cwf = cwf_;
322   assert (cnt <= cwf->head - cwf->tail);
323   cwf->tail += cnt;
324   if (cwf->head == cwf->tail)
325     cwf->head = cwf->tail = 0;
326 }
327
328 static bool
329 casewindow_file_get_case (void *cwf_, casenumber ofs, struct ccase *c)
330 {
331   struct casewindow_file *cwf = cwf_;
332   return case_tmpfile_get_case (cwf->file, cwf->tail + ofs, c);
333 }
334
335 static casenumber
336 casewindow_file_get_case_cnt (const void *cwf_)
337 {
338   const struct casewindow_file *cwf = cwf_;
339   return cwf->head - cwf->tail;
340 }
341
342 static const struct casewindow_class casewindow_file_class =
343   {
344     casewindow_file_create,
345     casewindow_file_destroy,
346     casewindow_file_push_head,
347     casewindow_file_pop_tail,
348     casewindow_file_get_case,
349     casewindow_file_get_case_cnt,
350   };