Rewrite formatted data input routines to conform to SPSS data formats
[pspp-builds.git] / src / language / data-io / ChangeLog
1 Sun Nov 19 09:17:45 2006  Ben Pfaff  <blp@gnu.org>
2
3         * data-list.c (parse_free): Follow documented (but odd) rule that
4         N format is treated as F format for free-field input.
5         
6         * data-reader.c (read_file_record): Drop new-line character from
7         input text lines.  This is symmetrical with the recently changed
8         dfm_put_record semantics.
9
10 Thu Nov  2 20:56:03 2006  Ben Pfaff  <blp@gnu.org>
11
12         Implement SKIP keyword on DATA LIST.  Fixes bug #17099.
13         
14         * data-list.c: (struct data_list_pgm) Add `skip_records' members.
15         (cmd_data_list) Set skip_records based on user input.
16         (data_list_source_read) Skip records requested by user.
17
18 Tue Oct 31 20:04:06 2006  Ben Pfaff  <blp@gnu.org>
19
20         * placement-parser.c: (PRS_TYPE_T) Now that struct fmt_spec uses
21         an enum fmt_type for its type member, we can't depend on the
22         ability to put negative values into that member as out-of-band
23         values, because enum fmt_type might be an unsigned type.  So use
24         values around SCHAR_MAX instead, because we know that SCHAR_MAX
25         will fit into any type, signed or unsigned, and there aren't
26         nearly that many format types.
27         (parse_var_placements) Add for_input parameter to specify whether
28         we're parsing input or output formats.  Update all callers.
29         (fixed_parse_columns) Ditto.
30         (fixed_parse_fortran) Ditto.
31         
32 Tue Oct 31 18:21:48 2006  Ben Pfaff  <blp@gnu.org>
33
34         * print-space.c (print_space_trns_proc): Let dfm_put_record add
35         the new-line character, to match dfm_put_record change below.
36
37 Sat Oct 28 11:57:19 2006  Ben Pfaff  <blp@gnu.org>
38
39         * data-writer.c (struct dfm_writer): Removed `bounce' member, and
40         all references to it.
41         (dfm_put_record) Change semantics so that it adds formatting
42         itself, such as new-line characters, instead of putting that
43         responsibility on the caller.  Also, pad binary records with
44         spaces instead of zeros, for compatibility.
45
46         * print.c (struct prt_out_spec) New member `sysmis_as_spaces'.
47         (struct print_trns) Remove `omit_new_lines' and all references,
48         since dfm_put_record() is taking care of that.  Add
49         `include_prefix'.
50         (internal_cmd_print) Allow an empty set of data to print.  Set
51         include_prefix.
52         (parse_specs) Allow an empty set of data to print.
53         (parse_variable_argument) Only add space with PRINT command.  Set
54         sysmis_as_spaces.
55         (print_trns_proc) Indent records if include_prefix is set, for
56         compatibility.  Output SYSMIS as spaces if sysmis_as_spaces is
57         set.  Put "1" in first column if PRINT EJECT is used with an
58         external output file.
59         (flush_records) Ditto.
60
61 Sat Oct 28 16:19:57 WST 2006 John Darrington <john@darrington.wattle.id.au>
62
63         * data-reader.c: Eliminated references to extern variable getl_buf
64
65 Sat Aug  5 08:25:07 2006  Ben Pfaff  <blp@gnu.org>
66
67         Fix bug #17329 in REREAD parsing, reported by John Darrington.
68
69         * inpt-pgm.c (cmd_reread): Fix file handle parsing.
70
71 Mon Jul 31 10:32:31 2006  Ben Pfaff  <blp@gnu.org>
72
73         * print.c (parse_specs): Allow a comma between specifications.
74
75 Sun Jul 16 19:57:10 2006  Ben Pfaff  <blp@gnu.org>
76
77         * automake.mk: (src_language_data_io_libdata_io_a_SOURCE) Add
78         print-space.c, placement-parser.c, placement-parser.h.
79
80         * data-list.c: Basically rewrote the whole thing.  Broke out a lot
81         of code into placement-parser.c.  Code is much cleaner now.
82
83         * placement-parser.c: New file.
84
85         * placement-parser.h: New file.
86
87         * print.c: Basically rewrote the whole thing.  Broke out PRINT
88         SPACE into print-space.c.  Code is much cleaner now.
89
90         * print-space.c: New file.
91
92 Sat Jul  1 17:39:40 2006  Ben Pfaff  <blp@gnu.org>
93
94         Fix bug #11612, "q2c documentation does not agree with code".
95         
96         * list.q: Audit use of q2c "+" prefixes that indicate that a
97         command may appear multiple times.
98
99 Sat Jul  1 20:44:22 2006  Ben Pfaff  <blp@gnu.org>
100
101         Fix bug #15786: System File Creation crashes if directoy is
102         nonexistent.
103         
104         * get.c (parse_write_command): Check that the any_writer open
105         succeeds.
106
107 Tue Jun 27 22:44:28 2006  Ben Pfaff  <blp@gnu.org>
108
109         Fix regression in command name completion reported by John
110         Darrington.  Now completion is again state-dependent and occurs
111         only on the first line of a command.
112         
113         * inpt-pgm.c: (cmd_input_program) Reading of first token in
114         command moved into cmd_parse.
115
116 Fri Jun  9 13:56:00 2006  Ben Pfaff  <blp@gnu.org>
117
118         Reform string library.
119         
120         * matrix-data.c (context): Use dynamic string.
121         (another_token) Deal with changed dfm_get_record() interface.
122         (mget_token) Ditto.
123         (force_eol) Ditto.
124
125         * data-list.c (struct data_list_pgm) Delete delims, delim_cnt
126         members, replacing them by struct string delims.  Update all
127         references to use struct string functions.
128         (cut_field) Change interface to avoid needing "end_blank", by
129         getting the data-reader to remember that state for us.  Change
130         internals to use substring.  Update both callers.
131
132         * data-reader.c (read_file_record): Use ds_read_stream().
133         (dfm_get_record) Change interface to return substring.  Updated
134         all callers.
135         (dfm_expand_tabs) Use ds_find_char().  Now maintain position
136         relative to end-of-line.  Use ds_swap().
137         (dfm_reread_record) Don't limit position by line length.
138         (dfm_column_start) Make parameter const.
139         (dfm_columns_past_end) New function.
140         (dfm_get_column) New function.
141
142 Thu May 25 18:26:26 WST 2006 John Darrington <john@darrington.wattle.id.au>
143
144         * print.c (print_trns_free): Made the code agree with the comment, by
145         not freeing PRT.  Has the side effect that the command no longer
146         crashes on invalid syntax.
147
148 Tue May  9 20:55:46 2006  Ben Pfaff  <blp@gnu.org>
149
150         * get.c (cmd_match_files): Fix memory leak replacing default_dict.
151
152 Sat May  6 22:25:09 2006  Ben Pfaff  <blp@gnu.org>
153
154         Fix segfault.
155         
156         * list.q (write_fallback_headers): (write_fallback_headers)
157         Properly record width of leader and pass it to write_varname().
158
159 Sat May  6 19:03:13 2006  Ben Pfaff  <blp@gnu.org>
160
161         * get.c: (mtf_merge_dictionary) Fix value label memory leak.
162
163 Sat May  6 13:51:16 2006  Ben Pfaff  <blp@gnu.org>
164
165         Use a casefile, instead of a case sink, for MATCH FILES output.
166         It's more straightforward, although it has the same effect.
167         
168         * get.c: (struct mtf_proc) Replace `sink' case sink member by
169         `output' casefile member.
170         (cmd_match_files) Work with casefile instead of sink.
171         (mtf_processing) Add case to casefile instead of sink.
172
173 Sat May  6 10:43:07 2006  Ben Pfaff  <blp@gnu.org>
174
175         Continue reforming procedure execution.  In this phase, get rid of
176         the output code for SPLIT FILE groups in procedure.c, which really
177         shouldn't be doing any output.  Move it into the individual
178         procedures instead.  This also adds some flexibility.
179
180         * list.q (write_all_headers): Call output_split_file_values().
181
182 Wed May  3 23:00:17 2006  Ben Pfaff  <blp@gnu.org>
183
184         Continue reforming procedure execution.  In this phase, get rid of
185         many global variables, consolidating procedure execution in
186         procedure.c.  Encapsulate transformations in new "struct
187         trns_chain".  Also, change implementation of N OF CASES, FILTER,
188         and PROCESS IF from special cases to transformations.
189          
190         * data-list.c: (data_list_trns_proc) Return TRNS_END_FILE at end
191         of file.  (Why didn't we do this before?)
192         (cmd_match_files) Direct procedure output to null sink.
193         Use discard_variables() instead of indirect version.
194
195         * inpt-pgm.c: Use transformation chain.
196         (struct input_program_pgm) Add trns_chain member.
197         (cmd_input_program) Initialize trns_chain member and capture
198         transformations with proc_capture_transformations().
199         (input_program_source_read) Use trns_chain_execute().
200         (destroy_input_program) Destroy input chain.
201
202 Tue May  2 10:39:56 WST 2006 John Darrington <john@darrington.wattle.id.au>
203
204         * list.q Changed from using fixed length char buffers to struct 
205         string so that any length variables can be used.
206
207 Mon May  1 18:21:19 2006  Ben Pfaff  <blp@gnu.org>
208
209         Further clean up the CMD_* command result codes.
210         
211         * (enum cmd_result_extensions) New.  Add CMD_END_INPUT_PROGRAM and
212         CMD_END_CASE result codes.
213         (struct input_program_pgm) Added case_nr, write_case, wc_data
214         members for use by END CASE transformation.
215         (emit_END_CASE) New function.
216         (cmd_input_program) Interpret CMD_END_CASE by outputting an END
217         CASE transformation.  If none is output by the input program
218         itself, add one automatically at the end.  Change lack of
219         variables from warning to error.
220         (cmd_end_input_program) Return CMD_END_INPUT_PROGRAM instead of
221         CMD_END_SUBLOOP.
222         (input_program_source_read) No longer any need to special-case END
223         CASE.  Handle TRNS_DROP_CASE properly.  Initialize new members in
224         inp for use by END CASE transformation.
225         (destroy_input_program) New function.
226         (input_program_source_destroy) Just call destroy_input_program().
227         (cmd_end_case) Just return CMD_END_CASE.
228         (end_case_trns_proc) No longer a stub handled by
229         input_program_source_read().  Actually output the case and
230         increment the case number.
231
232 Mon May  1 16:06:30 2006  Ben Pfaff  <blp@gnu.org>
233
234         Remove vestiges of REPEATING DATA support.
235         
236         * data-list.c: (struct rpd_num_or_var) Removed.
237         (struct repeating_data_trns) Removed.
238         (cmd_repeating_data) Removed.
239         (find_variable_input_spec) Removed.
240         (parse_num_or_var) Removed.
241         (parse_repeating_data) Removed.
242         (realize_value) Removed.
243         (struct rpd_parse_info) Removed.
244         (rpd_parse_record) Removed.
245         (repeating_data_trns_proc) Removed.
246         (repeating_data_trns_free) Removed.
247         (repeating_data_set_write_case) Removed.
248         (rpd_msg) Removed.
249
250         * inpt-pgm.c: (input_program_source_read) Don't deal with
251         REPEATING DATA.
252
253         * data-list.h: Removed.
254
255         * automake.mk (src_language_data_io_libdata_io_a_SOURCES): Removed
256         data-list.h.
257
258 Mon May  1 15:58:28 2006  Ben Pfaff  <blp@gnu.org>
259
260         Remove vestiges of FILE TYPE support. 
261         
262         * data-list.c: (cmd_data_list) Don't check for FILE TYPE.
263         (cmd_repeating_data) Ditto.
264         
265         * automake.mk (src_language_data_io_libdata_io_a_SOURCES): Remove
266         file-type.c, file-type.h.
267
268         * file-type.c: Removed.
269         
270         * file-type.h: Removed.
271
272 Wed Apr 26 13:16:28 2006  Ben Pfaff  <blp@gnu.org>
273
274         Improve the way we handle the various parsing "states".  Until now
275         we've hard-coded the state transitions in the command definition
276         file, but that's error-prone and, worse, it's redundant--we can
277         figure out what state we're in anyhow.  We can cleanly handle
278         INPUT PROGRAM and FILE TYPE with a nested command-processing loop.
279         
280         * data-list.c: (cmd_data_list) Use in_file_type() or
281         in_input_program() in place of case_source_is_class() or
282         case_source_is_complex().
283
284         * file-type.c: NB: Not really fixed except minimally to compile,
285         because it doesn't work anyway.
286         (in_file_type) New function.
287         (cmd_record_type) No need to check that we're in FILE TYPE.
288         (cmd_end_file_type) Ditto.
289         (var file_type_source_class) Make static.
290
291         * get.c: (cmd_match_files) Check vfm_source instead of pgm_state.
292
293         * inpt-pgm.c: (in_input_program) New function.
294         (cmd_input_program) Rewrite to include nested command processing
295         loop.
296         (cmd_end_input_program) Just return CMD_END_SUBLOOP.
297         (var input_program_source_class) Make static.
298         (cmd_end_case) No need to check that we're in INPUT PROGRAM.
299         (cmd_end_file) Ditto.
300         
301         * automake.mk (src_language_data_io_libdata_io_a_SOURCES): Add
302         file-type.h, inpt-pgm.h.
303
304         * file-type.h: New file.
305
306         * inpt-pgm.h: New file.
307
308 Tue Apr 25 13:11:55 2006  Ben Pfaff  <blp@gnu.org>
309
310         * print.c: Don't special-case MS-DOS line terminators.
311         (macro LINE_END_WIDTH) Removed.
312         (alloc_line) Line ends are 1 byte.
313         (print_trns_proc) Just output \n for line end.
314
315 Sun Apr 23 22:05:58 2006  Ben Pfaff  <blp@gnu.org>
316
317         Continue reforming error message support.  In this phase, get rid
318         of message "titles" and put the message text in `struct error'.
319         Now `struct error' encapsulates a message more properly.
320         
321         * data-list.c: (macro RPD_ERR) Removed.
322         (rpd_msg) New function.  Updated all references to tmsg() to call
323         this function instead.
324
325 Sat Apr 15 19:38:13 2006  Ben Pfaff  <blp@gnu.org>
326
327         Remove last users of struct file_ext so we can get rid of it
328         entirely.
329         
330         * data-reader.c: (struct dfm_reader) Change file member from
331         struct file_ext to FILE *.  Updated all references.
332         (dfm_close_reader) Close file with fn_close() instead of
333         fn_close_ext().  Also, make a copy of the file name from the file
334         handle before closing it, because we can't extract it after we
335         close the file.
336         (dfm_open_reader) Open file with fn_open() instead of
337         fn_open_ext().
338
339         * data-writer.c: (struct dfm_writer) Change file member 
340         struct file_ext to FILE *.  Updated all references.
341         (dfm_close_writer) Close file with fn_close() instead of
342         fn_close_ext().  Also, make a copy of the file name from the file
343         handle before closing it, because we can't extract it after we
344         close the file.
345         (dfm_open_writer) Open file with fn_open() instead of
346         fn_open_ext().
347
348 Sat Apr 15 18:00:32 2006  Ben Pfaff  <blp@gnu.org>
349
350         * data-list.c: Add prototype to suppress warning for
351         cmd_repeating_data().
352         
353 Thu Mar  2 08:40:33 WST 2006 John Darrington <john@darrington.wattle.id.au>
354         
355         * Moved files from src directory