db148a4ffe397c7f1c06fc88e4dbaaa6e0d1efe0
[pspp-builds.git] / src / language / stats / ChangeLog
1 2007-04-16 John Darrington <john@darrington.wattle.id.au>
2
3         * t-test.q: Changed the output width of reported counts and 
4         degrees of freedom, to avoid truncating these values.  Thanks
5         to Seth Woolley for reporting this problem.  A proper fix involves
6         re-thinking the output driver.
7
8 2007-04-12  Jason Stover  <jhs@math.gcsu.edu>
9
10         * regression.q (run_regression): Added if (n_data >0) to fix bug
11         19581.
12
13 2007-03-29  Jason Stover  <jhs@math.gcsu.edu>
14
15         * regression.q (prepare_data): New function.
16
17         * regression.q (compute_moments): New function.
18
19 2007-03-18  Ben Pfaff  <blp@gnu.org>
20
21         * crosstabs.q (static var write): Rename write_style to avoid
22         conflict with POSIX function of same name.
23
24 2007-03-16  Jason Stover  <jhs@math.gcsu.edu>
25
26         * regression.q (run_regression): Added support for moments.
27
28 Sat Feb 17 08:16:00 2007  Ben Pfaff  <blp@gnu.org>
29
30         * flip.c (flip_sink_create): Improve error message when temporary
31         file cannot be created.
32
33 Tue Feb  6 19:58:03 2007  Ben Pfaff  <blp@gnu.org>
34
35         * flip.c (flip_file): Give better error message on end-of-file.
36
37 2007-02-04  Jason Stover  <jhs@math.gcsu.edu>
38
39         * regression.q: Fixed p-value computation in the test for
40         individual regression coefficients.
41
42 Mon Jan 15 11:03:20 2007  Ben Pfaff  <blp@gnu.org>
43
44         Fix bugs found by valgrind when --enable-debug is used with the
45         new case code.  These bugs are hidden when the data set is small
46         enough to find in memory; if a bigger data set that would overflow
47         to disk were used, then data corruption would occur.
48
49         * chisquare.c (create_freq_hash): Pass free_freq_mutable_hash to
50         hsh_create as free function.  Make copy of data put into hash.
51
52         * oneway.q (free_value): New function.
53         (run_oneway): Use free_value as arg to hsh_create.  Make copy of
54         data put into hash.
55
56         * rank.q (rank_cases): Don't access data in case after we've given
57         away the case.
58
59 Tue Jan  9 19:16:11 2007  Ben Pfaff  <blp@gnu.org>
60
61         Fix bug #18739.
62         
63         * aggregate.c (parse_aggregate_functions) Initialize
64         function_name.
65
66 Fri Dec 22 14:04:09 2006  Ben Pfaff  <blp@gnu.org>
67
68         Simplify missing value handling.
69         
70         * aggregate.c (struct agr_var): Remove `bool include_missing', add
71         `enum mv_class exclude'.  Remove `int missing', add `bool
72         saw_missing'.  Update users.
73
74         * descriptives.c (struct dsc_trns): Removed `int
75         include_user_missing', add `enum mv_class exclude'.  Update users.
76         (struct dsc_proc): Ditto.
77
78         * examine.q: (static var value_is_missing): Rename
79         `exclude_values', change type to `enum mv_class'.  Update users.
80
81         * rank.q: Ditto.
82
83 Fri Dec 22 19:22:18 WST 2006 John Darrington <john@darrington.wattle.id.au>
84
85         * frequencies.q : Fixed bug #17420, where the table bounds were overun
86         when /FORMAT=nolabels was given.
87
88 Wed Dec 20 18:45:31 WST 2006 John Darrington <john@darrington.wattle.id.au>
89
90         * binomial.c binomial.h : New files.  Thanks to Jason Stover 
91           for assistance with these.
92
93         * chisquare.c chisquare.h freq.c freq.h npar-summary.c npar-summary.h 
94           npar.h npar.q: New files.  Implementing NPAR TESTS.
95
96         * frequencies.q  : Moved  structure definitions into freq.[ch]
97
98 Sat Dec 16 22:26:44 2006  Ben Pfaff  <blp@gnu.org>
99
100         Make it possible to pull cases from the active file with a
101         function call, instead of requiring indirection through a callback
102         function.
103
104         * aggregate.c (cmd_aggregate): Take advantage of new procedure
105         interface.
106         (agr_to_active_file): Removed.
107         (presorted_agr_to_sysfile): Removed.
108
109         * autorecode.c (cmd_autorecode): Take advantage of new procedure
110         interface.
111         (autorecode_proc_func): Removed.
112
113         * flip.c (struct flip_pgm): New members to allow conformance with
114         new case_source_class interface.
115         (cmd_flip): Adapt to new case_source_class interface.
116         (flip_source_read): Ditto.
117         (flip_source_destroy): Ditto.
118
119 Sat Dec 16 12:54:27 2006  Ben Pfaff  <blp@gnu.org>
120
121         * rank.q (rank_custom_variables): Allow grouping variables to be
122         strings.  Fixes bug #18533.  Thanks to John Darrington for review.
123
124 Sat Dec  9 18:47:51 2006  Ben Pfaff  <blp@gnu.org>
125
126         * regression.q (is_depvar): Compare variable pointers instead of
127         variable names.
128
129 Thu Dec  7 15:26:25 WST 2006 John Darrington <john@darrington.wattle.id.au>
130
131         * examine.q: Allocated the categorical values for the dependent and 
132         independent variables, on the heap.  Hence they can be of any width.
133
134 Wed Dec  6 21:14:26 2006  Ben Pfaff  <blp@gnu.org>
135
136         * regression.q (reg_inserted): Compare variable pointers instead
137         of variable indexes.
138
139 Mon Dec  4 22:33:46 2006  Ben Pfaff  <blp@gnu.org>
140
141         * crosstabs.q (insert_summary): Use var_to_string for labeling.
142         (output_pivot_table) Ditto.
143         (submit) Ditto.
144
145         * frequencies.q (setup_z_trns): Ditto.
146         (dump_full) Ditto.
147         (dump_condensed) Ditto.
148         (dump_statistics) Ditto.
149         
150
151 Sun Nov  5 08:31:42 WST 2006 John Darrington <john@darrington.wattle.id.au>
152
153         * t-test.q, oneway.q: Changed to use the new casefilter structure.
154
155 Sat Oct 14 16:52:28 2006  Ben Pfaff  <blp@gnu.org>
156
157         * rank.q: (rank_sorted_casefile) Add some missing case_destroy()
158         calls to fix a memory leak.
159
160 Sun Oct  8 09:45:40 WST 2006 John Darrington <john@darrington.wattle.id.au>
161
162         * rank.q: Plugged a small memory leak which occurred under error
163         conditions.
164         
165 Sat Oct  7 11:06:01 WST 2006 John Darrington <john@darrington.wattle.id.au>
166
167         * rank.q: Implemented most of the RANK command.
168
169 2006-07-14  Jason Stover  <jhs@math.gcsu.edu>
170
171         * regression.q (run_regression): New function to move knowledge of
172         pspp_linreg_cache out of math/coefficient.[ch].
173
174 Sat Jul  1 17:41:46 2006  Ben Pfaff  <blp@gnu.org>
175
176         Fix bug #11612, "q2c documentation does not agree with code".
177         
178         * examine.q: Audit use of q2c "+" prefixes that indicate that a
179         command may appear multiple times.
180
181         * frequencies.q: Ditto.
182
183         * oneway.q: Ditto.
184
185         * regression.q: Ditto.
186
187         * t-test.q: Ditto.
188
189 Fri Jun 23 14:18:22 2006  Ben Pfaff  <blp@gnu.org>
190
191         Support long string variables on FREQUENCIES, as
192         an extension when in enhanced algorithms mode.  For Greg Hunt
193         <greg@firmansyah.com>.
194         
195         * frequencies.q: (struct freq) Change `v' member from union value
196         to union value *.  Update all references.
197         (struct var_freqs) Add width, print members to represent effective
198         variable width and display format.
199         (calc) Copy entire long string value into the hash table.
200         (frq_custom_variables) Set new width, print members.
201         (hash_value_alpha) Get width from var_freqs.
202         (compare_value_alpha_a) Ditto.
203         (compare_freq_alpha_a) Ditto.
204         (compare_freq_alpha_d) Ditto.
205         (dump_full) Get display format from var_freqs.
206         (dump_condensed) Ditto.
207
208 Mon Jun 19 22:07:13 2006  Ben Pfaff  <blp@gnu.org>
209
210         * frequencies.q: (dump_full) Only put the first MAX_SHORT_STRING
211         bytes of string variables into the output cells, seeing as we only
212         copy that many.
213         (dump_condensed) Ditto.
214
215 Mon Jun 19 21:52:05 2006  Ben Pfaff  <blp@gnu.org>
216
217         Fixes a bug reported by Greg Hunt <greg@firmansyah.com>.
218         
219         * frequencies.q: (hsh_hash_bytes) We only copy the first
220         MAX_SHORT_STRING bytes of string variables, so we must only
221         compare that many bytes, even if the string variable is longer.
222         (compare_value_alpha_a) Ditto.
223         (compare_freq_alpha_a) Ditto.
224         (compare_freq_alpha_d) Ditto.
225
226 2006-05-11  Jason Stover  <jhs@math.gcsu.edu>
227
228         * regression.q: Adjusted code to account for cache->coeff being a
229         pspp_linreg_coeff **.
230
231 Sun May  7 18:31:25 2006  Ben Pfaff  <blp@gnu.org>
232
233         Fix memory leak.
234         
235         * aggregate.c (cmd_aggregate): Free default_dict before replacing
236         it.
237
238 Sun May  7 17:09:19 2006  Ben Pfaff  <blp@gnu.org>
239
240         * flip.c (flip_file): Check return value of pool_fclose().
241
242 Sat May  6 16:00:13 2006  Ben Pfaff  <blp@gnu.org>
243
244         Get rid of `char *c' member in union value, for cleanliness.
245         
246         * aggregate.c: (union agr_argument) New union.
247         (struct agr_var) Change element type of arg[] from union value to
248         union agr_argument.
249         (parse_aggregate_functions) Change local variable types likewise.
250
251         * autorecode.c: (union arc_value) New union.
252         (struct arc_item) Change "from" from union value to union
253         arc_value.
254         (recode) Change local variable from union value to union
255         arc_value.
256         (autorecode_trns_proc) Ditto.
257         (compare_alpha_value) Ditto.
258         (hash_alpha_value) Ditto.
259         (compare_numeric_value) Ditto.
260         (hash_numeric_value) Ditto.
261         (autorecode_proc_func) Ditto.
262
263 Sat May  6 10:43:33 2006  Ben Pfaff  <blp@gnu.org>
264
265         Continue reforming procedure execution.  In this phase, get rid of
266         the output code for SPLIT FILE groups in procedure.c, which really
267         shouldn't be doing any output.  Move it into the individual
268         procedures instead.  This also adds some flexibility.
269
270         * crosstabs.q (precalc): Call output_split_file_values().
271
272         * descriptives.c (calc_descriptives): Ditto.
273
274         * examine.q (run_examine): Ditto.
275         
276         * frequencies.q (precalc): Ditto.
277
278         * oneway.q (run_oneway): Ditto.
279
280         * regression.q (run_regression): Ditto.
281
282         * t-test.q (calculate): Ditto.
283
284 Wed May  3 23:05:31 2006  Ben Pfaff  <blp@gnu.org>
285
286         Continue reforming procedure execution.  In this phase, get rid of
287         many global variables, consolidating procedure execution in
288         procedure.c.  Encapsulate transformations in new "struct
289         trns_chain".  Also, change implementation of N OF CASES, FILTER,
290         and PROCESS IF from special cases to transformations.
291          
292         * aggregate.c (cmd_aggregate) Use discard_variables().
293         
294 2006-04-28  Jason Stover  <jhs@math.gcsu.edu>
295
296         * regression.q (regression_trns_resid_proc): Pass only the
297         variables used in the model to (*model->residual)().
298
299         * regression.q (regression_trns_pred_proc): Pass only the
300         variables used in the model to (*model->pred)().
301
302 2006-04-26  Jason Stover  <jhs@math.gcsu.edu>
303
304         * regression.q: Added support for multiple transformations.
305         
306         * regression.q (regression_trns_resid_proc): New function.
307
308         * regression.q (regression_trns_pred_proc): New function.
309
310         * regression.q (subcommand_save): Added support for saving
311         predicted values.
312
313         * regression.q (regression_trns_free): New function. 
314
315         * regression.q (reg_get_name): New function.
316
317         * regression.q (reg_save_var): New function.
318
319 Tue Apr 25 13:18:56 2006  Ben Pfaff  <blp@gnu.org>
320
321         * rank.q (parse_rank_function): Use SE instead of ME for parse
322         errors.
323
324 Tue Apr 25 13:16:28 2006  Ben Pfaff  <blp@gnu.org>
325
326         * flip.c (flip_sink_write): Use snprintf() to simplify a bit of
327         code.
328
329 2006-04-21  Jason Stover  <jhs@math.gcsu.edu>
330
331         * regression.q (try_name): New function. (Partly copied from
332         try_name in descriptives.c.)
333
334         * regression.q (subcommand_save): Choose residual variable names
335         correctly. 
336
337 2006-04-20  Jason Stover  <jhs@math.gcsu.edu>
338
339         * regression.q (cmd_regression): Moved call to subcommand_save()
340         outside multipass_procedure_with_splits().
341         
342         * regression.q (regression_trns_proc): Fixed value counter n_vals
343         before calling *model->residual().
344
345 2006-04-19  Jason Stover  <jhs@math.gcsu.edu>
346
347         * regression.q (regression_trns_proc): Fixed the look-up of the
348         number of variables.
349
350 2006-04-18  Jason Stover  <jhs@math.gcsu.edu>
351
352         * regression.q (regression_trns_proc): Look up the residual
353         variable in the linear regression cache.
354
355         * regression.q (subcommand_save): Set the residual variable in the
356         linear regression cache.
357
358 2006-04-17  Jason Stover  <jason@wonko.gcsu.edu>
359
360         * regression.q (regression_trns_proc): Accept case_idx as an int
361         to match the definition of trns_proc_func.
362
363 2006-04-17  Jason Stover  <jhs@math.gcsu.edu>
364
365         * regression.q (regression_trns_proc): New function.
366
367         * regression.q (subcommand_save): Create variable residuals and
368         add a transformation to assign values to them. Also free the
369         linreg_cache if the SAVE command was not called. Removed the
370         casereading loop. Placed actual computation of residuals in
371         regression_trns_proc.
372
373         * regression.q (run_regression): Moved call to free
374         pspp_linreg_cache to subcommand_save.
375
376 Sat Apr 15 18:01:03 2006  Ben Pfaff  <blp@gnu.org>
377
378         * examine.q (output_examine): Add casts to fix warnings.
379
380 2006-04-07  Jason Stover  <jhs@math.gcsu.edu>
381
382         * regression.q (subcommand_save): New function.
383
384 2006-04-04  Jason Stover  <jhs@math.gcsu.edu>
385
386         * regression.q: New function reg_has_categorical () to tell
387         whether a pspp_linreg_struct was made with any variables of type
388         ALPHA.
389
390         * regression.q: (subcommand_export): Call
391         reg_print_categorical_encoding() only if the model uses any
392         categorical variables.
393
394 Mon Mar 27 16:00:42 2006  Ben Pfaff  <blp@gnu.org>
395
396         * crosstabs.q: (output_pivot_table) Drop spurious space from
397         message.
398
399 2006-03-15  Jason Stover  <jhs@math.gcsu.edu>
400
401         * regression.q: Added custom syntax parser for VARIABLES subcommand
402
403         * regression.q: Moved most instructions for run_regression ()
404         inside the loop over dependent variables.
405
406 Thu Mar  2 08:40:33 WST 2006 John Darrington <john@darrington.wattle.id.au>
407         
408         * Moved files from src directory