partial fix of bug 19819
[pspp-builds.git] / src / language / stats / ChangeLog
1 2007-05-08  Jason Stover  <jhs@math.gcsu.edu>
2
3         * regression.q: Partial fix of bug which caused a crash if
4         dependent variable and independent variable were the same.
5
6 2007-04-16 John Darrington <john@darrington.wattle.id.au>
7
8         * t-test.q: Changed the output width of reported counts and 
9         degrees of freedom, to avoid truncating these values.  Thanks
10         to Seth Woolley for reporting this problem.  A proper fix involves
11         re-thinking the output driver.
12
13 2007-04-12  Jason Stover  <jhs@math.gcsu.edu>
14
15         * regression.q (run_regression): Added if (n_data >0) to fix bug
16         19581.
17
18 2007-03-29  Jason Stover  <jhs@math.gcsu.edu>
19
20         * regression.q (prepare_data): New function.
21
22         * regression.q (compute_moments): New function.
23
24 2007-03-18  Ben Pfaff  <blp@gnu.org>
25
26         * crosstabs.q (static var write): Rename write_style to avoid
27         conflict with POSIX function of same name.
28
29 2007-03-16  Jason Stover  <jhs@math.gcsu.edu>
30
31         * regression.q (run_regression): Added support for moments.
32
33 Sat Feb 17 08:16:00 2007  Ben Pfaff  <blp@gnu.org>
34
35         * flip.c (flip_sink_create): Improve error message when temporary
36         file cannot be created.
37
38 Tue Feb  6 19:58:03 2007  Ben Pfaff  <blp@gnu.org>
39
40         * flip.c (flip_file): Give better error message on end-of-file.
41
42 2007-02-04  Jason Stover  <jhs@math.gcsu.edu>
43
44         * regression.q: Fixed p-value computation in the test for
45         individual regression coefficients.
46
47 Mon Jan 15 11:03:20 2007  Ben Pfaff  <blp@gnu.org>
48
49         Fix bugs found by valgrind when --enable-debug is used with the
50         new case code.  These bugs are hidden when the data set is small
51         enough to find in memory; if a bigger data set that would overflow
52         to disk were used, then data corruption would occur.
53
54         * chisquare.c (create_freq_hash): Pass free_freq_mutable_hash to
55         hsh_create as free function.  Make copy of data put into hash.
56
57         * oneway.q (free_value): New function.
58         (run_oneway): Use free_value as arg to hsh_create.  Make copy of
59         data put into hash.
60
61         * rank.q (rank_cases): Don't access data in case after we've given
62         away the case.
63
64 Tue Jan  9 19:16:11 2007  Ben Pfaff  <blp@gnu.org>
65
66         Fix bug #18739.
67         
68         * aggregate.c (parse_aggregate_functions) Initialize
69         function_name.
70
71 Fri Dec 22 14:04:09 2006  Ben Pfaff  <blp@gnu.org>
72
73         Simplify missing value handling.
74         
75         * aggregate.c (struct agr_var): Remove `bool include_missing', add
76         `enum mv_class exclude'.  Remove `int missing', add `bool
77         saw_missing'.  Update users.
78
79         * descriptives.c (struct dsc_trns): Removed `int
80         include_user_missing', add `enum mv_class exclude'.  Update users.
81         (struct dsc_proc): Ditto.
82
83         * examine.q: (static var value_is_missing): Rename
84         `exclude_values', change type to `enum mv_class'.  Update users.
85
86         * rank.q: Ditto.
87
88 Fri Dec 22 19:22:18 WST 2006 John Darrington <john@darrington.wattle.id.au>
89
90         * frequencies.q : Fixed bug #17420, where the table bounds were overun
91         when /FORMAT=nolabels was given.
92
93 Wed Dec 20 18:45:31 WST 2006 John Darrington <john@darrington.wattle.id.au>
94
95         * binomial.c binomial.h : New files.  Thanks to Jason Stover 
96           for assistance with these.
97
98         * chisquare.c chisquare.h freq.c freq.h npar-summary.c npar-summary.h 
99           npar.h npar.q: New files.  Implementing NPAR TESTS.
100
101         * frequencies.q  : Moved  structure definitions into freq.[ch]
102
103 Sat Dec 16 22:26:44 2006  Ben Pfaff  <blp@gnu.org>
104
105         Make it possible to pull cases from the active file with a
106         function call, instead of requiring indirection through a callback
107         function.
108
109         * aggregate.c (cmd_aggregate): Take advantage of new procedure
110         interface.
111         (agr_to_active_file): Removed.
112         (presorted_agr_to_sysfile): Removed.
113
114         * autorecode.c (cmd_autorecode): Take advantage of new procedure
115         interface.
116         (autorecode_proc_func): Removed.
117
118         * flip.c (struct flip_pgm): New members to allow conformance with
119         new case_source_class interface.
120         (cmd_flip): Adapt to new case_source_class interface.
121         (flip_source_read): Ditto.
122         (flip_source_destroy): Ditto.
123
124 Sat Dec 16 12:54:27 2006  Ben Pfaff  <blp@gnu.org>
125
126         * rank.q (rank_custom_variables): Allow grouping variables to be
127         strings.  Fixes bug #18533.  Thanks to John Darrington for review.
128
129 Sat Dec  9 18:47:51 2006  Ben Pfaff  <blp@gnu.org>
130
131         * regression.q (is_depvar): Compare variable pointers instead of
132         variable names.
133
134 Thu Dec  7 15:26:25 WST 2006 John Darrington <john@darrington.wattle.id.au>
135
136         * examine.q: Allocated the categorical values for the dependent and 
137         independent variables, on the heap.  Hence they can be of any width.
138
139 Wed Dec  6 21:14:26 2006  Ben Pfaff  <blp@gnu.org>
140
141         * regression.q (reg_inserted): Compare variable pointers instead
142         of variable indexes.
143
144 Mon Dec  4 22:33:46 2006  Ben Pfaff  <blp@gnu.org>
145
146         * crosstabs.q (insert_summary): Use var_to_string for labeling.
147         (output_pivot_table) Ditto.
148         (submit) Ditto.
149
150         * frequencies.q (setup_z_trns): Ditto.
151         (dump_full) Ditto.
152         (dump_condensed) Ditto.
153         (dump_statistics) Ditto.
154         
155
156 Sun Nov  5 08:31:42 WST 2006 John Darrington <john@darrington.wattle.id.au>
157
158         * t-test.q, oneway.q: Changed to use the new casefilter structure.
159
160 Sat Oct 14 16:52:28 2006  Ben Pfaff  <blp@gnu.org>
161
162         * rank.q: (rank_sorted_casefile) Add some missing case_destroy()
163         calls to fix a memory leak.
164
165 Sun Oct  8 09:45:40 WST 2006 John Darrington <john@darrington.wattle.id.au>
166
167         * rank.q: Plugged a small memory leak which occurred under error
168         conditions.
169         
170 Sat Oct  7 11:06:01 WST 2006 John Darrington <john@darrington.wattle.id.au>
171
172         * rank.q: Implemented most of the RANK command.
173
174 2006-07-14  Jason Stover  <jhs@math.gcsu.edu>
175
176         * regression.q (run_regression): New function to move knowledge of
177         pspp_linreg_cache out of math/coefficient.[ch].
178
179 Sat Jul  1 17:41:46 2006  Ben Pfaff  <blp@gnu.org>
180
181         Fix bug #11612, "q2c documentation does not agree with code".
182         
183         * examine.q: Audit use of q2c "+" prefixes that indicate that a
184         command may appear multiple times.
185
186         * frequencies.q: Ditto.
187
188         * oneway.q: Ditto.
189
190         * regression.q: Ditto.
191
192         * t-test.q: Ditto.
193
194 Fri Jun 23 14:18:22 2006  Ben Pfaff  <blp@gnu.org>
195
196         Support long string variables on FREQUENCIES, as
197         an extension when in enhanced algorithms mode.  For Greg Hunt
198         <greg@firmansyah.com>.
199         
200         * frequencies.q: (struct freq) Change `v' member from union value
201         to union value *.  Update all references.
202         (struct var_freqs) Add width, print members to represent effective
203         variable width and display format.
204         (calc) Copy entire long string value into the hash table.
205         (frq_custom_variables) Set new width, print members.
206         (hash_value_alpha) Get width from var_freqs.
207         (compare_value_alpha_a) Ditto.
208         (compare_freq_alpha_a) Ditto.
209         (compare_freq_alpha_d) Ditto.
210         (dump_full) Get display format from var_freqs.
211         (dump_condensed) Ditto.
212
213 Mon Jun 19 22:07:13 2006  Ben Pfaff  <blp@gnu.org>
214
215         * frequencies.q: (dump_full) Only put the first MAX_SHORT_STRING
216         bytes of string variables into the output cells, seeing as we only
217         copy that many.
218         (dump_condensed) Ditto.
219
220 Mon Jun 19 21:52:05 2006  Ben Pfaff  <blp@gnu.org>
221
222         Fixes a bug reported by Greg Hunt <greg@firmansyah.com>.
223         
224         * frequencies.q: (hsh_hash_bytes) We only copy the first
225         MAX_SHORT_STRING bytes of string variables, so we must only
226         compare that many bytes, even if the string variable is longer.
227         (compare_value_alpha_a) Ditto.
228         (compare_freq_alpha_a) Ditto.
229         (compare_freq_alpha_d) Ditto.
230
231 2006-05-11  Jason Stover  <jhs@math.gcsu.edu>
232
233         * regression.q: Adjusted code to account for cache->coeff being a
234         pspp_linreg_coeff **.
235
236 Sun May  7 18:31:25 2006  Ben Pfaff  <blp@gnu.org>
237
238         Fix memory leak.
239         
240         * aggregate.c (cmd_aggregate): Free default_dict before replacing
241         it.
242
243 Sun May  7 17:09:19 2006  Ben Pfaff  <blp@gnu.org>
244
245         * flip.c (flip_file): Check return value of pool_fclose().
246
247 Sat May  6 16:00:13 2006  Ben Pfaff  <blp@gnu.org>
248
249         Get rid of `char *c' member in union value, for cleanliness.
250         
251         * aggregate.c: (union agr_argument) New union.
252         (struct agr_var) Change element type of arg[] from union value to
253         union agr_argument.
254         (parse_aggregate_functions) Change local variable types likewise.
255
256         * autorecode.c: (union arc_value) New union.
257         (struct arc_item) Change "from" from union value to union
258         arc_value.
259         (recode) Change local variable from union value to union
260         arc_value.
261         (autorecode_trns_proc) Ditto.
262         (compare_alpha_value) Ditto.
263         (hash_alpha_value) Ditto.
264         (compare_numeric_value) Ditto.
265         (hash_numeric_value) Ditto.
266         (autorecode_proc_func) Ditto.
267
268 Sat May  6 10:43:33 2006  Ben Pfaff  <blp@gnu.org>
269
270         Continue reforming procedure execution.  In this phase, get rid of
271         the output code for SPLIT FILE groups in procedure.c, which really
272         shouldn't be doing any output.  Move it into the individual
273         procedures instead.  This also adds some flexibility.
274
275         * crosstabs.q (precalc): Call output_split_file_values().
276
277         * descriptives.c (calc_descriptives): Ditto.
278
279         * examine.q (run_examine): Ditto.
280         
281         * frequencies.q (precalc): Ditto.
282
283         * oneway.q (run_oneway): Ditto.
284
285         * regression.q (run_regression): Ditto.
286
287         * t-test.q (calculate): Ditto.
288
289 Wed May  3 23:05:31 2006  Ben Pfaff  <blp@gnu.org>
290
291         Continue reforming procedure execution.  In this phase, get rid of
292         many global variables, consolidating procedure execution in
293         procedure.c.  Encapsulate transformations in new "struct
294         trns_chain".  Also, change implementation of N OF CASES, FILTER,
295         and PROCESS IF from special cases to transformations.
296          
297         * aggregate.c (cmd_aggregate) Use discard_variables().
298         
299 2006-04-28  Jason Stover  <jhs@math.gcsu.edu>
300
301         * regression.q (regression_trns_resid_proc): Pass only the
302         variables used in the model to (*model->residual)().
303
304         * regression.q (regression_trns_pred_proc): Pass only the
305         variables used in the model to (*model->pred)().
306
307 2006-04-26  Jason Stover  <jhs@math.gcsu.edu>
308
309         * regression.q: Added support for multiple transformations.
310         
311         * regression.q (regression_trns_resid_proc): New function.
312
313         * regression.q (regression_trns_pred_proc): New function.
314
315         * regression.q (subcommand_save): Added support for saving
316         predicted values.
317
318         * regression.q (regression_trns_free): New function. 
319
320         * regression.q (reg_get_name): New function.
321
322         * regression.q (reg_save_var): New function.
323
324 Tue Apr 25 13:18:56 2006  Ben Pfaff  <blp@gnu.org>
325
326         * rank.q (parse_rank_function): Use SE instead of ME for parse
327         errors.
328
329 Tue Apr 25 13:16:28 2006  Ben Pfaff  <blp@gnu.org>
330
331         * flip.c (flip_sink_write): Use snprintf() to simplify a bit of
332         code.
333
334 2006-04-21  Jason Stover  <jhs@math.gcsu.edu>
335
336         * regression.q (try_name): New function. (Partly copied from
337         try_name in descriptives.c.)
338
339         * regression.q (subcommand_save): Choose residual variable names
340         correctly. 
341
342 2006-04-20  Jason Stover  <jhs@math.gcsu.edu>
343
344         * regression.q (cmd_regression): Moved call to subcommand_save()
345         outside multipass_procedure_with_splits().
346         
347         * regression.q (regression_trns_proc): Fixed value counter n_vals
348         before calling *model->residual().
349
350 2006-04-19  Jason Stover  <jhs@math.gcsu.edu>
351
352         * regression.q (regression_trns_proc): Fixed the look-up of the
353         number of variables.
354
355 2006-04-18  Jason Stover  <jhs@math.gcsu.edu>
356
357         * regression.q (regression_trns_proc): Look up the residual
358         variable in the linear regression cache.
359
360         * regression.q (subcommand_save): Set the residual variable in the
361         linear regression cache.
362
363 2006-04-17  Jason Stover  <jason@wonko.gcsu.edu>
364
365         * regression.q (regression_trns_proc): Accept case_idx as an int
366         to match the definition of trns_proc_func.
367
368 2006-04-17  Jason Stover  <jhs@math.gcsu.edu>
369
370         * regression.q (regression_trns_proc): New function.
371
372         * regression.q (subcommand_save): Create variable residuals and
373         add a transformation to assign values to them. Also free the
374         linreg_cache if the SAVE command was not called. Removed the
375         casereading loop. Placed actual computation of residuals in
376         regression_trns_proc.
377
378         * regression.q (run_regression): Moved call to free
379         pspp_linreg_cache to subcommand_save.
380
381 Sat Apr 15 18:01:03 2006  Ben Pfaff  <blp@gnu.org>
382
383         * examine.q (output_examine): Add casts to fix warnings.
384
385 2006-04-07  Jason Stover  <jhs@math.gcsu.edu>
386
387         * regression.q (subcommand_save): New function.
388
389 2006-04-04  Jason Stover  <jhs@math.gcsu.edu>
390
391         * regression.q: New function reg_has_categorical () to tell
392         whether a pspp_linreg_struct was made with any variables of type
393         ALPHA.
394
395         * regression.q: (subcommand_export): Call
396         reg_print_categorical_encoding() only if the model uses any
397         categorical variables.
398
399 Mon Mar 27 16:00:42 2006  Ben Pfaff  <blp@gnu.org>
400
401         * crosstabs.q: (output_pivot_table) Drop spurious space from
402         message.
403
404 2006-03-15  Jason Stover  <jhs@math.gcsu.edu>
405
406         * regression.q: Added custom syntax parser for VARIABLES subcommand
407
408         * regression.q: Moved most instructions for run_regression ()
409         inside the loop over dependent variables.
410
411 Thu Mar  2 08:40:33 WST 2006 John Darrington <john@darrington.wattle.id.au>
412         
413         * Moved files from src directory