4456d8f2cb688208dc07d47a025a0b4fee4aa072
[pspp-builds.git] / src / language / stats / ChangeLog
1 2007-07-28 John Darrington <john@darrington.wattle.id.au>
2
3         * t-test.q: Moved the order in which groups are displayed in the 
4         independent samples case, where a cut point is given.
5
6 2007-07-27  Ben Pfaff  <blp@gnu.org>
7
8         * regression.q (run_regression): Move casereader_destroy call so
9         that it always gets called, not just if there was some valid
10         data.  Fixes bug #19581.
11         Reviewed by Jason Stover.
12
13 2007-07-24  Ben Pfaff  <blp@gnu.org>
14
15         * flip.c (struct flip_pgm): Remove `case_size' member (now
16         unused).
17         (cmd_flip): Pass var_cnt as number of cases instead of case_cnt,
18         to fix bug #20494.  Don't assign to `case_size' member, which was
19         unused after assignment.
20         (build_dictionary): When NEWNAMES not used, get the number of
21         variables right, to fix bug #20493.
22
23 2007-07-10  Jason Stover  <jhs@math.gcsu.edu>
24
25         * glm.q: Initial version of the GLM procedure.
26
27 2007-06-06  Ben Pfaff  <blp@gnu.org>
28
29         Adapt case sources, sinks, and clients of procedure code to the
30         new infrastructure.
31         
32         * aggregate.c: Simplify greatly since everything is more uniform
33         now.
34
35         * autorecode.c: Adapt to new procedure code.
36         * binomial.c: Ditto.
37         * chisquare.c: Ditto.
38         * crosstabs.q: Ditto.
39         * descriptives.c: Ditto.
40         * examine.q: Ditto.
41         * npar-summary.c: Ditto.
42         * frequencies.q: Ditto.
43         * npar.q: Ditto.
44         * oneway.q: Ditto.
45         * regression.q: Ditto.
46         * sort-cases.c: Ditto.
47         * t-test.c: Ditto.
48
49         * sort-criteria.c: Rewrite to output a struct case_ordering.
50         
51         * flip.c: Rewrite to be a casereader.
52
53         * rank.q: Simplify greatly since casereaders are much more
54         flexible than what we had before.
55         
56 2007-05-15  Jason Stover  <jhs@math.gcsu.edu>
57
58         * regression.q (run_regression): Tell the user when the data
59         contain no valid cases.
60
61 2007-05-08  Jason Stover  <jhs@math.gcsu.edu>
62
63         * regression.q: Partial fix of bug which caused a crash if
64         dependent variable and independent variable were the same.
65
66 2007-04-16 John Darrington <john@darrington.wattle.id.au>
67
68         * t-test.q: Changed the output width of reported counts and 
69         degrees of freedom, to avoid truncating these values.  Thanks
70         to Seth Woolley for reporting this problem.  A proper fix involves
71         re-thinking the output driver.
72
73 2007-04-12  Jason Stover  <jhs@math.gcsu.edu>
74
75         * regression.q (run_regression): Added if (n_data >0) to fix bug
76         19581.
77
78 2007-03-29  Jason Stover  <jhs@math.gcsu.edu>
79
80         * regression.q (prepare_data): New function.
81
82         * regression.q (compute_moments): New function.
83
84 2007-03-18  Ben Pfaff  <blp@gnu.org>
85
86         * crosstabs.q (static var write): Rename write_style to avoid
87         conflict with POSIX function of same name.
88
89 2007-03-16  Jason Stover  <jhs@math.gcsu.edu>
90
91         * regression.q (run_regression): Added support for moments.
92
93 Sat Feb 17 08:16:00 2007  Ben Pfaff  <blp@gnu.org>
94
95         * flip.c (flip_sink_create): Improve error message when temporary
96         file cannot be created.
97
98 Tue Feb  6 19:58:03 2007  Ben Pfaff  <blp@gnu.org>
99
100         * flip.c (flip_file): Give better error message on end-of-file.
101
102 2007-02-04  Jason Stover  <jhs@math.gcsu.edu>
103
104         * regression.q: Fixed p-value computation in the test for
105         individual regression coefficients.
106
107 Mon Jan 15 11:03:20 2007  Ben Pfaff  <blp@gnu.org>
108
109         Fix bugs found by valgrind when --enable-debug is used with the
110         new case code.  These bugs are hidden when the data set is small
111         enough to find in memory; if a bigger data set that would overflow
112         to disk were used, then data corruption would occur.
113
114         * chisquare.c (create_freq_hash): Pass free_freq_mutable_hash to
115         hsh_create as free function.  Make copy of data put into hash.
116
117         * oneway.q (free_value): New function.
118         (run_oneway): Use free_value as arg to hsh_create.  Make copy of
119         data put into hash.
120
121         * rank.q (rank_cases): Don't access data in case after we've given
122         away the case.
123
124 Tue Jan  9 19:16:11 2007  Ben Pfaff  <blp@gnu.org>
125
126         Fix bug #18739.
127         
128         * aggregate.c (parse_aggregate_functions) Initialize
129         function_name.
130
131 Fri Dec 22 14:04:09 2006  Ben Pfaff  <blp@gnu.org>
132
133         Simplify missing value handling.
134         
135         * aggregate.c (struct agr_var): Remove `bool include_missing', add
136         `enum mv_class exclude'.  Remove `int missing', add `bool
137         saw_missing'.  Update users.
138
139         * descriptives.c (struct dsc_trns): Removed `int
140         include_user_missing', add `enum mv_class exclude'.  Update users.
141         (struct dsc_proc): Ditto.
142
143         * examine.q: (static var value_is_missing): Rename
144         `exclude_values', change type to `enum mv_class'.  Update users.
145
146         * rank.q: Ditto.
147
148 Fri Dec 22 19:22:18 WST 2006 John Darrington <john@darrington.wattle.id.au>
149
150         * frequencies.q : Fixed bug #17420, where the table bounds were overun
151         when /FORMAT=nolabels was given.
152
153 Wed Dec 20 18:45:31 WST 2006 John Darrington <john@darrington.wattle.id.au>
154
155         * binomial.c binomial.h : New files.  Thanks to Jason Stover 
156           for assistance with these.
157
158         * chisquare.c chisquare.h freq.c freq.h npar-summary.c npar-summary.h 
159           npar.h npar.q: New files.  Implementing NPAR TESTS.
160
161         * frequencies.q  : Moved  structure definitions into freq.[ch]
162
163 Sat Dec 16 22:26:44 2006  Ben Pfaff  <blp@gnu.org>
164
165         Make it possible to pull cases from the active file with a
166         function call, instead of requiring indirection through a callback
167         function.
168
169         * aggregate.c (cmd_aggregate): Take advantage of new procedure
170         interface.
171         (agr_to_active_file): Removed.
172         (presorted_agr_to_sysfile): Removed.
173
174         * autorecode.c (cmd_autorecode): Take advantage of new procedure
175         interface.
176         (autorecode_proc_func): Removed.
177
178         * flip.c (struct flip_pgm): New members to allow conformance with
179         new case_source_class interface.
180         (cmd_flip): Adapt to new case_source_class interface.
181         (flip_source_read): Ditto.
182         (flip_source_destroy): Ditto.
183
184 Sat Dec 16 12:54:27 2006  Ben Pfaff  <blp@gnu.org>
185
186         * rank.q (rank_custom_variables): Allow grouping variables to be
187         strings.  Fixes bug #18533.  Thanks to John Darrington for review.
188
189 Sat Dec  9 18:47:51 2006  Ben Pfaff  <blp@gnu.org>
190
191         * regression.q (is_depvar): Compare variable pointers instead of
192         variable names.
193
194 Thu Dec  7 15:26:25 WST 2006 John Darrington <john@darrington.wattle.id.au>
195
196         * examine.q: Allocated the categorical values for the dependent and 
197         independent variables, on the heap.  Hence they can be of any width.
198
199 Wed Dec  6 21:14:26 2006  Ben Pfaff  <blp@gnu.org>
200
201         * regression.q (reg_inserted): Compare variable pointers instead
202         of variable indexes.
203
204 Mon Dec  4 22:33:46 2006  Ben Pfaff  <blp@gnu.org>
205
206         * crosstabs.q (insert_summary): Use var_to_string for labeling.
207         (output_pivot_table) Ditto.
208         (submit) Ditto.
209
210         * frequencies.q (setup_z_trns): Ditto.
211         (dump_full) Ditto.
212         (dump_condensed) Ditto.
213         (dump_statistics) Ditto.
214         
215
216 Sun Nov  5 08:31:42 WST 2006 John Darrington <john@darrington.wattle.id.au>
217
218         * t-test.q, oneway.q: Changed to use the new casefilter structure.
219
220 Sat Oct 14 16:52:28 2006  Ben Pfaff  <blp@gnu.org>
221
222         * rank.q: (rank_sorted_casefile) Add some missing case_destroy()
223         calls to fix a memory leak.
224
225 Sun Oct  8 09:45:40 WST 2006 John Darrington <john@darrington.wattle.id.au>
226
227         * rank.q: Plugged a small memory leak which occurred under error
228         conditions.
229         
230 Sat Oct  7 11:06:01 WST 2006 John Darrington <john@darrington.wattle.id.au>
231
232         * rank.q: Implemented most of the RANK command.
233
234 2006-07-14  Jason Stover  <jhs@math.gcsu.edu>
235
236         * regression.q (run_regression): New function to move knowledge of
237         pspp_linreg_cache out of math/coefficient.[ch].
238
239 Sat Jul  1 17:41:46 2006  Ben Pfaff  <blp@gnu.org>
240
241         Fix bug #11612, "q2c documentation does not agree with code".
242         
243         * examine.q: Audit use of q2c "+" prefixes that indicate that a
244         command may appear multiple times.
245
246         * frequencies.q: Ditto.
247
248         * oneway.q: Ditto.
249
250         * regression.q: Ditto.
251
252         * t-test.q: Ditto.
253
254 Fri Jun 23 14:18:22 2006  Ben Pfaff  <blp@gnu.org>
255
256         Support long string variables on FREQUENCIES, as
257         an extension when in enhanced algorithms mode.  For Greg Hunt
258         <greg@firmansyah.com>.
259         
260         * frequencies.q: (struct freq) Change `v' member from union value
261         to union value *.  Update all references.
262         (struct var_freqs) Add width, print members to represent effective
263         variable width and display format.
264         (calc) Copy entire long string value into the hash table.
265         (frq_custom_variables) Set new width, print members.
266         (hash_value_alpha) Get width from var_freqs.
267         (compare_value_alpha_a) Ditto.
268         (compare_freq_alpha_a) Ditto.
269         (compare_freq_alpha_d) Ditto.
270         (dump_full) Get display format from var_freqs.
271         (dump_condensed) Ditto.
272
273 Mon Jun 19 22:07:13 2006  Ben Pfaff  <blp@gnu.org>
274
275         * frequencies.q: (dump_full) Only put the first MAX_SHORT_STRING
276         bytes of string variables into the output cells, seeing as we only
277         copy that many.
278         (dump_condensed) Ditto.
279
280 Mon Jun 19 21:52:05 2006  Ben Pfaff  <blp@gnu.org>
281
282         Fixes a bug reported by Greg Hunt <greg@firmansyah.com>.
283         
284         * frequencies.q: (hsh_hash_bytes) We only copy the first
285         MAX_SHORT_STRING bytes of string variables, so we must only
286         compare that many bytes, even if the string variable is longer.
287         (compare_value_alpha_a) Ditto.
288         (compare_freq_alpha_a) Ditto.
289         (compare_freq_alpha_d) Ditto.
290
291 2006-05-11  Jason Stover  <jhs@math.gcsu.edu>
292
293         * regression.q: Adjusted code to account for cache->coeff being a
294         pspp_linreg_coeff **.
295
296 Sun May  7 18:31:25 2006  Ben Pfaff  <blp@gnu.org>
297
298         Fix memory leak.
299         
300         * aggregate.c (cmd_aggregate): Free default_dict before replacing
301         it.
302
303 Sun May  7 17:09:19 2006  Ben Pfaff  <blp@gnu.org>
304
305         * flip.c (flip_file): Check return value of pool_fclose().
306
307 Sat May  6 16:00:13 2006  Ben Pfaff  <blp@gnu.org>
308
309         Get rid of `char *c' member in union value, for cleanliness.
310         
311         * aggregate.c: (union agr_argument) New union.
312         (struct agr_var) Change element type of arg[] from union value to
313         union agr_argument.
314         (parse_aggregate_functions) Change local variable types likewise.
315
316         * autorecode.c: (union arc_value) New union.
317         (struct arc_item) Change "from" from union value to union
318         arc_value.
319         (recode) Change local variable from union value to union
320         arc_value.
321         (autorecode_trns_proc) Ditto.
322         (compare_alpha_value) Ditto.
323         (hash_alpha_value) Ditto.
324         (compare_numeric_value) Ditto.
325         (hash_numeric_value) Ditto.
326         (autorecode_proc_func) Ditto.
327
328 Sat May  6 10:43:33 2006  Ben Pfaff  <blp@gnu.org>
329
330         Continue reforming procedure execution.  In this phase, get rid of
331         the output code for SPLIT FILE groups in procedure.c, which really
332         shouldn't be doing any output.  Move it into the individual
333         procedures instead.  This also adds some flexibility.
334
335         * crosstabs.q (precalc): Call output_split_file_values().
336
337         * descriptives.c (calc_descriptives): Ditto.
338
339         * examine.q (run_examine): Ditto.
340         
341         * frequencies.q (precalc): Ditto.
342
343         * oneway.q (run_oneway): Ditto.
344
345         * regression.q (run_regression): Ditto.
346
347         * t-test.q (calculate): Ditto.
348
349 Wed May  3 23:05:31 2006  Ben Pfaff  <blp@gnu.org>
350
351         Continue reforming procedure execution.  In this phase, get rid of
352         many global variables, consolidating procedure execution in
353         procedure.c.  Encapsulate transformations in new "struct
354         trns_chain".  Also, change implementation of N OF CASES, FILTER,
355         and PROCESS IF from special cases to transformations.
356          
357         * aggregate.c (cmd_aggregate) Use discard_variables().
358         
359 2006-04-28  Jason Stover  <jhs@math.gcsu.edu>
360
361         * regression.q (regression_trns_resid_proc): Pass only the
362         variables used in the model to (*model->residual)().
363
364         * regression.q (regression_trns_pred_proc): Pass only the
365         variables used in the model to (*model->pred)().
366
367 2006-04-26  Jason Stover  <jhs@math.gcsu.edu>
368
369         * regression.q: Added support for multiple transformations.
370         
371         * regression.q (regression_trns_resid_proc): New function.
372
373         * regression.q (regression_trns_pred_proc): New function.
374
375         * regression.q (subcommand_save): Added support for saving
376         predicted values.
377
378         * regression.q (regression_trns_free): New function. 
379
380         * regression.q (reg_get_name): New function.
381
382         * regression.q (reg_save_var): New function.
383
384 Tue Apr 25 13:18:56 2006  Ben Pfaff  <blp@gnu.org>
385
386         * rank.q (parse_rank_function): Use SE instead of ME for parse
387         errors.
388
389 Tue Apr 25 13:16:28 2006  Ben Pfaff  <blp@gnu.org>
390
391         * flip.c (flip_sink_write): Use snprintf() to simplify a bit of
392         code.
393
394 2006-04-21  Jason Stover  <jhs@math.gcsu.edu>
395
396         * regression.q (try_name): New function. (Partly copied from
397         try_name in descriptives.c.)
398
399         * regression.q (subcommand_save): Choose residual variable names
400         correctly. 
401
402 2006-04-20  Jason Stover  <jhs@math.gcsu.edu>
403
404         * regression.q (cmd_regression): Moved call to subcommand_save()
405         outside multipass_procedure_with_splits().
406         
407         * regression.q (regression_trns_proc): Fixed value counter n_vals
408         before calling *model->residual().
409
410 2006-04-19  Jason Stover  <jhs@math.gcsu.edu>
411
412         * regression.q (regression_trns_proc): Fixed the look-up of the
413         number of variables.
414
415 2006-04-18  Jason Stover  <jhs@math.gcsu.edu>
416
417         * regression.q (regression_trns_proc): Look up the residual
418         variable in the linear regression cache.
419
420         * regression.q (subcommand_save): Set the residual variable in the
421         linear regression cache.
422
423 2006-04-17  Jason Stover  <jason@wonko.gcsu.edu>
424
425         * regression.q (regression_trns_proc): Accept case_idx as an int
426         to match the definition of trns_proc_func.
427
428 2006-04-17  Jason Stover  <jhs@math.gcsu.edu>
429
430         * regression.q (regression_trns_proc): New function.
431
432         * regression.q (subcommand_save): Create variable residuals and
433         add a transformation to assign values to them. Also free the
434         linreg_cache if the SAVE command was not called. Removed the
435         casereading loop. Placed actual computation of residuals in
436         regression_trns_proc.
437
438         * regression.q (run_regression): Moved call to free
439         pspp_linreg_cache to subcommand_save.
440
441 Sat Apr 15 18:01:03 2006  Ben Pfaff  <blp@gnu.org>
442
443         * examine.q (output_examine): Add casts to fix warnings.
444
445 2006-04-07  Jason Stover  <jhs@math.gcsu.edu>
446
447         * regression.q (subcommand_save): New function.
448
449 2006-04-04  Jason Stover  <jhs@math.gcsu.edu>
450
451         * regression.q: New function reg_has_categorical () to tell
452         whether a pspp_linreg_struct was made with any variables of type
453         ALPHA.
454
455         * regression.q: (subcommand_export): Call
456         reg_print_categorical_encoding() only if the model uses any
457         categorical variables.
458
459 Mon Mar 27 16:00:42 2006  Ben Pfaff  <blp@gnu.org>
460
461         * crosstabs.q: (output_pivot_table) Drop spurious space from
462         message.
463
464 2006-03-15  Jason Stover  <jhs@math.gcsu.edu>
465
466         * regression.q: Added custom syntax parser for VARIABLES subcommand
467
468         * regression.q: Moved most instructions for run_regression ()
469         inside the loop over dependent variables.
470
471 Thu Mar  2 08:40:33 WST 2006 John Darrington <john@darrington.wattle.id.au>
472         
473         * Moved files from src directory