use moments.c to compute moments
[pspp-builds.git] / src / language / stats / ChangeLog
1 2007-03-29  Jason Stover  <jhs@math.gcsu.edu>
2
3         * regression.q (prepare_data): New function.
4
5         * regression.q (compute_moments): New function.
6
7 2007-03-18  Ben Pfaff  <blp@gnu.org>
8
9         * crosstabs.q (static var write): Rename write_style to avoid
10         conflict with POSIX function of same name.
11
12 2007-03-16  Jason Stover  <jhs@math.gcsu.edu>
13
14         * regression.q (run_regression): Added support for moments.
15
16 Sat Feb 17 08:16:00 2007  Ben Pfaff  <blp@gnu.org>
17
18         * flip.c (flip_sink_create): Improve error message when temporary
19         file cannot be created.
20
21 Tue Feb  6 19:58:03 2007  Ben Pfaff  <blp@gnu.org>
22
23         * flip.c (flip_file): Give better error message on end-of-file.
24
25 2007-02-04  Jason Stover  <jhs@math.gcsu.edu>
26
27         * regression.q: Fixed p-value computation in the test for
28         individual regression coefficients.
29
30 Mon Jan 15 11:03:20 2007  Ben Pfaff  <blp@gnu.org>
31
32         Fix bugs found by valgrind when --enable-debug is used with the
33         new case code.  These bugs are hidden when the data set is small
34         enough to find in memory; if a bigger data set that would overflow
35         to disk were used, then data corruption would occur.
36
37         * chisquare.c (create_freq_hash): Pass free_freq_mutable_hash to
38         hsh_create as free function.  Make copy of data put into hash.
39
40         * oneway.q (free_value): New function.
41         (run_oneway): Use free_value as arg to hsh_create.  Make copy of
42         data put into hash.
43
44         * rank.q (rank_cases): Don't access data in case after we've given
45         away the case.
46
47 Tue Jan  9 19:16:11 2007  Ben Pfaff  <blp@gnu.org>
48
49         Fix bug #18739.
50         
51         * aggregate.c (parse_aggregate_functions) Initialize
52         function_name.
53
54 Fri Dec 22 14:04:09 2006  Ben Pfaff  <blp@gnu.org>
55
56         Simplify missing value handling.
57         
58         * aggregate.c (struct agr_var): Remove `bool include_missing', add
59         `enum mv_class exclude'.  Remove `int missing', add `bool
60         saw_missing'.  Update users.
61
62         * descriptives.c (struct dsc_trns): Removed `int
63         include_user_missing', add `enum mv_class exclude'.  Update users.
64         (struct dsc_proc): Ditto.
65
66         * examine.q: (static var value_is_missing): Rename
67         `exclude_values', change type to `enum mv_class'.  Update users.
68
69         * rank.q: Ditto.
70
71 Fri Dec 22 19:22:18 WST 2006 John Darrington <john@darrington.wattle.id.au>
72
73         * frequencies.q : Fixed bug #17420, where the table bounds were overun
74         when /FORMAT=nolabels was given.
75
76 Wed Dec 20 18:45:31 WST 2006 John Darrington <john@darrington.wattle.id.au>
77
78         * binomial.c binomial.h : New files.  Thanks to Jason Stover 
79           for assistance with these.
80
81         * chisquare.c chisquare.h freq.c freq.h npar-summary.c npar-summary.h 
82           npar.h npar.q: New files.  Implementing NPAR TESTS.
83
84         * frequencies.q  : Moved  structure definitions into freq.[ch]
85
86 Sat Dec 16 22:26:44 2006  Ben Pfaff  <blp@gnu.org>
87
88         Make it possible to pull cases from the active file with a
89         function call, instead of requiring indirection through a callback
90         function.
91
92         * aggregate.c (cmd_aggregate): Take advantage of new procedure
93         interface.
94         (agr_to_active_file): Removed.
95         (presorted_agr_to_sysfile): Removed.
96
97         * autorecode.c (cmd_autorecode): Take advantage of new procedure
98         interface.
99         (autorecode_proc_func): Removed.
100
101         * flip.c (struct flip_pgm): New members to allow conformance with
102         new case_source_class interface.
103         (cmd_flip): Adapt to new case_source_class interface.
104         (flip_source_read): Ditto.
105         (flip_source_destroy): Ditto.
106
107 Sat Dec 16 12:54:27 2006  Ben Pfaff  <blp@gnu.org>
108
109         * rank.q (rank_custom_variables): Allow grouping variables to be
110         strings.  Fixes bug #18533.  Thanks to John Darrington for review.
111
112 Sat Dec  9 18:47:51 2006  Ben Pfaff  <blp@gnu.org>
113
114         * regression.q (is_depvar): Compare variable pointers instead of
115         variable names.
116
117 Thu Dec  7 15:26:25 WST 2006 John Darrington <john@darrington.wattle.id.au>
118
119         * examine.q: Allocated the categorical values for the dependent and 
120         independent variables, on the heap.  Hence they can be of any width.
121
122 Wed Dec  6 21:14:26 2006  Ben Pfaff  <blp@gnu.org>
123
124         * regression.q (reg_inserted): Compare variable pointers instead
125         of variable indexes.
126
127 Mon Dec  4 22:33:46 2006  Ben Pfaff  <blp@gnu.org>
128
129         * crosstabs.q (insert_summary): Use var_to_string for labeling.
130         (output_pivot_table) Ditto.
131         (submit) Ditto.
132
133         * frequencies.q (setup_z_trns): Ditto.
134         (dump_full) Ditto.
135         (dump_condensed) Ditto.
136         (dump_statistics) Ditto.
137         
138
139 Sun Nov  5 08:31:42 WST 2006 John Darrington <john@darrington.wattle.id.au>
140
141         * t-test.q, oneway.q: Changed to use the new casefilter structure.
142
143 Sat Oct 14 16:52:28 2006  Ben Pfaff  <blp@gnu.org>
144
145         * rank.q: (rank_sorted_casefile) Add some missing case_destroy()
146         calls to fix a memory leak.
147
148 Sun Oct  8 09:45:40 WST 2006 John Darrington <john@darrington.wattle.id.au>
149
150         * rank.q: Plugged a small memory leak which occurred under error
151         conditions.
152         
153 Sat Oct  7 11:06:01 WST 2006 John Darrington <john@darrington.wattle.id.au>
154
155         * rank.q: Implemented most of the RANK command.
156
157 2006-07-14  Jason Stover  <jhs@math.gcsu.edu>
158
159         * regression.q (run_regression): New function to move knowledge of
160         pspp_linreg_cache out of math/coefficient.[ch].
161
162 Sat Jul  1 17:41:46 2006  Ben Pfaff  <blp@gnu.org>
163
164         Fix bug #11612, "q2c documentation does not agree with code".
165         
166         * examine.q: Audit use of q2c "+" prefixes that indicate that a
167         command may appear multiple times.
168
169         * frequencies.q: Ditto.
170
171         * oneway.q: Ditto.
172
173         * regression.q: Ditto.
174
175         * t-test.q: Ditto.
176
177 Fri Jun 23 14:18:22 2006  Ben Pfaff  <blp@gnu.org>
178
179         Support long string variables on FREQUENCIES, as
180         an extension when in enhanced algorithms mode.  For Greg Hunt
181         <greg@firmansyah.com>.
182         
183         * frequencies.q: (struct freq) Change `v' member from union value
184         to union value *.  Update all references.
185         (struct var_freqs) Add width, print members to represent effective
186         variable width and display format.
187         (calc) Copy entire long string value into the hash table.
188         (frq_custom_variables) Set new width, print members.
189         (hash_value_alpha) Get width from var_freqs.
190         (compare_value_alpha_a) Ditto.
191         (compare_freq_alpha_a) Ditto.
192         (compare_freq_alpha_d) Ditto.
193         (dump_full) Get display format from var_freqs.
194         (dump_condensed) Ditto.
195
196 Mon Jun 19 22:07:13 2006  Ben Pfaff  <blp@gnu.org>
197
198         * frequencies.q: (dump_full) Only put the first MAX_SHORT_STRING
199         bytes of string variables into the output cells, seeing as we only
200         copy that many.
201         (dump_condensed) Ditto.
202
203 Mon Jun 19 21:52:05 2006  Ben Pfaff  <blp@gnu.org>
204
205         Fixes a bug reported by Greg Hunt <greg@firmansyah.com>.
206         
207         * frequencies.q: (hsh_hash_bytes) We only copy the first
208         MAX_SHORT_STRING bytes of string variables, so we must only
209         compare that many bytes, even if the string variable is longer.
210         (compare_value_alpha_a) Ditto.
211         (compare_freq_alpha_a) Ditto.
212         (compare_freq_alpha_d) Ditto.
213
214 2006-05-11  Jason Stover  <jhs@math.gcsu.edu>
215
216         * regression.q: Adjusted code to account for cache->coeff being a
217         pspp_linreg_coeff **.
218
219 Sun May  7 18:31:25 2006  Ben Pfaff  <blp@gnu.org>
220
221         Fix memory leak.
222         
223         * aggregate.c (cmd_aggregate): Free default_dict before replacing
224         it.
225
226 Sun May  7 17:09:19 2006  Ben Pfaff  <blp@gnu.org>
227
228         * flip.c (flip_file): Check return value of pool_fclose().
229
230 Sat May  6 16:00:13 2006  Ben Pfaff  <blp@gnu.org>
231
232         Get rid of `char *c' member in union value, for cleanliness.
233         
234         * aggregate.c: (union agr_argument) New union.
235         (struct agr_var) Change element type of arg[] from union value to
236         union agr_argument.
237         (parse_aggregate_functions) Change local variable types likewise.
238
239         * autorecode.c: (union arc_value) New union.
240         (struct arc_item) Change "from" from union value to union
241         arc_value.
242         (recode) Change local variable from union value to union
243         arc_value.
244         (autorecode_trns_proc) Ditto.
245         (compare_alpha_value) Ditto.
246         (hash_alpha_value) Ditto.
247         (compare_numeric_value) Ditto.
248         (hash_numeric_value) Ditto.
249         (autorecode_proc_func) Ditto.
250
251 Sat May  6 10:43:33 2006  Ben Pfaff  <blp@gnu.org>
252
253         Continue reforming procedure execution.  In this phase, get rid of
254         the output code for SPLIT FILE groups in procedure.c, which really
255         shouldn't be doing any output.  Move it into the individual
256         procedures instead.  This also adds some flexibility.
257
258         * crosstabs.q (precalc): Call output_split_file_values().
259
260         * descriptives.c (calc_descriptives): Ditto.
261
262         * examine.q (run_examine): Ditto.
263         
264         * frequencies.q (precalc): Ditto.
265
266         * oneway.q (run_oneway): Ditto.
267
268         * regression.q (run_regression): Ditto.
269
270         * t-test.q (calculate): Ditto.
271
272 Wed May  3 23:05:31 2006  Ben Pfaff  <blp@gnu.org>
273
274         Continue reforming procedure execution.  In this phase, get rid of
275         many global variables, consolidating procedure execution in
276         procedure.c.  Encapsulate transformations in new "struct
277         trns_chain".  Also, change implementation of N OF CASES, FILTER,
278         and PROCESS IF from special cases to transformations.
279          
280         * aggregate.c (cmd_aggregate) Use discard_variables().
281         
282 2006-04-28  Jason Stover  <jhs@math.gcsu.edu>
283
284         * regression.q (regression_trns_resid_proc): Pass only the
285         variables used in the model to (*model->residual)().
286
287         * regression.q (regression_trns_pred_proc): Pass only the
288         variables used in the model to (*model->pred)().
289
290 2006-04-26  Jason Stover  <jhs@math.gcsu.edu>
291
292         * regression.q: Added support for multiple transformations.
293         
294         * regression.q (regression_trns_resid_proc): New function.
295
296         * regression.q (regression_trns_pred_proc): New function.
297
298         * regression.q (subcommand_save): Added support for saving
299         predicted values.
300
301         * regression.q (regression_trns_free): New function. 
302
303         * regression.q (reg_get_name): New function.
304
305         * regression.q (reg_save_var): New function.
306
307 Tue Apr 25 13:18:56 2006  Ben Pfaff  <blp@gnu.org>
308
309         * rank.q (parse_rank_function): Use SE instead of ME for parse
310         errors.
311
312 Tue Apr 25 13:16:28 2006  Ben Pfaff  <blp@gnu.org>
313
314         * flip.c (flip_sink_write): Use snprintf() to simplify a bit of
315         code.
316
317 2006-04-21  Jason Stover  <jhs@math.gcsu.edu>
318
319         * regression.q (try_name): New function. (Partly copied from
320         try_name in descriptives.c.)
321
322         * regression.q (subcommand_save): Choose residual variable names
323         correctly. 
324
325 2006-04-20  Jason Stover  <jhs@math.gcsu.edu>
326
327         * regression.q (cmd_regression): Moved call to subcommand_save()
328         outside multipass_procedure_with_splits().
329         
330         * regression.q (regression_trns_proc): Fixed value counter n_vals
331         before calling *model->residual().
332
333 2006-04-19  Jason Stover  <jhs@math.gcsu.edu>
334
335         * regression.q (regression_trns_proc): Fixed the look-up of the
336         number of variables.
337
338 2006-04-18  Jason Stover  <jhs@math.gcsu.edu>
339
340         * regression.q (regression_trns_proc): Look up the residual
341         variable in the linear regression cache.
342
343         * regression.q (subcommand_save): Set the residual variable in the
344         linear regression cache.
345
346 2006-04-17  Jason Stover  <jason@wonko.gcsu.edu>
347
348         * regression.q (regression_trns_proc): Accept case_idx as an int
349         to match the definition of trns_proc_func.
350
351 2006-04-17  Jason Stover  <jhs@math.gcsu.edu>
352
353         * regression.q (regression_trns_proc): New function.
354
355         * regression.q (subcommand_save): Create variable residuals and
356         add a transformation to assign values to them. Also free the
357         linreg_cache if the SAVE command was not called. Removed the
358         casereading loop. Placed actual computation of residuals in
359         regression_trns_proc.
360
361         * regression.q (run_regression): Moved call to free
362         pspp_linreg_cache to subcommand_save.
363
364 Sat Apr 15 18:01:03 2006  Ben Pfaff  <blp@gnu.org>
365
366         * examine.q (output_examine): Add casts to fix warnings.
367
368 2006-04-07  Jason Stover  <jhs@math.gcsu.edu>
369
370         * regression.q (subcommand_save): New function.
371
372 2006-04-04  Jason Stover  <jhs@math.gcsu.edu>
373
374         * regression.q: New function reg_has_categorical () to tell
375         whether a pspp_linreg_struct was made with any variables of type
376         ALPHA.
377
378         * regression.q: (subcommand_export): Call
379         reg_print_categorical_encoding() only if the model uses any
380         categorical variables.
381
382 Mon Mar 27 16:00:42 2006  Ben Pfaff  <blp@gnu.org>
383
384         * crosstabs.q: (output_pivot_table) Drop spurious space from
385         message.
386
387 2006-03-15  Jason Stover  <jhs@math.gcsu.edu>
388
389         * regression.q: Added custom syntax parser for VARIABLES subcommand
390
391         * regression.q: Moved most instructions for run_regression ()
392         inside the loop over dependent variables.
393
394 Thu Mar  2 08:40:33 WST 2006 John Darrington <john@darrington.wattle.id.au>
395         
396         * Moved files from src directory