pspp-convert: Add --labels and --recode options.
[pspp] / NEWS
1 PSPP NEWS -- history of user-visible changes.
2 Copyright (C) 1996-2000, 2008-2016, 2017, 2019 Free Software Foundation, Inc.
3 See the end for copying conditions.
4
5 Please send PSPP bug reports to bug-gnu-pspp@gnu.org.
6
7 Changes from 1.2.0 to 1.3.0:
8
9  * PSPP now supports the SPSS viewer (.spv) format that SPSS 16 and later
10    use to save the contents of its output editor:
11
12    - PSPP and PSPPIRE can write output to .spv files.
13
14    - The new utility pspp-output can convert .spv files to other formats.
15
16    - The pspp-convert utility can now decrypt encrypted .spv files.  The
17      encrypted viewer file format is unacceptably insecure, so to
18      discourage its use PSPP and PSPPIRE do not directly read or write
19      this format.
20
21  * A bug where the Data|Select Cases|Random Sample menu would generate
22    invalid syntax has been fixed.
23
24  * FREQUENCIES will emit a warning if one or more weight values are missing.
25
26  * Plain text output is no longer divided into pages, since it is now
27    rarely printed on paper.
28
29  * pspp-convert improvements:
30
31    - New "-a", "-l", "--password-list" options to search for an
32      encrypted file's password.
33
34    - New "--labels" and "--recode" options for CSV output.
35
36  * Improvements to SAVE DATA COLLECTION support for MDD files.
37
38  * Bug fix for CVE-2018-20230.
39
40  * The /RENAME subcommand in SAVE TRANSLATE et al. has been extended
41    to support the syntax also accepted by other software.
42
43  * The EXAMINE command will now perform the Shapiro-Wilk test when
44    one or more plots are requested.
45
46  * The REGRESSION command now supports the /STATISTICS=TOL option which
47    outputs tolerance and variance inflation factor metrics for the data.
48
49  * The QUICK CLUSTER command now supports the /SAVE option which can
50    be used to save the cases' cluster membership and/or their distance
51    from the cluster centre to the active file.
52
53  * The MEANS command has been re-implemented.
54
55  * A bug where the GUI would crash when T-TEST was executed whilst
56    a filter was set has been fixed.
57
58  * The GUI now has a sub-dialog for post-hoc tests of the oneway
59    anova test.
60
61  * Gtk+3.22.0 or later must now be used when building.
62
63  * GRAPH: Categorical barcharts displaying percentages now show the
64    sub-category as a percentage of the primary category instead of the
65    total.
66
67  * AUTORECODE:
68
69    - The PRINT subcommand is now implemented.
70
71    - Many bug fixes.
72
73 Changes from 1.0.1 to 1.2.0:
74
75  * New experimental command SAVE DATA COLLECTION to save MDD files.
76
77  * MTIME and YMDHMS variable formats now supported.
78
79  * Build changes:
80
81    - zlib is now a required dependency.  (Previously it was optional.)
82
83    - Gtk+3.18.0 or later must now be used when building.
84
85    - The code implementing the sheet rendering has been removed.  Instead we
86      use a third party library: spread-sheet-widget.
87
88  * The "NOMISSING" keyword when generating syntax for piecharts in the
89    frequencies command was omitted.  This has been corrected.
90
91 Changes from 1.0.0 to 1.0.1:
92
93  * Bug fixes, including fixes for CVE-2017-12958, CVE-2017-12959,
94    CVE-2017-12960, and CVE-2017-12961.
95
96 Changes from 0.11.0 to 1.0.0:
97
98  * Translation updates.
99
100 Changes from 0.10.2 to 0.11.0:
101
102  * The REGRESSION command now has a /ORIGIN subcommand to perform
103    regression through the origin.
104
105  * The FACTOR command can now analyse matrix files prepared with MATRIX DATA.
106
107  * The FACTOR command can now print the anti-image matrices.
108
109  * The MATRIX DATA command has been added.
110
111  * Some inappropriate properties in selection dialogs have been corrected.
112
113  * A bug which could cause the HTML driver to go into a tight loop
114    has been fixed.
115
116  * An error in the FREQUENCIES procedure, where the word "Mean" was
117    printed when "Variance" was appropriate has been fixed.
118
119  * The ncurses library is no longer required or used.
120
121  * A bug where the Mann-Whitney test would give misleading results
122    if run on multiple variables and MISSING=ANALAYSIS was specified
123    has been fixed.
124
125  * Gtk+3.14.5 or later must now be used when building.
126
127  * Graphical user interface changes:
128
129  ** There is a new menu: Edit|Options
130
131  ** The Non Parametric Statistics Menu has a new item: "K Independent Samples".
132
133  ** Dialog boxes can now be canceled using the <Escape> key.
134
135  * The AUTORECODE command now accepts an optional / before INTO.
136
137  * The short form of the VECTOR command can now create string variables.
138
139  * Bug fixes, including fixes for CVE-2017-10791 and CVE-2017-10792.
140
141 Changes from 0.10.1 to 0.10.2:
142
143  * CROSSTABS implements a new COUNT subcommand to round case or cell
144    weights.
145
146  * Help will be opened as HTML in default browser if yelp
147    is not available.
148
149  * When plotting scatterplots with only one dataset (the simple case)
150    the colour used for the dataset is now black.  The previous default
151    from the Tango palette was too faint to see easily.
152
153  * The varible info dialog could previously only paste a single variable.
154    Now it can paste multiple variables.
155
156  * Bug fixes, including the following:
157
158    - T-test with independent samples GUI crashed with string
159      type variable as group variable.
160
161    - The variable info dialog showed the previous selected variable
162      superimposed with the currently selected one.
163
164    - The GLM command did not properly deal with missing values.  This
165      has been fixed.
166
167 Changes from 0.10.0 to 0.10.1:
168
169  * Bug fixes, including the following:
170
171    - A bug where certain dialog boxes could not be properly populated
172      has been fixed.
173
174    - Various commands have been hardened against errors when called
175      with invalid syntax.
176
177  * Translation updates.  Thanks to our translators!
178
179 Changes from 0.8.5 to 0.10.0:
180
181  * The QUICK CLUSTER command has a  /PRINT subcommand which shows
182    the initial cluster centres and the final cluster membership of
183    each case.  The clustering algorithm has also been updated, so
184    as to produce better separated clusters.
185
186  * A Russian localisation has been contributed.
187
188  * The GRAPH command now has a /BAR subcommand to draw barcharts.
189
190  * If the DECIMAL character is set to COMMA then the ',' character
191    will not be treated as a separator by DATA LIST.
192
193  * The graphical user interface (psppire) has been changed as follows:
194
195    - It now uses Gtk+ version 3 instead of version 2.  Accordingly, it has a
196      somewhat different look and feel.
197
198    - There is now a Graphs menu to access the GRAPH command.
199
200    - The status of dialog box widgets are now preserved between calls
201      to the same dialog box for the same dataset.
202
203    - The dialog box for the Logistic Regression command will now
204      infer that string variables or any varible with a "measure"
205      of Nominal or Ordinal are to be treated as categorical variables
206      and will generate syntax accordingly.
207
208  * The pspp-convert utility can now decrypt encrypted syntax files.
209    The encrypted syntax file format is unacceptably insecure, so to
210    discourage its use PSPP and PSPPIRE do not directly read or write
211    this format.
212
213  * New commands:
214
215    - SORT VARIABLES.
216
217  * The following functions for transformation expressions are new:
218
219    - REPLACE, for search-and-replace of one string with another.
220
221    - STRUNC, to truncate a string and trim trailing spaces.
222
223    - MEDIAN, to compute the median of its arguments.
224
225    - The TRUNC function in expressions now supports additional arguments
226      for truncating to values other than integers and to indicate a level
227      of rounding fuzz.  The default rounding fuzz may now be controlled
228      and displayed with SET FUZZBITS and SHOW FUZZBITS, respectively.
229
230  * Bug fixes, including the following notable ones:
231
232    - The correlation coefficient in the paired samples t-test
233      procedure is now correctly calculated when presented with
234      weighted data.
235
236    - The ESCAPE subcommand has been removed from GET DATA /TYPE=TXT.
237      For compatibility, the behavior that ESCAPE enabled is now the
238      default and only supported behavior.
239
240    - Rendering of the variable and data sheets in right-to-left locales
241      now works properly.
242
243    - The Mann-Whitney test, when run on a dataset containing values
244      of the group variable, other than those defining the test groups,
245      would incorrectly calculate the ranks.  This has been corrected.
246
247  * The IMPORTCASES subcommand on GET DATA is now ignored, for
248    compatibility.
249
250 Changes from 0.8.4 to 0.8.5:
251
252  * The FREQUENCIES and CROSSTABS commands can now generate barcharts.
253
254  * The FACTOR command can now perform PROMAX rotations.
255
256  * SPSS/PC+ system files are now supported on GET and other commands
257    that read SPSS system files.  The pspp-convert program can now read
258    SPSS/PC+ system files.  Writing the obsolete SPSS/PC+ system file
259    format is not supported.
260
261  * SYSFILE INFO can now read SPSS/PC+ system files and SPSS portable
262    files.
263
264  * FREQUENCIES: A bug was fixed where an assertion failure occurred
265    when an empty dataset was presented.
266
267  * The GRAPH command is now available.  Initially it supports
268    scatterplots and histograms.
269
270  * The RND operator in expressions now supports additional operands
271    for rounding to values other than integers and to indicate a level
272    of rounding fuzz.  The default rounding fuzz may now be controlled
273    and displayed with SET FUZZBITS and SHOW FUZZBITS, respectively.
274
275 Changes from 0.8.3 to 0.8.4:
276
277  * Formatting of SYSFILE INFO output was made easier to read.
278
279  * Bug fixes, including the following notable ones:
280
281    - FREQUENCIES works properly for string variables.  (This bug was
282      introduced in 0.8.2.)
283
284    - CROSSTABS now correctly computes all of the measures that it
285      offers.  Some measures have been removed because they were not
286      computed correctly.
287
288    - The NPAR TESTS calculation of significance for the RUNS
289      subcommand has been corrected.
290
291    - Planned comparisons in ONEWAY ANOVA now correctly handle negative
292      T-values.
293
294    - The COUNT command now correctly treats missing values as
295      documented.
296
297    - Conformance fixes to Open Document output format.
298
299 Changes from 0.8.2 to 0.8.3:
300
301  * Independent T-Tests displayed the standard error of the difference
302    and the confidence interval for the unequal variances case, where
303    the equal variances case should have been.  This has been fixed.
304
305  * REGRESSION now recognises /STATISTICS=CI(x) which causes confidence
306    intervals for the coefficients to be printed.
307
308  * When DESCRIPTIVES calculates Z scores, it now omits cases filtered
309    by the current FILTER settings.
310
311  * PSPPIRE graphical user interface improvements:
312
313    - Dialog boxes with source  variable lists can now choose the sort
314      order;  right click and select from the popup menu.
315
316    - File|Open now allows an encoding to be selected for opening
317      system files.
318
319    - File|Display Data File Information|External File... now allows an
320      encoding to be selected.
321
322    - A problem with the Means dialog has been resolved (bug #41433).
323
324    - Several problems related to the input of spreadsheets have been
325      fixed (bug #41657, #41620
326
327  * System file related improvements:
328
329    - With ENCODING="DETECT", SYSFILE INFO can now help the user to
330      pick an encoding for reading a system file that does not identify
331      its own encoding
332
333    - SYSFILE INFO now accepts an ENCODING subcommand to specify the
334      character encoding of string data in the system file.
335
336    - Variable labels over 255 bytes long are now accepted without
337      truncation (bug #41863).
338
339    - System files that contain duplicate variable names may now be
340      read successfully (bug #41475).
341
342 Changes from 0.8.1 to 0.8.2:
343
344  * Charts are now rendered with colours from the Tango palette instead
345    of fully saturated primaries.
346
347  * Support for new system file variants:
348
349    - PSPP can now read and write ZCOMPRESSED system files, which
350      compress data much more effectively than older "compressed"
351      files.  (The older format is still supported.)
352
353    - PSPP can now decrypt encrypted system files, using the new
354      pspp-convert utility.  The encrypted system file format is
355      unacceptably insecure, so to discourage its use PSPP and PSPPIRE
356      do not directly read or write this format.
357
358  * Missing values for long string variables are now read from and
359    written to system files in an SPSS-compatible fashion.
360
361    (Earlier versions of PSPP that supported missing values for long
362    string variables wrote them to system files in an SPSS-incompatible
363    way.  To fix the problem, read the system file with this version of
364    PSPP and then save a new copy of it.)
365
366  * pspp-convert, a new standalone utility for converting SPSS system
367    and portable files to other formats, is now included.  The initial
368    version supports comma-separated value files as output format.
369    pspp-convert can also decrypt encrypted system files.
370
371  * Build changes:
372
373    - zlib is now a required dependency.  (Previously it was optional.)
374
375 Changes from 0.8.0 to 0.8.1:
376
377  * New commands:
378
379    - VARIABLE ROLE.
380
381  * Changes to existing commands:
382
383    - CROSSTABS: The requirement that one expected count must be less than five
384         before Fishers Exact Test will be reported has been removed.
385
386  * PSPPIRE graphical user interface improvements:
387
388    - A new set of icons has been contributed.
389
390    - Syntax windows now parse syntax in "auto" mode, which in practice
391      should mean that both "batch" and "interactive" syntax now works,
392      instead of just "interactive" syntax.
393
394    - The variable pane of data windows now include a Role column.
395
396  * Notable bug fixes:
397
398    - System files written by IBM SPSS 21 are now read without warnings.
399
400    - System files written by "VOXCO INTERVIEWER 4.3" are now read
401      without warnings.
402
403    - PSPPIRE should now more gracefully handle syntax files that contain
404      errors.
405
406 Changes from 0.6.2 to 0.8.0:
407
408  * New commands:
409
410    - ADD FILES
411    - CORRELATIONS
412    - DATAFILE ATTRIBUTES
413    - DATASET ACTIVATE
414    - DATASET CLOSE
415    - DATASET COPY
416    - DATASET DECLARE
417    - DATASET DISPLAY
418    - DATASET NAME
419    - LOGISTIC REGRESSION
420    - MATCH FILES
421    - MEANS
422    - MRSETS
423    - PRESERVE and RESTORE
424    - QUICK CLUSTER
425    - RELIABILITY
426    - ROC
427    - SAVE TRANSLATE to CSV and tab-delimited files
428    - UPDATE
429    - VARIABLE ATTRIBUTES
430
431  * Changes to existing commands:
432
433    - AUTORECODE has a new GROUP subcommand.
434
435    - CROSSTABS has been re-implemented to fix numerous bugs.
436
437    - EXAMINE: /MISSING=LISTWISE is now the default.
438
439    - DO REPEAT command has been reimplemented.  Now, when DO REPEAT
440      contains an INCLUDE or INSERT command, substitutions are not
441      applied to the included file.
442
443    - FILE HANDLE has a new ENDS subcommand to select CR or CRLF new-lines.
444
445    - HOST has been updated to use more modern syntax.
446
447    - Most commands that work with data files now support a new
448      ENCODING subcommand.
449
450    - MISSING VALUES can now assign missing values to long string
451      variables.
452
453    - ONEWAY: the POSTHOC subcommand is now implemented.
454
455    - The following new subcommands to NPAR TESTS have been implemented:
456      COCHRAN, FRIEDMAN, JONCKHEERE-TERPSTRA, KENDALL, KRUSKAL-WALLIS, MANN-WHITNEY,
457      MCNEMAR, SIGN, WILCOXON, and RUNS
458
459    - SET and SHOW no longer have ENDCMD, NULLINE, PROMPT, CPROMPT, and
460      DPROMPT subcommands.  The defaults are now fixed values.
461
462    - SHOW now has a JOURNAL subcommand, to show the location of the
463      journal file.
464
465    - VALUE LABELS can now assign value labels to long string
466      variables.
467
468  * Other language changes:
469
470    - The new DATASET commands replace the "scratch file" PSPP
471      extension, which is no longer supported.
472
473    - Strings may now include arbitrary Unicode code points specified
474      in hexadecimal, using the syntax U'hhhh'.  For example, Unicode
475      code point U+1D11E, the musical G clef character, may be
476      expressed as U'1D11E'.
477
478      See the "Tokens" section in the PSPP manual for more information.
479
480    - In previous versions of PSPP, in a string expressed in
481      hexadecimal with X'hh' syntax, the hexadecimal digits expressed
482      bytes in the locale encoding.  In this version of PSPP, X'hh'
483      syntax always expresses bytes in UTF-8 encoding.
484
485      See the "Tokens" section in the PSPP manual for more information.
486
487  * PSPPIRE graphical user interface improvements:
488
489    - Added support for non-ASCII characters in strings, labels and
490      variable names.
491
492    - A "Split Window" function is available, which makes it easier to
493      see different parts of a large data file.
494
495    - Data files can now be opened by specifing their name as the first
496      argument.  This means that on a properly configured desktop, double
497      clicking on an icon will open the file.
498
499    - Foreign formats, such as Gnumeric, OpenDocument and CSV can be imported
500      via using an "intelligent" application assistant dialog.
501
502  * Output changes:
503
504    - The new "cairo" output driver supports output in PostScript, PDF,
505      and SVG formats.  Its functionality is a superset of that of the
506      "postscript" driver, which has been removed.  You must have Cairo
507      and Pango installed to build the "cairo" driver.
508
509    - Charts are now produced with Cairo and Pango, instead of libplot.
510      Without them, the new graphing features will not work.  If you do
511      not have Cairo and Pango installed, you must run `configure' with
512      --without-cairo.
513
514    - The plain text output driver now properly supports multibyte UTF-8
515      characters, including double-width characters and combining
516      accents.
517
518    - Output to OpenDocument format is now supported.
519
520    - The HTML output is much improved.
521
522  * The "pspp" program has a new option --batch (or -b) that selects
523    "batch" syntax mode.  In previous versions of PSPP this syntax mode
524    was the default.  Now a new "auto" syntax mode is the default.  In
525    "auto" mode, PSPP interprets most syntax files correctly regardless
526    of their intended syntax mode.
527
528    See the "Syntax Variants" section in the PSPP manual for more
529    information.
530
531  * The "pspp" program has a new option --syntax-encoding that
532    specifies the encoding for syntax files listed on the command line,
533    as well as the default encoding for syntax files included with
534    INCLUDE or INSERT.  The default is to accept the system locale
535    encoding, UTF-8, UTF-16, or UTF-32, automatically detecting which
536    one the system file uses.
537
538    See the documentation for the INSERT command in the PSPP manual for
539    more information.
540
541  * Text data files that PRINT and WRITE creates now use the system
542    native line ends by default (CRLF on Windows, LF only elsewhere).
543    Use the new ENDS subcommand on FILE HANDLE to override the default.
544
545  * A new Perl module allows Perl programs to read and write PSPP
546    system files.
547
548  * A tutorial chapter has been added to the user manual.
549 \f
550 Changes from 0.6.1 to 0.6.2:
551
552   * New translations:
553
554     - Dutch, thanks to Harry Thijssen.
555
556     - Brazilian Portuguese, thanks to Michel Boaventura.
557
558     Thanks for translations are also due to the coordinators at
559     translationproject.org.
560
561   * Statistical bug fixes:
562
563     - REGRESSION: Report correct standard error of the estimate (bug
564       #25677).
565
566     - T-TEST: Report correct significance of paired sample T-test in
567       the common case (bug #26936) and corner cases.  Thanks to Mike
568       Griffiths and Matej Cepl for reporting these bugs.
569
570   * Build fixes and changes:
571
572     - Fix build with GTK+ 2.17.4 and later.
573
574     - Make running "make" after running "configure" with different
575       settings reliably rebuild version.c.
576
577     - Cygwin and MinGW build fixes.
578
579     - Fixes for building with recent gnulib.
580
581     - The Makefile now honors two new variables, PSPP_LDFLAGS and
582       PSPPIRE_LDFLAGS, that affect linking of the PSPP and PSPPIRE
583       binaries, respectively.  This makes building easier for some
584       packagers.
585
586     - Fixes for "configure --enable-relocatable" (bug #25508).
587
588   * Data file bug fixes and changes:
589
590     - Fix reading text data files that contain a mix of white space
591       and commas.  Now "a ,b" is treated as two fields containing "a"
592       and "b"; previously it was treated as three, with an empty field
593       in the middle.
594
595     - Fix writing corrupted .sav files on Windows.
596
597     - Fix writing variable labels longer than 252 bytes to save files.
598       Thanks to Robert Westlund for reporting this bug.
599
600     - Fix writing corrupted .por files (bug #26034).
601
602     - Fix reading .por files whose initial lines are not padded out
603       with spaces as expected.
604
605     - PSPP will no longer issue warnings about some .sav file records
606       or values that it does not understand.  These warnings were
607       harmless, but needlessly alarmed some users.
608
609     - Fix crash reading empty string fields from PostgreSQL databases.
610
611   * Bug fixes that affect PSPP and PSPPIRE:
612
613     - Users may now control precision of output statistics.  Instead
614       of hard coding the width and decimals of output numbers, respect
615       the default format in most instances.  Counts are now normally
616       displayed with the format of the weight variable, if any.
617
618     - Fix crash when an INSERT command specifies the name of a file
619       that does not exist (bug #24569).
620
621     - Fix crash when CROSSTABS specifies a long-string variable (bugs
622       #24557 and #26131).
623
624     - Fix crash drawing pie charts with many segments.
625
626     - Fix crash when NUMERIC specifies an invalid format.
627
628   * PSPPIRE bug fixes and changes:
629
630     - On Windows, write the output file to the user's home directory
631       instead of the current directory, to better match user
632       expectations.
633
634     - Some data editor fixes.
635
636   * Documentation:
637
638     - Fix typo in BINOMIAL section of user manual (bug #25892).
639
640 Changes from 0.6.0 to 0.6.1:
641
642   * Statistical bug fixes:
643
644     - Report correct standardized regression coefficients in linear
645       regression output (bug #23567).
646
647   * Bug fixes that affect PSPP and PSPPIRE:
648
649     - Avoid crash with pie charts (bug #24014).
650
651     - Don't append % to count totals (bug #24003).
652
653     - Don't crash on bad input (bug #24031).
654
655     - Don't crash if "end data." is not left aligned (bug #24115).
656
657     - Change default workspace value to 64 MB, to avoid unnecessary
658       disk accesses on modern machines.
659
660   * PSPPIRE bug fixes:
661
662     - Add ".sav" or ".por" suffix to filename when saving with Save_As
663       (bug #23137).
664
665     - Make it possible to reopen the output window on Windows (bug
666       #24033).
667
668     - A POSIX regular expression library is now included and used
669       automatically if the host does not have one or has one that is
670       inadequate.
671
672   * Build fixes and changes:
673
674     - Work around bug in GSL that prevented build with recent GCC
675       versions without manually adding -fgnu89-inline to CFLAGS.
676
677     - Also warn about missing prerequisites as we encounter them (bug
678       #24445).
679
680     - Distribute necessary files to allow users working from the
681       distributed tarball to configure with --enable-gui-tools.
682
683     - Append $(EXEEXT_FOR_BUILD) to output file name when building
684       q2c, fixing build problems on Windows.
685
686     - GSL 1.8 or later is now required.
687
688     - Build errors with --enable-relocatable were fixed.
689
690   * The German translations were removed, since native German speakers
691     found them too poor to be useful.
692
693 Changes from 0.4.0 to 0.6.0:
694
695   * The PSPP license is now version 3 or later of the GNU General
696     Public License.  Previously, it was version 2 or later.
697
698   * PSPP now has a graphical interface, called PSPPIRE.  This
699     interface allows you to enter data and variable definitions
700     interactively.  Commands may be executed in syntax form, or by
701     using the interactive dialog boxes available from the dropdown
702     menus.
703
704   * A few sample syntax files are now included in the `examples'
705     directory.
706
707   * Numerous major and minor bugs have been fixed.
708
709   Build changes:
710
711     * The INSTALL file now reflects the details of how to install
712       PSPP.  It is a tailored version of the generic installation
713       instructions, instead of a verbatim copy.
714
715     * iconv, which is ordinarily installed as part of a Unix-like
716       system, is now required.  If you don't have it already, you can
717       install GNU libiconv (http://www.gnu.org/software/libiconv/).
718
719     * libxml2 and zlib are new optional dependencies.  They are
720       required to use PSPP's support for reading Gnumeric files.
721
722   Statistical procedure changes:
723
724     * REGRESSION is a new procedure for fitting linear models to data
725       via least-squares estimation.
726
727     * NPAR TESTS is a new procedure for non-parametric tests.  In this
728       release, it supports binomial and chi-square tests.
729
730     * RANK is a new procedure to rank variables.  It supports numerous
731       forms of ranking.
732
733     * FREQUENCIES can now output histograms and pie charts.  These
734       features were present in earlier releases, but not documented.
735
736   User interface changes:
737
738     * In many situations where PSPP once terminated with a fatal
739       error, PSPP now recovers and continues execution.
740
741     * PSPP is now able to start up and run even if it cannot find its
742       configuration files.
743
744     * Journaling of interactive commands to a disk file is now
745       implemented.  By default, journaling is enabled, to a file named
746       `pspp.jnl' in the current directory.  SET JOURNAL may be used to
747       control journaling.
748
749     * The use of `+' between syntax file names on the command line to
750       prevent the dictionary from being cleared between their
751       executions is no longer supported.  All syntax files are now
752       executed as if `+' had been specified.
753
754     * The -d/--define and -u/--undef command line options are no
755       longer supported.  Instead, use /usr/bin/env or shell primitives
756       to define or clear environment variables before invoking PSPP.
757
758     * If a syntax file named named `rc' is found in a configuration
759       directory (such as $HOME/.pspp), it is executed before any
760       syntax file specified on the command line.  The -r or
761       --no-statrc command line option may be used to disable this
762       behavior.
763
764   Output changes:
765
766     * Output configuration options have changed.  Please refer to the
767       manual for a full description of the available options.
768
769       In consequence, you will need to reinstall your "devices" file.
770       "make install" will do this for you.
771
772     * Most error messages are now written to PSPP output files by
773       default.  SET ERROR can be used to disable this behavior.
774
775     * When invoked interactively, PSPP now by default produces output
776       on the terminal, piping it through the "more" program.
777       Previously, by default output was written only to file
778       pspp.list.  On most terminals, the page length used for output
779       automatically adapts to the terminal size, even if the terminal
780       is resized.
781
782     * ASCII driver:
783
784       - This driver now supports charts in output.  Charts are written
785         as separate files that the main output file refers to.  By
786         default, charts are written in PNG format to files named
787         pspp-1.png, pspp-2.png, and so on.
788
789       - Configurations are provided that use VT100 (and xterm)
790         line-drawing characters in tables.  The option "-o list-vt100"
791         requests use of this device for output to pspp.list.
792
793     * PostScript driver:
794
795       - The default paper size is now determined using the PAPERSIZE
796         environment variable, or the LC_PAPER locale category on
797         systems that support it.  If these are not set, the default is
798         now A4, instead of US letter.  To make US letter the default,
799         set PAPERSIZE to "letter" in your environment.
800
801       - Font metrics are now read from AFM files, instead of
802         Groff-format metrics files.  PostScript fonts can now be
803         embedded in output.
804
805         In consequence, you will need to install an AFM file for each
806         font used in PostScript output.  "make install" will install
807         AFM files for the standard PostScript fonts, including the
808         ones that the PostScript driver uses by default.
809
810       - Standard paper sizes no longer need to be specified through a
811         configuration file.  The "papersize" configuration file is no
812         longer needed, or supported.
813
814       - The PostScript prologue is no longer obtained from the
815         "ps-prologue" configuration file.  This configuration file is
816         no longer needed, or supported.
817
818     * HTML driver:
819
820       - The HTML prologue is no longer obtained from the
821         "html-prologue" configuration file.  This configuration file
822         is no longer needed, or supported.
823
824   Command language changes:
825
826     * The following commands are new:
827
828       - GET DATA, which currently supports reading Gnumeric files and
829         text data files.  It will be extended later to read other
830         types of foreign data.
831
832       - CD, to change the current directory.
833
834       - INSERT, to execute a syntax file.
835
836       - DELETE VARIABLES, to remove variables from the active file
837         dictionary.
838
839       - ADD DOCUMENT, to add text to active file documents.
840
841       - CLOSE FILE HANDLE (a PSPP extension; see below).
842
843       - XEXPORT, a PSPP extension that is a transformation equivalent
844         to EXPORT.
845
846     * The following functions for transformation expressions are new:
847
848       - DATEDIFF, for computing the difference of two dates.
849
850       - DATESUM, for advancing a date by a specified duration.
851
852       - VALUELABEL, to obtain the value label for a value.
853
854     * PSPP now supports very long string variables (over 255 bytes
855       long).
856
857     * MATCH FILES now supports the FIRST and LAST subcommands.
858
859     * Previous versions of PSPP prohibited using commands to both read and
860       write a single file at the same time.  Now, PSPP allows this, and
861       the new version of the file atomically replaces the old version.
862
863     * The following commands are no longer available.  They will be
864       re-implemented in a later release:
865
866       - CLEAR TRANSFORMATIONS
867
868       - MATRIX DATA
869
870       - REPEATING DATA
871
872     * The PROCESS IF command, which was deprecated, has been removed.
873       You may replace any usage of it by SELECT IF following
874       TEMPORARY, which has the same effect.
875
876     * The output format for variables created by VECTOR may now be
877       specified as part of the VECTOR syntax.
878
879   "Scratch files", a new PSPP extension:
880
881     A scratch file, like a system file, consists of a dictionary and
882     any number of cases.  Small scratch files are stored in memory;
883     one that grows too large is written to disk.  By default, any file
884     handle whose name begins with # is assumed to refer to a scratch
885     file.
886
887     Scratch files can be used just about anywhere a system or portable
888     file can be used.  Also, portable files are now allowed in most
889     places that system files were allowed in previous PSPP version.
890
891     A new CLOSE FILE HANDLE command allows the storage associated with
892     scratch files to be freed.  It also allows file handles to be
893     reassigned to new files.
894
895     For more information on scratch files, refer to the "File Handles"
896     section in the PSPP manual.  For specifics of what commands now
897     allow what kinds of files to be specified, refer to the
898     documentation on those particular commands.
899
900   Data access changes:
901
902     * Binary formats and IBM/360 formats, including ASCII/EBCDIC
903       translation, are now supported.  Use FILE HANDLE to specify the
904       format of these files.
905
906     * Little-endian, big-endian, and VAX-endian formats are now
907       supported for integer binary formats when reading and writing
908       data files.  The new RIB and WIB subcommands on the SET command
909       control endianness of integer data.  The default is the host's
910       native endianness.
911
912     * IEEE 754, VAX, and IBM hexadecimal formats are now supported for
913       floating point binary formats when reading and writing data
914       files.  The new RRB and WRB subcommands on the SET command
915       control the floating point format.  The default is the host's
916       native floating point format.
917
918     * DATA LIST now supports the SKIP subcommand, to skip records at
919       the beginning of a file.  For compatibility, DATA LIST now
920       treats N format as F format for FREE and LIST format input.
921
922     * The SAVE and XSAVE commands now support the UNSELECTED,
923       PERMISSIONS, NAMES, and MAP subcommands.
924
925     * The EXPORT command has been re-implemented to obtain better
926       results.  Support for the UNSELECTED, DIGITS, and TYPE
927       subcommands has been added.
928
929     * For compatibility, PRINT now inserts a space at the beginning of
930       every output line, even lines that would otherwise be blank,
931       when OUTFILE is specified.  (The behavior of WRITE is
932       unchanged.)
933
934     * For compatibility, PRINT EJECT now inserts the digit `1' at the
935       beginning of each line that should begin a new page.
936
937     * For compatibility, WRITE now outputs the system-missing value as
938       a field filled with spaces.  Binary formats are an exception.
939       (The behavior of PRINT is unchanged.)
940
941   Documentation:
942
943     * Input and output format descriptions have been rewritten.  They
944       now precisely describe what is accepted on input and written on
945       output.
946
947     * The descriptions of the PSPP system and portable file formats
948       have been extensively revised and improved.
949
950   For developers, the build system now requires Autoconf 2.60 and
951   Automake 1.10.
952 \f
953 Changes from 0.3.0 to 0.4.0:
954
955   Changes in build dependencies:
956
957     * The GNU Scientific Library (libgsl), version 1.6 or later, is
958       now required.
959
960     * libplot from GNU plotutils is optional.  Without it, the new
961       graphing features will not work.  If you do not have it
962       installed, you must run `configure' with --without-libplot.
963
964     * libgmp2 is no longer a dependency.
965
966   Newly implemented commands and statistical features:
967
968     * EXAMINE, including its graphing features.
969
970     * FREQUENCIES now supports percentiles.
971
972     * ONEWAY.
973
974     * PERMISSIONS.
975
976     * SHOW.
977
978     * SORT CASES now sorts stably, that is, two cases with equal sort
979       criteria will be in the same relative order before and after the
980       sort.
981
982     * T-TEST (re-written).
983
984     * DATE and USE.  These commands are parsed but otherwise ignored,
985       to enhance compatibility with certain command files that invoke
986       them unnecessarily.
987
988     * VARIABLE WIDTH, VARIABLE ALIGNMENT, and VARIABLE LEVEL.  These
989       currently have no effect on PSPP output, but their values are
990       written to and read from system files and thus may affect
991       third-party software.
992
993     * SET EPOCH implemented.
994
995     * DATA LIST FREE and DATA LIST LIST now support arbitrary field
996       delimiters.
997
998     * FILE HANDLE now supports custom tab widths.
999
1000   Long variable names (and other identifiers) are now supported.  Up
1001   to the first 64 bytes of each identifier is significant.  PSPP now
1002   reads and writes system files compatible with SPSS version 12.
1003
1004   New --algorithm and --syntax command line options allow
1005   SPSS-compatible or enhanced modes to be selected.
1006
1007   Support for transformation expressions has been rewritten and
1008   significantly improved.  Refer to the manual for details.
1009
1010   Calculation of moments (mean, standard deviation, kurtosis,
1011   skewness) has been rewritten and should now be more accurate.  In
1012   --algorithm=enhanced mode moments may be more accurate than SPSS in
1013   some cases.
1014
1015   Numerous bugs have been fixed, too many to mention here.  Many new
1016   tests have been added, leading to the discovery and fixing of many
1017   of these bugs.
1018
1019   The ASCII output driver can now squeeze multiple blank lines into
1020   single blank lines.
1021
1022   Much of the code has been rewritten and refactored.  It is now much
1023   cleaner.
1024
1025   The FILE TYPE and REPEATING DATA commands have been disabled for
1026   this release because their implementations were deemed too buggy to
1027   be useful.  They will be fixed and replaced in a future release.
1028
1029   New pspp-mode for Emacs (in pspp-mode.el).
1030
1031   Added rudimentary command-line completion for interactive input.
1032
1033   lib/julcal and lib/dcdflib are no longer used, so they have been
1034   removed.
1035
1036   For developers, the build system now requires Autoconf 2.58 and
1037   Automake 1.7.  The included gettext has been updated to version
1038   0.12.1.
1039
1040   Some reports state that Texinfo 4.8, the latest version, may be
1041   necessary to successfully format the documentation on some systems.
1042
1043 Version 0.3.0 changes since 0.2.3:
1044
1045   Bugs fixed:
1046
1047     * Using alphanumeric variables in functions under AGGREGATE
1048       segfaulted.  Fixed.
1049
1050     * Under certain circumstances, the final case would be omitted
1051       from the results of an AGGREGATE operation.  Fixed.
1052
1053     * Undefined behavior was invoked by referencing a freed pointer
1054       under certain circumstances.  Fixed.
1055
1056     * A wrong record size was displayed when paging the active file to
1057       disk.  Fixed.
1058
1059     * Not having enough temporary space for sorting caused a core
1060       dump.  Fixed.
1061
1062     * Syntax errors in function descriptions on AGGREGATE caused core
1063       dumps.  Fixed.
1064
1065     * A null pointer was dereferenced, causing a core dump, when
1066       PERCENTILES was specified on FREQUENCIES.  This fixes the
1067       problem, but PSPP still doesn't calculate percentiles.
1068
1069     * SORT always sorted in ascending order.  Fixed.
1070
1071     * Some minor memory leaks in the expression parser were removed.
1072
1073     * Many assertions fixed for strict ANSI C compliance.
1074
1075   New features:
1076
1077     * SET ECHO ON now implemented, but turned off by default.
1078
1079     * PRINT specifier supported on END REPEAT.
1080
1081   Other:
1082
1083     * System libgmp2 library is used if installed instead of
1084       unconditionally using the included libgmp2 subset.
1085
1086     * Extensive code cleanup, which continues.
1087
1088     * Added CORRELATIONS command parser, but not implemented.
1089
1090 Version 0.2.3 changes since 0.2.2:
1091
1092   Bugs fixed:
1093
1094     * SPLIT FILE with a string variable caused a core dump.  Fixed.
1095
1096     * Nested INCLUDEs didn't work.  Fixed.
1097
1098     * The MATCH FILES procedure set the values of variables not present
1099       to 0.  It should have been SYSMIS.  This is now fixed.
1100
1101     * The REMARK command was too aggressive about skipping lines.  It
1102       didn't like being the last command in a file.
1103
1104     * Comment parsing wasn't consistent with the rest of the code in its
1105       idea of where one command ends and another starts.  This meant
1106       that sometimes commands would be mysteriously ignored.  Thanks to
1107       Dr. Dirk Melcher <BZN-mdksh@t-online.de> for reporting this bug.
1108
1109     * The TABLE subcommand on MATCH FILES worked only erratically at
1110       best.  This fixes it.  Thanks to Dr. Dirk Melcher
1111       <BZN-mdksh@t-online.de> for reporting this bug.
1112
1113     * VARIABLE LABELS rejected a slash before the first variable
1114       specification, contradicting the documentation.  Thanks to Walter
1115       M. Gray <graywm@northernc.on.ca> for reporting this bug.
1116
1117     * Because of an incorrect optimization in memory allocation,
1118       CROSSTABS sometimes segfaulted when asked to output multiple
1119       tables.  Thanks to Walter M. Gray <graywm@northernc.on.ca> for
1120       reporting this bug.
1121
1122     * CROSSTABS didn't display value labels for column and row
1123       variables.  Thanks to Walter M. Gray <graywm@northernc.on.ca> for
1124       reporting this bug.
1125
1126     * WRITE didn't write line ends.  Fixed.  Thanks to Dr. Dirk Melcher
1127       <BZN-mdksh@t-online.de> for reporting this bug.
1128
1129     * The TABLE subcommand on MATCH FILES worked only erratically at
1130       best.  This fixes it.  Thanks to Dr. Dirk Melcher
1131       <BZN-mdksh@t-online.de> for reporting this bug.
1132
1133     * VARIABLE LABELS rejected a slash before the first variable
1134       specification, contradicting the documentation.  Thanks to Walter
1135       M. Gray <graywm@northernc.on.ca> for reporting this bug.
1136
1137     * Because of an incorrect optimization in memory allocation,
1138       CROSSTABS sometimes segfaulted when asked to output multiple
1139       tables.  Thanks to Walter M. Gray <graywm@northernc.on.ca> for
1140       reporting this bug.
1141
1142     * CROSSTABS didn't display value labels for column and row
1143       variables.  Thanks to Walter M. Gray <graywm@northernc.on.ca> for
1144       reporting this bug.
1145
1146     * WRITE didn't write line ends.  Fixed.  Thanks to Dr. Dirk Melcher
1147       <BZN-mdksh@t-online.de> for reporting this bug.
1148
1149     * MATCH FILES corrupted memory and dumped core on some syntax
1150       errors.  Fixed.
1151
1152     * MATCH FILES should set numeric values not available to the
1153       system-missing value, not to 0.  Thanks to Dr. Dirk Melcher
1154       <BZN-mdksh@t-online.de> for reporting this bug.
1155
1156     * KEEP didn't work properly on the SAVE procedure.  Fixed.  Thanks
1157       to Ralf Geschke <ralf@kuerbis.org> for reporting this bug.
1158
1159     * Memory leak fix.
1160
1161     * Some systems didn't like the way open_file was coded.  Thanks to
1162       Hankin <hankin@rogue.consultco.com> for pointing this out.
1163
1164     * The SAVE procedure didn't save long string variables properly.
1165       Fixed by this patch.  Thanks to Hankin
1166       <hankin@rogue.consultco.com> for this patch.
1167
1168     * Minor documentation fixes for MATCH FILES.
1169
1170 Version 0.2.2 changes since 0.2.1:
1171
1172   Bugs fixed:
1173
1174     * Fix behavior of PRINT SPACE for negative arguments.
1175
1176     * Fix reading some unusual system files.
1177
1178     * Fix LIST problems with very long variables.  Thanks to Hankin
1179       <hankin@dunno.com> for this bug report.
1180
1181     * Fix problems with some string format specifiers.
1182
1183     * Fix use of $CASENUM in expressions.  Thanks to Dirk Melcher
1184       <BZN-mdksh@t-online.de> for reporting this bug.
1185
1186     * Additional DATA LIST FREE and DATA LIST LIST fixes.  Thanks to
1187       Hankin <hankin@dunno.com> again on this one.
1188
1189     * Sometimes you may encounter a PSPP script that has to be
1190       interpreted in interactive mode.  Now you can use the -i flag to
1191       do this.
1192
1193     * Warnings for egcs 1.1.1 cleaned up.  (However you'll get lots of
1194       `unused variable' warnings under gcc 2.7.2.3, fixing this will
1195       take more effort.)
1196
1197     * Tests fixed.
1198
1199     * The files in gmp need the internationalization directory in
1200       their include path.  Thanks to OKUJI Yoshinori
1201       <okuji@kuicr.kyoto-u.ac.jp> for pointing this out.
1202
1203 Version 0.2.1 changes since 0.2.0:
1204
1205   Bugs fixed:
1206
1207     * Remember to include examples/ directory in distribution :-)
1208
1209     * Fixed gmp compile problems for some non-i386 architectures.
1210       Thanks to Hans Olav Eggestad <olav@jordforsk.nlh.no> and others
1211       for reporting this.
1212
1213     * DATA LIST FREE and DATA LIST LIST parsing of input files is now
1214       matches the documented behavior exactly, and error messages are
1215       more helpful.  Thanks to Mark H. Wood <mwood@IUPUI.Edu>.
1216
1217 Version 0.2.0 changes since 0.1.0:
1218
1219   Procedures now implemented:
1220     * CROSSTABS.  Please see documentation for caveats.
1221
1222   Transformations and utilities now implemented:
1223     * AGGREGATE
1224     * APPLY DICTIONARY
1225     * CLEAR TRANSFORMATIONS
1226     * DISPLAY (all subcommands).
1227     * ERASE
1228     * FLIP
1229     * EXPORT
1230     * HOST
1231     * IMPORT
1232     * MATCH FILES
1233     * MATRIX DATA
1234     * NEW FILE
1235     * REPEATING DATA
1236
1237   Support for input and output through pipes: "|command" and
1238   "command|" filenames; support for special filenames "-", "stdin",
1239   "stdout", "stderr".
1240
1241   New command-line features:
1242     * New option --testing-mode: Invoke heuristics to assist testing.
1243     * New option --safer, -s: Don't allow certain unsafe operations.
1244     * New option --command=CMD, -c CMD: Perform literal command CMD.
1245     * rc file ~/.pspp/rc is executed before any other files.
1246     * Now multiple syntax files can be specified.
1247
1248   Operator LAG is now implemented.
1249
1250   Added missing FILE subcommand to REREAD.
1251
1252   Table output manager completely rewritten.
1253
1254   Device configuration file syntax changed.  You will need to
1255   reinstall your `devices' file.
1256
1257   New output driver for HTML.
1258
1259   PostScript driver and prologue simplified.
1260
1261   Many bugs fixed.  General source-code cleanup.
1262
1263   Added Texinfo documentation for:
1264     * PSPP system file format
1265     * PSPP portable file format
1266     * How to write input for q2c parser generator
1267     * HTML driver
1268
1269   PSPP language is now fully documented.  Please report any
1270   inaccuracies or omissions in the documentation.
1271
1272 Changes for version 0.1.0:
1273
1274   First public release.  For changes from unreleased development
1275   versions, please see ONEWS.
1276 \f
1277 ----------------------------------------------------------------------
1278 Copyright information:
1279
1280    Permission is granted to anyone to make or distribute verbatim
1281    copies of this document as received, in any medium, provided that
1282    the copyright notice and this permission notice are preserved, thus
1283    giving the recipient permission to redistribute in turn.
1284
1285    Permission is granted to distribute modified versions of this
1286    document, or of portions of it, under the above conditions,
1287    provided also that they carry prominent notices stating who last
1288    changed them.
1289 \f
1290 Local variables:
1291 version-control: never
1292 mode: indented-text
1293 end: