output: Introduce pivot tables.
[pspp] / tests / language / stats / aggregate.at
1 dnl PSPP - a program for statistical analysis.
2 dnl Copyright (C) 2017 Free Software Foundation, Inc.
3 dnl 
4 dnl This program is free software: you can redistribute it and/or modify
5 dnl it under the terms of the GNU General Public License as published by
6 dnl the Free Software Foundation, either version 3 of the License, or
7 dnl (at your option) any later version.
8 dnl 
9 dnl This program is distributed in the hope that it will be useful,
10 dnl but WITHOUT ANY WARRANTY; without even the implied warranty of
11 dnl MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12 dnl GNU General Public License for more details.
13 dnl 
14 dnl You should have received a copy of the GNU General Public License
15 dnl along with this program.  If not, see <http://www.gnu.org/licenses/>.
16 dnl
17 AT_BANNER([AGGREGATE procedure])
18
19 dnl CHECK_AGGREGATE(OUTFILE, SORT, MISSING)
20 dnl
21 dnl Checks the AGGREGATE procedure with the specified combination of:
22 dnl
23 dnl - OUTFILE: One of "dataset", "active", or "external" according to
24 dnl   where AGGREGATE's output should be directed.
25 dnl 
26 dnl - SORT: Either "presorted" or "unsorted" according to whether
27 dnl   AGGREGATE should received presorted input.
28 dnl
29 dnl - MISSING: Either "itemwise" or "columnwise" according to the basis
30 dnl   on which missing values should be eliminated.
31 dnl
32 m4_define([CHECK_AGGREGATE], [
33   AT_SETUP([AGGREGATE $2 data to $1 file, $3 missing])
34   AT_DATA([aggregate.data],
35   [2 42
36 1001
37 4 41
38 3112
39 1112
40 2661
41 1221
42 2771
43 1331
44 1441
45 2881
46 1551
47 ])
48   AT_DATA([aggregate.sps],
49     [DATA LIST NOTABLE FILE='aggregate.data' /G N 1-2 S 3(a) W 4.
50 WEIGHT BY w.
51 MISSING VALUES n(4) s('4').
52 m4_if([$1], [dataset], [DATASET DECLARE aggregate.])
53 m4_if([$2], [presorted], [SORT CASES BY g.])
54 AGGREGATE dnl
55 m4_if([$1], [active], [OUTFILE=*],
56       [$1], [external], [OUTFILE='aggregate.sys'],
57       [outfile=aggregate]) dnl
58 m4_if([$2], [presorted], [/PRESORTED]) dnl
59 m4_if([$3], [columnwise], [/MISSING=COLUMNWISE])
60         /DOCUMENT
61         /BREAK=g
62         /N = n
63         /NI = n./
64         NU = nu
65         /NUI = nu./
66         NFGT2 = fgt(n, 2)
67         /NFGT2I = fgt.(n, 2)
68         /SFGT2 = fgt(s, '2')
69         /SFGT2I = fgt.(s, '2')
70         /NFIN23 = fin(n, 2, 3)
71         /NFIN23I = fin.(n, 2, 3)
72         /SFIN23 = fin(s, '2', '3')
73         /SFIN23I = fin.(s, '2', '3')
74         /NFLT2 = flt(n, 2)
75         /NFLT2I = flt.(n, 2)
76         /SFLT2 = flt(s, '2')
77         /SFLT2I = flt.(s, '2')
78         /NFIRST = first(n)
79         /NFIRSTI = first.(n)
80         /SFIRST = first(s)
81         /SFIRSTI = first.(s)
82         /NFOUT23 = fout(n, 3, 2)
83         /NFOUT23I = fout.(n, 3, 2)
84         /SFOUT23 = fout(s, '3', '2')
85         /SFOUT23I = fout.(s, '3', '2')
86         /NLAST = last(n)
87         /NLASTI = last.(n)
88         /SLAST = last(s)
89         /SLASTI = last.(s)
90         /NMAX = max(n)
91         /NMAXI = max.(n)
92         /SMAX = max(s)
93         /SMAXI = max.(s)
94         /NMEAN = mean(n)
95         /NMEANI = mean.(n)
96         /NMIN = min(n)
97         /NMINI = min.(n)
98         /SMIN = min(s)
99         /SMINI = min.(s)
100         /NN = n(n)
101         /NNI = n.(n)
102         /SN = n(s)
103         /SNI = n.(s)
104         /NNMISS = nmiss(n)
105         /NNMISSI = nmiss.(n)
106         /SNMISS = nmiss(s)
107         /SNMISSI = nmiss.(s)
108         /NNU = nu(n)
109         /NNUI = nu.(n)
110         /SNU = nu(s)
111         /SNUI = nu.(s)
112         /NNUMISS = numiss(n)
113         /NNUMISSI = numiss.(n)
114         /SNUMISS = numiss(s)
115         /SNUMISSI = numiss.(s)
116         /NPGT2 = pgt(n, 2)
117         /NPGT2I = pgt.(n, 2)
118         /SPGT2 = pgt(s, '2')
119         /SPGT2I = pgt.(s, '2')
120         /NPIN23 = pin(n, 2, 3)
121         /NPIN23I = pin.(n, 2, 3)
122         /SPIN23 = pin(s, '2', '3')
123         /SPIN23I = pin.(s, '2', '3')
124         /NPLT2 = plt(n, 2)
125         /NPLT2I = plt.(n, 2)
126         /SPLT2 = plt(s, '2')
127         /SPLT2I = plt.(s, '2')
128         /NPOUT23 = pout(n, 2, 3)
129         /NPOUT23I = pout.(n, 2, 3)
130         /SPOUT23 = pout(s, '2', '3')
131         /SPOUT23I = pout.(s, '2', '3')
132         /NMEDIAN = median(n)
133         /NMEDIANI = median.(n)
134         /NSD = sd(n)
135         /NSDI = sd.(n)
136         /NSUM = sum(n)
137         /NSUMI = sum.(n).
138 m4_if([$1], [external], [GET FILE='aggregate.sys'.],
139       [$1], [dataset], [DATASET ACTIVATE aggregate.])
140 LIST.
141 ])
142   AT_CHECK([pspp -O format=csv aggregate.sps], [0], [stdout])
143   AT_CHECK([[sed 's/^[^:]*:[0-9]*: //' < stdout]], [0],
144     [m4_if([$3], [itemwise],
145       [warning: AGGREGATE: The value arguments passed to the FOUT function are out-of-order.  They will be treated as if they had been specified in the correct order.
146
147 warning: AGGREGATE: The value arguments passed to the FOUT function are out-of-order.  They will be treated as if they had been specified in the correct order.
148
149 warning: AGGREGATE: The value arguments passed to the FOUT function are out-of-order.  They will be treated as if they had been specified in the correct order.
150
151 warning: AGGREGATE: The value arguments passed to the FOUT function are out-of-order.  They will be treated as if they had been specified in the correct order.
152
153 Table: Data List
154 G,N,NI,NU,NUI,NFGT2,NFGT2I,SFGT2,SFGT2I,NFIN23,NFIN23I,SFIN23,SFIN23I,NFLT2,NFLT2I,SFLT2,SFLT2I,NFIRST,NFIRSTI,SFIRST,SFIRSTI,NFOUT23,NFOUT23I,SFOUT23,SFOUT23I,NLAST,NLASTI,SLAST,SLASTI,NMAX,NMAXI,SMAX,SMAXI,NMEAN,NMEANI,NMIN,NMINI,SMIN,SMINI,NN,NNI,SN,SNI,NNMISS,NNMISSI,SNMISS,SNMISSI,NNU,NNUI,SNU,SNUI,NNUMISS,NNUMISSI,SNUMISS,SNUMISSI,NPGT2,NPGT2I,SPGT2,SPGT2I,NPIN23,NPIN23I,SPIN23,SPIN23I,NPLT2,NPLT2I,SPLT2,SPLT2I,NPOUT23,NPOUT23I,SPOUT23,SPOUT23I,NMEDIAN,NMEDIANI,NSD,NSDI,NSUM,NSUMI
155 1,7.00,7.00,6,6,.333,.429,.333,.429,.333,.286,.333,.286,.500,.429,.500,.429,0,0,0,0,.667,.714,.667,.714,5,5,5,5,5,5,5,5,2.00,2.29,0,0,0,0,6.00,7.00,6.00,7.00,1.00,.00,1.00,.00,5,6,5,6,1,0,1,0,33.3,42.9,33.3,42.9,33.3,28.6,33.3,28.6,50.0,42.9,50.0,42.9,66.7,71.4,66.7,71.4,1.50,2.00,1.79,1.80,12.00,16.00
156 2,5.00,5.00,4,4,1.000,1.000,1.000,1.000,.000,.000,.000,.000,.000,.000,.000,.000,6,6,6,4,1.000,1.000,1.000,1.000,8,8,8,8,8,8,8,8,7.00,7.00,6,6,6,4,3.00,3.00,3.00,5.00,2.00,2.00,2.00,.00,3,3,3,4,1,1,1,0,100.0,100.0,100.0,100.0,.0,.0,.0,.0,.0,.0,.0,.0,100.0,100.0,100.0,100.0,7.00,7.00,1.00,1.00,21.00,21.00
157 3,2.00,2.00,1,1,.000,.000,.000,.000,.000,.000,.000,.000,1.000,1.000,1.000,1.000,1,1,1,1,1.000,1.000,1.000,1.000,1,1,1,1,1,1,1,1,1.00,1.00,1,1,1,1,2.00,2.00,2.00,2.00,.00,.00,.00,.00,1,1,1,1,0,0,0,0,.0,.0,.0,.0,.0,.0,.0,.0,100.0,100.0,100.0,100.0,100.0,100.0,100.0,100.0,1.00,1.00,.00,.00,2.00,2.00
158 4,1.00,1.00,1,1,.   ,.   ,.   ,1.000,.   ,.   ,.   ,.000,.   ,.   ,.   ,.000,.,.,,4,.   ,.   ,.   ,1.000,.,.,,4,.,.,,4,.  ,.  ,.,.,,4,.00,.00,.00,1.00,1.00,1.00,1.00,.00,0,0,0,1,1,1,1,0,. ,. ,. ,100.0,. ,. ,. ,.0,. ,. ,. ,.0,. ,. ,. ,100.0,NaN,NaN,.  ,.  ,.  ,.  @&t@
159 ],
160       [warning: AGGREGATE: The value arguments passed to the FOUT function are out-of-order.  They will be treated as if they had been specified in the correct order.
161
162 warning: AGGREGATE: The value arguments passed to the FOUT function are out-of-order.  They will be treated as if they had been specified in the correct order.
163
164 warning: AGGREGATE: The value arguments passed to the FOUT function are out-of-order.  They will be treated as if they had been specified in the correct order.
165
166 warning: AGGREGATE: The value arguments passed to the FOUT function are out-of-order.  They will be treated as if they had been specified in the correct order.
167
168 Table: Data List
169 G,N,NI,NU,NUI,NFGT2,NFGT2I,SFGT2,SFGT2I,NFIN23,NFIN23I,SFIN23,SFIN23I,NFLT2,NFLT2I,SFLT2,SFLT2I,NFIRST,NFIRSTI,SFIRST,SFIRSTI,NFOUT23,NFOUT23I,SFOUT23,SFOUT23I,NLAST,NLASTI,SLAST,SLASTI,NMAX,NMAXI,SMAX,SMAXI,NMEAN,NMEANI,NMIN,NMINI,SMIN,SMINI,NN,NNI,SN,SNI,NNMISS,NNMISSI,SNMISS,SNMISSI,NNU,NNUI,SNU,SNUI,NNUMISS,NNUMISSI,SNUMISS,SNUMISSI,NPGT2,NPGT2I,SPGT2,SPGT2I,NPIN23,NPIN23I,SPIN23,SPIN23I,NPLT2,NPLT2I,SPLT2,SPLT2I,NPOUT23,NPOUT23I,SPOUT23,SPOUT23I,NMEDIAN,NMEDIANI,NSD,NSDI,NSUM,NSUMI
170 1,7.00,7.00,6,6,.   ,.429,.   ,.429,.   ,.286,.   ,.286,.   ,.429,.   ,.429,.,0,,0,.   ,.714,.   ,.714,.,5,,5,.,5,,5,.  ,2.29,.,0,,0,6.00,7.00,6.00,7.00,1.00,.00,1.00,.00,5,6,5,6,1,0,1,0,. ,42.9,. ,42.9,. ,28.6,. ,28.6,. ,42.9,. ,42.9,. ,71.4,. ,71.4,.  ,2.00,.  ,1.80,.  ,16.00
171 2,5.00,5.00,4,4,.   ,.   ,.   ,1.000,.   ,.   ,.   ,.000,.   ,.   ,.   ,.000,.,.,,4,.   ,.   ,.   ,1.000,.,.,,8,.,.,,8,.  ,.  ,.,.,,4,3.00,3.00,3.00,5.00,2.00,2.00,2.00,.00,3,3,3,4,1,1,1,0,. ,. ,. ,100.0,. ,. ,. ,.0,. ,. ,. ,.0,. ,. ,. ,100.0,.  ,.  ,.  ,.  ,.  ,.  @&t@
172 3,2.00,2.00,1,1,.000,.000,.000,.000,.000,.000,.000,.000,1.000,1.000,1.000,1.000,1,1,1,1,1.000,1.000,1.000,1.000,1,1,1,1,1,1,1,1,1.00,1.00,1,1,1,1,2.00,2.00,2.00,2.00,.00,.00,.00,.00,1,1,1,1,0,0,0,0,.0,.0,.0,.0,.0,.0,.0,.0,100.0,100.0,100.0,100.0,100.0,100.0,100.0,100.0,1.00,1.00,.00,.00,2.00,2.00
173 4,1.00,1.00,1,1,.   ,.   ,.   ,1.000,.   ,.   ,.   ,.000,.   ,.   ,.   ,.000,.,.,,4,.   ,.   ,.   ,1.000,.,.,,4,.,.,,4,.  ,.  ,.,.,,4,.00,.00,.00,1.00,1.00,1.00,1.00,.00,0,0,0,1,1,1,1,0,. ,. ,. ,100.0,. ,. ,. ,.0,. ,. ,. ,.0,. ,. ,. ,100.0,.  ,.  ,.  ,.  ,.  ,.  @&t@
174 ])])
175   AT_CLEANUP])
176
177 CHECK_AGGREGATE([dataset], [presorted], [itemwise])
178 CHECK_AGGREGATE([dataset], [presorted], [columnwise])
179 CHECK_AGGREGATE([dataset], [unsorted], [itemwise])
180 CHECK_AGGREGATE([dataset], [unsorted], [columnwise])
181 CHECK_AGGREGATE([active], [presorted], [itemwise])
182 CHECK_AGGREGATE([active], [presorted], [columnwise])
183 CHECK_AGGREGATE([active], [unsorted], [itemwise])
184 CHECK_AGGREGATE([active], [unsorted], [columnwise])
185 CHECK_AGGREGATE([external], [presorted], [itemwise])
186 CHECK_AGGREGATE([external], [presorted], [columnwise])
187 CHECK_AGGREGATE([external], [unsorted], [itemwise])
188 CHECK_AGGREGATE([external], [unsorted], [columnwise])
189
190 AT_SETUP([AGGREGATE crash with MAX function])
191 AT_DATA([aggregate.sps], 
192   [DATA LIST LIST /X (F8.2) Y (a25).
193
194 BEGIN DATA.
195 87.50 foo
196 87.34 bar
197 1 bar
198 END DATA.
199
200 AGGREGATE OUTFILE=* /BREAK=y /X=MAX(x).
201 LIST /x y.
202 ])
203 AT_CHECK([pspp -O format=csv aggregate.sps], [0],
204   [Table: Reading free-form data from INLINE.
205 Variable,Format
206 X,F8.2
207 Y,A25
208
209 Table: Data List
210 X,Y
211 87.34,bar
212 87.50,foo
213 ])
214 AT_CLEANUP
215
216 AT_SETUP([AGGREGATE crash with invalid syntax])
217 AT_DATA([aggregate.sps],
218   [INPUT PROGRAM.
219 LOOP c=1 TO 20.
220   COMPUTE x=UNIFORM(10)
221   END CASE.
222 END LOOP.
223 END FILE.
224 END INPUT PROGRAM.
225
226 AGGREGATE /BREAK=x .
227 ])
228 AT_CHECK([pspp -O format=csv aggregate.sps], [1], [ignore], [])
229 AT_CLEANUP
230
231
232 AT_SETUP([AGGREGATE mode=addvariables])
233 AT_DATA([addvariables.sps],
234   [data list notable list /x * cn * y *.
235 begin data.
236 1 1 2
237 3 2 3
238 3 3 4
239 5 4 6
240 7 5 8
241 7 6 9
242 7 7 20
243 9 8 11
244 end data.
245
246 aggregate outfile=* mode=addvariables
247         /break = x
248         /sum = sum(y)
249         /mean = mean (y)
250         /median = median (y).
251
252 list.
253 ])
254
255 AT_CHECK([pspp -O format=csv addvariables.sps], [0],
256   [Table: Data List
257 x,cn,y,sum,mean,median
258 1.00,1.00,2.00,2.00,2.00,2.00
259 3.00,2.00,3.00,7.00,3.50,3.50
260 3.00,3.00,4.00,7.00,3.50,3.50
261 5.00,4.00,6.00,6.00,6.00,6.00
262 7.00,5.00,8.00,37.00,12.33,9.00
263 7.00,6.00,9.00,37.00,12.33,9.00
264 7.00,7.00,20.00,37.00,12.33,9.00
265 9.00,8.00,11.00,11.00,11.00,11.00
266 ])
267
268 AT_CLEANUP
269
270
271 AT_SETUP([AGGREGATE buggy duplicate variables])
272 dnl Test for a bug which crashed when duplicated
273 dnl variables were attempted.
274 AT_DATA([dup-variables.sps],
275   [DATA LIST NOTABLE LIST /x * .
276 begin data
277 1
278 1
279 1
280 1
281 2
282 2
283 2
284 3
285 3
286 3
287 3
288 3
289 3
290 end data.
291
292 AGGREGATE OUTFILE=* MODE=ADDVARIABLES
293         /BREAK= x
294         /N_BREAK = N.
295
296 AGGREGATE OUTFILE=* MODE=ADDVARIABLES
297         /BREAK= x
298         /N_BREAK = N.
299 ])
300
301 AT_CHECK([pspp -O format=csv dup-variables.sps], [1],
302 ["dup-variables.sps:24: error: AGGREGATE: Variable name N_BREAK is not unique within the aggregate file dictionary, which contains the aggregate variables and the break variables."
303 ])
304
305 AT_CLEANUP