Replace dtoastr with c_dtoastr where appropriate
[pspp] / src / language / control / repeat.c
1 /* PSPP - a program for statistical analysis.
2    Copyright (C) 1997-9, 2000, 2007, 2009-2012 Free Software Foundation, Inc.
3
4    This program is free software: you can redistribute it and/or modify
5    it under the terms of the GNU General Public License as published by
6    the Free Software Foundation, either version 3 of the License, or
7    (at your option) any later version.
8
9    This program is distributed in the hope that it will be useful,
10    but WITHOUT ANY WARRANTY; without even the implied warranty of
11    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12    GNU General Public License for more details.
13
14    You should have received a copy of the GNU General Public License
15    along with this program.  If not, see <http://www.gnu.org/licenses/>. */
16
17 #include <config.h>
18
19 #include <stdlib.h>
20
21 #include "data/dataset.h"
22 #include "data/dictionary.h"
23 #include "data/settings.h"
24 #include "language/command.h"
25 #include "language/lexer/lexer.h"
26 #include "language/lexer/segment.h"
27 #include "language/lexer/token.h"
28 #include "language/lexer/variable-parser.h"
29 #include "libpspp/assertion.h"
30 #include "libpspp/cast.h"
31 #include "libpspp/hash-functions.h"
32 #include "libpspp/hmap.h"
33 #include "libpspp/message.h"
34 #include "libpspp/str.h"
35 #include "libpspp/misc.h"
36
37 #include "gl/ftoastr.h"
38 #include "gl/minmax.h"
39 #include "gl/xalloc.h"
40
41 #include "gettext.h"
42 #define _(msgid) gettext (msgid)
43
44 struct dummy_var
45   {
46     struct hmap_node hmap_node;
47     char *name;
48     char **values;
49     size_t n_values;
50   };
51
52 static bool parse_specification (struct lexer *, struct dictionary *,
53                                  struct hmap *dummies);
54 static bool parse_commands (struct lexer *, struct hmap *dummies);
55 static void destroy_dummies (struct hmap *dummies);
56
57 static bool parse_ids (struct lexer *, const struct dictionary *,
58                        struct dummy_var *);
59 static bool parse_numbers (struct lexer *, struct dummy_var *);
60 static bool parse_strings (struct lexer *, struct dummy_var *);
61
62 int
63 cmd_do_repeat (struct lexer *lexer, struct dataset *ds)
64 {
65   struct hmap dummies;
66   bool ok;
67
68   if (!parse_specification (lexer, dataset_dict (ds), &dummies))
69     return CMD_CASCADING_FAILURE;
70
71   ok = parse_commands (lexer, &dummies);
72
73   destroy_dummies (&dummies);
74
75   return ok ? CMD_SUCCESS : CMD_CASCADING_FAILURE;
76 }
77
78 static unsigned int
79 hash_dummy (const char *name, size_t name_len)
80 {
81   return hash_case_bytes (name, name_len, 0);
82 }
83
84 static const struct dummy_var *
85 find_dummy_var (struct hmap *hmap, const char *name, size_t name_len)
86 {
87   const struct dummy_var *dv;
88
89   HMAP_FOR_EACH_WITH_HASH (dv, struct dummy_var, hmap_node,
90                            hash_dummy (name, name_len), hmap)
91     if (strcasecmp (dv->name, name))
92       return dv;
93
94   return NULL;
95 }
96
97 /* Parses the whole DO REPEAT command specification.
98    Returns success. */
99 static bool
100 parse_specification (struct lexer *lexer, struct dictionary *dict,
101                      struct hmap *dummies)
102 {
103   struct dummy_var *first_dv = NULL;
104
105   hmap_init (dummies);
106   do
107     {
108       struct dummy_var *dv;
109       const char *name;
110       bool ok;
111
112       /* Get a stand-in variable name and make sure it's unique. */
113       if (!lex_force_id (lexer))
114         goto error;
115       name = lex_tokcstr (lexer);
116       if (dict_lookup_var (dict, name))
117         msg (SW, _("Dummy variable name `%s' hides dictionary variable `%s'."),
118              name, name);
119       if (find_dummy_var (dummies, name, strlen (name)))
120         {
121           msg (SE, _("Dummy variable name `%s' is given twice."), name);
122           goto error;
123         }
124
125       /* Make a new macro. */
126       dv = xmalloc (sizeof *dv);
127       dv->name = xstrdup (name);
128       dv->values = NULL;
129       dv->n_values = 0;
130       hmap_insert (dummies, &dv->hmap_node, hash_dummy (name, strlen (name)));
131
132       /* Skip equals sign. */
133       lex_get (lexer);
134       if (!lex_force_match (lexer, T_EQUALS))
135         goto error;
136
137       /* Get the details of the variable's possible values. */
138       if (lex_token (lexer) == T_ID || lex_token (lexer) == T_ALL)
139         ok = parse_ids (lexer, dict, dv);
140       else if (lex_is_number (lexer))
141         ok = parse_numbers (lexer, dv);
142       else if (lex_is_string (lexer))
143         ok = parse_strings (lexer, dv);
144       else
145         {
146           lex_error (lexer, NULL);
147           goto error;
148         }
149       if (!ok)
150         goto error;
151       assert (dv->n_values > 0);
152       if (lex_token (lexer) != T_SLASH && lex_token (lexer) != T_ENDCMD)
153         {
154           lex_error (lexer, NULL);
155           goto error;
156         }
157
158       /* If this is the first variable then it defines how many replacements
159          there must be; otherwise enforce this number of replacements. */
160       if (first_dv == NULL)
161         first_dv = dv;
162       else if (first_dv->n_values != dv->n_values)
163         {
164           msg (SE, _("Dummy variable `%s' had %zu substitutions, so `%s' must "
165                      "also, but %zu were specified."),
166                first_dv->name, first_dv->n_values,
167                dv->name, dv->n_values);
168           goto error;
169         }
170
171       lex_match (lexer, T_SLASH);
172     }
173   while (!lex_match (lexer, T_ENDCMD));
174
175   while (lex_match (lexer, T_ENDCMD))
176     continue;
177
178   return true;
179
180 error:
181   destroy_dummies (dummies);
182   return false;
183 }
184
185 static size_t
186 count_values (struct hmap *dummies)
187 {
188   const struct dummy_var *dv;
189   dv = HMAP_FIRST (struct dummy_var, hmap_node, dummies);
190   return dv->n_values;
191 }
192
193 static void
194 do_parse_commands (struct substring s, enum segmenter_mode mode,
195                    struct hmap *dummies,
196                    struct string *outputs, size_t n_outputs)
197 {
198   struct segmenter segmenter;
199
200   segmenter_init (&segmenter, mode);
201
202   while (!ss_is_empty (s))
203     {
204       enum segment_type type;
205       int n;
206
207       n = segmenter_push (&segmenter, s.string, s.length, &type);
208       assert (n >= 0);
209
210       if (type == SEG_DO_REPEAT_COMMAND)
211         {
212           for (;;)
213             {
214               int k;
215
216               k = segmenter_push (&segmenter, s.string + n, s.length - n,
217                                   &type);
218               if (type != SEG_NEWLINE && type != SEG_DO_REPEAT_COMMAND)
219                 break;
220
221               n += k;
222             }
223
224           do_parse_commands (ss_head (s, n), mode, dummies,
225                              outputs, n_outputs);
226         }
227       else if (type != SEG_END)
228         {
229           const struct dummy_var *dv;
230           size_t i;
231
232           dv = (type == SEG_IDENTIFIER
233                 ? find_dummy_var (dummies, s.string, n)
234                 : NULL);
235           for (i = 0; i < n_outputs; i++)
236             if (dv != NULL)
237               ds_put_cstr (&outputs[i], dv->values[i]);
238             else
239               ds_put_substring (&outputs[i], ss_head (s, n));
240         }
241
242       ss_advance (&s, n);
243     }
244 }
245
246 static bool
247 parse_commands (struct lexer *lexer, struct hmap *dummies)
248 {
249   enum lex_syntax_mode syntax_mode;
250   enum segmenter_mode mode;
251   struct string *outputs;
252   struct string input;
253   size_t n_values;
254   char *file_name;
255   int line_number;
256   bool ok;
257   size_t i;
258
259   if (lex_get_file_name (lexer) != NULL)
260     file_name = xstrdup (lex_get_file_name (lexer));
261   else
262     file_name = NULL;
263   line_number = lex_get_first_line_number (lexer, 0);
264
265   ds_init_empty (&input);
266   while (lex_is_string (lexer))
267     {
268       ds_put_substring (&input, lex_tokss (lexer));
269       ds_put_byte (&input, '\n');
270       lex_get (lexer);
271     }
272   if (ds_is_empty (&input))
273     ds_put_byte (&input, '\n');
274   ds_put_byte (&input, '\0');
275
276   n_values = count_values (dummies);
277   outputs = xmalloc (n_values * sizeof *outputs);
278   for (i = 0; i < n_values; i++)
279     ds_init_empty (&outputs[i]);
280
281   syntax_mode = lex_get_syntax_mode (lexer);
282   if (syntax_mode == LEX_SYNTAX_AUTO)
283     mode = SEG_MODE_AUTO;
284   else if (syntax_mode == LEX_SYNTAX_INTERACTIVE)
285     mode = SEG_MODE_INTERACTIVE;
286   else if (syntax_mode == LEX_SYNTAX_BATCH)
287     mode = SEG_MODE_BATCH;
288   else
289     NOT_REACHED ();
290   do_parse_commands (ds_ss (&input), mode, dummies, outputs, n_values);
291
292   ds_destroy (&input);
293
294   while (lex_match (lexer, T_ENDCMD))
295     continue;
296
297   ok = (lex_force_match_id (lexer, "END")
298         && lex_force_match_id (lexer, "REPEAT"));
299   if (ok)
300     lex_match_id (lexer, "PRINT"); /* XXX */
301
302   lex_discard_rest_of_command (lexer);
303
304   for (i = 0; i < n_values; i++)
305     {
306       struct string *output = &outputs[n_values - i - 1];
307       struct lex_reader *reader;
308
309       reader = lex_reader_for_substring_nocopy (ds_ss (output));
310       lex_reader_set_file_name (reader, file_name);
311       reader->line_number = line_number;
312       lex_include (lexer, reader);
313     }
314   free (file_name);
315   free (outputs);
316
317   return ok;
318 }
319
320 static void
321 destroy_dummies (struct hmap *dummies)
322 {
323   struct dummy_var *dv, *next;
324
325   HMAP_FOR_EACH_SAFE (dv, next, struct dummy_var, hmap_node, dummies)
326     {
327       size_t i;
328
329       hmap_delete (dummies, &dv->hmap_node);
330
331       free (dv->name);
332       for (i = 0; i < dv->n_values; i++)
333         free (dv->values[i]);
334       free (dv->values);
335       free (dv);
336     }
337   hmap_destroy (dummies);
338 }
339
340 /* Parses a set of ids for DO REPEAT. */
341 static bool
342 parse_ids (struct lexer *lexer, const struct dictionary *dict,
343            struct dummy_var *dv)
344 {
345   return parse_mixed_vars (lexer, dict, &dv->values, &dv->n_values, PV_NONE);
346 }
347
348 /* Adds REPLACEMENT to MACRO's list of replacements, which has
349    *USED elements and has room for *ALLOCATED.  Allocates memory
350    from POOL. */
351 static void
352 add_replacement (struct dummy_var *dv, char *value, size_t *allocated)
353 {
354   if (dv->n_values == *allocated)
355     dv->values = x2nrealloc (dv->values, allocated, sizeof *dv->values);
356   dv->values[dv->n_values++] = value;
357 }
358
359 /* Parses a list or range of numbers for DO REPEAT. */
360 static bool
361 parse_numbers (struct lexer *lexer, struct dummy_var *dv)
362 {
363   size_t allocated = 0;
364
365   do
366     {
367       if (!lex_force_num (lexer))
368         return false;
369
370       if (lex_next_token (lexer, 1) == T_TO)
371         {
372           long int a, b;
373           long int i;
374
375           if (!lex_is_integer (lexer))
376             {
377               msg (SE, _("Ranges may only have integer bounds."));
378               return false;
379             }
380
381           a = lex_integer (lexer);
382           lex_get (lexer);
383           lex_get (lexer);
384
385           if (!lex_force_int (lexer))
386             return false;
387
388           b = lex_integer (lexer);
389           if (b < a)
390             {
391               msg (SE, _("%ld TO %ld is an invalid range."), a, b);
392               return false;
393             }
394           lex_get (lexer);
395
396           for (i = a; i <= b; i++)
397             add_replacement (dv, xasprintf ("%ld", i), &allocated);
398         }
399       else
400         {
401           char s[DBL_BUFSIZE_BOUND];
402
403           c_dtoastr (s, sizeof s, 0, 0, lex_number (lexer));
404           add_replacement (dv, xstrdup (s), &allocated);
405           lex_get (lexer);
406         }
407
408       lex_match (lexer, T_COMMA);
409     }
410   while (lex_token (lexer) != T_SLASH && lex_token (lexer) != T_ENDCMD);
411
412   return true;
413 }
414
415 /* Parses a list of strings for DO REPEAT. */
416 static bool
417 parse_strings (struct lexer *lexer, struct dummy_var *dv)
418 {
419   size_t allocated = 0;
420
421   do
422     {
423       if (!lex_force_string (lexer))
424         {
425           return false;
426         }
427
428       add_replacement (dv, token_to_string (lex_next (lexer, 0)), &allocated);
429
430       lex_get (lexer);
431       lex_match (lexer, T_COMMA);
432     }
433   while (lex_token (lexer) != T_SLASH && lex_token (lexer) != T_ENDCMD);
434
435   return true;
436 }
437 \f
438 int
439 cmd_end_repeat (struct lexer *lexer UNUSED, struct dataset *ds UNUSED)
440 {
441   msg (SE, _("No matching DO REPEAT."));
442   return CMD_CASCADING_FAILURE;
443 }