57307bf306f89d6ec83d5f57f33d2a405da71a30
[pspp] / src / language / expressions / parse.c
1 /* PSPP - a program for statistical analysis.
2    Copyright (C) 1997-9, 2000, 2006, 2010, 2011, 2012, 2014 Free Software Foundation, Inc.
3
4    This program is free software: you can redistribute it and/or modify
5    it under the terms of the GNU General Public License as published by
6    the Free Software Foundation, either version 3 of the License, or
7    (at your option) any later version.
8
9    This program is distributed in the hope that it will be useful,
10    but WITHOUT ANY WARRANTY; without even the implied warranty of
11    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12    GNU General Public License for more details.
13
14    You should have received a copy of the GNU General Public License
15    along with this program.  If not, see <http://www.gnu.org/licenses/>. */
16
17 #include <config.h>
18
19 #include "private.h"
20
21 #include <ctype.h>
22 #include <float.h>
23 #include <limits.h>
24 #include <stdlib.h>
25
26 #include "data/case.h"
27 #include "data/dictionary.h"
28 #include "data/settings.h"
29 #include "data/variable.h"
30 #include "language/expressions/helpers.h"
31 #include "language/lexer/format-parser.h"
32 #include "language/lexer/lexer.h"
33 #include "language/lexer/variable-parser.h"
34 #include "libpspp/array.h"
35 #include "libpspp/assertion.h"
36 #include "libpspp/i18n.h"
37 #include "libpspp/message.h"
38 #include "libpspp/misc.h"
39 #include "libpspp/pool.h"
40 #include "libpspp/str.h"
41
42 #include "gl/c-strcase.h"
43 #include "gl/xalloc.h"
44 \f
45 /* Declarations. */
46
47 /* Recursive descent parser in order of increasing precedence. */
48 typedef union any_node *parse_recursively_func (struct lexer *, struct expression *);
49 static parse_recursively_func parse_or, parse_and, parse_not;
50 static parse_recursively_func parse_rel, parse_add, parse_mul;
51 static parse_recursively_func parse_neg, parse_exp;
52 static parse_recursively_func parse_primary;
53 static parse_recursively_func parse_vector_element, parse_function;
54
55 /* Utility functions. */
56 static struct expression *expr_create (struct dataset *ds);
57 atom_type expr_node_returns (const union any_node *);
58
59 static const char *atom_type_name (atom_type);
60 static struct expression *finish_expression (union any_node *,
61                                              struct expression *);
62 static bool type_check (const union any_node *, enum val_type expected_type);
63 static union any_node *allocate_unary_variable (struct expression *,
64                                                 const struct variable *);
65 \f
66 /* Public functions. */
67
68 /* Parses an expression of the given TYPE.  If DS is nonnull then variables and
69    vectors within it may be referenced within the expression; otherwise, the
70    expression must not reference any variables or vectors.  Returns the new
71    expression if successful or a null pointer otherwise.  If POOL is nonnull,
72    then destroying POOL will free the expression; otherwise, the caller must
73    eventually free it with expr_free(). */
74 struct expression *
75 expr_parse (struct lexer *lexer, struct pool *pool, struct dataset *ds,
76             enum val_type type)
77 {
78   assert (val_type_is_valid (type));
79
80   struct expression *e = expr_create (ds);
81   union any_node *n = parse_or (lexer, e);
82   if (!n || !type_check (n, type))
83     {
84       expr_free (e);
85       return NULL;
86     }
87
88   e = finish_expression (expr_optimize (n, e), e);
89   if (pool)
90     pool_add_subpool (pool, e->expr_pool);
91   return e;
92 }
93
94 /* Parses a boolean expression, otherwise similar to expr_parse(). */
95 struct expression *
96 expr_parse_bool (struct lexer *lexer, struct pool *pool, struct dataset *ds)
97 {
98   struct expression *e = expr_create (ds);
99   union any_node *n = parse_or (lexer, e);
100   if (!n)
101     {
102       expr_free (e);
103       return NULL;
104     }
105
106   atom_type actual_type = expr_node_returns (n);
107   if (actual_type == OP_number)
108     n = expr_allocate_binary (e, OP_NUM_TO_BOOLEAN, n,
109                               expr_allocate_string (e, ss_empty ()));
110   else if (actual_type != OP_boolean)
111     {
112       msg (SE, _("Type mismatch: expression has %s type, "
113                  "but a boolean value is required here."),
114            atom_type_name (actual_type));
115       expr_free (e);
116       return NULL;
117     }
118
119   e = finish_expression (expr_optimize (n, e), e);
120   if (pool)
121     pool_add_subpool (pool, e->expr_pool);
122   return e;
123 }
124
125 /* Parses a numeric expression that is intended to be assigned to newly created
126    variable NEW_VAR_NAME.  (This allows for a better error message if the
127    expression is not numeric.)  Otherwise similar to expr_parse(). */
128 struct expression *
129 expr_parse_new_variable (struct lexer *lexer, struct pool *pool, struct dataset *ds,
130                          const char *new_var_name)
131 {
132   struct expression *e = expr_create (ds);
133   union any_node *n = parse_or (lexer, e);
134   if (!n)
135     {
136       expr_free (e);
137       return NULL;
138     }
139
140   atom_type actual_type = expr_node_returns (n);
141   if (actual_type != OP_number && actual_type != OP_boolean)
142     {
143       msg (SE, _("This command tries to create a new variable %s by assigning a "
144                  "string value to it, but this is not supported.  Use "
145                  "the STRING command to create the new variable with the "
146                  "correct width before assigning to it, e.g. STRING %s(A20)."),
147            new_var_name, new_var_name);
148       expr_free (e);
149       return NULL;
150     }
151
152   e = finish_expression (expr_optimize (n, e), e);
153   if (pool)
154     pool_add_subpool (pool, e->expr_pool);
155   return e;
156 }
157
158 /* Free expression E. */
159 void
160 expr_free (struct expression *e)
161 {
162   if (e != NULL)
163     pool_destroy (e->expr_pool);
164 }
165
166 struct expression *
167 expr_parse_any (struct lexer *lexer, struct dataset *ds, bool optimize)
168 {
169   union any_node *n;
170   struct expression *e;
171
172   e = expr_create (ds);
173   n = parse_or (lexer, e);
174   if (n == NULL)
175     {
176       expr_free (e);
177       return NULL;
178     }
179
180   if (optimize)
181     n = expr_optimize (n, e);
182   return finish_expression (n, e);
183 }
184 \f
185 /* Finishing up expression building. */
186
187 /* Height of an expression's stacks. */
188 struct stack_heights
189   {
190     int number_height;  /* Height of number stack. */
191     int string_height;  /* Height of string stack. */
192   };
193
194 /* Stack heights used by different kinds of arguments. */
195 static const struct stack_heights on_number_stack = {1, 0};
196 static const struct stack_heights on_string_stack = {0, 1};
197 static const struct stack_heights not_on_stack = {0, 0};
198
199 /* Returns the stack heights used by an atom of the given
200    TYPE. */
201 static const struct stack_heights *
202 atom_type_stack (atom_type type)
203 {
204   assert (is_atom (type));
205
206   switch (type)
207     {
208     case OP_number:
209     case OP_boolean:
210       return &on_number_stack;
211
212     case OP_string:
213       return &on_string_stack;
214
215     case OP_format:
216     case OP_ni_format:
217     case OP_no_format:
218     case OP_num_var:
219     case OP_str_var:
220     case OP_integer:
221     case OP_pos_int:
222     case OP_vector:
223       return &not_on_stack;
224
225     default:
226       NOT_REACHED ();
227     }
228 }
229
230 /* Measures the stack height needed for node N, supposing that
231    the stack height is initially *HEIGHT and updating *HEIGHT to
232    the final stack height.  Updates *MAX, if necessary, to
233    reflect the maximum intermediate or final height. */
234 static void
235 measure_stack (const union any_node *n,
236                struct stack_heights *height, struct stack_heights *max)
237 {
238   const struct stack_heights *return_height;
239
240   if (is_composite (n->type))
241     {
242       struct stack_heights args;
243       int i;
244
245       args = *height;
246       for (i = 0; i < n->composite.arg_cnt; i++)
247         measure_stack (n->composite.args[i], &args, max);
248
249       return_height = atom_type_stack (operations[n->type].returns);
250     }
251   else
252     return_height = atom_type_stack (n->type);
253
254   height->number_height += return_height->number_height;
255   height->string_height += return_height->string_height;
256
257   if (height->number_height > max->number_height)
258     max->number_height = height->number_height;
259   if (height->string_height > max->string_height)
260     max->string_height = height->string_height;
261 }
262
263 /* Allocates stacks within E sufficient for evaluating node N. */
264 static void
265 allocate_stacks (union any_node *n, struct expression *e)
266 {
267   struct stack_heights initial = {0, 0};
268   struct stack_heights max = {0, 0};
269
270   measure_stack (n, &initial, &max);
271   e->number_stack = pool_alloc (e->expr_pool,
272                                 sizeof *e->number_stack * max.number_height);
273   e->string_stack = pool_alloc (e->expr_pool,
274                                 sizeof *e->string_stack * max.string_height);
275 }
276
277 /* Finalizes expression E for evaluating node N. */
278 static struct expression *
279 finish_expression (union any_node *n, struct expression *e)
280 {
281   /* Allocate stacks. */
282   allocate_stacks (n, e);
283
284   /* Output postfix representation. */
285   expr_flatten (n, e);
286
287   /* The eval_pool might have been used for allocating strings
288      during optimization.  We need to keep those strings around
289      for all subsequent evaluations, so start a new eval_pool. */
290   e->eval_pool = pool_create_subpool (e->expr_pool);
291
292   return e;
293 }
294
295 /* Verifies that expression E, whose root node is *N, can be
296    converted to type EXPECTED_TYPE, inserting a conversion at *N
297    if necessary.  Returns true if successful, false on failure. */
298 static bool
299 type_check (const union any_node *n, enum val_type expected_type)
300 {
301   atom_type actual_type = expr_node_returns (n);
302
303   switch (expected_type)
304     {
305     case VAL_NUMERIC:
306       if (actual_type != OP_number && actual_type != OP_boolean)
307         {
308           msg (SE, _("Type mismatch: expression has %s type, "
309                      "but a numeric value is required here."),
310                atom_type_name (actual_type));
311           return false;
312         }
313       break;
314
315     case VAL_STRING:
316       if (actual_type != OP_string)
317         {
318           msg (SE, _("Type mismatch: expression has %s type, "
319                      "but a string value is required here."),
320                atom_type_name (actual_type));
321           return false;
322         }
323       break;
324
325     default:
326       NOT_REACHED ();
327     }
328
329   return true;
330 }
331 \f
332 /* Recursive-descent expression parser. */
333
334 /* Considers whether *NODE may be coerced to type REQUIRED_TYPE.
335    Returns true if possible, false if disallowed.
336
337    If DO_COERCION is false, then *NODE is not modified and there
338    are no side effects.
339
340    If DO_COERCION is true, we perform the coercion if possible,
341    modifying *NODE if necessary.  If the coercion is not possible
342    then we free *NODE and set *NODE to a null pointer.
343
344    This function's interface is somewhat awkward.  Use one of the
345    wrapper functions type_coercion(), type_coercion_assert(), or
346    is_coercible() instead. */
347 static bool
348 type_coercion_core (struct expression *e,
349                     atom_type required_type,
350                     union any_node **node,
351                     const char *operator_name,
352                     bool do_coercion)
353 {
354   atom_type actual_type;
355
356   assert (!!do_coercion == (e != NULL));
357   if (*node == NULL)
358     {
359       /* Propagate error.  Whatever caused the original error
360          already emitted an error message. */
361       return false;
362     }
363
364   actual_type = expr_node_returns (*node);
365   if (actual_type == required_type)
366     {
367       /* Type match. */
368       return true;
369     }
370
371   switch (required_type)
372     {
373     case OP_number:
374       if (actual_type == OP_boolean)
375         {
376           /* To enforce strict typing rules, insert Boolean to
377              numeric "conversion".  This conversion is a no-op,
378              so it will be removed later. */
379           if (do_coercion)
380             *node = expr_allocate_unary (e, OP_BOOLEAN_TO_NUM, *node);
381           return true;
382         }
383       break;
384
385     case OP_string:
386       /* No coercion to string. */
387       break;
388
389     case OP_boolean:
390       if (actual_type == OP_number)
391         {
392           /* Convert numeric to boolean. */
393           if (do_coercion)
394             {
395               union any_node *op_name;
396
397               op_name = expr_allocate_string (e, ss_cstr (operator_name));
398               *node = expr_allocate_binary (e, OP_NUM_TO_BOOLEAN, *node,
399                                             op_name);
400             }
401           return true;
402         }
403       break;
404
405     case OP_format:
406       NOT_REACHED ();
407
408     case OP_ni_format:
409       msg_disable ();
410       if ((*node)->type == OP_format
411           && fmt_check_input (&(*node)->format.f)
412           && fmt_check_type_compat (&(*node)->format.f, VAL_NUMERIC))
413         {
414           msg_enable ();
415           if (do_coercion)
416             (*node)->type = OP_ni_format;
417           return true;
418         }
419       msg_enable ();
420       break;
421
422     case OP_no_format:
423       msg_disable ();
424       if ((*node)->type == OP_format
425           && fmt_check_output (&(*node)->format.f)
426           && fmt_check_type_compat (&(*node)->format.f, VAL_NUMERIC))
427         {
428           msg_enable ();
429           if (do_coercion)
430             (*node)->type = OP_no_format;
431           return true;
432         }
433       msg_enable ();
434       break;
435
436     case OP_num_var:
437       if ((*node)->type == OP_NUM_VAR)
438         {
439           if (do_coercion)
440             *node = (*node)->composite.args[0];
441           return true;
442         }
443       break;
444
445     case OP_str_var:
446       if ((*node)->type == OP_STR_VAR)
447         {
448           if (do_coercion)
449             *node = (*node)->composite.args[0];
450           return true;
451         }
452       break;
453
454     case OP_var:
455       if ((*node)->type == OP_NUM_VAR || (*node)->type == OP_STR_VAR)
456         {
457           if (do_coercion)
458             *node = (*node)->composite.args[0];
459           return true;
460         }
461       break;
462
463     case OP_pos_int:
464       if ((*node)->type == OP_number
465           && floor ((*node)->number.n) == (*node)->number.n
466           && (*node)->number.n > 0 && (*node)->number.n < INT_MAX)
467         {
468           if (do_coercion)
469             *node = expr_allocate_pos_int (e, (*node)->number.n);
470           return true;
471         }
472       break;
473
474     default:
475       NOT_REACHED ();
476     }
477
478   if (do_coercion)
479     {
480       msg (SE, _("Type mismatch while applying %s operator: "
481                  "cannot convert %s to %s."),
482            operator_name,
483            atom_type_name (actual_type), atom_type_name (required_type));
484       *node = NULL;
485     }
486   return false;
487 }
488
489 /* Coerces *NODE to type REQUIRED_TYPE, and returns success.  If
490    *NODE cannot be coerced to the desired type then we issue an
491    error message about operator OPERATOR_NAME and free *NODE. */
492 static bool
493 type_coercion (struct expression *e,
494                atom_type required_type, union any_node **node,
495                const char *operator_name)
496 {
497   return type_coercion_core (e, required_type, node, operator_name, true);
498 }
499
500 /* Coerces *NODE to type REQUIRED_TYPE.
501    Assert-fails if the coercion is disallowed. */
502 static void
503 type_coercion_assert (struct expression *e,
504                       atom_type required_type, union any_node **node)
505 {
506   int success = type_coercion_core (e, required_type, node, NULL, true);
507   assert (success);
508 }
509
510 /* Returns true if *NODE may be coerced to type REQUIRED_TYPE,
511    false otherwise. */
512 static bool
513 is_coercible (atom_type required_type, union any_node *const *node)
514 {
515   return type_coercion_core (NULL, required_type,
516                              (union any_node **) node, NULL, false);
517 }
518
519 /* Returns true if ACTUAL_TYPE is a kind of REQUIRED_TYPE, false
520    otherwise. */
521 static bool
522 is_compatible (atom_type required_type, atom_type actual_type)
523 {
524   return (required_type == actual_type
525           || (required_type == OP_var
526               && (actual_type == OP_num_var || actual_type == OP_str_var)));
527 }
528
529 /* How to parse an operator. */
530 struct operator
531   {
532     int token;                  /* Token representing operator. */
533     operation_type type;        /* Operation type representing operation. */
534     const char *name;           /* Name of operator. */
535   };
536
537 /* Attempts to match the current token against the tokens for the
538    OP_CNT operators in OPS[].  If successful, returns true
539    and, if OPERATOR is non-null, sets *OPERATOR to the operator.
540    On failure, returns false and, if OPERATOR is non-null, sets
541    *OPERATOR to a null pointer. */
542 static bool
543 match_operator (struct lexer *lexer, const struct operator ops[], size_t op_cnt,
544                 const struct operator **operator)
545 {
546   const struct operator *op;
547
548   for (op = ops; op < ops + op_cnt; op++)
549     if (lex_token (lexer) == op->token)
550       {
551         if (op->token != T_NEG_NUM)
552           lex_get (lexer);
553         if (operator != NULL)
554           *operator = op;
555         return true;
556       }
557   if (operator != NULL)
558     *operator = NULL;
559   return false;
560 }
561
562 static bool
563 check_operator (const struct operator *op, int arg_cnt, atom_type arg_type)
564 {
565   const struct operation *o;
566   size_t i;
567
568   assert (op != NULL);
569   o = &operations[op->type];
570   assert (o->arg_cnt == arg_cnt);
571   assert ((o->flags & OPF_ARRAY_OPERAND) == 0);
572   for (i = 0; i < arg_cnt; i++)
573     assert (is_compatible (arg_type, o->args[i]));
574   return true;
575 }
576
577 static bool
578 check_binary_operators (const struct operator ops[], size_t op_cnt,
579                         atom_type arg_type)
580 {
581   size_t i;
582
583   for (i = 0; i < op_cnt; i++)
584     check_operator (&ops[i], 2, arg_type);
585   return true;
586 }
587
588 static atom_type
589 get_operand_type (const struct operator *op)
590 {
591   return operations[op->type].args[0];
592 }
593
594 /* Parses a chain of left-associative operator/operand pairs.
595    There are OP_CNT operators, specified in OPS[].  The
596    operators' operands must all be the same type.  The next
597    higher level is parsed by PARSE_NEXT_LEVEL.  If CHAIN_WARNING
598    is non-null, then it will be issued as a warning if more than
599    one operator/operand pair is parsed. */
600 static union any_node *
601 parse_binary_operators (struct lexer *lexer, struct expression *e, union any_node *node,
602                         const struct operator ops[], size_t op_cnt,
603                         parse_recursively_func *parse_next_level,
604                         const char *chain_warning)
605 {
606   atom_type operand_type = get_operand_type (&ops[0]);
607   int op_count;
608   const struct operator *operator;
609
610   assert (check_binary_operators (ops, op_cnt, operand_type));
611   if (node == NULL)
612     return node;
613
614   for (op_count = 0; match_operator (lexer, ops, op_cnt, &operator); op_count++)
615     {
616       union any_node *rhs;
617
618       /* Convert the left-hand side to type OPERAND_TYPE. */
619       if (!type_coercion (e, operand_type, &node, operator->name))
620         return NULL;
621
622       /* Parse the right-hand side and coerce to type
623          OPERAND_TYPE. */
624       rhs = parse_next_level (lexer, e);
625       if (!type_coercion (e, operand_type, &rhs, operator->name))
626         return NULL;
627       node = expr_allocate_binary (e, operator->type, node, rhs);
628     }
629
630   if (op_count > 1 && chain_warning != NULL)
631     msg (SW, "%s", chain_warning);
632
633   return node;
634 }
635
636 static union any_node *
637 parse_inverting_unary_operator (struct lexer *lexer, struct expression *e,
638                                 const struct operator *op,
639                                 parse_recursively_func *parse_next_level)
640 {
641   union any_node *node;
642   unsigned op_count;
643
644   check_operator (op, 1, get_operand_type (op));
645
646   op_count = 0;
647   while (match_operator (lexer, op, 1, NULL))
648     op_count++;
649
650   node = parse_next_level (lexer, e);
651   if (op_count > 0
652       && type_coercion (e, get_operand_type (op), &node, op->name)
653       && op_count % 2 != 0)
654     return expr_allocate_unary (e, op->type, node);
655   else
656     return node;
657 }
658
659 /* Parses the OR level. */
660 static union any_node *
661 parse_or (struct lexer *lexer, struct expression *e)
662 {
663   static const struct operator op =
664     { T_OR, OP_OR, "logical disjunction (`OR')" };
665
666   return parse_binary_operators (lexer, e, parse_and (lexer, e), &op, 1, parse_and, NULL);
667 }
668
669 /* Parses the AND level. */
670 static union any_node *
671 parse_and (struct lexer *lexer, struct expression *e)
672 {
673   static const struct operator op =
674     { T_AND, OP_AND, "logical conjunction (`AND')" };
675
676   return parse_binary_operators (lexer, e, parse_not (lexer, e),
677                                  &op, 1, parse_not, NULL);
678 }
679
680 /* Parses the NOT level. */
681 static union any_node *
682 parse_not (struct lexer *lexer, struct expression *e)
683 {
684   static const struct operator op
685     = { T_NOT, OP_NOT, "logical negation (`NOT')" };
686   return parse_inverting_unary_operator (lexer, e, &op, parse_rel);
687 }
688
689 /* Parse relational operators. */
690 static union any_node *
691 parse_rel (struct lexer *lexer, struct expression *e)
692 {
693   const char *chain_warning =
694     _("Chaining relational operators (e.g. `a < b < c') will "
695       "not produce the mathematically expected result.  "
696       "Use the AND logical operator to fix the problem "
697       "(e.g. `a < b AND b < c').  "
698       "If chaining is really intended, parentheses will disable "
699       "this warning (e.g. `(a < b) < c'.)");
700
701   union any_node *node = parse_add (lexer, e);
702
703   if (node == NULL)
704     return NULL;
705
706   switch (expr_node_returns (node))
707     {
708     case OP_number:
709     case OP_boolean:
710       {
711         static const struct operator ops[] =
712           {
713             { T_EQUALS, OP_EQ, "numeric equality (`=')" },
714             { T_EQ, OP_EQ, "numeric equality (`EQ')" },
715             { T_GE, OP_GE, "numeric greater-than-or-equal-to (`>=')" },
716             { T_GT, OP_GT, "numeric greater than (`>')" },
717             { T_LE, OP_LE, "numeric less-than-or-equal-to (`<=')" },
718             { T_LT, OP_LT, "numeric less than (`<')" },
719             { T_NE, OP_NE, "numeric inequality (`<>')" },
720           };
721
722         return parse_binary_operators (lexer, e, node, ops,
723                                        sizeof ops / sizeof *ops,
724                                        parse_add, chain_warning);
725       }
726
727     case OP_string:
728       {
729         static const struct operator ops[] =
730           {
731             { T_EQUALS, OP_EQ_STRING, "string equality (`=')" },
732             { T_EQ, OP_EQ_STRING, "string equality (`EQ')" },
733             { T_GE, OP_GE_STRING, "string greater-than-or-equal-to (`>=')" },
734             { T_GT, OP_GT_STRING, "string greater than (`>')" },
735             { T_LE, OP_LE_STRING, "string less-than-or-equal-to (`<=')" },
736             { T_LT, OP_LT_STRING, "string less than (`<')" },
737             { T_NE, OP_NE_STRING, "string inequality (`<>')" },
738           };
739
740         return parse_binary_operators (lexer, e, node, ops,
741                                        sizeof ops / sizeof *ops,
742                                        parse_add, chain_warning);
743       }
744
745     default:
746       return node;
747     }
748 }
749
750 /* Parses the addition and subtraction level. */
751 static union any_node *
752 parse_add (struct lexer *lexer, struct expression *e)
753 {
754   static const struct operator ops[] =
755     {
756       { T_PLUS, OP_ADD, "addition (`+')" },
757       { T_DASH, OP_SUB, "subtraction (`-')" },
758       { T_NEG_NUM, OP_ADD, "subtraction (`-')" },
759     };
760
761   return parse_binary_operators (lexer, e, parse_mul (lexer, e),
762                                  ops, sizeof ops / sizeof *ops,
763                                  parse_mul, NULL);
764 }
765
766 /* Parses the multiplication and division level. */
767 static union any_node *
768 parse_mul (struct lexer *lexer, struct expression *e)
769 {
770   static const struct operator ops[] =
771     {
772       { T_ASTERISK, OP_MUL, "multiplication (`*')" },
773       { T_SLASH, OP_DIV, "division (`/')" },
774     };
775
776   return parse_binary_operators (lexer, e, parse_neg (lexer, e),
777                                  ops, sizeof ops / sizeof *ops,
778                                  parse_neg, NULL);
779 }
780
781 /* Parses the unary minus level. */
782 static union any_node *
783 parse_neg (struct lexer *lexer, struct expression *e)
784 {
785   static const struct operator op = { T_DASH, OP_NEG, "negation (`-')" };
786   return parse_inverting_unary_operator (lexer, e, &op, parse_exp);
787 }
788
789 static union any_node *
790 parse_exp (struct lexer *lexer, struct expression *e)
791 {
792   static const struct operator op =
793     { T_EXP, OP_POW, "exponentiation (`**')" };
794
795   const char *chain_warning =
796     _("The exponentiation operator (`**') is left-associative, "
797       "even though right-associative semantics are more useful.  "
798       "That is, `a**b**c' equals `(a**b)**c', not as `a**(b**c)'.  "
799       "To disable this warning, insert parentheses.");
800
801   union any_node *lhs, *node;
802   bool negative = false;
803
804   if (lex_token (lexer) == T_NEG_NUM)
805     {
806       lhs = expr_allocate_number (e, -lex_tokval (lexer));
807       negative = true;
808       lex_get (lexer);
809     }
810   else
811     lhs = parse_primary (lexer, e);
812
813   node = parse_binary_operators (lexer, e, lhs, &op, 1,
814                                   parse_primary, chain_warning);
815   return negative ? expr_allocate_unary (e, OP_NEG, node) : node;
816 }
817
818 /* Parses system variables. */
819 static union any_node *
820 parse_sysvar (struct lexer *lexer, struct expression *e)
821 {
822   if (lex_match_id (lexer, "$CASENUM"))
823     return expr_allocate_nullary (e, OP_CASENUM);
824   else if (lex_match_id (lexer, "$DATE"))
825     {
826       static const char *months[12] =
827         {
828           "JAN", "FEB", "MAR", "APR", "MAY", "JUN",
829           "JUL", "AUG", "SEP", "OCT", "NOV", "DEC",
830         };
831
832       time_t last_proc_time = time_of_last_procedure (e->ds);
833       struct tm *time;
834       char temp_buf[10];
835       struct substring s;
836
837       time = localtime (&last_proc_time);
838       sprintf (temp_buf, "%02d %s %02d", abs (time->tm_mday) % 100,
839                months[abs (time->tm_mon) % 12], abs (time->tm_year) % 100);
840
841       ss_alloc_substring (&s, ss_cstr (temp_buf));
842       return expr_allocate_string (e, s);
843     }
844   else if (lex_match_id (lexer, "$TRUE"))
845     return expr_allocate_boolean (e, 1.0);
846   else if (lex_match_id (lexer, "$FALSE"))
847     return expr_allocate_boolean (e, 0.0);
848   else if (lex_match_id (lexer, "$SYSMIS"))
849     return expr_allocate_number (e, SYSMIS);
850   else if (lex_match_id (lexer, "$JDATE"))
851     {
852       time_t time = time_of_last_procedure (e->ds);
853       struct tm *tm = localtime (&time);
854       return expr_allocate_number (e, expr_ymd_to_ofs (tm->tm_year + 1900,
855                                                        tm->tm_mon + 1,
856                                                        tm->tm_mday));
857     }
858   else if (lex_match_id (lexer, "$TIME"))
859     {
860       time_t time = time_of_last_procedure (e->ds);
861       struct tm *tm = localtime (&time);
862       return expr_allocate_number (e,
863                                    expr_ymd_to_date (tm->tm_year + 1900,
864                                                      tm->tm_mon + 1,
865                                                      tm->tm_mday)
866                                    + tm->tm_hour * 60 * 60.
867                                    + tm->tm_min * 60.
868                                    + tm->tm_sec);
869     }
870   else if (lex_match_id (lexer, "$LENGTH"))
871     return expr_allocate_number (e, settings_get_viewlength ());
872   else if (lex_match_id (lexer, "$WIDTH"))
873     return expr_allocate_number (e, settings_get_viewwidth ());
874   else
875     {
876       msg (SE, _("Unknown system variable %s."), lex_tokcstr (lexer));
877       return NULL;
878     }
879 }
880
881 /* Parses numbers, varnames, etc. */
882 static union any_node *
883 parse_primary (struct lexer *lexer, struct expression *e)
884 {
885   switch (lex_token (lexer))
886     {
887     case T_ID:
888       if (lex_next_token (lexer, 1) == T_LPAREN)
889         {
890           /* An identifier followed by a left parenthesis may be
891              a vector element reference.  If not, it's a function
892              call. */
893           if (e->ds != NULL && dict_lookup_vector (dataset_dict (e->ds), lex_tokcstr (lexer)) != NULL)
894             return parse_vector_element (lexer, e);
895           else
896             return parse_function (lexer, e);
897         }
898       else if (lex_tokcstr (lexer)[0] == '$')
899         {
900           /* $ at the beginning indicates a system variable. */
901           return parse_sysvar (lexer, e);
902         }
903       else if (e->ds != NULL && dict_lookup_var (dataset_dict (e->ds), lex_tokcstr (lexer)))
904         {
905           /* It looks like a user variable.
906              (It could be a format specifier, but we'll assume
907              it's a variable unless proven otherwise. */
908           return allocate_unary_variable (e, parse_variable (lexer, dataset_dict (e->ds)));
909         }
910       else
911         {
912           /* Try to parse it as a format specifier. */
913           struct fmt_spec fmt;
914           bool ok;
915
916           msg_disable ();
917           ok = parse_format_specifier (lexer, &fmt);
918           msg_enable ();
919
920           if (ok)
921             return expr_allocate_format (e, &fmt);
922
923           /* All attempts failed. */
924           msg (SE, _("Unknown identifier %s."), lex_tokcstr (lexer));
925           return NULL;
926         }
927       break;
928
929     case T_POS_NUM:
930     case T_NEG_NUM:
931       {
932         union any_node *node = expr_allocate_number (e, lex_tokval (lexer));
933         lex_get (lexer);
934         return node;
935       }
936
937     case T_STRING:
938       {
939         const char *dict_encoding;
940         union any_node *node;
941         char *s;
942
943         dict_encoding = (e->ds != NULL
944                          ? dict_get_encoding (dataset_dict (e->ds))
945                          : "UTF-8");
946         s = recode_string_pool (dict_encoding, "UTF-8", lex_tokcstr (lexer),
947                            ss_length (lex_tokss (lexer)), e->expr_pool);
948         node = expr_allocate_string (e, ss_cstr (s));
949
950         lex_get (lexer);
951         return node;
952       }
953
954     case T_LPAREN:
955       {
956         union any_node *node;
957         lex_get (lexer);
958         node = parse_or (lexer, e);
959         if (node != NULL && !lex_force_match (lexer, T_RPAREN))
960           return NULL;
961         return node;
962       }
963
964     default:
965       lex_error (lexer, NULL);
966       return NULL;
967     }
968 }
969
970 static union any_node *
971 parse_vector_element (struct lexer *lexer, struct expression *e)
972 {
973   const struct vector *vector;
974   union any_node *element;
975
976   /* Find vector, skip token.
977      The caller must already have verified that the current token
978      is the name of a vector. */
979   vector = dict_lookup_vector (dataset_dict (e->ds), lex_tokcstr (lexer));
980   assert (vector != NULL);
981   lex_get (lexer);
982
983   /* Skip left parenthesis token.
984      The caller must have verified that the lookahead is a left
985      parenthesis. */
986   assert (lex_token (lexer) == T_LPAREN);
987   lex_get (lexer);
988
989   element = parse_or (lexer, e);
990   if (!type_coercion (e, OP_number, &element, "vector indexing")
991       || !lex_match (lexer, T_RPAREN))
992     return NULL;
993
994   return expr_allocate_binary (e, (vector_get_type (vector) == VAL_NUMERIC
995                                    ? OP_VEC_ELEM_NUM : OP_VEC_ELEM_STR),
996                                element, expr_allocate_vector (e, vector));
997 }
998 \f
999 /* Individual function parsing. */
1000
1001 const struct operation operations[OP_first + OP_cnt] = {
1002 #include "parse.inc"
1003 };
1004
1005 static bool
1006 word_matches (const char **test, const char **name)
1007 {
1008   size_t test_len = strcspn (*test, ".");
1009   size_t name_len = strcspn (*name, ".");
1010   if (test_len == name_len)
1011     {
1012       if (buf_compare_case (*test, *name, test_len))
1013         return false;
1014     }
1015   else if (test_len < 3 || test_len > name_len)
1016     return false;
1017   else
1018     {
1019       if (buf_compare_case (*test, *name, test_len))
1020         return false;
1021     }
1022
1023   *test += test_len;
1024   *name += name_len;
1025   if (**test != **name)
1026     return false;
1027
1028   if (**test == '.')
1029     {
1030       (*test)++;
1031       (*name)++;
1032     }
1033   return true;
1034 }
1035
1036 static int
1037 compare_names (const char *test, const char *name, bool abbrev_ok)
1038 {
1039   if (!abbrev_ok)
1040     return true;
1041
1042   for (;;)
1043     {
1044       if (!word_matches (&test, &name))
1045         return true;
1046       if (*name == '\0' && *test == '\0')
1047         return false;
1048     }
1049 }
1050
1051 static int
1052 compare_strings (const char *test, const char *name, bool abbrev_ok UNUSED)
1053 {
1054   return c_strcasecmp (test, name);
1055 }
1056
1057 static bool
1058 lookup_function_helper (const char *name,
1059                         int (*compare) (const char *test, const char *name,
1060                                         bool abbrev_ok),
1061                         const struct operation **first,
1062                         const struct operation **last)
1063 {
1064   const struct operation *f;
1065
1066   for (f = operations + OP_function_first;
1067        f <= operations + OP_function_last; f++)
1068     if (!compare (name, f->name, !(f->flags & OPF_NO_ABBREV)))
1069       {
1070         *first = f;
1071
1072         while (f <= operations + OP_function_last
1073                && !compare (name, f->name, !(f->flags & OPF_NO_ABBREV)))
1074           f++;
1075         *last = f;
1076
1077         return true;
1078       }
1079
1080   return false;
1081 }
1082
1083 static bool
1084 lookup_function (const char *name,
1085                  const struct operation **first,
1086                  const struct operation **last)
1087 {
1088   *first = *last = NULL;
1089   return (lookup_function_helper (name, compare_strings, first, last)
1090           || lookup_function_helper (name, compare_names, first, last));
1091 }
1092
1093 static int
1094 extract_min_valid (const char *s)
1095 {
1096   char *p = strrchr (s, '.');
1097   if (p == NULL
1098       || p[1] < '0' || p[1] > '9'
1099       || strspn (p + 1, "0123456789") != strlen (p + 1))
1100     return -1;
1101   *p = '\0';
1102   return atoi (p + 1);
1103 }
1104
1105 static atom_type
1106 function_arg_type (const struct operation *f, size_t arg_idx)
1107 {
1108   assert (arg_idx < f->arg_cnt || (f->flags & OPF_ARRAY_OPERAND));
1109
1110   return f->args[arg_idx < f->arg_cnt ? arg_idx : f->arg_cnt - 1];
1111 }
1112
1113 static bool
1114 match_function (union any_node **args, int arg_cnt, const struct operation *f)
1115 {
1116   size_t i;
1117
1118   if (arg_cnt < f->arg_cnt
1119       || (arg_cnt > f->arg_cnt && (f->flags & OPF_ARRAY_OPERAND) == 0)
1120       || arg_cnt - (f->arg_cnt - 1) < f->array_min_elems)
1121     return false;
1122
1123   for (i = 0; i < arg_cnt; i++)
1124     if (!is_coercible (function_arg_type (f, i), &args[i]))
1125       return false;
1126
1127   return true;
1128 }
1129
1130 static void
1131 coerce_function_args (struct expression *e, const struct operation *f,
1132                       union any_node **args, size_t arg_cnt)
1133 {
1134   int i;
1135
1136   for (i = 0; i < arg_cnt; i++)
1137     type_coercion_assert (e, function_arg_type (f, i), &args[i]);
1138 }
1139
1140 static bool
1141 validate_function_args (const struct operation *f, int arg_cnt, int min_valid)
1142 {
1143   /* Count the function arguments that go into the trailing array (if any).  We
1144      know that there must be at least the minimum number because
1145      match_function() already checked. */
1146   int array_arg_cnt = arg_cnt - (f->arg_cnt - 1);
1147   assert (array_arg_cnt >= f->array_min_elems);
1148
1149   if ((f->flags & OPF_ARRAY_OPERAND)
1150       && array_arg_cnt % f->array_granularity != 0)
1151     {
1152       /* RANGE is the only case we have so far.  It has paired arguments with
1153          one initial argument, and that's the only special case we deal with
1154          here. */
1155       assert (f->array_granularity == 2);
1156       assert (arg_cnt % 2 == 0);
1157       msg (SE, _("%s must have an odd number of arguments."), f->prototype);
1158       return false;
1159     }
1160
1161   if (min_valid != -1)
1162     {
1163       if (f->array_min_elems == 0)
1164         {
1165           assert ((f->flags & OPF_MIN_VALID) == 0);
1166           msg (SE, _("%s function cannot accept suffix .%d to specify the "
1167                      "minimum number of valid arguments."),
1168                f->prototype, min_valid);
1169           return false;
1170         }
1171       else
1172         {
1173           assert (f->flags & OPF_MIN_VALID);
1174           if (min_valid > array_arg_cnt)
1175             {
1176               msg (SE, _("For %s with %d arguments, at most %d (not %d) may be "
1177                          "required to be valid."),
1178                    f->prototype, arg_cnt, array_arg_cnt, min_valid);
1179               return false;
1180             }
1181         }
1182     }
1183
1184   return true;
1185 }
1186
1187 static void
1188 add_arg (union any_node ***args, int *arg_cnt, int *arg_cap,
1189          union any_node *arg)
1190 {
1191   if (*arg_cnt >= *arg_cap)
1192     {
1193       *arg_cap += 8;
1194       *args = xrealloc (*args, sizeof **args * *arg_cap);
1195     }
1196
1197   (*args)[(*arg_cnt)++] = arg;
1198 }
1199
1200 static void
1201 put_invocation (struct string *s,
1202                 const char *func_name, union any_node **args, size_t arg_cnt)
1203 {
1204   size_t i;
1205
1206   ds_put_format (s, "%s(", func_name);
1207   for (i = 0; i < arg_cnt; i++)
1208     {
1209       if (i > 0)
1210         ds_put_cstr (s, ", ");
1211       ds_put_cstr (s, operations[expr_node_returns (args[i])].prototype);
1212     }
1213   ds_put_byte (s, ')');
1214 }
1215
1216 static void
1217 no_match (const char *func_name,
1218           union any_node **args, size_t arg_cnt,
1219           const struct operation *first, const struct operation *last)
1220 {
1221   struct string s;
1222   const struct operation *f;
1223
1224   ds_init_empty (&s);
1225
1226   if (last - first == 1)
1227     {
1228       ds_put_format (&s, _("Type mismatch invoking %s as "), first->prototype);
1229       put_invocation (&s, func_name, args, arg_cnt);
1230     }
1231   else
1232     {
1233       ds_put_cstr (&s, _("Function invocation "));
1234       put_invocation (&s, func_name, args, arg_cnt);
1235       ds_put_cstr (&s, _(" does not match any known function.  Candidates are:"));
1236
1237       for (f = first; f < last; f++)
1238         ds_put_format (&s, "\n%s", f->prototype);
1239     }
1240   ds_put_byte (&s, '.');
1241
1242   msg (SE, "%s", ds_cstr (&s));
1243
1244   ds_destroy (&s);
1245 }
1246
1247 static union any_node *
1248 parse_function (struct lexer *lexer, struct expression *e)
1249 {
1250   int min_valid;
1251   const struct operation *f, *first, *last;
1252
1253   union any_node **args = NULL;
1254   int arg_cnt = 0;
1255   int arg_cap = 0;
1256
1257   struct string func_name;
1258
1259   union any_node *n;
1260
1261   ds_init_substring (&func_name, lex_tokss (lexer));
1262   min_valid = extract_min_valid (lex_tokcstr (lexer));
1263   if (!lookup_function (lex_tokcstr (lexer), &first, &last))
1264     {
1265       msg (SE, _("No function or vector named %s."), lex_tokcstr (lexer));
1266       ds_destroy (&func_name);
1267       return NULL;
1268     }
1269
1270   lex_get (lexer);
1271   if (!lex_force_match (lexer, T_LPAREN))
1272     {
1273       ds_destroy (&func_name);
1274       return NULL;
1275     }
1276
1277   args = NULL;
1278   arg_cnt = arg_cap = 0;
1279   if (lex_token (lexer) != T_RPAREN)
1280     for (;;)
1281       {
1282         if (lex_token (lexer) == T_ID
1283             && lex_next_token (lexer, 1) == T_TO)
1284           {
1285             const struct variable **vars;
1286             size_t var_cnt;
1287             size_t i;
1288
1289             if (!parse_variables_const (lexer, dataset_dict (e->ds), &vars, &var_cnt, PV_SINGLE))
1290               goto fail;
1291             for (i = 0; i < var_cnt; i++)
1292               add_arg (&args, &arg_cnt, &arg_cap,
1293                        allocate_unary_variable (e, vars[i]));
1294             free (vars);
1295           }
1296         else
1297           {
1298             union any_node *arg = parse_or (lexer, e);
1299             if (arg == NULL)
1300               goto fail;
1301
1302             add_arg (&args, &arg_cnt, &arg_cap, arg);
1303           }
1304         if (lex_match (lexer, T_RPAREN))
1305           break;
1306         else if (!lex_match (lexer, T_COMMA))
1307           {
1308             lex_error_expecting (lexer, "`,'", "`)'");
1309             goto fail;
1310           }
1311       }
1312
1313   for (f = first; f < last; f++)
1314     if (match_function (args, arg_cnt, f))
1315       break;
1316   if (f >= last)
1317     {
1318       no_match (ds_cstr (&func_name), args, arg_cnt, first, last);
1319       goto fail;
1320     }
1321
1322   coerce_function_args (e, f, args, arg_cnt);
1323   if (!validate_function_args (f, arg_cnt, min_valid))
1324     goto fail;
1325
1326   if ((f->flags & OPF_EXTENSION) && settings_get_syntax () == COMPATIBLE)
1327     msg (SW, _("%s is a PSPP extension."), f->prototype);
1328   if (f->flags & OPF_UNIMPLEMENTED)
1329     {
1330       msg (SE, _("%s is not available in this version of PSPP."),
1331            f->prototype);
1332       goto fail;
1333     }
1334   if ((f->flags & OPF_PERM_ONLY) &&
1335       proc_in_temporary_transformations (e->ds))
1336     {
1337       msg (SE, _("%s may not appear after %s."), f->prototype, "TEMPORARY");
1338       goto fail;
1339     }
1340
1341   n = expr_allocate_composite (e, f - operations, args, arg_cnt);
1342   n->composite.min_valid = min_valid != -1 ? min_valid : f->array_min_elems;
1343
1344   if (n->type == OP_LAG_Vn || n->type == OP_LAG_Vs)
1345     dataset_need_lag (e->ds, 1);
1346   else if (n->type == OP_LAG_Vnn || n->type == OP_LAG_Vsn)
1347     {
1348       int n_before;
1349       assert (n->composite.arg_cnt == 2);
1350       assert (n->composite.args[1]->type == OP_pos_int);
1351       n_before = n->composite.args[1]->integer.i;
1352       dataset_need_lag (e->ds, n_before);
1353     }
1354
1355   free (args);
1356   ds_destroy (&func_name);
1357   return n;
1358
1359 fail:
1360   free (args);
1361   ds_destroy (&func_name);
1362   return NULL;
1363 }
1364 \f
1365 /* Utility functions. */
1366
1367 static struct expression *
1368 expr_create (struct dataset *ds)
1369 {
1370   struct pool *pool = pool_create ();
1371   struct expression *e = pool_alloc (pool, sizeof *e);
1372   e->expr_pool = pool;
1373   e->ds = ds;
1374   e->eval_pool = pool_create_subpool (e->expr_pool);
1375   e->ops = NULL;
1376   e->op_types = NULL;
1377   e->op_cnt = e->op_cap = 0;
1378   return e;
1379 }
1380
1381 atom_type
1382 expr_node_returns (const union any_node *n)
1383 {
1384   assert (n != NULL);
1385   assert (is_operation (n->type));
1386   if (is_atom (n->type))
1387     return n->type;
1388   else if (is_composite (n->type))
1389     return operations[n->type].returns;
1390   else
1391     NOT_REACHED ();
1392 }
1393
1394 static const char *
1395 atom_type_name (atom_type type)
1396 {
1397   assert (is_atom (type));
1398   return operations[type].name;
1399 }
1400
1401 union any_node *
1402 expr_allocate_nullary (struct expression *e, operation_type op)
1403 {
1404   return expr_allocate_composite (e, op, NULL, 0);
1405 }
1406
1407 union any_node *
1408 expr_allocate_unary (struct expression *e, operation_type op,
1409                      union any_node *arg0)
1410 {
1411   return expr_allocate_composite (e, op, &arg0, 1);
1412 }
1413
1414 union any_node *
1415 expr_allocate_binary (struct expression *e, operation_type op,
1416                       union any_node *arg0, union any_node *arg1)
1417 {
1418   union any_node *args[2];
1419   args[0] = arg0;
1420   args[1] = arg1;
1421   return expr_allocate_composite (e, op, args, 2);
1422 }
1423
1424 static bool
1425 is_valid_node (union any_node *n)
1426 {
1427   const struct operation *op;
1428   size_t i;
1429
1430   assert (n != NULL);
1431   assert (is_operation (n->type));
1432   op = &operations[n->type];
1433
1434   if (!is_atom (n->type))
1435     {
1436       struct composite_node *c = &n->composite;
1437
1438       assert (is_composite (n->type));
1439       assert (c->arg_cnt >= op->arg_cnt);
1440       for (i = 0; i < op->arg_cnt; i++)
1441         assert (is_compatible (op->args[i], expr_node_returns (c->args[i])));
1442       if (c->arg_cnt > op->arg_cnt && !is_operator (n->type))
1443         {
1444           assert (op->flags & OPF_ARRAY_OPERAND);
1445           for (i = 0; i < c->arg_cnt; i++)
1446             assert (is_compatible (op->args[op->arg_cnt - 1],
1447                                    expr_node_returns (c->args[i])));
1448         }
1449     }
1450
1451   return true;
1452 }
1453
1454 union any_node *
1455 expr_allocate_composite (struct expression *e, operation_type op,
1456                          union any_node **args, size_t arg_cnt)
1457 {
1458   union any_node *n;
1459   size_t i;
1460
1461   n = pool_alloc (e->expr_pool, sizeof n->composite);
1462   n->type = op;
1463   n->composite.arg_cnt = arg_cnt;
1464   n->composite.args = pool_alloc (e->expr_pool,
1465                                   sizeof *n->composite.args * arg_cnt);
1466   for (i = 0; i < arg_cnt; i++)
1467     {
1468       if (args[i] == NULL)
1469         return NULL;
1470       n->composite.args[i] = args[i];
1471     }
1472   memcpy (n->composite.args, args, sizeof *n->composite.args * arg_cnt);
1473   n->composite.min_valid = 0;
1474   assert (is_valid_node (n));
1475   return n;
1476 }
1477
1478 union any_node *
1479 expr_allocate_number (struct expression *e, double d)
1480 {
1481   union any_node *n = pool_alloc (e->expr_pool, sizeof n->number);
1482   n->type = OP_number;
1483   n->number.n = d;
1484   return n;
1485 }
1486
1487 union any_node *
1488 expr_allocate_boolean (struct expression *e, double b)
1489 {
1490   union any_node *n = pool_alloc (e->expr_pool, sizeof n->number);
1491   assert (b == 0.0 || b == 1.0 || b == SYSMIS);
1492   n->type = OP_boolean;
1493   n->number.n = b;
1494   return n;
1495 }
1496
1497 union any_node *
1498 expr_allocate_integer (struct expression *e, int i)
1499 {
1500   union any_node *n = pool_alloc (e->expr_pool, sizeof n->integer);
1501   n->type = OP_integer;
1502   n->integer.i = i;
1503   return n;
1504 }
1505
1506 union any_node *
1507 expr_allocate_pos_int (struct expression *e, int i)
1508 {
1509   union any_node *n = pool_alloc (e->expr_pool, sizeof n->integer);
1510   assert (i > 0);
1511   n->type = OP_pos_int;
1512   n->integer.i = i;
1513   return n;
1514 }
1515
1516 union any_node *
1517 expr_allocate_vector (struct expression *e, const struct vector *vector)
1518 {
1519   union any_node *n = pool_alloc (e->expr_pool, sizeof n->vector);
1520   n->type = OP_vector;
1521   n->vector.v = vector;
1522   return n;
1523 }
1524
1525 union any_node *
1526 expr_allocate_string (struct expression *e, struct substring s)
1527 {
1528   union any_node *n = pool_alloc (e->expr_pool, sizeof n->string);
1529   n->type = OP_string;
1530   n->string.s = s;
1531   return n;
1532 }
1533
1534 union any_node *
1535 expr_allocate_variable (struct expression *e, const struct variable *v)
1536 {
1537   union any_node *n = pool_alloc (e->expr_pool, sizeof n->variable);
1538   n->type = var_is_numeric (v) ? OP_num_var : OP_str_var;
1539   n->variable.v = v;
1540   return n;
1541 }
1542
1543 union any_node *
1544 expr_allocate_format (struct expression *e, const struct fmt_spec *format)
1545 {
1546   union any_node *n = pool_alloc (e->expr_pool, sizeof n->format);
1547   n->type = OP_format;
1548   n->format.f = *format;
1549   return n;
1550 }
1551
1552 /* Allocates a unary composite node that represents the value of
1553    variable V in expression E. */
1554 static union any_node *
1555 allocate_unary_variable (struct expression *e, const struct variable *v)
1556 {
1557   assert (v != NULL);
1558   return expr_allocate_unary (e, var_is_numeric (v) ? OP_NUM_VAR : OP_STR_VAR,
1559                               expr_allocate_variable (e, v));
1560 }
1561 \f
1562 /* Export function details to other modules. */
1563
1564 /* Returns the operation structure for the function with the
1565    given IDX. */
1566 const struct operation *
1567 expr_get_function (size_t idx)
1568 {
1569   assert (idx < OP_function_cnt);
1570   return &operations[OP_function_first + idx];
1571 }
1572
1573 /* Returns the number of expression functions. */
1574 size_t
1575 expr_get_function_cnt (void)
1576 {
1577   return OP_function_cnt;
1578 }
1579
1580 /* Returns the name of operation OP. */
1581 const char *
1582 expr_operation_get_name (const struct operation *op)
1583 {
1584   return op->name;
1585 }
1586
1587 /* Returns the human-readable prototype for operation OP. */
1588 const char *
1589 expr_operation_get_prototype (const struct operation *op)
1590 {
1591   return op->prototype;
1592 }
1593
1594 /* Returns the number of arguments for operation OP. */
1595 int
1596 expr_operation_get_arg_cnt (const struct operation *op)
1597 {
1598   return op->arg_cnt;
1599 }