14b122fee0eb1d2cdbe95b1fbc22bfa6757dbfda
[pspp] / src / data / variable.c
1 /* PSPP - a program for statistical analysis.
2    Copyright (C) 1997-9, 2000, 2006, 2009, 2010, 2011, 2012, 2013, 2014, 2016 Free Software Foundation, Inc.
3
4    This program is free software: you can redistribute it and/or modify
5    it under the terms of the GNU General Public License as published by
6    the Free Software Foundation, either version 3 of the License, or
7    (at your option) any later version.
8
9    This program is distributed in the hope that it will be useful,
10    but WITHOUT ANY WARRANTY; without even the implied warranty of
11    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12    GNU General Public License for more details.
13
14    You should have received a copy of the GNU General Public License
15    along with this program.  If not, see <http://www.gnu.org/licenses/>. */
16
17 #include <config.h>
18
19 #include "data/variable.h"
20
21 #include <stdlib.h>
22
23 #include "data/attributes.h"
24 #include "data/data-out.h"
25 #include "data/dictionary.h"
26 #include "data/format.h"
27 #include "data/identifier.h"
28 #include "data/missing-values.h"
29 #include "data/settings.h"
30 #include "data/value-labels.h"
31 #include "data/vardict.h"
32 #include "libpspp/assertion.h"
33 #include "libpspp/compiler.h"
34 #include "libpspp/hash-functions.h"
35 #include "libpspp/i18n.h"
36 #include "libpspp/message.h"
37 #include "libpspp/misc.h"
38 #include "libpspp/str.h"
39
40 #include "gl/minmax.h"
41 #include "gl/xalloc.h"
42
43 #include "gettext.h"
44 #define _(msgid) gettext (msgid)
45 #define N_(msgid) (msgid)
46
47 /* This should follow the definition in Gtk */
48 typedef struct
49 {
50   int value;
51   const char *name;
52   const char *label;
53 } GEnumValue;
54
55 const GEnumValue align[] =
56   {
57     {ALIGN_LEFT,   "left", N_("Left")},
58     {ALIGN_RIGHT,  "right", N_("Right")},
59     {ALIGN_CENTRE, "center", N_("Center")},
60     {0,0,0}
61   };
62
63 const GEnumValue measure[] =
64   {
65     {MEASURE_NOMINAL, "nominal", N_("Nominal")},
66     {MEASURE_ORDINAL, "ordinal", N_("Ordinal")},
67     {MEASURE_SCALE,   "scale", N_("Scale")},
68     {0,0,0}
69   };
70
71 const GEnumValue role[] =
72   {
73     {ROLE_INPUT,  "input",    N_("Input")},
74     {ROLE_TARGET, "output",   N_("Output")},
75     {ROLE_BOTH,   "both",     N_("Both")},
76     {ROLE_NONE,   "none",     N_("None")},
77     {ROLE_PARTITION, "partition", N_("Partition")},
78     {ROLE_SPLIT,  "split",    N_("Split")},
79     {0,0,0}
80   };
81
82 /* A variable. */
83 struct variable
84   {
85     /* Dictionary information. */
86     char *name;                 /* Variable name.  Mixed case. */
87     int width;                  /* 0 for numeric, otherwise string width. */
88     struct missing_values miss; /* Missing values. */
89     struct fmt_spec print;      /* Default format for PRINT. */
90     struct fmt_spec write;      /* Default format for WRITE. */
91     struct val_labs *val_labs;  /* Value labels. */
92     char *label;                /* Variable label. */
93     struct string name_and_label; /* The name and label in the same string */
94
95     /* GUI information. */
96     enum measure measure;       /* Nominal, ordinal, or continuous. */
97     enum var_role role;         /* Intended use. */
98     int display_width;          /* Width of data editor column. */
99     enum alignment alignment;   /* Alignment of data in GUI. */
100
101     /* Case information. */
102     bool leave;                 /* Leave value from case to case? */
103
104     /* Data for use by containing dictionary. */
105     struct vardict_info *vardict;
106
107     /* Used only for system and portable file input and output.
108        See short-names.h. */
109     char **short_names;
110     size_t short_name_cnt;
111
112     /* Custom attributes. */
113     struct attrset attributes;
114   };
115 \f
116
117 static void var_set_print_format_quiet (struct variable *v, const struct fmt_spec *print);
118 static void var_set_write_format_quiet (struct variable *v, const struct fmt_spec *write);
119 static void var_set_label_quiet (struct variable *v, const char *label);
120 static void var_set_name_quiet (struct variable *v, const char *name);
121
122 /* Creates and returns a new variable with the given NAME and
123    WIDTH and other fields initialized to default values.  The
124    variable is not added to a dictionary; for that, use
125    dict_create_var instead. */
126 struct variable *
127 var_create (const char *name, int width)
128 {
129   struct variable *v;
130   enum val_type type;
131
132   assert (width >= 0 && width <= MAX_STRING);
133
134   v = xzalloc (sizeof *v);
135   var_set_name_quiet (v, name);
136   v->width = width;
137   mv_init (&v->miss, width);
138   v->leave = var_must_leave (v);
139   type = val_type_from_width (width);
140   v->alignment = var_default_alignment (type);
141   v->measure = var_default_measure (type);
142   v->role = ROLE_INPUT;
143   v->display_width = var_default_display_width (width);
144   v->print = v->write = var_default_formats (width);
145   attrset_init (&v->attributes);
146   ds_init_empty (&v->name_and_label);
147
148   return v;
149 }
150
151 /* Destroys variable V.
152    V must not belong to a dictionary.  If it does, use
153    dict_delete_var instead. */
154 void
155 var_destroy (struct variable *v)
156 {
157   if (v != NULL)
158     {
159       assert (!var_has_vardict (v));
160       mv_destroy (&v->miss);
161       var_clear_short_names (v);
162       val_labs_destroy (v->val_labs);
163       var_set_label_quiet (v, NULL);
164       attrset_destroy (var_get_attributes (v));
165       free (v->name);
166       ds_destroy (&v->name_and_label);
167       free (v);
168     }
169 }
170 \f
171 /* Variable names. */
172
173 /* Return variable V's name, as a UTF-8 encoded string. */
174 const char *
175 var_get_name (const struct variable *v)
176 {
177   return v->name;
178 }
179
180
181
182 /* Sets V's name to NAME, a UTF-8 encoded string.
183    Do not use this function for a variable in a dictionary.  Use
184    dict_rename_var instead. */
185 static void
186 var_set_name_quiet (struct variable *v, const char *name)
187 {
188   assert (!var_has_vardict (v));
189
190   free (v->name);
191   v->name = xstrdup (name);
192   ds_destroy (&v->name_and_label);
193   ds_init_empty (&v->name_and_label);
194 }
195
196 /* Sets V's name to NAME, a UTF-8 encoded string.
197    Do not use this function for a variable in a dictionary.  Use
198    dict_rename_var instead. */
199 void
200 var_set_name (struct variable *v, const char *name)
201 {
202   struct variable *ov = var_clone (v);
203   var_set_name_quiet (v, name);
204   dict_var_changed (v, VAR_TRAIT_NAME, ov);
205 }
206
207 /* Returns VAR's dictionary class. */
208 enum dict_class
209 var_get_dict_class (const struct variable *var)
210 {
211   return dict_class_from_id (var->name);
212 }
213
214 /* A hsh_compare_func that orders variables A and B by their
215    names. */
216 int
217 compare_vars_by_name (const void *a_, const void *b_, const void *aux UNUSED)
218 {
219   const struct variable *a = a_;
220   const struct variable *b = b_;
221
222   return utf8_strcasecmp (a->name, b->name);
223 }
224
225 /* A hsh_hash_func that hashes variable V based on its name. */
226 unsigned
227 hash_var_by_name (const void *v_, const void *aux UNUSED)
228 {
229   const struct variable *v = v_;
230
231   return utf8_hash_case_string (v->name, 0);
232 }
233
234 /* A hsh_compare_func that orders pointers to variables A and B
235    by their names. */
236 int
237 compare_var_ptrs_by_name (const void *a_, const void *b_,
238                           const void *aux UNUSED)
239 {
240   struct variable *const *a = a_;
241   struct variable *const *b = b_;
242
243   return utf8_strcasecmp (var_get_name (*a), var_get_name (*b));
244 }
245
246 /* A hsh_compare_func that orders pointers to variables A and B
247    by their dictionary indexes. */
248 int
249 compare_var_ptrs_by_dict_index (const void *a_, const void *b_,
250                                 const void *aux UNUSED)
251 {
252   struct variable *const *a = a_;
253   struct variable *const *b = b_;
254   size_t a_index = var_get_dict_index (*a);
255   size_t b_index = var_get_dict_index (*b);
256
257   return a_index < b_index ? -1 : a_index > b_index;
258 }
259
260 /* A hsh_hash_func that hashes pointer to variable V based on its
261    name. */
262 unsigned
263 hash_var_ptr_by_name (const void *v_, const void *aux UNUSED)
264 {
265   struct variable *const *v = v_;
266
267   return utf8_hash_case_string (var_get_name (*v), 0);
268 }
269 \f
270 /* Returns the type of variable V. */
271 enum val_type
272 var_get_type (const struct variable *v)
273 {
274   return val_type_from_width (v->width);
275 }
276
277 /* Returns the width of variable V. */
278 int
279 var_get_width (const struct variable *v)
280 {
281   return v->width;
282 }
283
284 void
285 var_set_width_and_formats (struct variable *v, int new_width,
286                            const struct fmt_spec *print, const struct fmt_spec *write)
287 {
288   struct variable *ov;
289   unsigned int traits = 0;
290
291   ov = var_clone (v);
292
293   if (var_has_missing_values (v))
294     {
295       if (mv_is_resizable (&v->miss, new_width))
296         mv_resize (&v->miss, new_width);
297       else
298         {
299           mv_destroy (&v->miss);
300           mv_init (&v->miss, new_width);
301         }
302       traits |= VAR_TRAIT_MISSING_VALUES;
303     }
304
305   if (v->val_labs != NULL)
306     {
307       if (val_labs_can_set_width (v->val_labs, new_width))
308         val_labs_set_width (v->val_labs, new_width);
309       else
310         {
311           val_labs_destroy (v->val_labs);
312           v->val_labs = NULL;
313         }
314       traits |= VAR_TRAIT_VALUE_LABELS;
315     }
316
317   if (fmt_resize (&v->print, new_width))
318     traits |= VAR_TRAIT_PRINT_FORMAT;
319
320   if (fmt_resize (&v->write, new_width))
321     traits |= VAR_TRAIT_WRITE_FORMAT;
322
323   if (v->width != new_width)
324     {
325       v->width = new_width;
326       traits |= VAR_TRAIT_WIDTH;
327     }
328
329   if (print)
330     {
331       var_set_print_format_quiet (v, print);
332       traits |= VAR_TRAIT_PRINT_FORMAT;
333     }
334
335   if (write)
336     {
337       var_set_write_format_quiet (v, write);
338       traits |= VAR_TRAIT_WRITE_FORMAT;
339     }
340
341   if (traits != 0)
342     dict_var_changed (v, traits, ov);
343 }
344
345 /* Changes the width of V to NEW_WIDTH.
346    This function should be used cautiously. */
347 void
348 var_set_width (struct variable *v, int new_width)
349 {
350   const int old_width = v->width;
351
352   if (old_width == new_width)
353     return;
354
355   var_set_width_and_formats (v, new_width, NULL, NULL);
356 }
357
358
359
360
361 /* Returns true if variable V is numeric, false otherwise. */
362 bool
363 var_is_numeric (const struct variable *v)
364 {
365   return var_get_type (v) == VAL_NUMERIC;
366 }
367
368 /* Returns true if variable V is a string variable, false
369    otherwise. */
370 bool
371 var_is_alpha (const struct variable *v)
372 {
373   return var_get_type (v) == VAL_STRING;
374 }
375 \f
376 /* Returns variable V's missing values. */
377 const struct missing_values *
378 var_get_missing_values (const struct variable *v)
379 {
380   return &v->miss;
381 }
382
383 /* Sets variable V's missing values to MISS, which must be of V's
384    width or at least resizable to V's width.
385    If MISS is null, then V's missing values, if any, are
386    cleared. */
387 static void
388 var_set_missing_values_quiet (struct variable *v, const struct missing_values *miss)
389 {
390   if (miss != NULL)
391     {
392       assert (mv_is_resizable (miss, v->width));
393       mv_destroy (&v->miss);
394       mv_copy (&v->miss, miss);
395       mv_resize (&v->miss, v->width);
396     }
397   else
398     mv_clear (&v->miss);
399 }
400
401 /* Sets variable V's missing values to MISS, which must be of V's
402    width or at least resizable to V's width.
403    If MISS is null, then V's missing values, if any, are
404    cleared. */
405 void
406 var_set_missing_values (struct variable *v, const struct missing_values *miss)
407 {
408   struct variable *ov = var_clone (v);
409   var_set_missing_values_quiet (v, miss);
410   dict_var_changed (v, VAR_TRAIT_MISSING_VALUES, ov);
411 }
412
413 /* Sets variable V to have no user-missing values. */
414 void
415 var_clear_missing_values (struct variable *v)
416 {
417   var_set_missing_values (v, NULL);
418 }
419
420 /* Returns true if V has any user-missing values,
421    false otherwise. */
422 bool
423 var_has_missing_values (const struct variable *v)
424 {
425   return !mv_is_empty (&v->miss);
426 }
427
428 /* Returns true if VALUE is in the given CLASS of missing values
429    in V, false otherwise. */
430 bool
431 var_is_value_missing (const struct variable *v, const union value *value,
432                       enum mv_class class)
433 {
434   return mv_is_value_missing (&v->miss, value, class);
435 }
436
437 /* Returns true if D is in the given CLASS of missing values in
438    V, false otherwise.
439    V must be a numeric variable. */
440 bool
441 var_is_num_missing (const struct variable *v, double d, enum mv_class class)
442 {
443   return mv_is_num_missing (&v->miss, d, class);
444 }
445
446 /* Returns true if S[] is a missing value for V, false otherwise.
447    S[] must contain exactly as many characters as V's width.
448    V must be a string variable. */
449 bool
450 var_is_str_missing (const struct variable *v, const uint8_t s[],
451                     enum mv_class class)
452 {
453   return mv_is_str_missing (&v->miss, s, class);
454 }
455 \f
456 /* Returns variable V's value labels,
457    possibly a null pointer if it has none. */
458 const struct val_labs *
459 var_get_value_labels (const struct variable *v)
460 {
461   return v->val_labs;
462 }
463
464 /* Returns true if variable V has at least one value label. */
465 bool
466 var_has_value_labels (const struct variable *v)
467 {
468   return val_labs_count (v->val_labs) > 0;
469 }
470
471 /* Sets variable V's value labels to a copy of VLS,
472    which must have a width equal to V's width or one that can be
473    changed to V's width.
474    If VLS is null, then V's value labels, if any, are removed. */
475 static void
476 var_set_value_labels_quiet (struct variable *v, const struct val_labs *vls)
477 {
478   val_labs_destroy (v->val_labs);
479   v->val_labs = NULL;
480
481   if (vls != NULL)
482     {
483       assert (val_labs_can_set_width (vls, v->width));
484       v->val_labs = val_labs_clone (vls);
485       val_labs_set_width (v->val_labs, v->width);
486     }
487 }
488
489
490 /* Sets variable V's value labels to a copy of VLS,
491    which must have a width equal to V's width or one that can be
492    changed to V's width.
493    If VLS is null, then V's value labels, if any, are removed. */
494 void
495 var_set_value_labels (struct variable *v, const struct val_labs *vls)
496 {
497   struct variable *ov = var_clone (v);
498   var_set_value_labels_quiet (v, vls);
499   dict_var_changed (v, VAR_TRAIT_LABEL, ov);
500 }
501
502
503 /* Makes sure that V has a set of value labels,
504    by assigning one to it if necessary. */
505 static void
506 alloc_value_labels (struct variable *v)
507 {
508   if (v->val_labs == NULL)
509     v->val_labs = val_labs_create (v->width);
510 }
511
512 /* Attempts to add a value label with the given VALUE and UTF-8 encoded LABEL
513    to V.  Returns true if successful, false otherwise (probably due to an
514    existing label).
515
516    In LABEL, the two-byte sequence "\\n" is interpreted as a new-line. */
517 bool
518 var_add_value_label (struct variable *v,
519                      const union value *value, const char *label)
520 {
521   alloc_value_labels (v);
522   return val_labs_add (v->val_labs, value, label);
523 }
524
525 /* Adds or replaces a value label with the given VALUE and UTF-8 encoded LABEL
526    to V.
527
528    In LABEL, the two-byte sequence "\\n" is interpreted as a new-line. */
529 void
530 var_replace_value_label (struct variable *v,
531                          const union value *value, const char *label)
532 {
533   alloc_value_labels (v);
534   val_labs_replace (v->val_labs, value, label);
535 }
536
537 /* Removes V's value labels, if any. */
538 void
539 var_clear_value_labels (struct variable *v)
540 {
541   var_set_value_labels (v, NULL);
542 }
543
544 /* Returns the label associated with VALUE for variable V, as a UTF-8 string in
545    a format suitable for output, or a null pointer if none. */
546 const char *
547 var_lookup_value_label (const struct variable *v, const union value *value)
548 {
549   return val_labs_find (v->val_labs, value);
550 }
551
552 /*
553    Append to STR the string representation of VALUE for variable V.
554    STR must be a pointer to an initialised struct string.
555 */
556 static void
557 append_value (const struct variable *v, const union value *value,
558               struct string *str)
559 {
560   char *s = data_out (value, var_get_encoding (v), &v->print);
561   ds_put_cstr (str, s);
562   free (s);
563 }
564
565 /* Append STR with a string representing VALUE for variable V.
566    That is, if VALUE has a label, append that label,
567    otherwise format VALUE and append the formatted string.
568    STR must be a pointer to an initialised struct string.
569 */
570 void
571 var_append_value_name (const struct variable *v, const union value *value,
572                        struct string *str)
573 {
574   enum settings_value_style style = settings_get_value_style ();
575   const char *name = var_lookup_value_label (v, value);
576
577   switch (style)
578     {
579     case SETTINGS_VAL_STYLE_VALUES:
580       append_value (v, value, str);
581       break;
582
583     case SETTINGS_VAL_STYLE_LABELS:
584       if (name == NULL)
585         append_value (v, value, str);
586       else
587         ds_put_cstr (str, name);
588       break;
589
590     case SETTINGS_VAL_STYLE_BOTH:
591     default:
592       append_value (v, value, str);
593       if (name != NULL)
594         {
595           ds_put_cstr (str, " (");
596           ds_put_cstr (str, name);
597           ds_put_cstr (str, ")");
598         }
599       break;
600     };
601 }
602 \f
603 /* Print and write formats. */
604
605 /* Returns V's print format specification. */
606 const struct fmt_spec *
607 var_get_print_format (const struct variable *v)
608 {
609   return &v->print;
610 }
611
612 /* Sets V's print format specification to PRINT, which must be a
613    valid format specification for a variable of V's width
614    (ordinarily an output format, but input formats are not
615    rejected). */
616 static void
617 var_set_print_format_quiet (struct variable *v, const struct fmt_spec *print)
618 {
619   if (!fmt_equal (&v->print, print))
620     {
621       assert (fmt_check_width_compat (print, v->width));
622       v->print = *print;
623     }
624 }
625
626 /* Sets V's print format specification to PRINT, which must be a
627    valid format specification for a variable of V's width
628    (ordinarily an output format, but input formats are not
629    rejected). */
630 void
631 var_set_print_format (struct variable *v, const struct fmt_spec *print)
632 {
633   struct variable *ov = var_clone (v);
634   var_set_print_format_quiet (v, print);
635   dict_var_changed (v, VAR_TRAIT_PRINT_FORMAT, ov);
636 }
637
638 /* Returns V's write format specification. */
639 const struct fmt_spec *
640 var_get_write_format (const struct variable *v)
641 {
642   return &v->write;
643 }
644
645 /* Sets V's write format specification to WRITE, which must be a
646    valid format specification for a variable of V's width
647    (ordinarily an output format, but input formats are not
648    rejected). */
649 static void
650 var_set_write_format_quiet (struct variable *v, const struct fmt_spec *write)
651 {
652   if (!fmt_equal (&v->write, write))
653     {
654       assert (fmt_check_width_compat (write, v->width));
655       v->write = *write;
656     }
657 }
658
659 /* Sets V's write format specification to WRITE, which must be a
660    valid format specification for a variable of V's width
661    (ordinarily an output format, but input formats are not
662    rejected). */
663 void
664 var_set_write_format (struct variable *v, const struct fmt_spec *write)
665 {
666   struct variable *ov = var_clone (v);
667   var_set_write_format_quiet (v, write);
668   dict_var_changed (v, VAR_TRAIT_WRITE_FORMAT, ov);
669 }
670
671
672 /* Sets V's print and write format specifications to FORMAT,
673    which must be a valid format specification for a variable of
674    V's width (ordinarily an output format, but input formats are
675    not rejected). */
676 void
677 var_set_both_formats (struct variable *v, const struct fmt_spec *format)
678 {
679   struct variable *ov = var_clone (v);
680   var_set_print_format_quiet (v, format);
681   var_set_write_format_quiet (v, format);
682   dict_var_changed (v, VAR_TRAIT_PRINT_FORMAT | VAR_TRAIT_WRITE_FORMAT, ov);
683 }
684
685 /* Returns the default print and write format for a variable of
686    the given TYPE, as set by var_create.  The return value can be
687    used to reset a variable's print and write formats to the
688    default. */
689 struct fmt_spec
690 var_default_formats (int width)
691 {
692   return (width == 0
693           ? fmt_for_output (FMT_F, 8, 2)
694           : fmt_for_output (FMT_A, width, 0));
695 }
696
697
698 \f
699
700 /* Update the combined name and label string if necessary */
701 static void
702 update_vl_string (const struct variable *v)
703 {
704   /* Cast away const! */
705   struct string *str = (struct string *) &v->name_and_label;
706
707   if (ds_is_empty (str))
708     {
709       if (v->label)
710         ds_put_format (str, _("%s (%s)"), v->label, v->name);
711       else
712         ds_put_cstr (str, v->name);
713     }
714 }
715
716
717 /* Return a string representing this variable, in the form most
718    appropriate from a human factors perspective, that is, its
719    variable label if it has one, otherwise its name. */
720 const char *
721 var_to_string (const struct variable *v)
722 {
723   enum settings_var_style style = settings_get_var_style ();
724
725   switch (style)
726   {
727     case SETTINGS_VAR_STYLE_NAMES:
728       return v->name;
729       break;
730     case SETTINGS_VAR_STYLE_LABELS:
731       return v->label != NULL ? v->label : v->name;
732       break;
733     case SETTINGS_VAR_STYLE_BOTH:
734       update_vl_string (v);
735       return ds_cstr (&v->name_and_label);
736       break;
737     default:
738       NOT_REACHED ();
739       break;
740   };
741 }
742
743 /* Returns V's variable label, or a null pointer if it has none. */
744 const char *
745 var_get_label (const struct variable *v)
746 {
747   return v->label;
748 }
749
750 /* Sets V's variable label to UTF-8 encoded string LABEL, stripping off leading
751    and trailing white space.  If LABEL is a null pointer or if LABEL is an
752    empty string (after stripping white space), then V's variable label (if any)
753    is removed. */
754 static void
755 var_set_label_quiet (struct variable *v, const char *label)
756 {
757   free (v->label);
758   v->label = NULL;
759
760   if (label != NULL && label[strspn (label, CC_SPACES)])
761     v->label = xstrdup (label);
762
763   ds_destroy (&v->name_and_label);
764   ds_init_empty (&v->name_and_label);
765 }
766
767
768
769 /* Sets V's variable label to UTF-8 encoded string LABEL, stripping off leading
770    and trailing white space.  If LABEL is a null pointer or if LABEL is an
771    empty string (after stripping white space), then V's variable label (if any)
772    is removed. */
773 void
774 var_set_label (struct variable *v, const char *label)
775 {
776   struct variable *ov = var_clone (v);
777   var_set_label_quiet (v, label);
778   dict_var_changed (v, VAR_TRAIT_LABEL, ov);
779 }
780
781
782 /* Removes any variable label from V. */
783 void
784 var_clear_label (struct variable *v)
785 {
786   var_set_label (v, NULL);
787 }
788
789 /* Returns true if V has a variable V,
790    false otherwise. */
791 bool
792 var_has_label (const struct variable *v)
793 {
794   return v->label != NULL;
795 }
796 \f
797 /* Returns true if M is a valid variable measurement level,
798    false otherwise. */
799 bool
800 measure_is_valid (enum measure m)
801 {
802   return m == MEASURE_NOMINAL || m == MEASURE_ORDINAL || m == MEASURE_SCALE;
803 }
804
805 /* Returns a string version of measurement level M, for display to a user.
806    The caller may translate the string by passing it to gettext(). */
807 const char *
808 measure_to_string (enum measure m)
809 {
810   assert (m == measure[m].value);
811   return measure[m].label;
812 }
813
814 /* Returns a string version of measurement level M, for use in PSPP command
815    syntax. */
816 const char *
817 measure_to_syntax (enum measure m)
818 {
819   switch (m)
820     {
821     case MEASURE_NOMINAL:
822       return "NOMINAL";
823
824     case MEASURE_ORDINAL:
825       return "ORDINAL";
826
827     case MEASURE_SCALE:
828       return "SCALE";
829
830     default:
831       return "Invalid";
832     }
833 }
834
835 /* Returns V's measurement level. */
836 enum measure
837 var_get_measure (const struct variable *v)
838 {
839   return v->measure;
840 }
841
842 /* Sets V's measurement level to MEASURE. */
843 static void
844 var_set_measure_quiet (struct variable *v, enum measure measure)
845 {
846   assert (measure_is_valid (measure));
847   v->measure = measure;
848 }
849
850
851 /* Sets V's measurement level to MEASURE. */
852 void
853 var_set_measure (struct variable *v, enum measure measure)
854 {
855   struct variable *ov = var_clone (v);
856   var_set_measure_quiet (v, measure);
857   dict_var_changed (v, VAR_TRAIT_MEASURE, ov);
858 }
859
860
861 /* Returns the default measurement level for a variable of the
862    given TYPE, as set by var_create.  The return value can be
863    used to reset a variable's measurement level to the
864    default. */
865 enum measure
866 var_default_measure (enum val_type type)
867 {
868   return type == VAL_NUMERIC ? MEASURE_SCALE : MEASURE_NOMINAL;
869 }
870 \f
871 /* Returns true if M is a valid variable role,
872    false otherwise. */
873 bool
874 var_role_is_valid (enum var_role role)
875 {
876   switch (role)
877     {
878     case ROLE_NONE:
879     case ROLE_INPUT:
880     case ROLE_TARGET:
881     case ROLE_BOTH:
882     case ROLE_PARTITION:
883     case ROLE_SPLIT:
884       return true;
885
886     default:
887       return false;
888     }
889 }
890
891 /* Returns a string version of ROLE, for display to a user.
892    The caller may translate the string by passing it to gettext(). */
893 const char *
894 var_role_to_string (enum var_role r)
895 {
896   assert (r == role[r].value);
897   return role[r].label;
898 }
899
900 /* Returns a string version of ROLE, for use in PSPP comamnd syntax. */
901 const char *
902 var_role_to_syntax (enum var_role role)
903 {
904   switch (role)
905     {
906     case ROLE_INPUT:
907       return "INPUT";
908
909     case ROLE_TARGET:
910       return "TARGET";
911
912     case ROLE_BOTH:
913       return "BOTH";
914
915     case ROLE_NONE:
916       return "NONE";
917
918     case ROLE_PARTITION:
919       return "PARTITION";
920
921     case ROLE_SPLIT:
922       return "SPLIT";
923
924     default:
925       return "<invalid>";
926     }
927 }
928
929 /* Returns V's role. */
930 enum var_role
931 var_get_role (const struct variable *v)
932 {
933   return v->role;
934 }
935
936 /* Sets V's role to ROLE. */
937 static void
938 var_set_role_quiet (struct variable *v, enum var_role role)
939 {
940   assert (var_role_is_valid (role));
941   v->role = role;
942 }
943
944
945 /* Sets V's role to ROLE. */
946 void
947 var_set_role (struct variable *v, enum var_role role)
948 {
949   struct variable *ov = var_clone (v);
950   var_set_role_quiet (v, role);
951   dict_var_changed (v, VAR_TRAIT_ROLE, ov);
952 }
953 \f
954 /* Returns V's display width, which applies only to GUIs. */
955 int
956 var_get_display_width (const struct variable *v)
957 {
958   return v->display_width;
959 }
960
961 /* Sets V's display width to DISPLAY_WIDTH. */
962 static void
963 var_set_display_width_quiet (struct variable *v, int new_width)
964 {
965   if (v->display_width != new_width)
966     {
967       v->display_width = new_width;
968     }
969 }
970
971 void
972 var_set_display_width (struct variable *v, int new_width)
973 {
974   if (v->display_width != new_width)
975     {
976       struct variable *ov = var_clone (v);
977       var_set_display_width_quiet (v, new_width);
978       dict_var_changed (v, VAR_TRAIT_DISPLAY_WIDTH, ov);
979     }
980 }
981
982 /* Returns the default display width for a variable of the given
983    WIDTH, as set by var_create.  The return value can be used to
984    reset a variable's display width to the default. */
985 int
986 var_default_display_width (int width)
987 {
988   return width == 0 ? 8 : MIN (width, 32);
989 }
990 \f
991 /* Returns true if A is a valid alignment,
992    false otherwise. */
993 bool
994 alignment_is_valid (enum alignment a)
995 {
996   return a == ALIGN_LEFT || a == ALIGN_RIGHT || a == ALIGN_CENTRE;
997 }
998
999 /* Returns a string version of alignment A, for display to a user.
1000    The caller may translate the string by passing it to gettext(). */
1001 const char *
1002 alignment_to_string (enum alignment a)
1003 {
1004   assert (a == align[a].value);
1005   return align[a].label;
1006 }
1007
1008 /* Returns a string version of alignment A, for use in PSPP command syntax. */
1009 const char *
1010 alignment_to_syntax (enum alignment a)
1011 {
1012   switch (a)
1013     {
1014     case ALIGN_LEFT:
1015       return "LEFT";
1016
1017     case ALIGN_RIGHT:
1018       return "RIGHT";
1019
1020     case ALIGN_CENTRE:
1021       return "CENTER";
1022
1023     default:
1024       return "Invalid";
1025     }
1026 }
1027
1028 /* Returns V's display alignment, which applies only to GUIs. */
1029 enum alignment
1030 var_get_alignment (const struct variable *v)
1031 {
1032   return v->alignment;
1033 }
1034
1035 /* Sets V's display alignment to ALIGNMENT. */
1036 static void
1037 var_set_alignment_quiet (struct variable *v, enum alignment alignment)
1038 {
1039   assert (alignment_is_valid (alignment));
1040   v->alignment = alignment;
1041 }
1042
1043 /* Sets V's display alignment to ALIGNMENT. */
1044 void
1045 var_set_alignment (struct variable *v, enum alignment alignment)
1046 {
1047   struct variable *ov = var_clone (v);
1048   var_set_alignment_quiet (v, alignment);
1049   dict_var_changed (v, VAR_TRAIT_ALIGNMENT, ov);
1050 }
1051
1052
1053 /* Returns the default display alignment for a variable of the
1054    given TYPE, as set by var_create.  The return value can be
1055    used to reset a variable's display alignment to the default. */
1056 enum alignment
1057 var_default_alignment (enum val_type type)
1058 {
1059   return type == VAL_NUMERIC ? ALIGN_RIGHT : ALIGN_LEFT;
1060 }
1061 \f
1062 /* Whether variables' values should be preserved from case to
1063    case. */
1064
1065 /* Returns true if variable V's value should be left from case to
1066    case, instead of being reset to system-missing or blanks. */
1067 bool
1068 var_get_leave (const struct variable *v)
1069 {
1070   return v->leave;
1071 }
1072
1073 /* Sets V's leave setting to LEAVE. */
1074 static void
1075 var_set_leave_quiet (struct variable *v, bool leave)
1076 {
1077   assert (leave || !var_must_leave (v));
1078   v->leave = leave;
1079 }
1080
1081
1082 /* Sets V's leave setting to LEAVE. */
1083 void
1084 var_set_leave (struct variable *v, bool leave)
1085 {
1086   struct variable *ov = var_clone (v);
1087   var_set_leave_quiet (v, leave);
1088   dict_var_changed (v, VAR_TRAIT_LEAVE, ov);
1089 }
1090
1091
1092 /* Returns true if V must be left from case to case,
1093    false if it can be set either way. */
1094 bool
1095 var_must_leave (const struct variable *v)
1096 {
1097   return var_get_dict_class (v) == DC_SCRATCH;
1098 }
1099 \f
1100 /* Returns the number of short names stored in VAR.
1101
1102    Short names are used only for system and portable file input
1103    and output.  They are upper-case only, not necessarily unique,
1104    and limited to SHORT_NAME_LEN characters (plus a null
1105    terminator).  Ordinarily a variable has at most one short
1106    name, but very long string variables (longer than 255 bytes)
1107    may have more.  A variable might not have any short name at
1108    all if it hasn't been saved to or read from a system or
1109    portable file. */
1110 size_t
1111 var_get_short_name_cnt (const struct variable *var)
1112 {
1113   return var->short_name_cnt;
1114 }
1115
1116 /* Returns VAR's short name with the given IDX, if it has one
1117    with that index, or a null pointer otherwise.  Short names may
1118    be sparse: even if IDX is less than the number of short names
1119    in VAR, this function may return a null pointer. */
1120 const char *
1121 var_get_short_name (const struct variable *var, size_t idx)
1122 {
1123   return idx < var->short_name_cnt ? var->short_names[idx] : NULL;
1124 }
1125
1126 /* Sets VAR's short name with the given IDX to the UTF-8 string SHORT_NAME.
1127    The caller must already have checked that, in the dictionary encoding,
1128    SHORT_NAME is no more than SHORT_NAME_LEN bytes long.  The new short name
1129    will be converted to uppercase.
1130
1131    Specifying a null pointer for SHORT_NAME clears the specified short name. */
1132 void
1133 var_set_short_name (struct variable *var, size_t idx, const char *short_name)
1134 {
1135   struct variable *ov = var_clone (var);
1136
1137   /* Clear old short name numbered IDX, if any. */
1138   if (idx < var->short_name_cnt)
1139     {
1140       free (var->short_names[idx]);
1141       var->short_names[idx] = NULL;
1142     }
1143
1144   /* Install new short name for IDX. */
1145   if (short_name != NULL)
1146     {
1147       if (idx >= var->short_name_cnt)
1148         {
1149           size_t old_cnt = var->short_name_cnt;
1150           size_t i;
1151           var->short_name_cnt = MAX (idx * 2, 1);
1152           var->short_names = xnrealloc (var->short_names, var->short_name_cnt,
1153                                         sizeof *var->short_names);
1154           for (i = old_cnt; i < var->short_name_cnt; i++)
1155             var->short_names[i] = NULL;
1156         }
1157       var->short_names[idx] = utf8_to_upper (short_name);
1158     }
1159
1160   dict_var_changed (var, VAR_TRAIT_NAME, ov);
1161 }
1162
1163 /* Clears V's short names. */
1164 void
1165 var_clear_short_names (struct variable *v)
1166 {
1167   size_t i;
1168
1169   for (i = 0; i < v->short_name_cnt; i++)
1170     free (v->short_names[i]);
1171   free (v->short_names);
1172   v->short_names = NULL;
1173   v->short_name_cnt = 0;
1174 }
1175 \f
1176 /* Relationship with dictionary. */
1177
1178 /* Returns V's index within its dictionary, the value
1179    for which "dict_get_var (dict, index)" will return V.
1180    V must be in a dictionary. */
1181 size_t
1182 var_get_dict_index (const struct variable *v)
1183 {
1184   assert (var_has_vardict (v));
1185   return vardict_get_dict_index (v->vardict);
1186 }
1187
1188 /* Returns V's index within the case represented by its
1189    dictionary, that is, the value for which "case_data_idx (case,
1190    index)" will return the data for V in that case.
1191    V must be in a dictionary. */
1192 size_t
1193 var_get_case_index (const struct variable *v)
1194 {
1195   assert (var_has_vardict (v));
1196   return vardict_get_case_index (v->vardict);
1197 }
1198 \f
1199 /* Returns variable V's attribute set.  The caller may examine or
1200    modify the attribute set, but must not destroy it.  Destroying
1201    V, or calling var_set_attributes() on V, will also destroy its
1202    attribute set. */
1203 struct attrset *
1204 var_get_attributes (const struct variable *v)
1205 {
1206   return CONST_CAST (struct attrset *, &v->attributes);
1207 }
1208
1209 /* Replaces variable V's attributes set by a copy of ATTRS. */
1210 static void
1211 var_set_attributes_quiet (struct variable *v, const struct attrset *attrs)
1212 {
1213   attrset_destroy (&v->attributes);
1214   attrset_clone (&v->attributes, attrs);
1215 }
1216
1217 /* Replaces variable V's attributes set by a copy of ATTRS. */
1218 void
1219 var_set_attributes (struct variable *v, const struct attrset *attrs)
1220 {
1221   struct variable *ov = var_clone (v);
1222   var_set_attributes_quiet (v, attrs);
1223   dict_var_changed (v, VAR_TRAIT_ATTRIBUTES, ov);
1224 }
1225
1226
1227 /* Returns true if V has any custom attributes, false if it has none. */
1228 bool
1229 var_has_attributes (const struct variable *v)
1230 {
1231   return attrset_count (&v->attributes) > 0;
1232 }
1233 \f
1234
1235 /* Creates and returns a clone of OLD_VAR.  Most properties of
1236    the new variable are copied from OLD_VAR, except:
1237
1238     - The variable's short name is not copied, because there is
1239       no reason to give a new variable with potentially a new
1240       name the same short name.
1241
1242     - The new variable is not added to OLD_VAR's dictionary by
1243       default.  Use dict_clone_var, instead, to do that.
1244 */
1245 struct variable *
1246 var_clone (const struct variable *old_var)
1247 {
1248   struct variable *new_var = var_create (var_get_name (old_var),
1249                                          var_get_width (old_var));
1250
1251   var_set_missing_values_quiet (new_var, var_get_missing_values (old_var));
1252   var_set_print_format_quiet (new_var, var_get_print_format (old_var));
1253   var_set_write_format_quiet (new_var, var_get_write_format (old_var));
1254   var_set_value_labels_quiet (new_var, var_get_value_labels (old_var));
1255   var_set_label_quiet (new_var, var_get_label (old_var));
1256   var_set_measure_quiet (new_var, var_get_measure (old_var));
1257   var_set_role_quiet (new_var, var_get_role (old_var));
1258   var_set_display_width_quiet (new_var, var_get_display_width (old_var));
1259   var_set_alignment_quiet (new_var, var_get_alignment (old_var));
1260   var_set_leave_quiet (new_var, var_get_leave (old_var));
1261   var_set_attributes_quiet (new_var, var_get_attributes (old_var));
1262
1263   return new_var;
1264 }
1265
1266
1267
1268 /* Returns the encoding of values of variable VAR.  (This is actually a
1269    property of the dictionary.)  Returns null if no specific encoding has been
1270    set.  */
1271 const char *
1272 var_get_encoding (const struct variable *var)
1273 {
1274   return (var_has_vardict (var)
1275           ? dict_get_encoding (vardict_get_dictionary (var->vardict))
1276           : NULL);
1277 }
1278 \f
1279 /* Returns V's vardict structure. */
1280 struct vardict_info *
1281 var_get_vardict (const struct variable *v)
1282 {
1283   return CONST_CAST (struct vardict_info *, v->vardict);
1284 }
1285
1286 /* Sets V's vardict data to VARDICT. */
1287 void
1288 var_set_vardict (struct variable *v, struct vardict_info *vardict)
1289 {
1290   v->vardict = vardict;
1291 }
1292
1293 /* Returns true if V has vardict data. */
1294 bool
1295 var_has_vardict (const struct variable *v)
1296 {
1297   return v->vardict != NULL;
1298 }
1299
1300 /* Clears V's vardict data. */
1301 void
1302 var_clear_vardict (struct variable *v)
1303 {
1304   v->vardict = NULL;
1305 }
1306
1307 \f
1308 /*
1309   Returns zero, if W is a missing value for WV or if it is less than zero.
1310   Typically used to force a numerical value into a valid weight.
1311
1312   As a side effect, this function will emit a warning if the value
1313   WARN_ON_INVALID points to a bool which is TRUE.  That bool will be then
1314   set to FALSE.
1315  */
1316 double
1317 var_force_valid_weight (const struct variable *wv, double w, bool *warn_on_invalid)
1318 {
1319   if (w < 0.0 || (wv && var_is_num_missing (wv, w, MV_ANY)))
1320     w = 0.0;
1321
1322   if (w == 0.0 && warn_on_invalid != NULL && *warn_on_invalid)
1323     {
1324       *warn_on_invalid = false;
1325       msg (SW, _("At least one case in the data file had a weight value "
1326                  "that was user-missing, system-missing, zero, or "
1327                  "negative.  These case(s) were ignored."));
1328     }
1329
1330   return w;
1331 }