Use UTF-8 case-insensitive hashes and comparisons for language identifiers.
[pspp] / src / data / variable.c
1 /* PSPP - a program for statistical analysis.
2    Copyright (C) 1997-9, 2000, 2006, 2009, 2010, 2011, 2012 Free Software Foundation, Inc.
3
4    This program is free software: you can redistribute it and/or modify
5    it under the terms of the GNU General Public License as published by
6    the Free Software Foundation, either version 3 of the License, or
7    (at your option) any later version.
8
9    This program is distributed in the hope that it will be useful,
10    but WITHOUT ANY WARRANTY; without even the implied warranty of
11    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12    GNU General Public License for more details.
13
14    You should have received a copy of the GNU General Public License
15    along with this program.  If not, see <http://www.gnu.org/licenses/>. */
16
17 #include <config.h>
18
19 #include "data/variable.h"
20
21 #include <stdlib.h>
22
23 #include "data/attributes.h"
24 #include "data/data-out.h"
25 #include "data/dictionary.h"
26 #include "data/format.h"
27 #include "data/identifier.h"
28 #include "data/missing-values.h"
29 #include "data/settings.h"
30 #include "data/value-labels.h"
31 #include "data/vardict.h"
32 #include "libpspp/assertion.h"
33 #include "libpspp/compiler.h"
34 #include "libpspp/hash-functions.h"
35 #include "libpspp/i18n.h"
36 #include "libpspp/message.h"
37 #include "libpspp/misc.h"
38 #include "libpspp/str.h"
39
40 #include "gl/minmax.h"
41 #include "gl/xalloc.h"
42
43 #include "gettext.h"
44 #define _(msgid) gettext (msgid)
45
46 /* A variable. */
47 struct variable
48   {
49     /* Dictionary information. */
50     char *name;                 /* Variable name.  Mixed case. */
51     int width;                  /* 0 for numeric, otherwise string width. */
52     struct missing_values miss; /* Missing values. */
53     struct fmt_spec print;      /* Default format for PRINT. */
54     struct fmt_spec write;      /* Default format for WRITE. */
55     struct val_labs *val_labs;  /* Value labels. */
56     char *label;                /* Variable label. */
57     struct string name_and_label; /* The name and label in the same string */
58
59     /* GUI information. */
60     enum measure measure;       /* Nominal, ordinal, or continuous. */
61     int display_width;          /* Width of data editor column. */
62     enum alignment alignment;   /* Alignment of data in GUI. */
63
64     /* Case information. */
65     bool leave;                 /* Leave value from case to case? */
66
67     /* Data for use by containing dictionary. */
68     struct vardict_info *vardict;
69
70     /* Used only for system and portable file input and output.
71        See short-names.h. */
72     char **short_names;
73     size_t short_name_cnt;
74
75     /* Each command may use these fields as needed. */
76     void *aux;
77     void (*aux_dtor) (struct variable *);
78
79     /* Custom attributes. */
80     struct attrset attributes;
81   };
82 \f
83 /* Creates and returns a new variable with the given NAME and
84    WIDTH and other fields initialized to default values.  The
85    variable is not added to a dictionary; for that, use
86    dict_create_var instead. */
87 struct variable *
88 var_create (const char *name, int width)
89 {
90   struct variable *v;
91   enum val_type type;
92
93   assert (width >= 0 && width <= MAX_STRING);
94
95   v = xzalloc (sizeof *v);
96   var_set_name (v, name);
97   v->width = width;
98   mv_init (&v->miss, width);
99   v->leave = var_must_leave (v);
100   type = val_type_from_width (width);
101   v->alignment = var_default_alignment (type);
102   v->measure = var_default_measure (type);
103   v->display_width = var_default_display_width (width);
104   v->print = v->write = var_default_formats (width);
105   attrset_init (&v->attributes);
106   ds_init_empty (&v->name_and_label);
107
108   return v;
109 }
110
111 /* Creates and returns a clone of OLD_VAR.  Most properties of
112    the new variable are copied from OLD_VAR, except:
113
114     - The variable's short name is not copied, because there is
115       no reason to give a new variable with potentially a new
116       name the same short name.
117
118     - The new variable is not added to OLD_VAR's dictionary by
119       default.  Use dict_clone_var, instead, to do that.
120 */
121 struct variable *
122 var_clone (const struct variable *old_var)
123 {
124   struct variable *new_var = var_create (var_get_name (old_var),
125                                          var_get_width (old_var));
126
127   var_set_missing_values (new_var, var_get_missing_values (old_var));
128   var_set_print_format (new_var, var_get_print_format (old_var));
129   var_set_write_format (new_var, var_get_write_format (old_var));
130   var_set_value_labels (new_var, var_get_value_labels (old_var));
131   var_set_label (new_var, var_get_label (old_var), false);
132   var_set_measure (new_var, var_get_measure (old_var));
133   var_set_display_width (new_var, var_get_display_width (old_var));
134   var_set_alignment (new_var, var_get_alignment (old_var));
135   var_set_leave (new_var, var_get_leave (old_var));
136   var_set_attributes (new_var, var_get_attributes (old_var));
137
138   return new_var;
139 }
140
141 /* Destroys variable V.
142    V must not belong to a dictionary.  If it does, use
143    dict_delete_var instead. */
144 void
145 var_destroy (struct variable *v)
146 {
147   if (v != NULL)
148     {
149       assert (!var_has_vardict (v));
150       mv_destroy (&v->miss);
151       var_clear_short_names (v);
152       var_clear_aux (v);
153       val_labs_destroy (v->val_labs);
154       var_clear_label (v);
155       attrset_destroy (var_get_attributes (v));
156       free (v->name);
157       ds_destroy (&v->name_and_label);
158       free (v);
159     }
160 }
161 \f
162 /* Variable names. */
163
164 /* Return variable V's name, as a UTF-8 encoded string. */
165 const char *
166 var_get_name (const struct variable *v)
167 {
168   return v->name;
169 }
170
171
172
173 /* Sets V's name to NAME, a UTF-8 encoded string.
174    Do not use this function for a variable in a dictionary.  Use
175    dict_rename_var instead. */
176 void
177 var_set_name (struct variable *v, const char *name)
178 {
179   assert (!var_has_vardict (v));
180   assert (id_is_plausible (name, false));
181
182   free (v->name);
183   v->name = xstrdup (name);
184   ds_destroy (&v->name_and_label);
185   ds_init_empty (&v->name_and_label);
186   dict_var_changed (v);
187 }
188
189 /* Returns VAR's dictionary class. */
190 enum dict_class
191 var_get_dict_class (const struct variable *var)
192 {
193   return dict_class_from_id (var->name);
194 }
195
196 /* A hsh_compare_func that orders variables A and B by their
197    names. */
198 int
199 compare_vars_by_name (const void *a_, const void *b_, const void *aux UNUSED)
200 {
201   const struct variable *a = a_;
202   const struct variable *b = b_;
203
204   return utf8_strcasecmp (a->name, b->name);
205 }
206
207 /* A hsh_hash_func that hashes variable V based on its name. */
208 unsigned
209 hash_var_by_name (const void *v_, const void *aux UNUSED)
210 {
211   const struct variable *v = v_;
212
213   return utf8_hash_case_string (v->name, 0);
214 }
215
216 /* A hsh_compare_func that orders pointers to variables A and B
217    by their names. */
218 int
219 compare_var_ptrs_by_name (const void *a_, const void *b_,
220                           const void *aux UNUSED)
221 {
222   struct variable *const *a = a_;
223   struct variable *const *b = b_;
224
225   return utf8_strcasecmp (var_get_name (*a), var_get_name (*b));
226 }
227
228 /* A hsh_compare_func that orders pointers to variables A and B
229    by their dictionary indexes. */
230 int
231 compare_var_ptrs_by_dict_index (const void *a_, const void *b_,
232                                 const void *aux UNUSED)
233 {
234   struct variable *const *a = a_;
235   struct variable *const *b = b_;
236   size_t a_index = var_get_dict_index (*a);
237   size_t b_index = var_get_dict_index (*b);
238
239   return a_index < b_index ? -1 : a_index > b_index;
240 }
241
242 /* A hsh_hash_func that hashes pointer to variable V based on its
243    name. */
244 unsigned
245 hash_var_ptr_by_name (const void *v_, const void *aux UNUSED)
246 {
247   struct variable *const *v = v_;
248
249   return utf8_hash_case_string (var_get_name (*v), 0);
250 }
251 \f
252 /* Returns the type of variable V. */
253 enum val_type
254 var_get_type (const struct variable *v)
255 {
256   return val_type_from_width (v->width);
257 }
258
259 /* Returns the width of variable V. */
260 int
261 var_get_width (const struct variable *v)
262 {
263   return v->width;
264 }
265
266 /* Changes the width of V to NEW_WIDTH.
267    This function should be used cautiously. */
268 void
269 var_set_width (struct variable *v, int new_width)
270 {
271   const int old_width = v->width;
272
273   if (old_width == new_width)
274     return;
275
276   if (mv_is_resizable (&v->miss, new_width))
277     mv_resize (&v->miss, new_width);
278   else
279     {
280       mv_destroy (&v->miss);
281       mv_init (&v->miss, new_width);
282     }
283
284   if (v->val_labs != NULL)
285     {
286       if (val_labs_can_set_width (v->val_labs, new_width))
287         val_labs_set_width (v->val_labs, new_width);
288       else
289         {
290           val_labs_destroy (v->val_labs);
291           v->val_labs = NULL;
292         }
293     }
294
295   fmt_resize (&v->print, new_width);
296   fmt_resize (&v->write, new_width);
297
298   v->width = new_width;
299   dict_var_resized (v, old_width);
300   dict_var_changed (v);
301 }
302
303 /* Returns true if variable V is numeric, false otherwise. */
304 bool
305 var_is_numeric (const struct variable *v)
306 {
307   return var_get_type (v) == VAL_NUMERIC;
308 }
309
310 /* Returns true if variable V is a string variable, false
311    otherwise. */
312 bool
313 var_is_alpha (const struct variable *v)
314 {
315   return var_get_type (v) == VAL_STRING;
316 }
317 \f
318 /* Returns variable V's missing values. */
319 const struct missing_values *
320 var_get_missing_values (const struct variable *v)
321 {
322   return &v->miss;
323 }
324
325 /* Sets variable V's missing values to MISS, which must be of V's
326    width or at least resizable to V's width.
327    If MISS is null, then V's missing values, if any, are
328    cleared. */
329 void
330 var_set_missing_values (struct variable *v, const struct missing_values *miss)
331 {
332   if (miss != NULL)
333     {
334       assert (mv_is_resizable (miss, v->width));
335       mv_destroy (&v->miss);
336       mv_copy (&v->miss, miss);
337       mv_resize (&v->miss, v->width);
338     }
339   else
340     mv_clear (&v->miss);
341
342   dict_var_changed (v);
343 }
344
345 /* Sets variable V to have no user-missing values. */
346 void
347 var_clear_missing_values (struct variable *v)
348 {
349   var_set_missing_values (v, NULL);
350 }
351
352 /* Returns true if V has any user-missing values,
353    false otherwise. */
354 bool
355 var_has_missing_values (const struct variable *v)
356 {
357   return !mv_is_empty (&v->miss);
358 }
359
360 /* Returns true if VALUE is in the given CLASS of missing values
361    in V, false otherwise. */
362 bool
363 var_is_value_missing (const struct variable *v, const union value *value,
364                       enum mv_class class)
365 {
366   return mv_is_value_missing (&v->miss, value, class);
367 }
368
369 /* Returns true if D is in the given CLASS of missing values in
370    V, false otherwise.
371    V must be a numeric variable. */
372 bool
373 var_is_num_missing (const struct variable *v, double d, enum mv_class class)
374 {
375   return mv_is_num_missing (&v->miss, d, class);
376 }
377
378 /* Returns true if S[] is a missing value for V, false otherwise.
379    S[] must contain exactly as many characters as V's width.
380    V must be a string variable. */
381 bool
382 var_is_str_missing (const struct variable *v, const uint8_t s[],
383                     enum mv_class class)
384 {
385   return mv_is_str_missing (&v->miss, s, class);
386 }
387 \f
388 /* Returns variable V's value labels,
389    possibly a null pointer if it has none. */
390 const struct val_labs *
391 var_get_value_labels (const struct variable *v)
392 {
393   return v->val_labs;
394 }
395
396 /* Returns true if variable V has at least one value label. */
397 bool
398 var_has_value_labels (const struct variable *v)
399 {
400   return val_labs_count (v->val_labs) > 0;
401 }
402
403 /* Sets variable V's value labels to a copy of VLS,
404    which must have a width equal to V's width or one that can be
405    changed to V's width.
406    If VLS is null, then V's value labels, if any, are removed. */
407 void
408 var_set_value_labels (struct variable *v, const struct val_labs *vls)
409 {
410   val_labs_destroy (v->val_labs);
411   v->val_labs = NULL;
412
413   if (vls != NULL)
414     {
415       assert (val_labs_can_set_width (vls, v->width));
416       v->val_labs = val_labs_clone (vls);
417       val_labs_set_width (v->val_labs, v->width);
418       dict_var_changed (v);
419     }
420 }
421
422 /* Makes sure that V has a set of value labels,
423    by assigning one to it if necessary. */
424 static void
425 alloc_value_labels (struct variable *v)
426 {
427   if (v->val_labs == NULL)
428     v->val_labs = val_labs_create (v->width);
429 }
430
431 /* Attempts to add a value label with the given VALUE and UTF-8 encoded LABEL
432    to V.  Returns true if successful, false otherwise (probably due to an
433    existing label).
434
435    In LABEL, the two-byte sequence "\\n" is interpreted as a new-line. */
436 bool
437 var_add_value_label (struct variable *v,
438                      const union value *value, const char *label)
439 {
440   alloc_value_labels (v);
441   return val_labs_add (v->val_labs, value, label);
442 }
443
444 /* Adds or replaces a value label with the given VALUE and UTF-8 encoded LABEL
445    to V.
446
447    In LABEL, the two-byte sequence "\\n" is interpreted as a new-line. */
448 void
449 var_replace_value_label (struct variable *v,
450                          const union value *value, const char *label)
451 {
452   alloc_value_labels (v);
453   val_labs_replace (v->val_labs, value, label);
454 }
455
456 /* Removes V's value labels, if any. */
457 void
458 var_clear_value_labels (struct variable *v)
459 {
460   var_set_value_labels (v, NULL);
461 }
462
463 /* Returns the label associated with VALUE for variable V, as a UTF-8 string in
464    a format suitable for output, or a null pointer if none. */
465 const char *
466 var_lookup_value_label (const struct variable *v, const union value *value)
467 {
468   return val_labs_find (v->val_labs, value);
469 }
470
471 /*
472    Append to STR the string representation of VALUE for variable V.
473    STR must be a pointer to an initialised struct string.
474 */
475 static void
476 append_value (const struct variable *v, const union value *value,
477               struct string *str)
478 {
479   char *s = data_out (value, var_get_encoding (v), &v->print);
480   ds_put_cstr (str, s);
481   free (s);
482 }
483
484 /* Append STR with a string representing VALUE for variable V.
485    That is, if VALUE has a label, append that label,
486    otherwise format VALUE and append the formatted string.
487    STR must be a pointer to an initialised struct string.
488 */
489 void
490 var_append_value_name (const struct variable *v, const union value *value,
491                        struct string *str)
492 {
493   enum settings_value_style style = settings_get_value_style ();
494   const char *name = var_lookup_value_label (v, value);
495
496   switch (style)
497     {
498     case SETTINGS_VAL_STYLE_VALUES:
499       append_value (v, value, str);
500       break;
501       
502     case SETTINGS_VAL_STYLE_LABELS:
503       if (name == NULL)
504         append_value (v, value, str);
505       else
506         ds_put_cstr (str, name);
507       break;
508
509     case SETTINGS_VAL_STYLE_BOTH:
510     default:
511       append_value (v, value, str);
512       if (name != NULL)
513         {
514           ds_put_cstr (str, " (");
515           ds_put_cstr (str, name);
516           ds_put_cstr (str, ")");
517         }
518       break;
519     };
520 }
521 \f
522 /* Print and write formats. */
523
524 /* Returns V's print format specification. */
525 const struct fmt_spec *
526 var_get_print_format (const struct variable *v)
527 {
528   return &v->print;
529 }
530
531 /* Sets V's print format specification to PRINT, which must be a
532    valid format specification for a variable of V's width
533    (ordinarily an output format, but input formats are not
534    rejected). */
535 void
536 var_set_print_format (struct variable *v, const struct fmt_spec *print)
537 {
538   if (!fmt_equal (&v->print, print))
539     {
540       assert (fmt_check_width_compat (print, v->width));
541       v->print = *print;
542       dict_var_changed (v);
543     }
544 }
545
546 /* Returns V's write format specification. */
547 const struct fmt_spec *
548 var_get_write_format (const struct variable *v)
549 {
550   return &v->write;
551 }
552
553 /* Sets V's write format specification to WRITE, which must be a
554    valid format specification for a variable of V's width
555    (ordinarily an output format, but input formats are not
556    rejected). */
557 void
558 var_set_write_format (struct variable *v, const struct fmt_spec *write)
559 {
560   if (!fmt_equal (&v->write, write))
561     {
562       assert (fmt_check_width_compat (write, v->width));
563       v->write = *write;
564       dict_var_changed (v);
565     }
566 }
567
568 /* Sets V's print and write format specifications to FORMAT,
569    which must be a valid format specification for a variable of
570    V's width (ordinarily an output format, but input formats are
571    not rejected). */
572 void
573 var_set_both_formats (struct variable *v, const struct fmt_spec *format)
574 {
575   var_set_print_format (v, format);
576   var_set_write_format (v, format);
577 }
578
579 /* Returns the default print and write format for a variable of
580    the given TYPE, as set by var_create.  The return value can be
581    used to reset a variable's print and write formats to the
582    default. */
583 struct fmt_spec
584 var_default_formats (int width)
585 {
586   return (width == 0
587           ? fmt_for_output (FMT_F, 8, 2)
588           : fmt_for_output (FMT_A, width, 0));
589 }
590
591
592 \f
593
594 /* Update the combined name and label string if necessary */
595 static void
596 update_vl_string (const struct variable *v)
597 {
598   /* Cast away const! */
599   struct string *str = (struct string *) &v->name_and_label;
600
601   if (ds_is_empty (str))
602     {
603       if (v->label)
604         ds_put_format (str, _("%s (%s)"), v->label, v->name);
605       else
606         ds_put_cstr (str, v->name);
607     }
608 }
609
610
611 /* Return a string representing this variable, in the form most
612    appropriate from a human factors perspective, that is, its
613    variable label if it has one, otherwise its name. */
614 const char *
615 var_to_string (const struct variable *v)
616 {
617   enum settings_var_style style = settings_get_var_style ();
618
619   switch (style)
620   {
621     case SETTINGS_VAR_STYLE_NAMES:
622       return v->name;
623       break;
624     case SETTINGS_VAR_STYLE_LABELS:
625       return v->label != NULL ? v->label : v->name;
626       break;
627     case SETTINGS_VAR_STYLE_BOTH:
628       update_vl_string (v);
629       return ds_cstr (&v->name_and_label);
630       break;
631     default:
632       NOT_REACHED ();
633       break;
634   };
635 }
636
637 /* Returns V's variable label, or a null pointer if it has none. */
638 const char *
639 var_get_label (const struct variable *v)
640 {
641   return v->label;
642 }
643
644 /* Sets V's variable label to UTF-8 encoded string LABEL, stripping off leading
645    and trailing white space.  If LABEL is a null pointer or if LABEL is an
646    empty string (after stripping white space), then V's variable label (if any)
647    is removed.
648
649    Variable labels are limited to 255 bytes in V's encoding (as returned by
650    var_get_encoding()).  If LABEL fits within this limit, this function returns
651    true.  Otherwise, the variable label is set to a truncated value, this
652    function returns false and, if ISSUE_WARNING is true, issues a warning.  */
653 bool
654 var_set_label (struct variable *v, const char *label, bool issue_warning)
655 {
656   bool truncated = false;
657
658   free (v->label);
659   v->label = NULL;
660
661   if (label != NULL && label[strspn (label, CC_SPACES)])
662     {
663       const char *dict_encoding = var_get_encoding (v);
664       struct substring s = ss_cstr (label);
665       size_t trunc_len;
666
667       if (dict_encoding != NULL)
668         {
669           enum { MAX_LABEL_LEN = 255 };
670
671           trunc_len = utf8_encoding_trunc_len (label, dict_encoding,
672                                                MAX_LABEL_LEN);
673           if (ss_length (s) > trunc_len)
674             {
675               if (issue_warning)
676                 msg (SW, _("Truncating variable label for variable `%s' to %d "
677                            "bytes."), var_get_name (v), MAX_LABEL_LEN);
678               ss_truncate (&s, trunc_len);
679               truncated = true;
680             }
681         }
682
683         v->label = ss_xstrdup (s);
684     }
685
686   ds_destroy (&v->name_and_label);
687   ds_init_empty (&v->name_and_label);
688
689   dict_var_changed (v);
690
691   return truncated;
692 }
693
694 /* Removes any variable label from V. */
695 void
696 var_clear_label (struct variable *v)
697 {
698   var_set_label (v, NULL, false);
699 }
700
701 /* Returns true if V has a variable V,
702    false otherwise. */
703 bool
704 var_has_label (const struct variable *v)
705 {
706   return v->label != NULL;
707 }
708 \f
709 /* Returns true if M is a valid variable measurement level,
710    false otherwise. */
711 bool
712 measure_is_valid (enum measure m)
713 {
714   return m == MEASURE_NOMINAL || m == MEASURE_ORDINAL || m == MEASURE_SCALE;
715 }
716
717 /* Returns a string version of measurement level M, for display to a user. */
718 const char *
719 measure_to_string (enum measure m)
720 {
721   switch (m)
722     {
723     case MEASURE_NOMINAL:
724       return _("Nominal");
725
726     case MEASURE_ORDINAL:
727       return _("Ordinal");
728
729     case MEASURE_SCALE:
730       return _("Scale");
731
732     default:
733       return "Invalid";
734     }
735 }
736
737 /* Returns V's measurement level. */
738 enum measure
739 var_get_measure (const struct variable *v)
740 {
741   return v->measure;
742 }
743
744 /* Sets V's measurement level to MEASURE. */
745 void
746 var_set_measure (struct variable *v, enum measure measure)
747 {
748   assert (measure_is_valid (measure));
749   v->measure = measure;
750   dict_var_changed (v);
751 }
752
753 /* Returns the default measurement level for a variable of the
754    given TYPE, as set by var_create.  The return value can be
755    used to reset a variable's measurement level to the
756    default. */
757 enum measure
758 var_default_measure (enum val_type type)
759 {
760   return type == VAL_NUMERIC ? MEASURE_SCALE : MEASURE_NOMINAL;
761 }
762 \f
763 /* Returns V's display width, which applies only to GUIs. */
764 int
765 var_get_display_width (const struct variable *v)
766 {
767   return v->display_width;
768 }
769
770 /* Sets V's display width to DISPLAY_WIDTH. */
771 void
772 var_set_display_width (struct variable *v, int new_width)
773 {
774   if (v->display_width != new_width)
775     {
776       v->display_width = new_width;
777       dict_var_display_width_changed (v);
778       dict_var_changed (v);
779     }
780 }
781
782 /* Returns the default display width for a variable of the given
783    WIDTH, as set by var_create.  The return value can be used to
784    reset a variable's display width to the default. */
785 int
786 var_default_display_width (int width)
787 {
788   return width == 0 ? 8 : MIN (width, 32);
789 }
790 \f
791 /* Returns true if A is a valid alignment,
792    false otherwise. */
793 bool
794 alignment_is_valid (enum alignment a)
795 {
796   return a == ALIGN_LEFT || a == ALIGN_RIGHT || a == ALIGN_CENTRE;
797 }
798
799 /* Returns a string version of alignment A, for display to a user. */
800 const char *
801 alignment_to_string (enum alignment a)
802 {
803   switch (a)
804     {
805     case ALIGN_LEFT:
806       return _("Left");
807
808     case ALIGN_RIGHT:
809       return _("Right");
810
811     case ALIGN_CENTRE:
812       return _("Center");
813
814     default:
815       return "Invalid";
816     }
817 }
818
819 /* Returns V's display alignment, which applies only to GUIs. */
820 enum alignment
821 var_get_alignment (const struct variable *v)
822 {
823   return v->alignment;
824 }
825
826 /* Sets V's display alignment to ALIGNMENT. */
827 void
828 var_set_alignment (struct variable *v, enum alignment alignment)
829 {
830   assert (alignment_is_valid (alignment));
831   v->alignment = alignment;
832   dict_var_changed (v);
833 }
834
835 /* Returns the default display alignment for a variable of the
836    given TYPE, as set by var_create.  The return value can be
837    used to reset a variable's display alignment to the default. */
838 enum alignment
839 var_default_alignment (enum val_type type)
840 {
841   return type == VAL_NUMERIC ? ALIGN_RIGHT : ALIGN_LEFT;
842 }
843 \f
844 /* Whether variables' values should be preserved from case to
845    case. */
846
847 /* Returns true if variable V's value should be left from case to
848    case, instead of being reset to system-missing or blanks. */
849 bool
850 var_get_leave (const struct variable *v)
851 {
852   return v->leave;
853 }
854
855 /* Sets V's leave setting to LEAVE. */
856 void
857 var_set_leave (struct variable *v, bool leave)
858 {
859   assert (leave || !var_must_leave (v));
860   v->leave = leave;
861   dict_var_changed (v);
862 }
863
864 /* Returns true if V must be left from case to case,
865    false if it can be set either way. */
866 bool
867 var_must_leave (const struct variable *v)
868 {
869   return var_get_dict_class (v) == DC_SCRATCH;
870 }
871 \f
872 /* Returns the number of short names stored in VAR.
873
874    Short names are used only for system and portable file input
875    and output.  They are upper-case only, not necessarily unique,
876    and limited to SHORT_NAME_LEN characters (plus a null
877    terminator).  Ordinarily a variable has at most one short
878    name, but very long string variables (longer than 255 bytes)
879    may have more.  A variable might not have any short name at
880    all if it hasn't been saved to or read from a system or
881    portable file. */
882 size_t
883 var_get_short_name_cnt (const struct variable *var) 
884 {
885   return var->short_name_cnt;
886 }
887
888 /* Returns VAR's short name with the given IDX, if it has one
889    with that index, or a null pointer otherwise.  Short names may
890    be sparse: even if IDX is less than the number of short names
891    in VAR, this function may return a null pointer. */
892 const char *
893 var_get_short_name (const struct variable *var, size_t idx)
894 {
895   return idx < var->short_name_cnt ? var->short_names[idx] : NULL;
896 }
897
898 /* Sets VAR's short name with the given IDX to the UTF-8 string SHORT_NAME.
899    The caller must already have checked that, in the dictionary encoding,
900    SHORT_NAME is no more than SHORT_NAME_LEN bytes long.  The new short name
901    will be converted to uppercase.
902
903    Specifying a null pointer for SHORT_NAME clears the specified short name. */
904 void
905 var_set_short_name (struct variable *var, size_t idx, const char *short_name)
906 {
907   assert (short_name == NULL || id_is_plausible (short_name, false));
908
909   /* Clear old short name numbered IDX, if any. */
910   if (idx < var->short_name_cnt) 
911     {
912       free (var->short_names[idx]);
913       var->short_names[idx] = NULL; 
914     }
915
916   /* Install new short name for IDX. */
917   if (short_name != NULL) 
918     {
919       if (idx >= var->short_name_cnt)
920         {
921           size_t old_cnt = var->short_name_cnt;
922           size_t i;
923           var->short_name_cnt = MAX (idx * 2, 1);
924           var->short_names = xnrealloc (var->short_names, var->short_name_cnt,
925                                         sizeof *var->short_names);
926           for (i = old_cnt; i < var->short_name_cnt; i++)
927             var->short_names[i] = NULL;
928         }
929       var->short_names[idx] = xstrdup (short_name);
930       str_uppercase (var->short_names[idx]);
931     }
932
933   dict_var_changed (var);
934 }
935
936 /* Clears V's short names. */
937 void
938 var_clear_short_names (struct variable *v)
939 {
940   size_t i;
941
942   for (i = 0; i < v->short_name_cnt; i++)
943     free (v->short_names[i]);
944   free (v->short_names);
945   v->short_names = NULL;
946   v->short_name_cnt = 0;
947 }
948 \f
949 /* Relationship with dictionary. */
950
951 /* Returns V's index within its dictionary, the value
952    for which "dict_get_var (dict, index)" will return V.
953    V must be in a dictionary. */
954 size_t
955 var_get_dict_index (const struct variable *v)
956 {
957   assert (var_has_vardict (v));
958   return vardict_get_dict_index (v->vardict);
959 }
960
961 /* Returns V's index within the case represented by its
962    dictionary, that is, the value for which "case_data_idx (case,
963    index)" will return the data for V in that case.
964    V must be in a dictionary. */
965 size_t
966 var_get_case_index (const struct variable *v)
967 {
968   assert (var_has_vardict (v));
969   return vardict_get_case_index (v->vardict);
970 }
971 \f
972 /* Returns V's auxiliary data, or a null pointer if none has been
973    attached. */
974 void *
975 var_get_aux (const struct variable *v)
976 {
977   return v->aux;
978 }
979
980 /* Assign auxiliary data AUX to variable V, which must not
981    already have auxiliary data.  Before V's auxiliary data is
982    cleared, AUX_DTOR(V) will be called.  (var_dtor_free, below,
983    may be appropriate for use as AUX_DTOR.) */
984 void *
985 var_attach_aux (const struct variable *v_,
986                 void *aux, void (*aux_dtor) (struct variable *))
987 {
988   struct variable *v = CONST_CAST (struct variable *, v_);
989   assert (v->aux == NULL);
990   assert (aux != NULL);
991   v->aux = aux;
992   v->aux_dtor = aux_dtor;
993   return aux;
994 }
995
996 /* Remove auxiliary data, if any, from V, and return it, without
997    calling any associated destructor. */
998 void *
999 var_detach_aux (struct variable *v)
1000 {
1001   void *aux = v->aux;
1002   assert (aux != NULL);
1003   v->aux = NULL;
1004   return aux;
1005 }
1006
1007 /* Clears auxiliary data, if any, from V, and calls any
1008    associated destructor. */
1009 void
1010 var_clear_aux (struct variable *v)
1011 {
1012   if (v->aux != NULL)
1013     {
1014       if (v->aux_dtor != NULL)
1015         v->aux_dtor (v);
1016       v->aux = NULL;
1017     }
1018 }
1019
1020 /* This function is appropriate for use an auxiliary data
1021    destructor (passed as AUX_DTOR to var_attach_aux()) for the
1022    case where the auxiliary data should be passed to free(). */
1023 void
1024 var_dtor_free (struct variable *v)
1025 {
1026   free (v->aux);
1027 }
1028 \f
1029 /* Returns variable V's attribute set.  The caller may examine or
1030    modify the attribute set, but must not destroy it.  Destroying
1031    V, or calling var_set_attributes() on V, will also destroy its
1032    attribute set. */
1033 struct attrset *
1034 var_get_attributes (const struct variable *v) 
1035 {
1036   return CONST_CAST (struct attrset *, &v->attributes);
1037 }
1038
1039 /* Replaces variable V's attributes set by a copy of ATTRS. */
1040 void
1041 var_set_attributes (struct variable *v, const struct attrset *attrs) 
1042 {
1043   attrset_destroy (&v->attributes);
1044   attrset_clone (&v->attributes, attrs);
1045 }
1046
1047 /* Returns true if V has any custom attributes, false if it has none. */
1048 bool
1049 var_has_attributes (const struct variable *v)
1050 {
1051   return attrset_count (&v->attributes) > 0;
1052 }
1053 \f
1054 /* Returns the encoding of values of variable VAR.  (This is actually a
1055    property of the dictionary.)  Returns null if no specific encoding has been
1056    set.  */
1057 const char *
1058 var_get_encoding (const struct variable *var)
1059 {
1060   return (var_has_vardict (var)
1061           ? dict_get_encoding (vardict_get_dictionary (var->vardict))
1062           : NULL);
1063 }
1064 \f
1065 /* Returns V's vardict structure. */
1066 struct vardict_info *
1067 var_get_vardict (const struct variable *v)
1068 {
1069   return CONST_CAST (struct vardict_info *, v->vardict);
1070 }
1071
1072 /* Sets V's vardict data to VARDICT. */
1073 void
1074 var_set_vardict (struct variable *v, struct vardict_info *vardict)
1075 {
1076   v->vardict = vardict;
1077 }
1078
1079 /* Returns true if V has vardict data. */
1080 bool
1081 var_has_vardict (const struct variable *v)
1082 {
1083   return v->vardict != NULL;
1084 }
1085
1086 /* Clears V's vardict data. */
1087 void
1088 var_clear_vardict (struct variable *v)
1089 {
1090   v->vardict = NULL;
1091 }