Fix assertion for proper Huffman merge pattern: 0 == 1 modulo 1.
[pspp] / src / apply-dict.c
1 /* PSPP - computes sample statistics.
2    Copyright (C) 1997-9, 2000 Free Software Foundation, Inc.
3    Written by Ben Pfaff <blp@gnu.org>.
4
5    This program is free software; you can redistribute it and/or
6    modify it under the terms of the GNU General Public License as
7    published by the Free Software Foundation; either version 2 of the
8    License, or (at your option) any later version.
9
10    This program is distributed in the hope that it will be useful, but
11    WITHOUT ANY WARRANTY; without even the implied warranty of
12    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13    General Public License for more details.
14
15    You should have received a copy of the GNU General Public License
16    along with this program; if not, write to the Free Software
17    Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA
18    02111-1307, USA. */
19
20 #include <config.h>
21 #include <stdlib.h>
22 #include "command.h"
23 #include "dictionary.h"
24 #include "error.h"
25 #include "file-handle.h"
26 #include "hash.h"
27 #include "lexer.h"
28 #include "sfm-read.h"
29 #include "str.h"
30 #include "value-labels.h"
31 #include "var.h"
32
33 #include "debug-print.h"
34
35 /* Parses and executes APPLY DICTIONARY. */
36 int
37 cmd_apply_dictionary (void)
38 {
39   struct file_handle *handle;
40   struct sfm_reader *reader;
41   struct dictionary *dict;
42
43   int n_matched = 0;
44
45   int i;
46   
47   lex_match_id ("FROM");
48   lex_match ('=');
49   handle = fh_parse ();
50   if (!handle)
51     return CMD_FAILURE;
52
53   reader = sfm_open_reader (handle, &dict, NULL);
54   if (dict == NULL)
55     return CMD_FAILURE;
56   sfm_close_reader (reader);
57
58   for (i = 0; i < dict_get_var_cnt (dict); i++)
59     {
60       struct variable *s = dict_get_var (dict, i);
61       struct variable *t = dict_lookup_var (default_dict, s->name);
62       if (t == NULL)
63         continue;
64
65       n_matched++;
66       if (s->type != t->type)
67         {
68           msg (SW, _("Variable %s is %s in target file, but %s in "
69                      "source file."),
70                s->name,
71                t->type == ALPHA ? _("string") : _("numeric"),
72                s->type == ALPHA ? _("string") : _("numeric"));
73           continue;
74         }
75
76       if (s->label && strcspn (s->label, " ") != strlen (s->label))
77         {
78           free (t->label);
79           t->label = s->label;
80           s->label = NULL;
81         }
82
83       if (val_labs_count (s->val_labs) && t->width > MAX_SHORT_STRING)
84         msg (SW, _("Cannot add value labels from source file to "
85                    "long string variable %s."),
86              s->name);
87       else if (val_labs_count (s->val_labs))
88         {
89           /* Whether to apply the value labels. */
90           int apply = 1;
91           
92           if (t->width < s->width)
93             {
94               struct val_labs_iterator *i;
95               struct val_lab *lab;
96
97               for (lab = val_labs_first (s->val_labs, &i); lab != NULL;
98                    lab = val_labs_next (s->val_labs, &i))
99                 {
100                   int j;
101
102                   /* We will apply the value labels only if all
103                      the truncated characters are blanks. */
104                   for (j = t->width; j < s->width; j++)
105                     if (lab->value.s[j] != ' ') 
106                       {
107                         val_labs_done (&i);
108                         apply = 0;
109                         break; 
110                       }
111                 }
112             }
113           else
114             {
115               /* Fortunately, we follow the convention that all value
116                  label values are right-padded with spaces, so it is
117                  unnecessary to bother padding values here. */
118             }
119
120           if (apply) 
121             {
122               val_labs_destroy (t->val_labs);
123               t->val_labs = s->val_labs;
124               val_labs_set_width (t->val_labs, t->width);
125               s->val_labs = val_labs_create (s->width);
126             }
127         }
128
129       if (s->miss_type != MISSING_NONE && t->width > MAX_SHORT_STRING)
130         msg (SW, _("Cannot apply missing values from source file to "
131                    "long string variable %s."),
132              s->name);
133       else if (s->miss_type != MISSING_NONE)
134         {
135           if (t->width < s->width)
136             {
137               static const int miss_count[MISSING_COUNT] = 
138                 {
139                   0, 1, 2, 3, 2, 1, 1, 3, 2, 2,
140                 };
141
142               int j, k;
143               
144               for (j = 0; j < miss_count[s->miss_type]; j++)
145                 for (k = t->width; k < s->width; k++)
146                   if (s->missing[j].s[k] != ' ')
147                     goto skip_missing_values;
148             }
149
150           t->miss_type = s->miss_type;
151           memcpy (t->missing, s->missing, sizeof s->missing);
152         }
153     skip_missing_values: ;
154
155       if (s->type == NUMERIC)
156         {
157           t->print = s->print;
158           t->write = s->write;
159         }
160     }
161
162   if (!n_matched)
163     msg (SW, _("No matching variables found between the source "
164                "and target files."));
165       
166   /* Weighting. */
167   if (dict_get_weight (dict) != NULL) 
168     {
169       struct variable *new_weight
170         = dict_lookup_var (default_dict, dict_get_weight (dict)->name);
171
172       if (new_weight != NULL)
173         dict_set_weight (default_dict, new_weight);
174     }
175   
176   sfm_close_reader (reader);
177
178   return lex_end_of_command ();
179 }