fix string lexer
[pspp] / tests / language / lexer / scan-test.c
1 /* PSPP - a program for statistical analysis.
2    Copyright (C) 2010, 2011, 2013 Free Software Foundation, Inc.
3
4    This program is free software: you can redistribute it and/or modify
5    it under the terms of the GNU General Public License as published by
6    the Free Software Foundation, either version 3 of the License, or
7    (at your option) any later version.
8
9    This program is distributed in the hope that it will be useful,
10    but WITHOUT ANY WARRANTY; without even the implied warranty of
11    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12    GNU General Public License for more details.
13
14    You should have received a copy of the GNU General Public License
15    along with this program.  If not, see <http://www.gnu.org/licenses/>. */
16
17 #include <config.h>
18
19 #include <ctype.h>
20 #include <errno.h>
21 #include <getopt.h>
22 #include <limits.h>
23 #include <stdio.h>
24 #include <stdlib.h>
25 #include <string.h>
26
27 #include "libpspp/assertion.h"
28 #include "libpspp/compiler.h"
29 #include "libpspp/misc.h"
30 #include "language/lexer/scan.h"
31 #include "language/lexer/token.h"
32
33 #include "gl/error.h"
34 #include "gl/ftoastr.h"
35 #include "gl/progname.h"
36 #include "gl/read-file.h"
37 #include "gl/xalloc.h"
38
39 /* -a/--auto, -b/--batch, -i/--interactive: syntax mode. */
40 static enum segmenter_mode mode = SEG_MODE_AUTO;
41
42 /* -s, --strip-trailing-newline: Strip trailing newline from last line of
43     input. */
44 static bool strip_trailing_newline;
45
46 static const char *parse_options (int argc, char **argv);
47 static void usage (void) NO_RETURN;
48
49 int
50 main (int argc, char *argv[])
51 {
52   const char *file_name;
53   size_t length;
54   char *input;
55
56   struct string_lexer slex;
57   bool more;
58
59   set_program_name (argv[0]);
60   file_name = parse_options (argc, argv);
61
62   /* Read from stdin into 'input'. */
63   input = (!strcmp (file_name, "-")
64            ? fread_file (stdin, 0, &length)
65            : read_file (file_name, 0, &length));
66   if (input == NULL)
67     error (EXIT_FAILURE, errno, "reading %s failed", file_name);
68
69   if (strip_trailing_newline && length && input[length - 1] == '\n')
70     {
71       length--;
72       if (length && input[length - 1] == '\r')
73         length--;
74     }
75
76   string_lexer_init (&slex, input, length, mode, false);
77   do
78     {
79       struct token token;
80
81       more = string_lexer_next (&slex, &token);
82
83       printf ("%s", scan_type_to_string (token.type));
84       if (token.number != 0.0)
85         {
86           double x = token.number;
87
88           if (x > LONG_MIN && x <= LONG_MAX && floor (x) == x)
89             printf (" %ld", (long int) x);
90           else
91             printf (" %.3g", x);
92         }
93       if (token.string.string != NULL || token.string.length > 0)
94         printf (" \"%.*s\"", (int) token.string.length, token.string.string);
95       printf ("\n");
96
97       token_uninit (&token);
98     }
99   while (more);
100
101   free (input);
102
103   return 0;
104 }
105
106 static const char *
107 parse_options (int argc, char **argv)
108 {
109   for (;;)
110     {
111       static const struct option options[] =
112         {
113           {"auto", no_argument, NULL, 'a'},
114           {"batch", no_argument, NULL, 'b'},
115           {"interactive", no_argument, NULL, 'i'},
116           {"strip-trailing-newline", no_argument, NULL, 's'},
117           {"help", no_argument, NULL, 'h'},
118           {NULL, 0, NULL, 0},
119         };
120
121       int c = getopt_long (argc, argv, "sabih", options, NULL);
122       if (c == -1)
123         break;
124
125       switch (c)
126         {
127         case 'a':
128           mode = SEG_MODE_AUTO;
129           break;
130
131         case 'b':
132           mode = SEG_MODE_BATCH;
133           break;
134
135         case 'i':
136           mode = SEG_MODE_INTERACTIVE;
137           break;
138
139         case 's':
140           strip_trailing_newline = true;
141           break;
142
143         case 'h':
144           usage ();
145
146         case 0:
147           break;
148
149         case '?':
150           exit (EXIT_FAILURE);
151           break;
152
153         default:
154           NOT_REACHED ();
155         }
156
157     }
158
159   if (optind + 1 != argc)
160     error (1, 0, "exactly one non-option argument required; "
161            "use --help for help");
162   return argv[optind];
163 }
164
165 static void
166 usage (void)
167 {
168   printf ("\
169 %s, to test breaking PSPP syntax into tokens\n\
170 usage: %s [OPTIONS] INPUT\n\
171 \n\
172 Options:\n\
173   -a, --auto          use \"auto\" syntax mode\n\
174   -b, --batch         use \"batch\" syntax mode\n\
175   -i, --interactive   use \"interactive\" syntax mode (default)\n\
176   -s, --strip-trailing-newline  remove newline from end of input\n\
177   -v, --verbose       include rows and column numbers in output\n\
178   -h, --help          print this help message\n",
179           program_name, program_name);
180   exit (EXIT_SUCCESS);
181 }