lexer: Add support for embedded \0 bytes and missing trailing new-line.
[pspp] / tests / language / lexer / lexer.at
1 dnl PSPP - a program for statistical analysis.
2 dnl Copyright (C) 2017 Free Software Foundation, Inc.
3 dnl 
4 dnl This program is free software: you can redistribute it and/or modify
5 dnl it under the terms of the GNU General Public License as published by
6 dnl the Free Software Foundation, either version 3 of the License, or
7 dnl (at your option) any later version.
8 dnl 
9 dnl This program is distributed in the hope that it will be useful,
10 dnl but WITHOUT ANY WARRANTY; without even the implied warranty of
11 dnl MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12 dnl GNU General Public License for more details.
13 dnl 
14 dnl You should have received a copy of the GNU General Public License
15 dnl along with this program.  If not, see <http://www.gnu.org/licenses/>.
16 dnl
17 AT_BANNER([lexer])
18
19 AT_SETUP([lexer ignores initial @%:@! line])
20 AT_DATA([lexer.sps], [dnl
21 #! /usr/local/bin/pspp
22 DATA LIST LIST NOTABLE /a.
23 BEGIN DATA.
24 1
25 2
26 END DATA.
27 LIST.
28 ])
29 AT_CHECK([pspp -o pspp.csv lexer.sps])
30 AT_CHECK([cat pspp.csv], [0], [dnl
31 Table: Data List
32 a
33 1.00
34 2.00
35 ])
36 AT_CLEANUP
37
38 AT_SETUP([lexer properly reports scan errors])
39 AT_DATA([lexer.sps], [dnl
40 x'123'
41 x'1x'
42 u''
43 u'012345678'
44 u'd800'
45 u'110000'
46 'foo
47 'very long unterminated string that be ellipsized in its error message
48 1e .x
49 `
50
51 ])
52 AT_CHECK([pspp -O format=csv lexer.sps], [1], [dnl
53 "lexer.sps:1.1-1.6: error: Syntax error at `x'123'': String of hex digits has 3 characters, which is not a multiple of 2."
54
55 lexer.sps:2.1-2.5: error: Syntax error at `x'1x'': `x' is not a valid hex digit.
56
57 "lexer.sps:3.1-3.3: error: Syntax error at `u''': Unicode string contains 0 bytes, which is not in the valid range of 1 to 8 bytes."
58
59 "lexer.sps:4.1-4.12: error: Syntax error at `u'012345678'': Unicode string contains 9 bytes, which is not in the valid range of 1 to 8 bytes."
60
61 lexer.sps:5.1-5.7: error: Syntax error at `u'd800'': U+D800 is not a valid Unicode code point.
62
63 lexer.sps:6.1-6.9: error: Syntax error at `u'110000'': U+110000 is not a valid Unicode code point.
64
65 lexer.sps:7.1-7.4: error: Syntax error at `'foo': Unterminated string constant.
66
67 lexer.sps:8.1-8.70: error: Syntax error at `'very long unterminated string that be ellipsized in its err...': Unterminated string constant.
68
69 lexer.sps:9.1-9.2: error: Syntax error at `1e': Missing exponent following `1e'.
70
71 lexer.sps:9.4: error: Syntax error at `.': Unexpected `.' in middle of command.
72
73 lexer.sps:9: error: Unknown command `x'.
74
75 lexer.sps:10.1: error: Syntax error at ``': Bad character ``' in input.
76
77 lexer.sps:11.1: error: Syntax error at `�': Bad character U+FFFD in input.
78 ])
79 AT_CLEANUP
80
81 # Bug #47602.
82 AT_SETUP([lexer crash due to null byte])
83 # Intentionally leave out the new-line and add a null byte:
84 printf "datA dist list notable file='input.txt'/a b c.
85 lis|.\0" > lexer.sps
86
87 AT_CHECK([pspp -O format=csv lexer.sps], [1], [dnl
88 lexer.sps:1: error: Unknown command `datA dist'.
89
90 lexer.sps:2: error: LIST: LIST is allowed only after the active dataset has been defined.
91
92 lexer.sps:2.5: error: LIST: Syntax error at `.': Unexpected `.' in middle of command.
93
94 lexer.sps:2.6: error: LIST: Syntax error at `...': Bad character U+0000 in input.
95 ])
96 AT_CLEANUP