Change license from GPLv2+ to GPLv3+.
[pspp-builds.git] / src / language / data-io / data-reader.c
index 6cd92882eb6c854faab2de03c332b49a767fa7b0..c752587b5b1354393de8442eb6efb47d579ed2c9 100644 (file)
@@ -1,21 +1,18 @@
-/* PSPP - computes sample statistics.
+/* PSPP - a program for statistical analysis.
    Copyright (C) 1997-2004, 2006 Free Software Foundation, Inc.
-   Written by Ben Pfaff <blp@gnu.org>.
 
-   This program is free software; you can redistribute it and/or
-   modify it under the terms of the GNU General Public License as
-   published by the Free Software Foundation; either version 2 of the
-   License, or (at your option) any later version.
+   This program is free software: you can redistribute it and/or modify
+   it under the terms of the GNU General Public License as published by
+   the Free Software Foundation, either version 3 of the License, or
+   (at your option) any later version.
 
-   This program is distributed in the hope that it will be useful, but
-   WITHOUT ANY WARRANTY; without even the implied warranty of
-   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
-   General Public License for more details.
+   This program is distributed in the hope that it will be useful,
+   but WITHOUT ANY WARRANTY; without even the implied warranty of
+   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+   GNU General Public License for more details.
 
    You should have received a copy of the GNU General Public License
-   along with this program; if not, write to the Free Software
-   Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
-   02110-1301, USA. */
+   along with this program.  If not, see <http://www.gnu.org/licenses/>. */
 
 #include <config.h>
 
 #include <stdio.h>
 #include <stdlib.h>
 
+#include <data/casereader.h>
 #include <data/file-handle-def.h>
 #include <data/file-name.h>
 #include <data/procedure.h>
 #include <language/command.h>
 #include <language/data-io/file-handle.h>
 #include <language/lexer/lexer.h>
-#include <language/line-buffer.h>
+#include <language/prompt.h>
 #include <libpspp/alloc.h>
 #include <libpspp/assertion.h>
 #include <libpspp/message.h>
@@ -48,7 +46,7 @@
 enum dfm_reader_flags
   {
     DFM_ADVANCE = 002,          /* Read next line on dfm_get_record() call? */
-    DFM_SAW_BEGIN_DATA = 004,   /* For inline_file only, whether we've 
+    DFM_SAW_BEGIN_DATA = 004,   /* For inline_file only, whether we've
                                    already read a BEGIN DATA line. */
     DFM_TABS_EXPANDED = 010,    /* Tabs have been expanded. */
   };
@@ -64,6 +62,7 @@ struct dfm_reader
     FILE *file;                 /* Associated file. */
     size_t pos;                 /* Offset in line of current character. */
     unsigned eof_cnt;           /* # of attempts to advance past EOF. */
+    struct lexer *lexer;        /* The lexer reading the file */
   };
 
 /* Closes reader R opened by dfm_open_reader(). */
@@ -80,10 +79,10 @@ dfm_close_reader (struct dfm_reader *r)
   is_inline = r->fh == fh_inline_file ();
   file_name = is_inline ? NULL : xstrdup (fh_get_file_name (r->fh));
   still_open = fh_close (r->fh, "data file", "rs");
-  if (still_open) 
+  if (still_open)
     {
       free (file_name);
-      return; 
+      return;
     }
 
   if (!is_inline)
@@ -91,11 +90,11 @@ dfm_close_reader (struct dfm_reader *r)
   else
     {
       /* Skip any remaining data on the inline file. */
-      if (r->flags & DFM_SAW_BEGIN_DATA) 
+      if (r->flags & DFM_SAW_BEGIN_DATA)
         {
           dfm_reread_record (r, 0);
           while (!dfm_eof (r))
-            dfm_forward_record (r); 
+            dfm_forward_record (r);
         }
     }
 
@@ -111,7 +110,7 @@ dfm_close_reader (struct dfm_reader *r)
    file between BEGIN FILE and END FILE.  Returns a reader if
    successful, or a null pointer otherwise. */
 struct dfm_reader *
-dfm_open_reader (struct file_handle *fh)
+dfm_open_reader (struct file_handle *fh, struct lexer *lexer)
 {
   struct dfm_reader *r;
   void **rp;
@@ -120,18 +119,19 @@ dfm_open_reader (struct file_handle *fh)
   if (rp == NULL)
     return NULL;
   if (*rp != NULL)
-    return *rp; 
-  
+    return *rp;
+
   r = xmalloc (sizeof *r);
   r->fh = fh;
+  r->lexer = lexer ;
   ds_init_empty (&r->line);
   ds_init_empty (&r->scratch);
   r->flags = DFM_ADVANCE;
   r->eof_cnt = 0;
-  if (fh != fh_inline_file ()) 
+  if (fh != fh_inline_file ())
     {
       r->where.file_name = fh_get_file_name (fh);
-      r->where.line_number = 0; 
+      r->where.line_number = 0;
       r->file = fn_open (fh_get_file_name (fh), "rb");
       if (r->file == NULL)
         {
@@ -149,7 +149,7 @@ dfm_open_reader (struct file_handle *fh)
 
 /* Returns true if an I/O error occurred on READER, false otherwise. */
 bool
-dfm_reader_error (const struct dfm_reader *r) 
+dfm_reader_error (const struct dfm_reader *r)
 {
   return fh_get_referent (r->fh) == FH_REF_FILE && ferror (r->file);
 }
@@ -163,14 +163,14 @@ read_inline_record (struct dfm_reader *r)
     {
       r->flags |= DFM_SAW_BEGIN_DATA;
 
-      while (token == '.')
-        lex_get ();
-      if (!lex_force_match_id ("BEGIN") || !lex_force_match_id ("DATA"))
+      while (lex_token (r->lexer) == '.')
+        lex_get (r->lexer);
+      if (!lex_force_match_id (r->lexer, "BEGIN") || !lex_force_match_id (r->lexer, "DATA"))
         return false;
-      getl_set_prompt_style (GETL_PROMPT_DATA);
+      prompt_set_style (PROMPT_DATA);
     }
-      
-  if (!getl_read_line (NULL))
+
+  if (!lex_get_line_raw (r->lexer, NULL))
     {
       msg (SE, _("Unexpected end-of-file while reading data in BEGIN "
                  "DATA.  This probably indicates "
@@ -180,14 +180,15 @@ read_inline_record (struct dfm_reader *r)
       return false;
     }
 
-  if (ds_length (&getl_buf) >= 8
-      && !strncasecmp (ds_cstr (&getl_buf), "end data", 8))
+  if (ds_length (lex_entire_line_ds (r->lexer) ) >= 8
+      && !strncasecmp (lex_entire_line (r->lexer), "end data", 8))
     {
-      lex_set_prog (ds_end (&getl_buf));
+      lex_discard_line (r->lexer);
       return false;
     }
 
-  ds_assign_string (&r->line, &getl_buf);
+  ds_assign_string (&r->line, lex_entire_line_ds (r->lexer) );
+
   return true;
 }
 
@@ -200,13 +201,14 @@ read_file_record (struct dfm_reader *r)
   ds_clear (&r->line);
   if (fh_get_mode (r->fh) == FH_MODE_TEXT)
     {
-      if (!ds_read_line (&r->line, r->file)) 
+      if (!ds_read_line (&r->line, r->file))
         {
           if (ferror (r->file))
             msg (ME, _("Error reading file %s: %s."),
                  fh_get_name (r->fh), strerror (errno));
           return false;
         }
+      ds_chomp (&r->line, '\n');
     }
   else if (fh_get_mode (r->fh) == FH_MODE_BINARY)
     {
@@ -253,16 +255,16 @@ read_record (struct dfm_reader *r)
    an error message is issued, and the caller should more
    forcibly abort to avoid an infinite loop. */
 unsigned
-dfm_eof (struct dfm_reader *r) 
+dfm_eof (struct dfm_reader *r)
 {
   if (r->flags & DFM_ADVANCE)
     {
       r->flags &= ~DFM_ADVANCE;
 
-      if (r->eof_cnt == 0 && read_record (r)
+      if (r->eof_cnt == 0 && read_record (r) )
         {
           r->pos = 0;
-          return 0; 
+          return 0;
         }
 
       r->eof_cnt++;
@@ -296,7 +298,7 @@ dfm_get_record (struct dfm_reader *r)
    reading from the file is necessary or at end of file, so call
    dfm_eof() first.*/
 void
-dfm_expand_tabs (struct dfm_reader *r) 
+dfm_expand_tabs (struct dfm_reader *r)
 {
   size_t ofs, new_pos, tab_width;
 
@@ -321,21 +323,21 @@ dfm_expand_tabs (struct dfm_reader *r)
   for (ofs = 0; ofs < ds_length (&r->line); ofs++)
     {
       unsigned char c;
-      
+
       if (ofs == r->pos)
         new_pos = ds_length (&r->scratch);
 
       c = ds_data (&r->line)[ofs];
       if (c != '\t')
         ds_put_char (&r->scratch, c);
-      else 
+      else
         {
           do
             ds_put_char (&r->scratch, ' ');
           while (ds_length (&r->scratch) % tab_width != 0);
         }
     }
-  if (new_pos == SIZE_MAX) 
+  if (new_pos == SIZE_MAX)
     {
       /* Maintain the same relationship between position and line
          length that we had before.  DATA LIST uses a
@@ -390,7 +392,7 @@ dfm_column_start (const struct dfm_reader *r)
    of the line.  At or before end-of-line, this is 0; one column
    after end-of-line, this is 1; and so on. */
 size_t
-dfm_columns_past_end (const struct dfm_reader *r) 
+dfm_columns_past_end (const struct dfm_reader *r)
 {
   return r->pos < ds_length (&r->line) ? 0 : ds_length (&r->line) - r->pos;
 }
@@ -398,7 +400,7 @@ dfm_columns_past_end (const struct dfm_reader *r)
 /* Returns the 1-based column within the current line that P
    designates. */
 size_t
-dfm_get_column (const struct dfm_reader *r, const char *p) 
+dfm_get_column (const struct dfm_reader *r, const char *p)
 {
   return ds_pointer_to_position (&r->line, p) + 1;
 }
@@ -423,7 +425,7 @@ dfm_pop (struct dfm_reader *r)
 
 /* Perform BEGIN DATA...END DATA as a procedure in itself. */
 int
-cmd_begin_data (struct dataset *ds)
+cmd_begin_data (struct lexer *lexer, struct dataset *ds)
 {
   struct dfm_reader *r;
   bool ok;
@@ -436,13 +438,13 @@ cmd_begin_data (struct dataset *ds)
     }
 
   /* Open inline file. */
-  r = dfm_open_reader (fh_inline_file ());
+  r = dfm_open_reader (fh_inline_file (), lexer);
   r->flags |= DFM_SAW_BEGIN_DATA;
 
   /* Input procedure reads from inline file. */
-  getl_set_prompt_style (GETL_PROMPT_DATA);
-  ok = procedure (ds, NULL, NULL);
-
+  prompt_set_style (PROMPT_DATA);
+  casereader_destroy (proc_open (ds));
+  ok = proc_commit (ds);
   dfm_close_reader (r);
 
   return ok ? CMD_SUCCESS : CMD_CASCADING_FAILURE;