Make cases simpler, faster, and easier to understand.
[pspp-builds.git] / src / data / case.c
index 8613eca6f1b9944da0ffd2269f4dd8bf0691f429..8ae989002f016f2b6978ede795415715c1fe585a 100644 (file)
-/* PSPP - computes sample statistics.
-   Copyright (C) 2004 Free Software Foundation, Inc.
-   Written by Ben Pfaff <blp@gnu.org>.
+/* PSPP - a program for statistical analysis.
+   Copyright (C) 2004, 2007, 2009 Free Software Foundation, Inc.
 
-   This program is free software; you can redistribute it and/or
-   modify it under the terms of the GNU General Public License as
-   published by the Free Software Foundation; either version 2 of the
-   License, or (at your option) any later version.
+   This program is free software: you can redistribute it and/or modify
+   it under the terms of the GNU General Public License as published by
+   the Free Software Foundation, either version 3 of the License, or
+   (at your option) any later version.
 
-   This program is distributed in the hope that it will be useful, but
-   WITHOUT ANY WARRANTY; without even the implied warranty of
-   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
-   General Public License for more details.
+   This program is distributed in the hope that it will be useful,
+   but WITHOUT ANY WARRANTY; without even the implied warranty of
+   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+   GNU General Public License for more details.
 
    You should have received a copy of the GNU General Public License
-   along with this program; if not, write to the Free Software
-   Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
-   02110-1301, USA. */
+   along with this program.  If not, see <http://www.gnu.org/licenses/>. */
 
 #include <config.h>
-#include "case.h"
+
+#include <data/case.h>
+
+#include <assert.h>
 #include <limits.h>
+#include <stddef.h>
 #include <stdlib.h>
-#include "value.h"
-#include "alloc.h"
-#include "str.h"
-#include "variable.h"
-
-#ifdef DEBUGGING
-#undef NDEBUG
-#else
-#ifndef NDEBUG
-#define NDEBUG
-#endif
-#endif
-#include <assert.h>
 
-/* Changes C not to share data with any other case.
-   C must be a case with a reference count greater than 1.
-   There should be no reason for external code to call this
-   function explicitly.  It will be called automatically when
-   needed. */
-void
-case_unshare (struct ccase *c) 
-{
-  struct case_data *cd;
-  
-  assert (c != NULL);
-  assert (c->this == c);
-  assert (c->case_data != NULL);
-  assert (c->case_data->ref_cnt > 1);
-
-  cd = c->case_data;
-  cd->ref_cnt--;
-  case_create (c, c->case_data->value_cnt);
-  memcpy (c->case_data->values, cd->values,
-          sizeof *cd->values * cd->value_cnt); 
-}
+#include <data/value.h>
+#include <data/variable.h>
+#include <libpspp/str.h>
 
-/* Returns the number of bytes needed by a case with VALUE_CNT
-   values. */
-static inline size_t
-case_size (size_t value_cnt) 
-{
-  return (offsetof (struct case_data, values)
-          + value_cnt * sizeof (union value));
-}
+#include "minmax.h"
+#include "xalloc.h"
 
-#ifdef DEBUGGING
-/* Initializes C as a null case. */
-void
-case_nullify (struct ccase *c) 
+/* Returns the number of bytes needed by a case with N_VALUES
+   values. */
+static size_t
+case_size (size_t n_values)
 {
-  c->case_data = NULL;
-  c->this = c;
+  return offsetof (struct ccase, values) + n_values * sizeof (union value);
 }
-#endif /* DEBUGGING */
 
-#ifdef DEBUGGING
-/* Returns true iff C is a null case. */
-int
-case_is_null (const struct ccase *c) 
+/* Returns true if case C contains COUNT cases starting at index
+   OFS, false if any of those values are out of range for case
+   C. */
+static inline bool UNUSED
+range_is_valid (const struct ccase *c, size_t ofs, size_t count)
 {
-  return c->case_data == NULL;
+  return (count <= c->n_values
+          && ofs <= c->n_values
+          && ofs + count <= c->n_values);
 }
-#endif /* DEBUGGING */
 
-/* Initializes C as a new case that can store VALUE_CNT values.
+/* Creates and returns a new case that can store N_VALUES values.
    The values have indeterminate contents until explicitly
    written. */
-void
-case_create (struct ccase *c, size_t value_cnt) 
+struct ccase *
+case_create (size_t n_values)
 {
-  if (!case_try_create (c, value_cnt))
+  struct ccase *c = case_try_create (n_values);
+  if (c == NULL)
     xalloc_die ();
+  return c;
 }
 
-#ifdef DEBUGGING
-/* Initializes CLONE as a copy of ORIG. */
-void
-case_clone (struct ccase *clone, const struct ccase *orig)
+/* Like case_create, but returns a null pointer if not enough
+   memory is available. */
+struct ccase *
+case_try_create (size_t n_values)
 {
-  assert (orig != NULL);
-  assert (orig->this == orig);
-  assert (orig->case_data != NULL);
-  assert (orig->case_data->ref_cnt > 0);
-  assert (clone != NULL);
-
-  if (clone != orig) 
+  struct ccase *c = malloc (case_size (n_values));
+  if (c)
     {
-      *clone = *orig;
-      clone->this = clone;
+      c->n_values = n_values;
+      c->ref_cnt = 1;
     }
-  orig->case_data->ref_cnt++;
+  return c;
 }
-#endif /* DEBUGGING */
 
-#ifdef DEBUGGING
-/* Replaces DST by SRC and nullifies SRC.
-   DST and SRC must be initialized cases at entry. */
-void
-case_move (struct ccase *dst, struct ccase *src) 
+/* Resizes case C, which must not be shared, to N_VALUES union
+   values.  If N_VALUES is greater than the current size of case
+   C, then the newly added values have indeterminate content that
+   the caller is responsible for initializing.  Returns the new
+   case. */
+struct ccase *
+case_resize (struct ccase *c, size_t n_values)
 {
-  assert (src != NULL);
-  assert (src->this == src);
-  assert (src->case_data != NULL);
-  assert (src->case_data->ref_cnt > 0);
-  assert (dst != NULL);
-
-  *dst = *src;
-  dst->this = dst;
-  case_nullify (src);
+  assert (!case_is_shared (c));
+  if (n_values != c->n_values)
+    {
+      c->n_values = n_values;
+      return xrealloc (c, case_size (n_values));
+    }
+  else
+    return c;
 }
-#endif /* DEBUGGING */
 
-#ifdef DEBUGGING
-/* Destroys case C. */
-void
-case_destroy (struct ccase *c) 
-{
-  struct case_data *cd;
-  
-  assert (c != NULL);
-  assert (c->this == c);
+/* case_unshare_and_resize(C, N) is equivalent to
+   case_resize(case_unshare(C), N), but it is faster if case C is
+   shared.
 
-  cd = c->case_data;
-  if (cd != NULL && --cd->ref_cnt == 0) 
+   Returns the new case.*/
+struct ccase *
+case_unshare_and_resize (struct ccase *c, size_t n_values)
+{
+  if (!case_is_shared (c))
+    return case_resize (c, n_values);
+  else
     {
-      memset (cd->values, 0xcc, sizeof *cd->values * cd->value_cnt);
-      cd->value_cnt = 0xdeadbeef;
-      free (cd); 
+      struct ccase *new = case_create (n_values);
+      case_copy (new, 0, c, 0, MIN (n_values, c->n_values));
+      c->ref_cnt--;
+      return new;
     }
 }
-#endif /* DEBUGGING */
 
-/* Resizes case C from OLD_CNT to NEW_CNT values. */
+/* Copies N_VALUES values from SRC (starting at SRC_IDX) to DST
+   (starting at DST_IDX).
+
+   DST must not be shared. */
 void
-case_resize (struct ccase *c, size_t old_cnt, size_t new_cnt) 
+case_copy (struct ccase *dst, size_t dst_idx,
+           const struct ccase *src, size_t src_idx,
+           size_t n_values)
 {
-  struct ccase new;
+  assert (!case_is_shared (dst));
+  assert (range_is_valid (dst, dst_idx, n_values));
+  assert (range_is_valid (src, dst_idx, n_values));
 
-  case_create (&new, new_cnt);
-  case_copy (&new, 0, c, 0, old_cnt < new_cnt ? old_cnt : new_cnt);
-  case_swap (&new, c);
-  case_destroy (&new);
+  if (dst != src || dst_idx != src_idx)
+    memmove (dst->values + dst_idx, src->values + src_idx,
+             sizeof *dst->values * n_values);
 }
 
-/* Swaps cases A and B. */
+/* Copies N_VALUES values out of case C to VALUES, starting at
+   the given START_IDX. */
 void
-case_swap (struct ccase *a, struct ccase *b) 
+case_copy_out (const struct ccase *c,
+               size_t start_idx, union value *values, size_t n_values)
 {
-  struct case_data *t = a->case_data;
-  a->case_data = b->case_data;
-  b->case_data = t;
+  assert (range_is_valid (c, start_idx, n_values));
+  memcpy (values, c->values + start_idx, n_values * sizeof *values);
 }
 
-/* Attempts to create C as a new case that holds VALUE_CNT
-   values.  Returns nonzero if successful, zero if memory
-   allocation failed. */
-int
-case_try_create (struct ccase *c, size_t value_cnt) 
-{
-  c->case_data = malloc (case_size (value_cnt));
-  if (c->case_data != NULL) 
-    {
-#ifdef DEBUGGING
-      c->this = c;
-#endif
-      c->case_data->value_cnt = value_cnt;
-      c->case_data->ref_cnt = 1;
-      return 1;
-    }
-  else 
-    {
-#ifdef DEBUGGING
-      c->this = c;
-#endif
-      return 0;
-    }
-}
+/* Copies N_VALUES values from VALUES into case C, starting at
+   the given START_IDX.
 
-/* Tries to initialize CLONE as a copy of ORIG.
-   Returns nonzero if successful, zero if memory allocation
-   failed. */
-int
-case_try_clone (struct ccase *clone, const struct ccase *orig) 
+   C must not be shared. */
+void
+case_copy_in (struct ccase *c,
+              size_t start_idx, const union value *values, size_t n_values)
 {
-  case_clone (clone, orig);
-  return 1;
+  assert (!case_is_shared (c));
+  assert (range_is_valid (c, start_idx, n_values));
+  memcpy (c->values + start_idx, values, n_values * sizeof *values);
 }
 
-#ifdef DEBUGGING
-/* Copies VALUE_CNT values from SRC (starting at SRC_IDX) to DST
-   (starting at DST_IDX). */
-void
-case_copy (struct ccase *dst, size_t dst_idx,
-           const struct ccase *src, size_t src_idx,
-           size_t value_cnt)
+/* Returns a pointer to the `union value' used for the
+   element of C for variable V.
+   Case C must be drawn from V's dictionary.
+   The caller must not modify the returned data. */
+const union value *
+case_data (const struct ccase *c, const struct variable *v)
 {
-  assert (dst != NULL);
-  assert (dst->this == dst);
-  assert (dst->case_data != NULL);
-  assert (dst->case_data->ref_cnt > 0);
-  assert (dst_idx + value_cnt <= dst->case_data->value_cnt);
-
-  assert (src != NULL);
-  assert (src->this == src);
-  assert (src->case_data != NULL);
-  assert (src->case_data->ref_cnt > 0);
-  assert (src_idx + value_cnt <= dst->case_data->value_cnt);
-
-  if (dst->case_data->ref_cnt > 1)
-    case_unshare (dst);
-  if (dst->case_data != src->case_data || dst_idx != src_idx) 
-    memmove (dst->case_data->values + dst_idx,
-             src->case_data->values + src_idx,
-             sizeof *dst->case_data->values * value_cnt); 
+  return case_data_idx (c, var_get_case_index (v));
 }
-#endif /* DEBUGGING */
 
-#ifdef DEBUGGING
-/* Copies case C to OUTPUT.
-   OUTPUT_SIZE is the number of `union values' in OUTPUT,
-   which must match the number of `union values' in C. */
-void
-case_to_values (const struct ccase *c, union value *output,
-                size_t output_size UNUSED) 
+/* Returns a pointer to the `union value' used for the element of
+   C numbered IDX.  The caller must not modify the returned
+   data. */
+const union value *
+case_data_idx (const struct ccase *c, size_t idx)
 {
-  assert (c != NULL);
-  assert (c->this == c);
-  assert (c->case_data != NULL);
-  assert (c->case_data->ref_cnt > 0);
-  assert (output_size == c->case_data->value_cnt);
-  assert (output != NULL || output_size == 0);
-
-  memcpy (output, c->case_data->values,
-          c->case_data->value_cnt * sizeof *output);
+  assert (idx < c->n_values);
+  return &c->values[idx];
 }
-#endif /* DEBUGGING */
 
-#ifdef DEBUGGING
-/* Copies INPUT into case C.
-   INPUT_SIZE is the number of `union values' in INPUT,
-   which must match the number of `union values' in C. */
-void
-case_from_values (struct ccase *c, const union value *input,
-                  size_t input_size UNUSED) 
+/* Returns a pointer to the `union value' used for the element of
+   C for variable V.  Case C must be drawn from V's dictionary.
+   The caller is allowed to modify the returned data.
+
+   Case C must not be shared. */
+union value *
+case_data_rw (struct ccase *c, const struct variable *v)
 {
-  assert (c != NULL);
-  assert (c->this == c);
-  assert (c->case_data != NULL);
-  assert (c->case_data->ref_cnt > 0);
-  assert (input_size == c->case_data->value_cnt);
-  assert (input != NULL || input_size == 0);
-
-  if (c->case_data->ref_cnt > 1)
-    case_unshare (c);
-  memcpy (c->case_data->values, input,
-          c->case_data->value_cnt * sizeof *input);
+  return case_data_rw_idx (c, var_get_case_index (v));
 }
-#endif /* DEBUGGING */
 
-#ifdef DEBUGGING
 /* Returns a pointer to the `union value' used for the
    element of C numbered IDX.
-   The caller must not modify the returned data. */
-const union value *
-case_data (const struct ccase *c, size_t idx) 
+   The caller is allowed to modify the returned data.
+
+   Case C must not be shared. */
+union value *
+case_data_rw_idx (struct ccase *c, size_t idx)
 {
-  assert (c != NULL);
-  assert (c->this == c);
-  assert (c->case_data != NULL);
-  assert (c->case_data->ref_cnt > 0);
-  assert (idx < c->case_data->value_cnt);
+  assert (!case_is_shared (c));
+  assert (idx < c->n_values);
+  return &c->values[idx];
+}
 
-  return &c->case_data->values[idx];
+/* Returns the numeric value of the `union value' in C for
+   variable V.
+   Case C must be drawn from V's dictionary. */
+double
+case_num (const struct ccase *c, const struct variable *v)
+{
+  return case_num_idx (c, var_get_case_index (v));
 }
-#endif /* DEBUGGING */
 
-#ifdef DEBUGGING
 /* Returns the numeric value of the `union value' in C numbered
    IDX. */
 double
-case_num (const struct ccase *c, size_t idx) 
+case_num_idx (const struct ccase *c, size_t idx)
 {
-  assert (c != NULL);
-  assert (c->this == c);
-  assert (c->case_data != NULL);
-  assert (c->case_data->ref_cnt > 0);
-  assert (idx < c->case_data->value_cnt);
-
-  return c->case_data->values[idx].f;
+  assert (idx < c->n_values);
+  return c->values[idx].f;
 }
-#endif /* DEBUGGING */
 
-#ifdef DEBUGGING
-/* Returns the string value of the `union value' in C numbered
-   IDX.
-   (Note that the value is not null-terminated.)
-   The caller must not modify the return value. */
+/* Returns the string value of the `union value' in C for
+   variable V.  Case C must be drawn from V's dictionary.  The
+   caller must not modify the return value.
+
+   Like all "union value"s, the return value is not
+   null-terminated. */
 const char *
-case_str (const struct ccase *c, size_t idx) 
+case_str (const struct ccase *c, const struct variable *v)
 {
-  assert (c != NULL);
-  assert (c->this == c);
-  assert (c->case_data != NULL);
-  assert (c->case_data->ref_cnt > 0);
-  assert (idx < c->case_data->value_cnt);
-
-  return c->case_data->values[idx].s;
+  return case_str_idx (c, var_get_case_index (v));
 }
-#endif /* DEBUGGING */
 
-#ifdef DEBUGGING
-/* Returns a pointer to the `union value' used for the
-   element of C numbered IDX.
-   The caller is allowed to modify the returned data. */
-union value *
-case_data_rw (struct ccase *c, size_t idx) 
+/* Returns the string value of the `union value' in C numbered
+   IDX.  The caller must not modify the return value.
+
+   Like all "union value"s, the return value is not
+   null-terminated. */
+const char *
+case_str_idx (const struct ccase *c, size_t idx)
 {
-  assert (c != NULL);
-  assert (c->this == c);
-  assert (c->case_data != NULL);
-  assert (c->case_data->ref_cnt > 0);
-  assert (idx < c->case_data->value_cnt);
-
-  if (c->case_data->ref_cnt > 1)
-    case_unshare (c);
-  return &c->case_data->values[idx];
+  assert (idx < c->n_values);
+  return c->values[idx].s;
 }
-#endif /* DEBUGGING */
 
-/* Compares the values of the VAR_CNT variables in VP
+/* Compares the values of the N_VARS variables in VP
    in cases A and B and returns a strcmp()-type result. */
 int
 case_compare (const struct ccase *a, const struct ccase *b,
-              struct variable *const *vp, size_t var_cnt)
+              const struct variable *const *vp, size_t n_vars)
 {
-  return case_compare_2dict (a, b, vp, vp, var_cnt);
+  return case_compare_2dict (a, b, vp, vp, n_vars);
 }
 
-/* Compares the values of the VAR_CNT variables in VAP in case CA
-   to the values of the VAR_CNT variables in VBP in CB
+/* Compares the values of the N_VARS variables in VAP in case CA
+   to the values of the N_VARS variables in VBP in CB
    and returns a strcmp()-type result. */
 int
 case_compare_2dict (const struct ccase *ca, const struct ccase *cb,
-                    struct variable *const *vap, struct variable *const *vbp,
-                    size_t var_cnt) 
+                    const struct variable *const *vap,
+                    const struct variable *const *vbp,
+                    size_t n_vars)
 {
-  for (; var_cnt-- > 0; vap++, vbp++) 
+  for (; n_vars-- > 0; vap++, vbp++)
     {
       const struct variable *va = *vap;
       const struct variable *vb = *vbp;
 
-      assert (va->type == vb->type);
-      assert (va->width == vb->width);
-      
-      if (va->width == 0) 
+      assert (var_get_width (va) == var_get_width (vb));
+
+      if (var_get_width (va) == 0)
         {
-          double af = case_num (ca, va->fv);
-          double bf = case_num (cb, vb->fv);
+          double af = case_num (ca, va);
+          double bf = case_num (cb, vb);
 
-          if (af != bf) 
+          if (af != bf)
             return af > bf ? 1 : -1;
         }
-      else 
+      else
         {
-          const char *as = case_str (ca, va->fv);
-          const char *bs = case_str (cb, vb->fv);
-          int cmp = memcmp (as, bs, va->width);
+          const char *as = case_str (ca, va);
+          const char *bs = case_str (cb, vb);
+          int cmp = memcmp (as, bs, var_get_width (va));
 
           if (cmp != 0)
             return cmp;
@@ -399,33 +288,34 @@ case_compare_2dict (const struct ccase *ca, const struct ccase *cb,
 /* Returns a pointer to the array of `union value's used for C.
    The caller must *not* modify the returned data.
 
-   NOTE: This function breaks the case abstraction.  It should
-   *not* be used often.  Prefer the other case functions. */
+   This function breaks the case abstraction.  It should *not* be
+   commonly used.  Prefer the other case functions. */
 const union value *
-case_data_all (const struct ccase *c) 
+case_data_all (const struct ccase *c)
 {
-  assert (c != NULL);
-  assert (c->this == c);
-  assert (c->case_data != NULL);
-  assert (c->case_data->ref_cnt > 0);
-
-  return c->case_data->values;
+  return c->values;
 }
 
 /* Returns a pointer to the array of `union value's used for C.
    The caller is allowed to modify the returned data.
 
-   NOTE: This function breaks the case abstraction.  It should
-   *not* be used often.  Prefer the other case functions. */
+   Case C must not be shared.
+
+   This function breaks the case abstraction.  It should *not* be
+   commonly used.  Prefer the other case functions. */
 union value *
-case_data_all_rw (struct ccase *c) 
+case_data_all_rw (struct ccase *c)
+{
+  assert (!case_is_shared (c));
+  return c->values;
+}
+
+/* Internal helper function for case_unshare. */
+struct ccase *
+case_unshare__ (struct ccase *old)
 {
-  assert (c != NULL);
-  assert (c->this == c);
-  assert (c->case_data != NULL);
-  assert (c->case_data->ref_cnt > 0);
-
-  if (c->case_data->ref_cnt > 1)
-    case_unshare (c);
-  return c->case_data->values;
+  struct ccase *new = case_create (old->n_values);
+  memcpy (new->values, old->values, old->n_values * sizeof old->values[0]);
+  --old->ref_cnt;
+  return new;
 }