(x)memcoll: speedup when input is known to be NUL delimited
authorChen Guo <chenguo4@yahoo.com>
Thu, 8 Jul 2010 22:50:11 +0000 (15:50 -0700)
committerPaul Eggert <eggert@cs.ucla.edu>
Thu, 8 Jul 2010 22:50:11 +0000 (15:50 -0700)
* lib/memcoll.c: Include stdlib.
(memcoll0) New function.
(strcoll_loop) New function, refactored for use in both memcoll
and memcoll0.
* lib/memcoll.h: Add prototype for memcoll0.
* lib/xmemcoll.c: (xmemcoll0) New function.
(collate_error) New function, refactored for use in both xmemcoll
and xmemcoll0.
* lib/xmemcoll.h: Add prototype for xmemcoll0.
* m4/memcoll.m4: add inline invocation.

ChangeLog
lib/memcoll.c
lib/memcoll.h
lib/xmemcoll.c
lib/xmemcoll.h
m4/memcoll.m4

index 71d3d8bdc21af672c857261f02b1c085442549cc..1577e12aa15e15e41460e20bd7d441a12ce53f93 100644 (file)
--- a/ChangeLog
+++ b/ChangeLog
@@ -1,3 +1,17 @@
+2010-07-08  Chen Guo <chenguo4@yahoo.com>
+
+       (x)memcoll: speedup when input is known to be NUL delimited
+       * lib/memcoll.c: Include stdlib.
+       (memcoll0) New function.
+       (strcoll_loop) New function, refactored for use in both memcoll
+       and memcoll0.
+       * lib/memcoll.h: Add prototype for memcoll0.
+       * lib/xmemcoll.c: (xmemcoll0) New function.
+       (collate_error) New function, refactored for use in both xmemcoll
+       and xmemcoll0.
+       * lib/xmemcoll.h: Add prototype for xmemcoll0.
+       * m4/memcoll.m4: add inline invocation.
+
 2010-07-06  Pádraig Brady  <P@draigBrady.com>
 
        * build-aux/bootstrap: Remove any local translations
index e08ffa5469cd04fcb71797e13c9f2d8e63047cdc..8e4855135f12151a0fa93abe3c7751f4912c2c2e 100644 (file)
 #include "memcoll.h"
 
 #include <errno.h>
+#include <stdlib.h>
 #include <string.h>
 
+/* Ensure strcoll operates on the entire input strings, in case they contain
+   NUL bytes. */
+
+static inline int
+strcoll_loop (const char *s1, size_t s1len, const char *s2, size_t s2len)
+{
+  int diff;
+  while (! (errno = 0, (diff = strcoll (s1, s2)) || errno))
+    {
+      /* strcoll found no difference, but perhaps it was fooled by NUL
+         characters in the data.  Work around this problem by advancing
+         past the NUL chars.  */
+      size_t size1 = strlen (s1) + 1;
+      size_t size2 = strlen (s2) + 1;
+      s1 += size1;
+      s2 += size2;
+      s1len -= size1;
+      s2len -= size2;
+
+      if (s1len == 0)
+        {
+          if (s2len != 0)
+            diff = -1;
+          break;
+        }
+      else if (s2len == 0)
+        {
+          diff = 1;
+          break;
+        }
+    }
+  return diff;
+}
+
 /* Compare S1 (with length S1LEN) and S2 (with length S2LEN) according
    to the LC_COLLATE locale.  S1 and S2 do not overlap, and are not
    adjacent.  Perhaps temporarily modify the bytes after S1 and S2,
    but restore their original contents before returning.  Set errno to an
    error number if there is an error, and to zero otherwise.  */
+
 int
 memcoll (char *s1, size_t s1len, char *s2, size_t s2len)
 {
   int diff;
 
-#if HAVE_STRCOLL
-
   /* strcoll is slow on many platforms, so check for the common case
      where the arguments are bytewise equal.  Otherwise, walk through
      the buffers using strcoll on each substring.  */
@@ -54,43 +88,33 @@ memcoll (char *s1, size_t s1len, char *s2, size_t s2len)
       s1[s1len++] = '\0';
       s2[s2len++] = '\0';
 
-      while (! (errno = 0, (diff = strcoll (s1, s2)) || errno))
-        {
-          /* strcoll found no difference, but perhaps it was fooled by NUL
-             characters in the data.  Work around this problem by advancing
-             past the NUL chars.  */
-          size_t size1 = strlen (s1) + 1;
-          size_t size2 = strlen (s2) + 1;
-          s1 += size1;
-          s2 += size2;
-          s1len -= size1;
-          s2len -= size2;
-
-          if (s1len == 0)
-            {
-              if (s2len != 0)
-                diff = -1;
-              break;
-            }
-          else if (s2len == 0)
-            {
-              diff = 1;
-              break;
-            }
-        }
+      diff = strcoll_loop (s1, s1len, s2, s2len);
 
       s1[s1len - 1] = n1;
       s2[s2len - 1] = n2;
     }
 
-#else
+  return diff;
+}
 
-  diff = memcmp (s1, s2, s1len < s2len ? s1len : s2len);
-  if (! diff)
-    diff = s1len < s2len ? -1 : s1len != s2len;
-  errno = 0;
+/* Like memcoll, but S1 and S2 are known to be NUL delimited, thus no
+   modification to S1 or S2 are needed. */
+int
+memcoll0 (const char *s1, size_t s1len, const char *s2, size_t s2len)
+{
+  int diff;
+  if (!(s1len > 0 && s1[s1len] == '\0'))
+    abort ();
+  if (!(s2len > 0 && s2[s2len] == '\0'))
+    abort ();
 
-#endif
+  if (s1len == s2len && memcmp (s1, s2, s1len) == 0)
+    {
+      errno = 0;
+      diff = 0;
+    }
+  else
+    diff = strcoll_loop (s1, s1len, s2, s2len);
 
   return diff;
 }
index 8f2e1b15a4da23e1182276582bcd798ff5cc2d4f..b43a96e6c37765403309c2d43195a7f28d268c02 100644 (file)
@@ -23,5 +23,6 @@
 # include <stddef.h>
 
 int memcoll (char *, size_t, char *, size_t);
+int memcoll0 (const char *, size_t, const char *, size_t);
 
 #endif /* MEMCOLL_H_ */
index 84bbd8ced3131fa732008fa580da5b8cb8b08949..36958f4af494456647e6e2dea99e7636188edc79 100644 (file)
 #include "quotearg.h"
 #include "xmemcoll.h"
 
+static inline void
+collate_error (int collation_errno, const char *s1, size_t s1len,
+               const char *s2, size_t s2len)
+{
+  error (0, collation_errno, _("string comparison failed"));
+  error (0, 0, _("Set LC_ALL='C' to work around the problem."));
+  error (exit_failure, 0,
+         _("The strings compared were %s and %s."),
+         quotearg_n_style_mem (0, locale_quoting_style, s1, s1len),
+         quotearg_n_style_mem (1, locale_quoting_style, s2, s2len));
+}
+
 /* Compare S1 (with length S1LEN) and S2 (with length S2LEN) according
    to the LC_COLLATE locale.  S1 and S2 do not overlap, and are not
    adjacent.  Temporarily modify the bytes after S1 and S2, but
@@ -44,14 +56,21 @@ xmemcoll (char *s1, size_t s1len, char *s2, size_t s2len)
   int collation_errno = errno;
 
   if (collation_errno)
-    {
-      error (0, collation_errno, _("string comparison failed"));
-      error (0, 0, _("Set LC_ALL='C' to work around the problem."));
-      error (exit_failure, 0,
-             _("The strings compared were %s and %s."),
-             quotearg_n_style_mem (0, locale_quoting_style, s1, s1len),
-             quotearg_n_style_mem (1, locale_quoting_style, s2, s2len));
-    }
+    collate_error (collation_errno, s1, s1len, s2, s2len);
+
+  return diff;
+}
 
+/* Like xmemcoll, but S1 and S2 are known to be NUL delimited, thus
+   no modifications to S1 and S2 are needed. */
+
+int
+xmemcoll0 (const char *s1, size_t s1len, const char *s2, size_t s2len)
+{
+  int diff = memcoll0 (s1, s1len, s2, s2len);
+  int collation_errno = errno;
+
+  if (collation_errno)
+    collate_error (collation_errno, s1, s1len, s2, s2len);
   return diff;
 }
index 2f422e8c1c009d249ddcd3fda4ec18d2204978d6..b72127dd5495910231a62843447b84db1bdd5a44 100644 (file)
@@ -1,2 +1,3 @@
 #include <stddef.h>
 int xmemcoll (char *, size_t, char *, size_t);
+int xmemcoll0 (const char *, size_t, const char *, size_t);
index 1c4bd61c000dfae0677b4b2fa6c202a7353b0997..0edf30ca42b399a93bc98973d57d31e09ff99098 100644 (file)
@@ -7,6 +7,7 @@ dnl with or without modifications, as long as this notice is preserved.
 
 AC_DEFUN([gl_MEMCOLL],
 [
+  AC_REQUIRE([AC_C_INLINE])
   AC_LIBOBJ([memcoll])
 
   dnl Prerequisites of lib/memcoll.c.