Wed Dec 10 23:32:47 2003 Ben Pfaff <blp@gnu.org>
[pspp] / lib / misc / getopt.c
1 /* Getopt for GNU.
2    NOTE: getopt is now part of the C library, so if you don't know what
3    "Keep this file name-space clean" means, talk to roland@gnu.org
4    before changing it!
5
6    Copyright (C) 1987, 88, 89, 90, 91, 92, 93, 94
7    Free Software Foundation, Inc.
8
9    This file is part of the GNU C Library.  Its master source is NOT part of
10    the C library, however.  The master source lives in /gd/gnu/lib.
11
12    The GNU C Library is free software; you can redistribute it and/or
13    modify it under the terms of the GNU Library General Public License as
14    published by the Free Software Foundation; either version 2 of the
15    License, or (at your option) any later version.
16
17    The GNU C Library is distributed in the hope that it will be useful,
18    but WITHOUT ANY WARRANTY; without even the implied warranty of
19    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
20    Library General Public License for more details.
21
22    You should have received a copy of the GNU Library General Public
23    License along with the GNU C Library; see the file COPYING.LIB.  If
24    not, write to the Free Software Foundation, Inc., 675 Mass Ave,
25    Cambridge, MA 02139, USA.  */
26 \f
27 /* This file has been modified from the GNU libc distribution. */
28
29 /* This tells Alpha OSF/1 not to define a getopt prototype in <stdio.h>.
30    Ditto for AIX 3.2 and <stdlib.h>.  */
31 #ifndef _NO_PROTO
32 #define _NO_PROTO
33 #endif
34
35 #include <config.h>
36
37 #if !defined (__STDC__) || !__STDC__
38 /* This is a separate conditional since some stdc systems
39    reject `defined (const)'.  */
40 #ifndef const
41 #define const
42 #endif
43 #endif
44
45 #include <stdio.h>
46
47 /* Comment out all this code if we are using the GNU C Library, and are not
48    actually compiling the library itself.  This code is part of the GNU C
49    Library, but also included in many other GNU distributions.  Compiling
50    and linking in this code is a waste when using the GNU C library
51    (especially if it is a shared library).  Rather than having every GNU
52    program understand `configure --with-gnu-libc' and omit the object files,
53    it is simpler to just do this in the source for each such file.  */
54
55 #if defined (_LIBC) || !defined (__GNU_LIBRARY__)
56
57
58 /* This needs to come after some library #include
59    to get __GNU_LIBRARY__ defined.  */
60 #ifdef  __GNU_LIBRARY__
61 /* Don't include stdlib.h for non-GNU C libraries because some of them
62    contain conflicting prototypes for getopt.  */
63 #include <stdlib.h>
64 #endif /* GNU C library.  */
65
66 /* This version of `getopt' appears to the caller like standard Unix `getopt'
67    but it behaves differently for the user, since it allows the user
68    to intersperse the options with the other arguments.
69
70    As `getopt' works, it permutes the elements of ARGV so that,
71    when it is done, all the options precede everything else.  Thus
72    all application programs are extended to handle flexible argument order.
73
74    Setting the environment variable POSIXLY_CORRECT disables permutation.
75    Then the behavior is completely standard.
76
77    GNU application programs can use a third alternative mode in which
78    they can distinguish the relative order of options and other arguments.  */
79
80 #include "getopt.h"
81
82 /* For communication from `getopt' to the caller.
83    When `getopt' finds an option that takes an argument,
84    the argument value is returned here.
85    Also, when `ordering' is RETURN_IN_ORDER,
86    each non-option ARGV-element is returned here.  */
87
88 char *optarg = NULL;
89
90 /* Index in ARGV of the next element to be scanned.
91    This is used for communication to and from the caller
92    and for communication between successive calls to `getopt'.
93
94    On entry to `getopt', zero means this is the first call; initialize.
95
96    When `getopt' returns EOF, this is the index of the first of the
97    non-option elements that the caller should itself scan.
98
99    Otherwise, `optind' communicates from one call to the next
100    how much of ARGV has been scanned so far.  */
101
102 /* XXX 1003.2 says this must be 1 before any call.  */
103 int optind = 0;
104
105 /* The next char to be scanned in the option-element
106    in which the last option character we returned was found.
107    This allows us to pick up the scan where we left off.
108
109    If this is zero, or a null string, it means resume the scan
110    by advancing to the next ARGV-element.  */
111
112 static char *nextchar;
113
114 /* Callers store zero here to inhibit the error message
115    for unrecognized options.  */
116
117 int opterr = 1;
118
119 /* Set to an option character which was unrecognized.
120    This must be initialized on some systems to avoid linking in the
121    system's own getopt implementation.  */
122
123 int optopt = '?';
124
125 /* Describe how to deal with options that follow non-option ARGV-elements.
126
127    If the caller did not specify anything,
128    the default is REQUIRE_ORDER if the environment variable
129    POSIXLY_CORRECT is defined, PERMUTE otherwise.
130
131    REQUIRE_ORDER means don't recognize them as options;
132    stop option processing when the first non-option is seen.
133    This is what Unix does.
134    This mode of operation is selected by either setting the environment
135    variable POSIXLY_CORRECT, or using `+' as the first character
136    of the list of option characters.
137
138    PERMUTE is the default.  We permute the contents of ARGV as we scan,
139    so that eventually all the non-options are at the end.  This allows options
140    to be given in any order, even with programs that were not written to
141    expect this.
142
143    RETURN_IN_ORDER is an option available to programs that were written
144    to expect options and other ARGV-elements in any order and that care about
145    the ordering of the two.  We describe each non-option ARGV-element
146    as if it were the argument of an option with character code 1.
147    Using `-' as the first character of the list of option characters
148    selects this mode of operation.
149
150    The special argument `--' forces an end of option-scanning regardless
151    of the value of `ordering'.  In the case of RETURN_IN_ORDER, only
152    `--' can cause `getopt' to return EOF with `optind' != ARGC.  */
153
154 static enum
155   {
156     REQUIRE_ORDER, PERMUTE, RETURN_IN_ORDER
157   }
158 ordering;
159
160 /* Value of POSIXLY_CORRECT environment variable.  */
161 static char *posixly_correct;
162 \f
163 #ifdef  __GNU_LIBRARY__
164 /* We want to avoid inclusion of string.h with non-GNU libraries
165    because there are many ways it can cause trouble.
166    On some systems, it contains special magic macros that don't work
167    in GCC.  */
168 #include <string.h>
169 #define my_index        strchr
170 #else
171
172 /* Avoid depending on library functions or files
173    whose names are inconsistent.  */
174
175 char *getenv ();
176
177 static char *
178 my_index (str, chr)
179      const char *str;
180      int chr;
181 {
182   while (*str)
183     {
184       if (*str == chr)
185         return (char *) str;
186       str++;
187     }
188   return 0;
189 }
190
191 /* If using GCC, we can safely declare strlen this way.
192    If not using GCC, it is ok not to declare it.  */
193 #ifdef __GNUC__
194 /* Note that Motorola Delta 68k R3V7 comes with GCC but not stddef.h.
195    That was relevant to code that was here before.  */
196 #if !defined (__STDC__) || !__STDC__
197 /* gcc with -traditional declares the built-in strlen to return int,
198    and has done so at least since version 2.4.5. -- rms.  */
199 extern int strlen (const char *);
200 #endif /* not __STDC__ */
201 #endif /* __GNUC__ */
202
203 #endif /* not __GNU_LIBRARY__ */
204 \f
205 /* Handle permutation of arguments.  */
206
207 /* Describe the part of ARGV that contains non-options that have
208    been skipped.  `first_nonopt' is the index in ARGV of the first of them;
209    `last_nonopt' is the index after the last of them.  */
210
211 static int first_nonopt;
212 static int last_nonopt;
213
214 /* Exchange two adjacent subsequences of ARGV.
215    One subsequence is elements [first_nonopt,last_nonopt)
216    which contains all the non-options that have been skipped so far.
217    The other is elements [last_nonopt,optind), which contains all
218    the options processed since those non-options were skipped.
219
220    `first_nonopt' and `last_nonopt' are relocated so that they describe
221    the new indices of the non-options in ARGV after they are moved.  */
222
223 static void
224 exchange (argv)
225      char **argv;
226 {
227   int bottom = first_nonopt;
228   int middle = last_nonopt;
229   int top = optind;
230   char *tem;
231
232   /* Exchange the shorter segment with the far end of the longer segment.
233      That puts the shorter segment into the right place.
234      It leaves the longer segment in the right place overall,
235      but it consists of two parts that need to be swapped next.  */
236
237   while (top > middle && middle > bottom)
238     {
239       if (top - middle > middle - bottom)
240         {
241           /* Bottom segment is the short one.  */
242           int len = middle - bottom;
243           register int i;
244
245           /* Swap it with the top part of the top segment.  */
246           for (i = 0; i < len; i++)
247             {
248               tem = argv[bottom + i];
249               argv[bottom + i] = argv[top - (middle - bottom) + i];
250               argv[top - (middle - bottom) + i] = tem;
251             }
252           /* Exclude the moved bottom segment from further swapping.  */
253           top -= len;
254         }
255       else
256         {
257           /* Top segment is the short one.  */
258           int len = top - middle;
259           register int i;
260
261           /* Swap it with the bottom part of the bottom segment.  */
262           for (i = 0; i < len; i++)
263             {
264               tem = argv[bottom + i];
265               argv[bottom + i] = argv[middle + i];
266               argv[middle + i] = tem;
267             }
268           /* Exclude the moved top segment from further swapping.  */
269           bottom += len;
270         }
271     }
272
273   /* Update records for the slots the non-options now occupy.  */
274
275   first_nonopt += (optind - last_nonopt);
276   last_nonopt = optind;
277 }
278
279 /* Initialize the internal data when the first call is made.  */
280
281 static const char *
282 _getopt_initialize (optstring)
283      const char *optstring;
284 {
285   /* Start processing options with ARGV-element 1 (since ARGV-element 0
286      is the program name); the sequence of previously skipped
287      non-option ARGV-elements is empty.  */
288
289   first_nonopt = last_nonopt = optind = 1;
290
291   nextchar = NULL;
292
293   posixly_correct = getenv ("POSIXLY_CORRECT");
294
295   /* Determine how to handle the ordering of options and nonoptions.  */
296
297   if (optstring[0] == '-')
298     {
299       ordering = RETURN_IN_ORDER;
300       ++optstring;
301     }
302   else if (optstring[0] == '+')
303     {
304       ordering = REQUIRE_ORDER;
305       ++optstring;
306     }
307   else if (posixly_correct != NULL)
308     ordering = REQUIRE_ORDER;
309   else
310     ordering = PERMUTE;
311
312   return optstring;
313 }
314 \f
315 /* Scan elements of ARGV (whose length is ARGC) for option characters
316    given in OPTSTRING.
317
318    If an element of ARGV starts with '-', and is not exactly "-" or "--",
319    then it is an option element.  The characters of this element
320    (aside from the initial '-') are option characters.  If `getopt'
321    is called repeatedly, it returns successively each of the option characters
322    from each of the option elements.
323
324    If `getopt' finds another option character, it returns that character,
325    updating `optind' and `nextchar' so that the next call to `getopt' can
326    resume the scan with the following option character or ARGV-element.
327
328    If there are no more option characters, `getopt' returns `EOF'.
329    Then `optind' is the index in ARGV of the first ARGV-element
330    that is not an option.  (The ARGV-elements have been permuted
331    so that those that are not options now come last.)
332
333    OPTSTRING is a string containing the legitimate option characters.
334    If an option character is seen that is not listed in OPTSTRING,
335    return '?' after printing an error message.  If you set `opterr' to
336    zero, the error message is suppressed but we still return '?'.
337
338    If a char in OPTSTRING is followed by a colon, that means it wants an arg,
339    so the following text in the same ARGV-element, or the text of the following
340    ARGV-element, is returned in `optarg'.  Two colons mean an option that
341    wants an optional arg; if there is text in the current ARGV-element,
342    it is returned in `optarg', otherwise `optarg' is set to zero.
343
344    If OPTSTRING starts with `-' or `+', it requests different methods of
345    handling the non-option ARGV-elements.
346    See the comments about RETURN_IN_ORDER and REQUIRE_ORDER, above.
347
348    Long-named options begin with `--' instead of `-'.
349    Their names may be abbreviated as long as the abbreviation is unique
350    or is an exact match for some defined option.  If they have an
351    argument, it follows the option name in the same ARGV-element, separated
352    from the option name by a `=', or else the in next ARGV-element.
353    When `getopt' finds a long-named option, it returns 0 if that option's
354    `flag' field is nonzero, the value of the option's `val' field
355    if the `flag' field is zero.
356
357    The elements of ARGV aren't really const, because we permute them.
358    But we pretend they're const in the prototype to be compatible
359    with other systems.
360
361    LONGOPTS is a vector of `struct option' terminated by an
362    element containing a name which is zero.
363
364    LONGIND returns the index in LONGOPT of the long-named option found.
365    It is only valid when a long-named option has been found by the most
366    recent call.
367
368    If LONG_ONLY is nonzero, '-' as well as '--' can introduce
369    long-named options.  */
370
371 int
372 _getopt_internal (argc, argv, optstring, longopts, longind, long_only)
373      int argc;
374      char *const *argv;
375      const char *optstring;
376      const struct option *longopts;
377      int *longind;
378      int long_only;
379 {
380   optarg = NULL;
381
382   if (optind == 0)
383     optstring = _getopt_initialize (optstring);
384
385   if (nextchar == NULL || *nextchar == '\0')
386     {
387       /* Advance to the next ARGV-element.  */
388
389       if (ordering == PERMUTE)
390         {
391           /* If we have just processed some options following some non-options,
392              exchange them so that the options come first.  */
393
394           if (first_nonopt != last_nonopt && last_nonopt != optind)
395             exchange ((char **) argv);
396           else if (last_nonopt != optind)
397             first_nonopt = optind;
398
399           /* Skip any additional non-options
400              and extend the range of non-options previously skipped.  */
401
402           while (optind < argc
403                  && (argv[optind][0] != '-' || argv[optind][1] == '\0'))
404             optind++;
405           last_nonopt = optind;
406         }
407
408       /* The special ARGV-element `--' means premature end of options.
409          Skip it like a null option,
410          then exchange with previous non-options as if it were an option,
411          then skip everything else like a non-option.  */
412
413       if (optind != argc && !strcmp (argv[optind], "--"))
414         {
415           optind++;
416
417           if (first_nonopt != last_nonopt && last_nonopt != optind)
418             exchange ((char **) argv);
419           else if (first_nonopt == last_nonopt)
420             first_nonopt = optind;
421           last_nonopt = argc;
422
423           optind = argc;
424         }
425
426       /* If we have done all the ARGV-elements, stop the scan
427          and back over any non-options that we skipped and permuted.  */
428
429       if (optind == argc)
430         {
431           /* Set the next-arg-index to point at the non-options
432              that we previously skipped, so the caller will digest them.  */
433           if (first_nonopt != last_nonopt)
434             optind = first_nonopt;
435           return EOF;
436         }
437
438       /* If we have come to a non-option and did not permute it,
439          either stop the scan or describe it to the caller and pass it by.  */
440
441       if ((argv[optind][0] != '-' || argv[optind][1] == '\0'))
442         {
443           if (ordering == REQUIRE_ORDER)
444             return EOF;
445           optarg = argv[optind++];
446           return 1;
447         }
448
449       /* We have found another option-ARGV-element.
450          Skip the initial punctuation.  */
451
452       nextchar = (argv[optind] + 1
453                   + (longopts != NULL && argv[optind][1] == '-'));
454     }
455
456   /* Decode the current option-ARGV-element.  */
457
458   /* Check whether the ARGV-element is a long option.
459
460      If long_only and the ARGV-element has the form "-f", where f is
461      a valid short option, don't consider it an abbreviated form of
462      a long option that starts with f.  Otherwise there would be no
463      way to give the -f short option.
464
465      On the other hand, if there's a long option "fubar" and
466      the ARGV-element is "-fu", do consider that an abbreviation of
467      the long option, just like "--fu", and not "-f" with arg "u".
468
469      This distinction seems to be the most useful approach.  */
470
471   if (longopts != NULL
472       && (argv[optind][1] == '-'
473           || (long_only && (argv[optind][2]
474                             || !my_index (optstring, argv[optind][1])))))
475     {
476       char *nameend;
477       const struct option *p;
478       const struct option *pfound = NULL;
479       int exact = 0;
480       int ambig = 0;
481       int indfound;
482       int option_index;
483
484       for (nameend = nextchar; *nameend && *nameend != '='; nameend++)
485         /* Do nothing.  */ ;
486
487       /* Test all long options for either exact match
488          or abbreviated matches.  */
489       for (p = longopts, option_index = 0; p->name; p++, option_index++)
490         if (!strncmp (p->name, nextchar, nameend - nextchar))
491           {
492             if (nameend - nextchar == strlen (p->name))
493               {
494                 /* Exact match found.  */
495                 pfound = p;
496                 indfound = option_index;
497                 exact = 1;
498                 break;
499               }
500             else if (pfound == NULL)
501               {
502                 /* First nonexact match found.  */
503                 pfound = p;
504                 indfound = option_index;
505               }
506             else
507               /* Second or later nonexact match found.  */
508               ambig = 1;
509           }
510
511       if (ambig && !exact)
512         {
513           if (opterr)
514             fprintf (stderr, _("%s: option `%s' is ambiguous\n"),
515                      argv[0], argv[optind]);
516           nextchar += strlen (nextchar);
517           optind++;
518           return '?';
519         }
520
521       if (pfound != NULL)
522         {
523           option_index = indfound;
524           optind++;
525           if (*nameend)
526             {
527               /* Don't test has_arg with >, because some C compilers don't
528                  allow it to be used on enums.  */
529               if (pfound->has_arg)
530                 optarg = nameend + 1;
531               else
532                 {
533                   if (opterr)
534                     {
535                       if (argv[optind - 1][1] == '-')
536                         /* --option */
537                         fprintf (stderr,
538                             _("%s: option `--%s' doesn't allow an argument\n"),
539                                  argv[0], pfound->name);
540                       else
541                         /* +option or -option */
542                         fprintf (stderr,
543                             _("%s: option `%c%s' doesn't allow an argument\n"),
544                                  argv[0], argv[optind - 1][0], pfound->name);
545                     }
546                   nextchar += strlen (nextchar);
547                   return '?';
548                 }
549             }
550           else if (pfound->has_arg == 1)
551             {
552               if (optind < argc)
553                 optarg = argv[optind++];
554               else
555                 {
556                   if (opterr)
557                     fprintf (stderr, _("%s: option `%s' requires an argument\n"),
558                              argv[0], argv[optind - 1]);
559                   nextchar += strlen (nextchar);
560                   return optstring[0] == ':' ? ':' : '?';
561                 }
562             }
563           nextchar += strlen (nextchar);
564           if (longind != NULL)
565             *longind = option_index;
566           if (pfound->flag)
567             {
568               *(pfound->flag) = pfound->val;
569               return 0;
570             }
571           return pfound->val;
572         }
573
574       /* Can't find it as a long option.  If this is not getopt_long_only,
575          or the option starts with '--' or is not a valid short
576          option, then it's an error.
577          Otherwise interpret it as a short option.  */
578       if (!long_only || argv[optind][1] == '-'
579           || my_index (optstring, *nextchar) == NULL)
580         {
581           if (opterr)
582             {
583               if (argv[optind][1] == '-')
584                 /* --option */
585                 fprintf (stderr, _("%s: unrecognized option `--%s'\n"),
586                          argv[0], nextchar);
587               else
588                 /* +option or -option */
589                 fprintf (stderr, _("%s: unrecognized option `%c%s'\n"),
590                          argv[0], argv[optind][0], nextchar);
591             }
592           nextchar = (char *) "";
593           optind++;
594           return '?';
595         }
596     }
597
598   /* Look at and handle the next short option-character.  */
599
600   {
601     char c = *nextchar++;
602     char *temp = my_index (optstring, c);
603
604     /* Increment `optind' when we start to process its last character.  */
605     if (*nextchar == '\0')
606       ++optind;
607
608     if (temp == NULL || c == ':')
609       {
610         if (opterr)
611           {
612             if (posixly_correct)
613               /* 1003.2 specifies the format of this message.  */
614               fprintf (stderr, _("%s: illegal option -- %c\n"), argv[0], c);
615             else
616               fprintf (stderr, _("%s: invalid option -- %c\n"), argv[0], c);
617           }
618         optopt = c;
619         return '?';
620       }
621     if (temp[1] == ':')
622       {
623         if (temp[2] == ':')
624           {
625             /* This is an option that accepts an argument optionally.  */
626             if (*nextchar != '\0')
627               {
628                 optarg = nextchar;
629                 optind++;
630               }
631             else
632               optarg = NULL;
633             nextchar = NULL;
634           }
635         else
636           {
637             /* This is an option that requires an argument.  */
638             if (*nextchar != '\0')
639               {
640                 optarg = nextchar;
641                 /* If we end this ARGV-element by taking the rest as an arg,
642                    we must advance to the next element now.  */
643                 optind++;
644               }
645             else if (optind == argc)
646               {
647                 if (opterr)
648                   {
649                     /* 1003.2 specifies the format of this message.  */
650                     fprintf (stderr, _("%s: option requires an argument -- %c\n"),
651                              argv[0], c);
652                   }
653                 optopt = c;
654                 if (optstring[0] == ':')
655                   c = ':';
656                 else
657                   c = '?';
658               }
659             else
660               /* We already incremented `optind' once;
661                  increment it again when taking next ARGV-elt as argument.  */
662               optarg = argv[optind++];
663             nextchar = NULL;
664           }
665       }
666     return c;
667   }
668 }
669
670 int
671 getopt (argc, argv, optstring)
672      int argc;
673      char *const *argv;
674      const char *optstring;
675 {
676   return _getopt_internal (argc, argv, optstring,
677                            (const struct option *) 0,
678                            (int *) 0,
679                            0);
680 }
681
682 #endif /* _LIBC or not __GNU_LIBRARY__.  */
683 \f
684 #ifdef TEST
685
686 /* Compile with -DTEST to make an executable for use in testing
687    the above definition of `getopt'.  */
688
689 int
690 main (argc, argv)
691      int argc;
692      char **argv;
693 {
694   int c;
695   int digit_optind = 0;
696
697   while (1)
698     {
699       int this_option_optind = optind ? optind : 1;
700
701       c = getopt (argc, argv, "abc:d:0123456789");
702       if (c == EOF)
703         break;
704
705       switch (c)
706         {
707         case '0':
708         case '1':
709         case '2':
710         case '3':
711         case '4':
712         case '5':
713         case '6':
714         case '7':
715         case '8':
716         case '9':
717           if (digit_optind != 0 && digit_optind != this_option_optind)
718             printf ("digits occur in two different argv-elements.\n");
719           digit_optind = this_option_optind;
720           printf ("option %c\n", c);
721           break;
722
723         case 'a':
724           printf ("option a\n");
725           break;
726
727         case 'b':
728           printf ("option b\n");
729           break;
730
731         case 'c':
732           printf ("option c with value `%s'\n", optarg);
733           break;
734
735         case '?':
736           break;
737
738         default:
739           printf ("?? getopt returned character code 0%o ??\n", c);
740         }
741     }
742
743   if (optind < argc)
744     {
745       printf ("non-option ARGV-elements: ");
746       while (optind < argc)
747         printf ("%s ", argv[optind++]);
748       printf ("\n");
749     }
750
751   exit (0);
752 }
753
754 #endif /* TEST */