with - preprocessor definitions




Warum interpretiert der C-Präprozessor das Wort "linux" als Konstante "1"? (4)

Dies scheint eine (undokumentierte) "GNU-Erweiterung" zu sein: [ Korrektur : Ich habe endlich eine Erwähnung in den Dokumenten gefunden. Siehe unten.]

Der folgende Befehl verwendet die Option -dM , um alle Präprozessordefinitionen zu drucken. Da die Eingabe "Datei" leer ist, zeigt sie genau die vordefinierten Makros an. Es wurde mit gcc-4.7.3 auf einer Standard-Ubuntu-Installation ausgeführt. Sie können sehen, dass der Präprozessor standardbewusst ist. Insgesamt gibt es 243 Makros mit -std=gnu99 und 240 mit -std=c99 ; Ich habe die Ausgabe auf Relevanz gefiltert.

$ cpp --std=c89 -dM < /dev/null | grep linux
#define __linux 1
#define __linux__ 1
#define __gnu_linux__ 1

$ cpp --std=gnu89 -dM < /dev/null | grep linux
#define __linux 1
#define __linux__ 1
#define __gnu_linux__ 1
#define linux 1

$ cpp --std=c99 -dM < /dev/null | grep linux
#define __linux 1
#define __linux__ 1
#define __gnu_linux__ 1

$ cpp --std=gnu99 -dM < /dev/null | grep linux
#define __linux 1
#define __linux__ 1
#define __gnu_linux__ 1
#define linux 1

Die "gnu standard" -Versionen definieren auch #define unix . (Die Verwendung von c11 und gnu11 führt zu denselben Ergebnissen.)

Ich nehme an, sie hatten ihre Gründe, aber es scheint mir, die Standardinstallation von gcc (die C-Code mit -std=gnu89 wenn nicht anders angegeben) nicht-konform zu machen, und - wie in dieser Frage - überraschend. Die Verunreinigung des globalen Namespace mit Makros, deren Namen nicht mit einem Unterstrich beginnen, ist in einer konformen Implementierung nicht erlaubt. (6.8.10p2: "Alle anderen vordefinierten Makronamen müssen mit einem führenden Unterstrich gefolgt von einem Großbuchstaben oder einem zweiten Unterstrich beginnen", aber wie in Anhang J.5 (Portabilitätsprobleme) erwähnt, sind solche Namen oft vordefiniert.)

Als ich diese Antwort ursprünglich geschrieben habe, konnte ich in gcc keine Dokumentation über dieses Problem finden, aber ich habe es schließlich entdeckt, nicht im C-implementierten Verhalten oder in C-Erweiterungen, sondern im cpp Handbuch Abschnitt 3.7.3 , wo es bemerkt, dass:

Wir beenden langsam alle vordefinierten Makros, die sich außerhalb des reservierten Namensraums befinden. Sie sollten sie nie in neuen Programmen verwenden ...

Warum interpretiert der C-Präprozessor in GCC das Wort linux (Kleinbuchstaben) als Konstante 1 ?

test.c:

#include <stdio.h>
int main(void)
{       
    int linux = 5;
    return 0;
}

Ergebnis von $ gcc -E test.c (nach der Vorverarbeitung stoppen):

....
int main(void)
{
    int 1 = 5;
    return 0;
}

Was - natürlich - einen Fehler ergibt.

(BTW: In der Datei stdio.h gibt es kein #define linux .)


In den alten Tagen (pre-ANSI) war das vax Symbolen wie unix und vax eine Möglichkeit, Code zur Kompilierungszeit erkennen zu lassen, für welches System er kompiliert wurde. Es gab damals keinen offiziellen Sprachstandard (jenseits des Referenzmaterials auf der Rückseite der ersten Ausgabe von K & R), und C-Code jeder Komplexität war typischerweise ein komplexes Labyrinth von #ifdef , um Unterschiede zwischen Systemen zu #ifdef . Diese Makrodefinitionen wurden im Allgemeinen vom Compiler selbst festgelegt und nicht in einer Bibliothekskopfdatei definiert. Da es keine echten Regeln gab, welche Kennungen von der Implementierung verwendet werden könnten und welche für Programmierer reserviert waren, fühlten sich Compiler-Autoren frei, einfache Namen wie unix und nahmen an, dass Programmierer diese Namen einfach für ihre eigenen Zwecke verwenden würden.

Der 1989 ANSI C-Standard führte Regeln ein, die einschränkten, welche Symbole eine Implementierung rechtlich vorgeben könnte. Ein vom Compiler vordefiniertes Makro kann nur einen Namen haben, der mit zwei Unterstrichen oder einem Unterstrich gefolgt von einem Großbuchstaben beginnt. Programmierer können dann Bezeichner verwenden, die nicht mit diesem Muster übereinstimmen und nicht in der Standardbibliothek verwendet werden.

Als Ergebnis ist jeder Compiler, der unix oder linux vordefiniert, nicht konform, da es nicht kompilieren wird, um den richtigen Code zu kompilieren, der etwas wie int linux = 5; .

Wie dem auch sei, gcc ist standardmäßig nicht konform - aber es kann so gemacht werden, dass es (recht gut) mit den richtigen Kommandozeilenoptionen übereinstimmt:

gcc -std=c90 -pedantic ... # or -std=c89 or -ansi
gcc -std=c99 -pedantic
gcc -std=c11 -pedantic

Weitere Informationen finden Sie im gcc-Handbuch .

gcc wird diese Definitionen in zukünftigen Versionen auslaufen lassen, also sollten Sie keinen Code schreiben, der von ihnen abhängt. Wenn Ihr Programm wissen muss, ob es für ein Linux-Ziel kompiliert wird oder nicht, kann es prüfen, ob __linux__ definiert ist (vorausgesetzt, Sie verwenden gcc oder einen Compiler, der damit kompatibel ist). Weitere Informationen finden Sie im GNU C-Präprozessorhandbuch .

Eine weitgehend irrelevante Nebenbemerkung: Der "Best One Liner" -Gewinner des International Obfuscated C Code Contest 1987 von David Korn (ja, der Autor der Korn Shell) nutzte das vordefinierte unix Makro:

main() { printf(&unix["\021%six\012\0"],(unix)["have"]+"fun"-0x60);}

Es druckt "unix" , aber aus Gründen, die absolut nichts mit der Schreibweise des Makronamens zu tun haben.


Von info gcc (Hervorhebung meins):

-ansi

Im C-Modus entspricht dies -std=c90 . Im C ++ - Modus entspricht dies -std=c++98 . Dadurch werden bestimmte Funktionen von GCC deaktiviert, die nicht mit ISO C90 (beim Kompilieren von C-Code) oder Standard-C ++ (beim Kompilieren von C ++ - Code) wie den Schlüsselwörtern asm und typeof sowie vordefinierten Makros wie "unix" und "vax" kompatibel sind ' , die den Systemtyp identifizieren, den Sie verwenden. Es aktiviert auch die unerwünschte und selten verwendete ISO-Trigraph-Funktion. Für den C-Compiler deaktiviert es die Erkennung von // C ++ - Kommentaren sowie das inline Schlüsselwort.

(Es verwendet vax im Beispiel anstelle von linux, denn wenn es geschrieben wurde, war es vielleicht populärer ;-).

Die Grundidee ist, dass GCC nur versucht, die ISO-Standards vollständig zu erfüllen, wenn es mit der Option -ansi aufgerufen wird.


Weil linux ein eingebauter Makro ist, der definiert wird, wenn der Compiler läuft, oder Kompilieren für Linux (wenn es ein Cross-Compiler ist).

Es gibt viele solcher vordefinierten Makros. Mit GCC können Sie Folgendes verwenden:

cp /dev/null emptyfile.c
gcc -E -dM emptyfile.c

um eine Liste von Makros zu erhalten. (Ich habe es nicht geschafft, GCC zu überreden, /dev/null direkt zu akzeptieren, aber die leere Datei scheint zu funktionieren.) Mit GCC 4.8.1, das unter Mac OS X 10.8.5 läuft, habe ich folgende Ausgabe:

#define __DBL_MIN_EXP__ (-1021)
#define __UINT_LEAST16_MAX__ 65535
#define __ATOMIC_ACQUIRE 2
#define __FLT_MIN__ 1.17549435082228750797e-38F
#define __UINT_LEAST8_TYPE__ unsigned char
#define __INTMAX_C(c) c ## L
#define __CHAR_BIT__ 8
#define __UINT8_MAX__ 255
#define __WINT_MAX__ 2147483647
#define __ORDER_LITTLE_ENDIAN__ 1234
#define __SIZE_MAX__ 18446744073709551615UL
#define __WCHAR_MAX__ 2147483647
#define __GCC_HAVE_SYNC_COMPARE_AND_SWAP_1 1
#define __GCC_HAVE_SYNC_COMPARE_AND_SWAP_2 1
#define __GCC_HAVE_SYNC_COMPARE_AND_SWAP_4 1
#define __DBL_DENORM_MIN__ ((double)4.94065645841246544177e-324L)
#define __GCC_HAVE_SYNC_COMPARE_AND_SWAP_8 1
#define __GCC_ATOMIC_CHAR_LOCK_FREE 2
#define __FLT_EVAL_METHOD__ 0
#define __GCC_ATOMIC_CHAR32_T_LOCK_FREE 2
#define __x86_64 1
#define __UINT_FAST64_MAX__ 18446744073709551615ULL
#define __SIG_ATOMIC_TYPE__ int
#define __DBL_MIN_10_EXP__ (-307)
#define __FINITE_MATH_ONLY__ 0
#define __GNUC_PATCHLEVEL__ 1
#define __UINT_FAST8_MAX__ 255
#define __DEC64_MAX_EXP__ 385
#define __INT8_C(c) c
#define __UINT_LEAST64_MAX__ 18446744073709551615ULL
#define __SHRT_MAX__ 32767
#define __LDBL_MAX__ 1.18973149535723176502e+4932L
#define __UINT_LEAST8_MAX__ 255
#define __GCC_ATOMIC_BOOL_LOCK_FREE 2
#define __APPLE_CC__ 1
#define __UINTMAX_TYPE__ long unsigned int
#define __DEC32_EPSILON__ 1E-6DF
#define __UINT32_MAX__ 4294967295U
#define __LDBL_MAX_EXP__ 16384
#define __WINT_MIN__ (-__WINT_MAX__ - 1)
#define __SCHAR_MAX__ 127
#define __WCHAR_MIN__ (-__WCHAR_MAX__ - 1)
#define __INT64_C(c) c ## LL
#define __DBL_DIG__ 15
#define __GCC_ATOMIC_POINTER_LOCK_FREE 2
#define __SIZEOF_INT__ 4
#define __SIZEOF_POINTER__ 8
#define __USER_LABEL_PREFIX__ _
#define __STDC_HOSTED__ 1
#define __LDBL_HAS_INFINITY__ 1
#define __FLT_EPSILON__ 1.19209289550781250000e-7F
#define __LDBL_MIN__ 3.36210314311209350626e-4932L
#define __DEC32_MAX__ 9.999999E96DF
#define __strong 
#define __INT32_MAX__ 2147483647
#define __SIZEOF_LONG__ 8
#define __APPLE__ 1
#define __UINT16_C(c) c
#define __DECIMAL_DIG__ 21
#define __LDBL_HAS_QUIET_NAN__ 1
#define __DYNAMIC__ 1
#define __GNUC__ 4
#define __MMX__ 1
#define __FLT_HAS_DENORM__ 1
#define __SIZEOF_LONG_DOUBLE__ 16
#define __BIGGEST_ALIGNMENT__ 16
#define __DBL_MAX__ ((double)1.79769313486231570815e+308L)
#define __INT_FAST32_MAX__ 2147483647
#define __DBL_HAS_INFINITY__ 1
#define __DEC32_MIN_EXP__ (-94)
#define __INT_FAST16_TYPE__ short int
#define __LDBL_HAS_DENORM__ 1
#define __DEC128_MAX__ 9.999999999999999999999999999999999E6144DL
#define __INT_LEAST32_MAX__ 2147483647
#define __DEC32_MIN__ 1E-95DF
#define __weak 
#define __DBL_MAX_EXP__ 1024
#define __DEC128_EPSILON__ 1E-33DL
#define __SSE2_MATH__ 1
#define __ATOMIC_HLE_RELEASE 131072
#define __PTRDIFF_MAX__ 9223372036854775807L
#define __amd64 1
#define __tune_core2__ 1
#define __ATOMIC_HLE_ACQUIRE 65536
#define __LONG_LONG_MAX__ 9223372036854775807LL
#define __SIZEOF_SIZE_T__ 8
#define __SIZEOF_WINT_T__ 4
#define __GXX_ABI_VERSION 1002
#define __FLT_MIN_EXP__ (-125)
#define __INT_FAST64_TYPE__ long long int
#define __DBL_MIN__ ((double)2.22507385850720138309e-308L)
#define __LP64__ 1
#define __DEC128_MIN__ 1E-6143DL
#define __REGISTER_PREFIX__ 
#define __UINT16_MAX__ 65535
#define __DBL_HAS_DENORM__ 1
#define __UINT8_TYPE__ unsigned char
#define __NO_INLINE__ 1
#define __FLT_MANT_DIG__ 24
#define __VERSION__ "4.8.1"
#define __UINT64_C(c) c ## ULL
#define __GCC_ATOMIC_INT_LOCK_FREE 2
#define __FLOAT_WORD_ORDER__ __ORDER_LITTLE_ENDIAN__
#define __INT32_C(c) c
#define __DEC64_EPSILON__ 1E-15DD
#define __ORDER_PDP_ENDIAN__ 3412
#define __DEC128_MIN_EXP__ (-6142)
#define __INT_FAST32_TYPE__ int
#define __UINT_LEAST16_TYPE__ short unsigned int
#define __INT16_MAX__ 32767
#define __ENVIRONMENT_MAC_OS_X_VERSION_MIN_REQUIRED__ 1080
#define __SIZE_TYPE__ long unsigned int
#define __UINT64_MAX__ 18446744073709551615ULL
#define __INT8_TYPE__ signed char
#define __FLT_RADIX__ 2
#define __INT_LEAST16_TYPE__ short int
#define __LDBL_EPSILON__ 1.08420217248550443401e-19L
#define __UINTMAX_C(c) c ## UL
#define __SSE_MATH__ 1
#define __k8 1
#define __SIG_ATOMIC_MAX__ 2147483647
#define __GCC_ATOMIC_WCHAR_T_LOCK_FREE 2
#define __SIZEOF_PTRDIFF_T__ 8
#define __x86_64__ 1
#define __DEC32_SUBNORMAL_MIN__ 0.000001E-95DF
#define __INT_FAST16_MAX__ 32767
#define __UINT_FAST32_MAX__ 4294967295U
#define __UINT_LEAST64_TYPE__ long long unsigned int
#define __FLT_HAS_QUIET_NAN__ 1
#define __FLT_MAX_10_EXP__ 38
#define __LONG_MAX__ 9223372036854775807L
#define __DEC128_SUBNORMAL_MIN__ 0.000000000000000000000000000000001E-6143DL
#define __FLT_HAS_INFINITY__ 1
#define __UINT_FAST16_TYPE__ short unsigned int
#define __DEC64_MAX__ 9.999999999999999E384DD
#define __CHAR16_TYPE__ short unsigned int
#define __PRAGMA_REDEFINE_EXTNAME 1
#define __INT_LEAST16_MAX__ 32767
#define __DEC64_MANT_DIG__ 16
#define __INT64_MAX__ 9223372036854775807LL
#define __UINT_LEAST32_MAX__ 4294967295U
#define __GCC_ATOMIC_LONG_LOCK_FREE 2
#define __INT_LEAST64_TYPE__ long long int
#define __INT16_TYPE__ short int
#define __INT_LEAST8_TYPE__ signed char
#define __DEC32_MAX_EXP__ 97
#define __INT_FAST8_MAX__ 127
#define __INTPTR_MAX__ 9223372036854775807L
#define __LITTLE_ENDIAN__ 1
#define __SSE2__ 1
#define __LDBL_MANT_DIG__ 64
#define __CONSTANT_CFSTRINGS__ 1
#define __DBL_HAS_QUIET_NAN__ 1
#define __SIG_ATOMIC_MIN__ (-__SIG_ATOMIC_MAX__ - 1)
#define __code_model_small__ 1
#define __k8__ 1
#define __INTPTR_TYPE__ long int
#define __UINT16_TYPE__ short unsigned int
#define __WCHAR_TYPE__ int
#define __SIZEOF_FLOAT__ 4
#define __pic__ 2
#define __UINTPTR_MAX__ 18446744073709551615UL
#define __DEC64_MIN_EXP__ (-382)
#define __INT_FAST64_MAX__ 9223372036854775807LL
#define __GCC_ATOMIC_TEST_AND_SET_TRUEVAL 1
#define __FLT_DIG__ 6
#define __UINT_FAST64_TYPE__ long long unsigned int
#define __INT_MAX__ 2147483647
#define __MACH__ 1
#define __amd64__ 1
#define __INT64_TYPE__ long long int
#define __FLT_MAX_EXP__ 128
#define __ORDER_BIG_ENDIAN__ 4321
#define __DBL_MANT_DIG__ 53
#define __INT_LEAST64_MAX__ 9223372036854775807LL
#define __GCC_ATOMIC_CHAR16_T_LOCK_FREE 2
#define __DEC64_MIN__ 1E-383DD
#define __WINT_TYPE__ int
#define __UINT_LEAST32_TYPE__ unsigned int
#define __SIZEOF_SHORT__ 2
#define __SSE__ 1
#define __LDBL_MIN_EXP__ (-16381)
#define __INT_LEAST8_MAX__ 127
#define __SIZEOF_INT128__ 16
#define __LDBL_MAX_10_EXP__ 4932
#define __ATOMIC_RELAXED 0
#define __DBL_EPSILON__ ((double)2.22044604925031308085e-16L)
#define _LP64 1
#define __UINT8_C(c) c
#define __INT_LEAST32_TYPE__ int
#define __SIZEOF_WCHAR_T__ 4
#define __UINT64_TYPE__ long long unsigned int
#define __INT_FAST8_TYPE__ signed char
#define __DBL_DECIMAL_DIG__ 17
#define __FXSR__ 1
#define __DEC_EVAL_METHOD__ 2
#define __UINT32_C(c) c ## U
#define __INTMAX_MAX__ 9223372036854775807L
#define __BYTE_ORDER__ __ORDER_LITTLE_ENDIAN__
#define __FLT_DENORM_MIN__ 1.40129846432481707092e-45F
#define __INT8_MAX__ 127
#define __PIC__ 2
#define __UINT_FAST32_TYPE__ unsigned int
#define __CHAR32_TYPE__ unsigned int
#define __FLT_MAX__ 3.40282346638528859812e+38F
#define __INT32_TYPE__ int
#define __SIZEOF_DOUBLE__ 8
#define __FLT_MIN_10_EXP__ (-37)
#define __INTMAX_TYPE__ long int
#define __DEC128_MAX_EXP__ 6145
#define __ATOMIC_CONSUME 1
#define __GNUC_MINOR__ 8
#define __UINTMAX_MAX__ 18446744073709551615UL
#define __DEC32_MANT_DIG__ 7
#define __DBL_MAX_10_EXP__ 308
#define __LDBL_DENORM_MIN__ 3.64519953188247460253e-4951L
#define __INT16_C(c) c
#define __STDC__ 1
#define __PTRDIFF_TYPE__ long int
#define __ATOMIC_SEQ_CST 5
#define __UINT32_TYPE__ unsigned int
#define __UINTPTR_TYPE__ long unsigned int
#define __DEC64_SUBNORMAL_MIN__ 0.000000000000001E-383DD
#define __DEC128_MANT_DIG__ 34
#define __LDBL_MIN_10_EXP__ (-4931)
#define __SIZEOF_LONG_LONG__ 8
#define __GCC_ATOMIC_LLONG_LOCK_FREE 2
#define __LDBL_DIG__ 18
#define __FLT_DECIMAL_DIG__ 9
#define __UINT_FAST16_MAX__ 65535
#define __GNUC_GNU_INLINE__ 1
#define __GCC_ATOMIC_SHORT_LOCK_FREE 2
#define __SSE3__ 1
#define __UINT_FAST8_TYPE__ unsigned char
#define __ATOMIC_ACQ_REL 4
#define __ATOMIC_RELEASE 3

Das sind 236 Makros aus einer leeren Datei. Als ich #include <stdio.h> zur Datei hinzufügte, stieg die Anzahl der definierten Makros auf 505. Dazu gehören alle Arten von plattformidentifizierenden Makros.





c-preprocessor