Adjust TAS assembly as per recent discussions: use "+m"(*lock) everywhere
authorTom Lane <tgl@sss.pgh.pa.us>
Sat, 19 Jun 2004 23:02:32 +0000 (23:02 +0000)
committerTom Lane <tgl@sss.pgh.pa.us>
Sat, 19 Jun 2004 23:02:32 +0000 (23:02 +0000)
to reference the spinlock variable, and specify "memory" as a clobber
operand to be sure gcc does not try to keep shared-memory values in
registers across a spinlock acquisition.  Also tighten the S/390 asm
sequence, which was apparently written with only minimal study of the
gcc asm documentation.  I have personally tested i386, ia64, ppc, hppa,
and s390 variants --- there is some small chance that I broke the others,
but I doubt it.

src/include/storage/s_lock.h

index f8bcf5e96a9cf2773cac4c41e6591d6f2d953489..0725fd06d24caed01607a74bd1b9dbc511e0e8cf 100644 (file)
@@ -66,7 +66,7 @@
  * Portions Copyright (c) 1996-2003, PostgreSQL Global Development Group
  * Portions Copyright (c) 1994, Regents of the University of California
  *
- *       $PostgreSQL: pgsql/src/include/storage/s_lock.h,v 1.125 2004/01/03 05:47:44 tgl Exp $
+ *       $PostgreSQL: pgsql/src/include/storage/s_lock.h,v 1.126 2004/06/19 23:02:32 tgl Exp $
  *
  *-------------------------------------------------------------------------
  */
  * Other compilers use __cpu or __cpu__ so we test for both in those cases.
  */
 
-/*
- * Standard gcc asm format is:
- *
+/*----------
+ * Standard gcc asm format (assuming "volatile slock_t *lock"):
+
        __asm__ __volatile__(
-               "       command \n"
-               "       command \n"
-               "       command \n"
-:              "=r"(_res)                      return value, in register
-:              "r"(lock)                       argument, 'lock pointer', in register
-:              "r0");                          inline code uses this register
+               "       instruction     \n"
+               "       instruction     \n"
+               "       instruction     \n"
+:              "=r"(_res), "+m"(*lock)         // return register, in/out lock value
+:              "r"(lock)                                       // lock pointer, in input register
+:              "memory", "cc");                        // show clobbered registers here
+
+ * The output-operands list (after first colon) should always include
+ * "+m"(*lock), whether or not the asm code actually refers to this
+ * operand directly.  This ensures that gcc believes the value in the
+ * lock variable is used and set by the asm code.  Also, the clobbers
+ * list (after third colon) should always include "memory"; this prevents
+ * gcc from thinking it can cache the values of shared-memory fields
+ * across the asm code.  Add "cc" if your asm code changes the condition
+ * code register, and also list any temp registers the code uses.
+ *----------
  */
 
 
@@ -117,8 +127,9 @@ tas(volatile slock_t *lock)
                "       lock                    \n"
                "       xchgb   %0,%1   \n"
                "1: \n"
-:              "=q"(_res), "=m"(*lock)
-:              "0"(_res));
+:              "+q"(_res), "+m"(*lock)
+:
+:              "memory", "cc");
        return (int) _res;
 }
 
@@ -128,8 +139,7 @@ static __inline__ void
 spin_delay(void)
 {
        __asm__ __volatile__(
-               " rep; nop                      \n"
-               : : : "memory");
+               " rep; nop                      \n");
 }
 
 #endif  /* __i386__ || __x86_64__ */
@@ -150,10 +160,9 @@ tas(volatile slock_t *lock)
 
        __asm__ __volatile__(
                "       xchg4   %0=%1,%2        \n"
-:              "=r"(ret), "=m"(*lock)
-:              "r"(1), "1"(*lock)
+:              "=r"(ret), "+m"(*lock)
+:              "r"(1)
 :              "memory");
-
        return (int) ret;
 }
 
@@ -173,46 +182,18 @@ tas(volatile slock_t *lock)
        register slock_t _res = 1;
 
        __asm__ __volatile__(
-               "       swpb    %0, %0, [%3]    \n"
-:              "=r"(_res), "=m"(*lock)
-:              "0"(_res), "r"(lock));
+               "       swpb    %0, %0, [%2]    \n"
+:              "+r"(_res), "+m"(*lock)
+:              "r"(lock)
+:              "memory");
        return (int) _res;
 }
 
 #endif  /* __arm__ */
 
 
-#if defined(__s390__) && !defined(__s390x__)
-/* S/390 Linux */
-#define HAS_TEST_AND_SET
-
-typedef unsigned int slock_t;
-
-#define TAS(lock)         tas(lock)
-
-static __inline__ int
-tas(volatile slock_t *lock)
-{
-       int                     _res;
-
-       __asm__ __volatile__(
-               "       la      1,1                     \n"
-               "       l       2,%2            \n"
-               "       slr 0,0                 \n"
-               "       cs      0,1,0(2)        \n"
-               "       lr      %1,0            \n"
-:              "=m"(lock), "=d"(_res)
-:              "m"(lock)
-:              "0", "1", "2");
-
-       return (_res);
-}
-
-#endif  /* __s390__ */
-
-
-#if defined(__s390x__)
-/* S/390x Linux (64-bit zSeries) */
+#if defined(__s390__) || defined(__s390x__)
+/* S/390 and S/390x Linux (32- and 64-bit zSeries) */
 #define HAS_TEST_AND_SET
 
 typedef unsigned int slock_t;
@@ -222,22 +203,17 @@ typedef unsigned int slock_t;
 static __inline__ int
 tas(volatile slock_t *lock)
 {
-       int                     _res;
+       int                     _res = 0;
 
        __asm__ __volatile__(
-               "       la      1,1                     \n"
-               "       lg      2,%2            \n"
-               "       slr 0,0                 \n"
-               "       cs      0,1,0(2)        \n"
-               "       lr      %1,0            \n"
-:              "=m"(lock), "=d"(_res)
-:              "m"(lock)
-:              "0", "1", "2");
-
-       return (_res);
+               "       cs      %0,%3,0(%2)             \n"
+:              "+d"(_res), "+m"(*lock)
+:              "a"(lock), "d"(1)
+:              "memory", "cc");
+       return _res;
 }
 
-#endif  /* __s390x__ */
+#endif  /* __s390__ || __s390x__ */
 
 
 #if defined(__sparc__)
@@ -250,12 +226,13 @@ typedef unsigned char slock_t;
 static __inline__ int
 tas(volatile slock_t *lock)
 {
-       register slock_t _res = 1;
+       register slock_t _res;
 
        __asm__ __volatile__(
                "       ldstub  [%2], %0        \n"
-:              "=r"(_res), "=m"(*lock)
-:              "r"(lock));
+:              "=r"(_res), "+m"(*lock)
+:              "r"(lock)
+:              "memory");
        return (int) _res;
 }
 
@@ -283,11 +260,11 @@ tas(volatile slock_t *lock)
        int _res;
 
        __asm__ __volatile__(
-"      lwarx   %0,0,%2         \n"
+"      lwarx   %0,0,%3         \n"
 "      cmpwi   %0,0            \n"
 "      bne     1f                      \n"
 "      addi    %0,%0,1         \n"
-"      stwcx.  %0,0,%2         \n"
+"      stwcx.  %0,0,%3         \n"
 "      beq     2f              \n"
 "1:    li      %1,1            \n"
 "      b               3f                      \n"
@@ -296,10 +273,9 @@ tas(volatile slock_t *lock)
 "      li      %1,0            \n"
 "3:                                            \n"
 
-:      "=&r" (_t), "=r" (_res)
-:      "r" (lock)
-:      "cc", "memory"
-       );
+:      "=&r"(_t), "=r"(_res), "+m"(*lock)
+:      "r"(lock)
+:      "memory", "cc");
        return _res;
 }
 
@@ -330,10 +306,9 @@ tas(volatile slock_t *lock)
                "       clrl    %0              \n"
                "       tas             %1              \n"
                "       sne             %0              \n"
-:              "=d"(rv), "=m"(*lock)
-:              "1"(*lock)
-:              "cc");
-
+:              "=d"(rv), "+m"(*lock)
+:
+:              "memory", "cc");
        return rv;
 }
 
@@ -357,13 +332,13 @@ tas(volatile slock_t *lock)
        register int    _res;
 
        __asm__ __volatile__(
-               "       movl    $1, r0                  \n"
-               "       bbssi   $0, (%1), 1f    \n"
-               "       clrl    r0                              \n"
-               "1:     movl    r0, %0                  \n"
-:              "=r"(_res)
+               "       movl    $1, %0                  \n"
+               "       bbssi   $0, (%2), 1f    \n"
+               "       clrl    %0                              \n"
+               "1: \n"
+:              "=&r"(_res), "+m"(*lock)
 :              "r"(lock)
-:              "r0");
+:              "memory");
        return _res;
 }
 
@@ -383,9 +358,11 @@ tas(volatile slock_t *lock)
        register int    _res;
 
        __asm__ __volatile__(
-               "       sbitb   0, %0   \n"
-               "       sfsd    %1              \n"
-:              "=m"(*lock), "=r"(_res));
+               "       sbitb   0, %1   \n"
+               "       sfsd    %0              \n"
+:              "=r"(_res), "+m"(*lock)
+:
+:              "memory");
        return _res;
 }
 
@@ -404,12 +381,6 @@ tas(volatile slock_t *lock)
 typedef unsigned long slock_t;
 
 #define TAS(lock)  tas(lock)
-#define S_UNLOCK(lock) \
-do \
-{\
-       __asm__ __volatile__ (" mb \n"); \
-       *((volatile slock_t *) (lock)) = 0; \
-} while (0)
 
 static __inline__ int
 tas(volatile slock_t *lock)
@@ -417,24 +388,30 @@ tas(volatile slock_t *lock)
        register slock_t _res;
 
        __asm__ __volatile__(
-               "       ldq             $0, %0  \n"
+               "       ldq             $0, %1  \n"
                "       bne             $0, 2f  \n"
-               "       ldq_l   %1, %0  \n"
-               "       bne             %1, 2f  \n"
+               "       ldq_l   %0, %1  \n"
+               "       bne             %0, 2f  \n"
                "       mov             1,  $0  \n"
-               "       stq_c   $0, %0  \n"
+               "       stq_c   $0, %1  \n"
                "       beq             $0, 2f  \n"
                "       mb                              \n"
                "       br              3f              \n"
-               "2:     mov             1, %1   \n"
+               "2:     mov             1, %0   \n"
                "3:                                     \n"
-:              "=m"(*lock), "=r"(_res)
+:              "=&r"(_res), "+m"(*lock)
 :
-:              "0");
-
+:              "memory", "0");
        return (int) _res;
 }
 
+#define S_UNLOCK(lock) \
+do \
+{\
+       __asm__ __volatile__ (" mb \n"); \
+       *((volatile slock_t *) (lock)) = 0; \
+} while (0)
+
 #endif /* __alpha || __alpha__ */
 
 
@@ -540,8 +517,9 @@ tas(volatile slock_t *lock)
 
        __asm__ __volatile__(
                "       ldcwx   0(0,%2),%0      \n"
-:              "=r"(lockval), "=m"(*lockword)
-:              "r"(lockword));
+:              "=r"(lockval), "+m"(*lockword)
+:              "r"(lockword)
+:              "memory");
        return (lockval == 0);
 }