powerpc/64: Optimise syscall entry for virtual, relocatable case
authorNicholas Piggin <npiggin@gmail.com>
Thu, 15 Sep 2016 09:03:21 +0000 (19:03 +1000)
committerMichael Ellerman <mpe@ellerman.id.au>
Tue, 20 Sep 2016 04:46:05 +0000 (14:46 +1000)
commit18e3f56b1cacb96017e2a66844ceceefabf6e7bc
tree7a945f7fb3b97de627c2314b8dccae90704dba1f
parentd5a1e42cb4be016a45a787953dd70c3bc4509da5
powerpc/64: Optimise syscall entry for virtual, relocatable case

The mflr r10 instruction was left over from when the code used LR to
branch to system_call_entry from the exception handler. That was
changed by commit 6a404806dfce ("powerpc: Avoid link stack corruption in
MMU on syscall entry path") to use the count register. The value is
never used now, so mflr can be removed, and r10 can be used for storage
rather than spilling to the SPR scratch register.

The scratch register spill causes a long pipeline stall due to the SPR
read after write. This change brings getppid syscall cost from 406 to
376 cycles on POWER8. getppid for non-relocatable case is 371 cycles.

Signed-off-by: Nicholas Piggin <npiggin@gmail.com>
Acked-by: Balbir Singh <bsingharora@gmail.com>
Signed-off-by: Michael Ellerman <mpe@ellerman.id.au>
arch/powerpc/kernel/exceptions-64s.S