В случае, если у вас GNU gcc версии 4.6.2 и выше, или же Open64 от AMD версии 4.5.1 и выше, можно использовать -march=bdver1 или -mtune=bdver1 (bd – от Bulldozer). Рекомендованные безопасные CFLAGS включают в себя такой немаленький набор оптимизаций: CFLAGS="-O2 -pipe -fomit-frame-pointer -march=bdver1 -mtune=bdver1 -mcx16 -msahf -maes -mpclmul -mpopcnt -mabm -mlwp -mavx". Не стоит забывать использовать CXXFLAGS="${CFLAGS}", чтобы компилятор C++ использовал такие же опции.
Ещё интересные опции: -mprefer-avx128 (AVX tuning), -ftree-vectorize для векторизации. Спасибо AMD за документацию.