このインテル® ストリーミング SIMD 拡張命令 3 補足命令 (インテル® SSSE3) 組み込み関数は、水平減算に使用されます。これらの組み込み関数のプロトタイプは、tmmintrin.h 内にあります。これらの組み込み関数に対して ia32intrin.h ヘッダーファイルを使用することもできます。
extern __m128i _mm_hsub_epi16 (__m128i a, __m128i b);
パックド符号付きワードを水平減算します。
符号付き 16 ビット整数の配列として a、b、r を解釈します。
for (i = 0; i < 4; i++) {
r[i] = a[2*i] - a[2i+1];
r[i+4] = b[2*i] - b[2*i+1];
}
extern __m128i _mm_hsub_epi32 (__m128i a, __m128i b);
パックド符号付きダブルワードを水平に減算します。
符号付き 32 ビット整数の配列として a、b、r を解釈します。
for (i = 0; i < 2; i++) {
r[i] = a[2*i] - a[2i+1];
r[i+2] = b[2*i] - b[2*i+1];
}
extern __m128i _mm_hsubs_epi16 (__m128i a, __m128i b);
符号付き飽和処理を使用して、パックド符号付きワードを水平に減算します。
符号付き 16 ビット整数の配列として a、b、r を解釈します。
for (i = 0; i < 4; i++) {
r[i] = signed_saturate_to_word(a[2*i] - a[2i+1]);
r[i+4] = signed_saturate_to_word(b[2*i] - b[2*i+1]);
}
extern __m64 _mm_hsub_pi16 (__m64 a, __m64 b);
パックド符号付きワードを水平減算します。
符号付き 16 ビット整数の配列として a、b、r を解釈します。
for (i = 0; i < 2; i++) {
r[i] = a[2*i] - a[2i+1];
r[i+2] = b[2*i] - b[2*i+1];
}
extern __m64 _mm_hsub_pi32 (__m64 a, __m64 b);
パックド符号付きダブルワードを水平に減算します。
符号付き 32 ビット整数の配列として a、b、r を解釈します。
r[0] = a[0] - a[1];
r[1] = b[0] - b[1];
extern __m64 _mm_hsubs_pi16 (__m64 a, __m64 b);
符号付き符号付き飽和処理を使用して、パックド符号付きワードを水平に減算します。
符号付き 16 ビット整数の配列として a、b、r を解釈します。
for (i = 0; i < 2; i++) {
r[i] = signed_saturate_to_word(a[2*i] - a[2i+1]);
r[i+2] = signed_saturate_to_word(b[2*i] - b[2*i+1]);
}