自動フィールドシフト 高速化版+8
高速化版+8
もっと高速化。
afs_analyze_xxとafs_analyze_shrink_infoを統合
高速化版+7 (結局この時点では公開しなかった)
・VC++2012のWinXP互換ビルドに変更。
特に影響はないと思うけど、VS2012 Update1で利用可能になったので、念のため。
・popcntの確認をSSE4.2のフラグの有無で確認していたのを、正しくpopcntのフラグで確認するようにした。
AMD Phenom等における、「SSE4.2非対応だけどpopcntはある」ケースにも対応。
・メモリアクセスパターンを変更することで、HD映像処理向けの高速化。
詳細は続きに。
・AVX2対応の準備。
Haswell実機で確認後、AVX2対応版を公開できるかも?
x264のAVX2は意外と効果が小さいようで(+5%)残念だけど…afsはどうだろう…。まあ自分で試してみてなんぼですわな。
ダウンロード>>
続きに高速化の細かい話とか。
もっと高速化。
afs_analyze_xxとafs_analyze_shrink_infoを統合
高速化版+7 (結局この時点では公開しなかった)
・VC++2012のWinXP互換ビルドに変更。
特に影響はないと思うけど、VS2012 Update1で利用可能になったので、念のため。
・popcntの確認をSSE4.2のフラグの有無で確認していたのを、正しくpopcntのフラグで確認するようにした。
AMD Phenom等における、「SSE4.2非対応だけどpopcntはある」ケースにも対応。
・メモリアクセスパターンを変更することで、HD映像処理向けの高速化。
詳細は続きに。
・AVX2対応の準備。
Haswell実機で確認後、AVX2対応版を公開できるかも?
x264のAVX2は意外と効果が小さいようで(+5%)残念だけど…afsはどうだろう…。まあ自分で試してみてなんぼですわな。
ダウンロード>>
続きに高速化の細かい話とか。
スポンサーサイト