00001 
00002 
00003 
00004 
00005 
00006 
00007 
00008 
00009 
00010 
00011 
00012 
00013 
00014 
00015 
00016 
00017 
00018 
00019 
00020 
00021 
00022 
00023 
00024 #include "libavutil/x86_cpu.h"
00025 #include "libavcodec/dnxhdenc.h"
00026 
00027 static void get_pixels_8x4_sym_sse2(DCTELEM *block, const uint8_t *pixels, int line_size)
00028 {
00029     __asm__ volatile(
00030         "pxor %%xmm5,      %%xmm5       \n\t"
00031         "movq (%0),        %%xmm0       \n\t"
00032         "add  %2,          %0           \n\t"
00033         "movq (%0),        %%xmm1       \n\t"
00034         "movq (%0, %2),    %%xmm2       \n\t"
00035         "movq (%0, %2,2),  %%xmm3       \n\t"
00036         "punpcklbw %%xmm5, %%xmm0       \n\t"
00037         "punpcklbw %%xmm5, %%xmm1       \n\t"
00038         "punpcklbw %%xmm5, %%xmm2       \n\t"
00039         "punpcklbw %%xmm5, %%xmm3       \n\t"
00040         "movdqa %%xmm0,      (%1)       \n\t"
00041         "movdqa %%xmm1,    16(%1)       \n\t"
00042         "movdqa %%xmm2,    32(%1)       \n\t"
00043         "movdqa %%xmm3,    48(%1)       \n\t"
00044         "movdqa %%xmm3 ,   64(%1)       \n\t"
00045         "movdqa %%xmm2 ,   80(%1)       \n\t"
00046         "movdqa %%xmm1 ,   96(%1)       \n\t"
00047         "movdqa %%xmm0,   112(%1)       \n\t"
00048         : "+r" (pixels)
00049         : "r" (block), "r" ((x86_reg)line_size)
00050     );
00051 }
00052 
00053 void ff_dnxhd_init_mmx(DNXHDEncContext *ctx)
00054 {
00055     if (av_get_cpu_flags() & AV_CPU_FLAG_SSE2) {
00056         ctx->get_pixels_8x4_sym = get_pixels_8x4_sym_sse2;
00057     }
00058 }