青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

Dict.CN 在線詞典, 英語學習, 在線翻譯

學海苦作舟,書山勤為徑

留下點回憶

常用鏈接

統計

積分與排名

Denoise

English study

Web技術

數據壓縮

一些連接

最新評論

一段代碼優化的討論

 優化很多時候是必要的,特別對于瓶頸程序。這里討論一段代碼的優化過程,從而演示一段簡單的代碼優化過程,并希望得到一些建議。

先描述一下需求:

一個16位數的序列,將其奇數位置放到一個序列,偶數問題放到另外一個序列。注意奇數和偶數序列的長度不一定相同。

最簡單的代碼:

 

 1void CTestClass::SplitToEvenOddSeqs(short *sp,short *dp1,short *dp2,int evenLen,int oddLen)
 2
 3{
 4
 5            int i;
 6
 7            for(i = 0;i<oddLen;i++,sp+=2,dp1++,dp2++)
 8
 9            {
10
11                        dp1[0= sp[0];
12
13                        dp2[0= sp[1];
14
15            }

16
17            if(i != evenLen)
18
19                        dp1[0= sp[0];
20
21}

22
23

這段代碼可以達到必要的功能,但他肯定不是優化的。

1.循環中,每次需要訪問5個變量。

2.每次循環需要一個判斷,4個加法

3.最后的不等式判斷也

考慮到dp1dp2總是同時訪問,于是定義一個結構體:

 

typedef struct tagDstData

{

            
short dp1;

            
short dp2;

}
TagDstData;

現在的算法為:

 

void CTestClass::SplitToEvenOddSeqs(short *sp,TagDstData *dp,int evenLen,int oddLen)

{

            
int i;

            
for(i = 0;i<oddLen;i++,sp+=2,dp++){

                        dp
->dp1 = sp[0];

                        dp
->dp2 = sp[1];

            }


            
if(i < evenLen)

                        dp
->dp1 = sp[0];

}


這樣做以后CPU每次讀取dp只需要一次。循環條件少了一次加法。

上面代碼每次復制一個16bit的值,總共四個字節要復制兩次,考慮把這個地方優化一下。優化后的代碼如下:

 

void CTestClass::SplitToEvenOddSeqs2(short *sp,TagDstData *dp,int evenLen,int oddLen)

{

            
long *lSp = (long *)sp;

            
long *spEnd = (long *)(sp + (oddLen<<1));

            
long *lDp = (long *)dp;

            

            
while(lSp < spEnd){

                        
*lDp++ = *lSp++;

            }


            
if(oddLen < evenLen)

                        dp[evenLen].dp1 
= *((short *)lSp);

}


這里先不考慮字節序的問題。

這樣優化后和前面比較起來有那些改進?

1.循環體內只有一個指令;對于++運算,很多處理器都能很好處理。

2.循環條件檢查只有一條比較指令

其實這里的檢查的比較指令還可以優化一下,因為比較指令比較長,看一下下面的改進:

反正是四個字節的復制,不如下計算好復制的4個字節數量;再循環。

void CTestClass::SplitToEvenOddSeqs3(short *sp,TagDstData *dp,int evenLen,int oddLen)

{

            
long *lSp = (long *)sp;

            
long *spEnd = (long *)(sp + (oddLen<<1));

            
long *lDp = (long *)dp;

            
long nDWORDs = oddLen>>1;

            

            
while(nDWORDs–){

                        
*lDp++ = *lSp++;

            }


            
if(oddLen - evenLen)

                        dp[evenLen].dp1 
= *((short *)lSp);

}



寫好上面四段代碼,拿VS2005編譯一下發現,測試代碼如下:

 

void CompareData(TagDstData *spDst,short *pSrcTest)

{

            
for(int i = 0;i<10240;i++)

            
{

                        
//if(spDst[0].dp1 )//if we access spDst here, the time will be longer

                        
if(spDst[0].dp1 > pSrcTest[0]|| spDst[0].dp2 >pSrcTest[1])

                        
{

                                    printf(”
Split arithmetic 
is not right!\n”);

                                    
break;

                        }


                        pSrcTest 
+=2;

            }


                        printf(”
Split arithmetic 
is right!\n”);

}


int _tmain(int argc, _TCHAR* argv[])

{

            
int i,f ;

            
int now;

            CTestClass testClass;

            
short spSrc[20480];     

            
short spDst1[10240];

            
short spDst2[10240];

            TagDstData spDst[
10240];

            
short *pSrcTest = spSrc;

            memset(spSrc,
2,20480<<1);

            memset(spDst1,
0,10240<<1);

            memset(spDst2,
0,10240<<1);

            memset(spDst,
0,20480<<1);

            CStopWatch stop1;

            stop1.Start();

            
for(i = 0;i<100000; i++)

                        testClass.SplitToEvenOddSeqs(spSrc,spDst1,spDst2,
10240,10240);

            now 
= stop1.Now();

            printf(”time2 
=%d\n”,now);

            stop1.Start();

            
for(i = 0;i<100000; i++)

                        testClass.SplitToEvenOddSeqs(spSrc,spDst,
10240,10240);

            now 
= stop1.Now();

            printf(”time3 
=%d\n”,now);

            
for(i=0;i<20480;i++)

                        spSrc[i] 
= i;

            memset(spDst,
0,10240<<1);

            CStopWatch stop2;

            
for(f = 0;f<100000; f++)

                        testClass.SplitToEvenOddSeqs2(spSrc,spDst,
10240,10240);

            now 
= stop2.Now();

            printf(”time4 
=%d\n”,now);

            CompareData(spDst,pSrcTest);

            memset(spDst,
0,10240<<1);

            CStopWatch stop3;

            
for(f = 0;f<100000; f++)

                        testClass.SplitToEvenOddSeqs3(spSrc,spDst,
10240,10240);

            now 
= stop3.Now();

            printf(”time5 
=%d\n”,now);

            CompareData(spDst,pSrcTest);

            
return 0;

}


注:其中CStopWatch是我寫的用來計算時間的類。

如果把CompareData中訪問spDst的代碼注釋掉,運行的結果:

Intel® Core™2 CPU 6400 2.13Ghz 1GB

time2 =753945 us

time3 =494852 us

time4 =0 us

time5 =0 us

Intel® Core™2 Duo CPU T7250 @2.00GHz 2.00 GHz 2GB

Time2 = 847431 us

Time3=523269 us

Time4=1 us

Time5 =1 us

Pentium® 4 CPU 2.6 GHz  512MB

Time2 = 613622 us

Time3=616545 us

Time4=1 us

Time5 =1 us

如果使用VC6編譯,各種運行結果如下:

Intel® Core™2 CPU 6400 2.13Ghz 1GB

time2 =2041530 us

time3 =1352753 us

time4 =930849 us

time5 =501492 us

Intel® Core™2 Duo CPU T7250 @2.00GHz 2.00 GHz 2GB

time2 =1878766 ustime3 =1380009 ustime4 =959918 us

time5 =523022 us

Pentium® 4 CPU 2.6 GHz  512MB

time2 =2098438 us

time3 =1855219 us

time4 =1068678 us

time5 =610458 us

再把CompareData還原,在VC2005中編譯,執行結果如下:

Intel® Core™2 CPU 6400 2.13Ghz 1GB

time2 =1007759 us

time3 =1364986 us

time4 =876046 us

time5 =437623 us

Intel® Core™2 Duo CPU T7250 @2.00GHz 2.00 GHz 2GB

time2 =1103970 ustime3 =1403941 ustime4 =630279 ustime5 =313330 us 

Pentium® 4 CPU 2.6 GHz  512MB

time2 =1218860 ustime3 =1743361 ustime4 =478785 us

time5 =241885 us

使用VC6重新編譯:

Intel® Core™2 CPU 6400 2.13Ghz 1GB

time2 =2026392 us

time3 =1359155 us

time4 =946604 us

time5 =511307 us

Intel® Core™2 Duo CPU T7250 @2.00GHz 2.00 GHz 2GB

time2 =1921379 ustime3 =1410035 ustime4 =967616 ustime5 =528601 us 

Pentium® 4 CPU 2.6 GHz  512MB

time2 =2089173 ustime3 =1849719 ustime4 =1062956 ustime5 =610357 us 

當然這里有重復運算對算法的運行時間的影響;但考慮所有的算法都是對同樣的內存操作,不考慮。那么我們發現的就是算法的效率提高是明顯的。算法運行時間縮短為原來的1/31/4 

另外有幾個問題需要在這里討論一下:

1.演示了時間問題的同時,還看到一個奇怪的問題就是如果注釋了CompareData,在VC2005上得到的后面兩個算法的時間幾乎為0。為什么?而VC6的編譯沒有這樣的現象?

2.VC6上編譯得到的結果與VC2005編譯得到的結果相比,VC2005結果更好,為什么?(這個很弱智了)

3.我覺得程序還可以再優化,怎么樣做?

歡迎大家就這個簡單的優化問題,提出討論。

posted on 2007-12-07 06:11 笨笨 閱讀(2492) 評論(19)  編輯 收藏 引用 所屬分類: 編碼

評論

# re: 一段代碼優化的討論[未登錄] 2007-12-07 08:28 cppexplore

根本原因要看編譯器 優化 后的匯編代碼
重構代碼的出發點是可讀性 可維護性 不是優化
系統性能依賴于設計階段 之后就是關鍵算法 性能工具檢測的性能瓶頸處了  回復  更多評論   

# re: 一段代碼優化的討論 2007-12-07 08:43 搞笑

搞笑,樓主連一點cache優化的意識都沒有,卻在加幾次上面死磕,看來又是一個工作了3-4年的落伍人士,呵呵。  回復  更多評論   

# re: 一段代碼優化的討論 2007-12-07 09:08 笨笨

@搞笑
說的很好!看來你沒有把文章看完。  回復  更多評論   

# re: 一段代碼優化的討論 2007-12-07 09:10 笨笨

@cppexplore
你的出發點我很贊同,就是算法的優劣比優化要好前百倍。
我這里的例子你也看到了,是一個非常簡單的問題,好比memcpy或strcpy
所以這里算法的改進,以我的笨眼來看,應該沒有什么余地了。
這里只是討論一點優化的知識;我首先告訴大家,我是初學這個方面的人。  回復  更多評論   

# re: 一段代碼優化的討論 2007-12-07 09:16 笨笨

我希望大家能夠給出一些真正的意見和想法,或者是代碼來讓這段代碼運行的更快。這也是我的發這個貼的目的。

也希望大家可以了解到有的應該可以跑的比我們想像的快。
我不想得到一些無聊的建議或話。
謝謝!  回復  更多評論   

# re: 一段代碼優化的討論 2007-12-07 09:17 LouixG

你應該看看自己優化代碼的匯編,你在文中說了一些讀和寫的計數,不知你是否是看了匯編后得出的結論。不同的編譯器優化的結果也不一樣,你用Intel的編譯器試試,效果應該會更好。
我想到一些優化辦法:
1,循環展開;
2,多線程;//這兩個是高級語言代碼優化,下面是面向特定機器的指令優化。
3,利用更強的單指令數據操縱能力:如果目標機器是32位,可以用浮點指令fld和fstp裝載64位數據;如果目標機器是64位的那么可以直接使用64位寄存器;
4,利用SSE指令,SSE指令集對應的寄存器提供最多128位數據寬度;
5,如果你的目標機器不是兼容機而是PowerPC、SPARC或者嵌入式的架構,那推薦你查閱對應的CPU手冊,在指令層次上尋找突破。

  回復  更多評論   

# re: 一段代碼優化的討論 2007-12-07 09:50 笨笨

@LouixG
謝謝。應該看出來是這方面的高手,希望多指點。
想得到一點建議就是:程序性能優化如何才能入門?  回復  更多評論   

# re: 一段代碼優化的討論 2007-12-07 11:46 夢在天涯

看了大家的回復,深有感觸啊,

非常高興可以看到C++ Blog這里聚集了越來越多的高手!

  回復  更多評論   

# re: 一段代碼優化的討論[未登錄] 2007-12-07 12:35 cppexplore

@搞笑
這樣說就不對了 文章寫出來 大家share下 目的是互補長短 互相交流 互相進步
@笨笨
從本文中例子來說 這種“優化”,可讀性更好,更好維護。的確是正確的。這種差異不是算法的造成的,是開始設計的不合理。另,我的建議真的不是無聊的建議 :)。
@LouixG
(1)展開循環的點滴性能不是問題
(2)多線程模型的目的一般系統設計層面的吧,主要是提高系統的吞吐能力,這種問題上的性能遠遠談不上
(3)后面的問題帶來移植性的問題,非底層的關鍵算法 也不會有人去做這種優化
@夢在天涯
blog里的文章真是多啊

@me
廢話真多。。。。。。  回復  更多評論   

# re: 一段代碼優化的討論 2007-12-07 13:57 LouixG

@cppexplore
每種優化可能只提高很小的性能,但為了達到極致把這些方法綜合就能產生質的飛躍。優化也分算法優化和代碼優化,我的想法就是在樓主算法確定的情況下最大可能的優化實現代碼。
提到多線程主要是為了利用多核,但小數據量不推薦多線程,提到多核就多說點,在多核上跑得快的代碼不一定在單核上跑的好,請看代碼:
int * src1 = src;
int * src2 = src + 1;
int * dst1 = dst;
int * dst2 = dst + 1;
while ( ... )
{
*dst1 = *src1;
*dst2 = *src2;
dst1 += 2;
dst2 += 2;
src1 += 2;
src2 += 2;
};
這個代碼可以肯定在單核上跑得很爛,但是在多核上dst1和dst2被流水線確定為無關變量,不相互影響就會被雙核同時執行,這樣就比單核上跑得快。

在指令層面上思考優化不一定帶來移植性問題,例如這段代碼:
double * src_opt = ( ( double * ) src ) - 1;
double * dst_opt = ( ( double * ) dst ) - 1;
int src_ind = 0;
int dst_ind = 0;
int loop_time = ( src_len >> 1 ) + 1;
while ( --loop_time )
{
dst_opt[ ++dst_ind ] = src_opt[ ++src_ind ];
}
Intel編譯器產生的while循環的匯編:
$B68$3:
add edx, 1
fld QWORD PTR [edi+edx*8-8]
add eax, 1
fstp QWORD PTR [esi+eax*8-8]
add ecx, -1
jne $B68$3
這樣的代碼可以在兼容機上編譯+運行無阻,且不說前兩個add可被替換inc獲得一定效率提升,我相信這段代碼要比樓主的代碼快。

只有有沒有人做這樣的工作就仁者見仁了,肯定有需要這種工作的時候。  回復  更多評論   

# re: 一段代碼優化的討論 2007-12-07 14:22 金慶

怎么會 0 us? 計時有問題吧?
time4 =0 us
time5 =0 us

看代碼
printf(”time5 =%d\n”,now);
沒有打印"us". 應該保持代碼與結果的一致.

即然輸出與輸出的內存結構一致,直接用memcpy就行了,不必循環賦值.  回復  更多評論   

# re: 一段代碼優化的討論[未登錄] 2007-12-07 14:55 cppexplore

@LouixG
(1)這個問題不敢妄言,多核下編程重來沒有接觸過。不知道這種各個cpu的分配,是在編譯期間由編譯器完成的,還是在運行期間由額外的硬件決定把指令分配給某個cpu的?這種多核下的編程,值得探討的問題就多了,尤其這種在一個線程內的數據被分配到多個cpu,如果真有這種情況,估計以后會有語言層面的東西支持。不同線程分配不同的cpu,這個到還好。
(2)這個例子的高性能我絲毫不懷疑,通過字節對齊提高性能。其實標準庫函數也是這么做的。不過這個例子沒意義啊,直接使用庫函數就好。  回復  更多評論   

# re: 一段代碼優化的討論 2007-12-07 16:22 笨笨

感謝大家的回復
我沒有說cppexplore說的是無聊的啊。

大家說的都很好。
我這段代碼只是我自己在隨便看了兩片文章后對我以前一段代碼進行的優化;這里面僅僅是用到了幾點:
1.合并同時訪問的兩個數組
2.使用多字節復制
3.替換比較而用減法
4.減少指令的數目

實際上我正學習這方面的編程,沒有想到這里竟然一下子碰到兩個高手啊,這么不見你們的BLOG?

另外,我看到一個比系統的memcpy寫的還要快的內存復制函數,大家不妨看一下:
http://www.vik.cc/daniel/portfolio/memcpy.htm  回復  更多評論   

# re: 一段代碼優化的討論 2007-12-07 16:24 笨笨

碰到二位強人真是我的幸運,希望能得到多多指點。  回復  更多評論   

# re: 一段代碼優化的討論 2007-12-07 17:04 haskell

如果是為優化而優化,那就管不了那么多了
void haha(short *sp,short *dp1,short *dp2,int count)
{
switch (count % 8) {
case 0: do { *dp1++ = *sp++;
case 7: *dp2++ = *sp++;
case 6: *dp1++ = *sp++;
case 5: *dp2++ = *sp++;
case 4: *dp1++ = *sp++;
case 3: *dp2++ = *sp++;
case 2: *dp1++ = *sp++;
case 1: *dp2++ = *sp++;
} while ((count -= 8) > 0);
}
}
可對for語句優化,看有幫助沒^_^能編譯的  回復  更多評論   

# re: 一段代碼優化的討論 2007-12-07 19:20 空明流轉

最近在寫一個軟件渲染器,流水線還沒通,哪管他優不優化。。。

大量的std::vector。。。等流水通了把Shader Register改成boost::array,再加上一個pool應該會快不少吧。反正debug下渲染一個512 * 512的要好幾秒時間。。。  回復  更多評論   

# re: 一段代碼優化的討論 2007-12-08 01:39 笨笨

@haskell
你這個這么多的條件分支,CPU命中率不是很低???  回復  更多評論   

# re: 一段代碼優化的討論 2007-12-08 01:59 haskell

忘了這個方法叫什么了?
不會慢的  回復  更多評論   

# re: 一段代碼優化的討論 2007-12-12 11:14 no name

haskell的方法叫 達夫設備Duff's Device,google可找到更多解釋。注意其中每個case都特意少了break,使用了switch的fall though特性。  回復  更多評論   

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美成年网站| 亚洲国产成人久久综合| 91久久精品视频| 欧美中文字幕视频在线观看| 欧美日韩国产成人精品| 国产一区二区福利| 亚洲综合色噜噜狠狠| 亚洲午夜av| 国产精品色婷婷| 亚洲一区二区三区精品视频| 老牛嫩草一区二区三区日本 | 欧美性大战久久久久久久蜜臀 | 亚洲国产精彩中文乱码av在线播放| 欧美一区二区三区视频| 国产精品久久波多野结衣| 亚洲国产成人不卡| 欧美自拍偷拍| 欧美亚洲午夜视频在线观看| 国产精品激情偷乱一区二区∴| 亚洲第一黄色网| 免费美女久久99| 免费观看国产成人| 亚洲午夜国产成人av电影男同| 亚洲精品欧美日韩| 欧美日韩午夜视频在线观看| 久久精品一区中文字幕| 欧美大成色www永久网站婷| 在线电影一区| 男女精品视频| 欧美日韩久久不卡| 久久精品一区二区三区四区 | 欧美激情一区二区| 亚洲欧美制服另类日韩| 久久精品视频免费观看| 亚洲乱码国产乱码精品精可以看| 欧美高清视频| 久久精品欧洲| 久久综合九色九九| 在线视频精品一区| 久久九九免费视频| 日韩午夜中文字幕| 欧美有码在线视频| 亚洲自拍偷拍麻豆| 欧美 日韩 国产一区二区在线视频 | 久久国产精品亚洲77777| 久久久噜噜噜久久中文字免| 亚洲少妇最新在线视频| 久久夜色精品国产噜噜av| 久久久亚洲高清| 欧美日韩一二区| 蜜桃av一区二区三区| 国产午夜精品在线观看| 一区二区三区精品久久久| 亚洲精品久久久久久久久久久久久| 久久国产夜色精品鲁鲁99| 亚洲一区精品电影| 欧美色图一区二区三区| 亚洲二区在线观看| 亚洲国产精品高清久久久| 久久精品亚洲一区二区三区浴池| 久久男人资源视频| 夜夜嗨av一区二区三区四区| 久久一区二区精品| 久久蜜臀精品av| 国产免费亚洲高清| 亚洲一区二区三区乱码aⅴ蜜桃女| av成人免费| 欧美日韩三级| 亚洲一区二区三区成人在线视频精品| 宅男66日本亚洲欧美视频| 欧美三级日本三级少妇99| 一区二区三区视频在线| 亚洲在线观看| 国产一区二区三区高清播放| 午夜精品久久久久久久白皮肤| 久久精品一区二区三区四区 | 久久综合一区二区| 亚洲国产一区在线观看| 国产午夜精品美女视频明星a级| 亚洲自拍偷拍视频| 久久久国产一区二区| 伊人久久亚洲美女图片| 欧美极品一区二区三区| 香蕉久久a毛片| 亚洲午夜精品17c| 久久在线精品| 一区二区高清| 激情自拍一区| 国产精品久久久久9999吃药| 欧美一区成人| 这里是久久伊人| 亚洲人成高清| 免费观看在线综合| 欧美在线视频观看免费网站| 99视频超级精品| 黄色欧美成人| 国产真实乱偷精品视频免| 欧美激情精品久久久久久久变态| 欧美夜福利tv在线| 一本不卡影院| 亚洲人www| 亚洲国产精品悠悠久久琪琪| 欧美a级大片| 美女主播精品视频一二三四| 久久国产视频网| 亚洲欧美中文另类| 中文一区二区| 中文久久乱码一区二区| 日韩亚洲不卡在线| 亚洲国产欧美一区二区三区久久 | 亚洲午夜在线| 亚洲影院一区| 午夜久久福利| 欧美日本二区| 狠狠色丁香久久婷婷综合_中| 9久草视频在线视频精品| 亚洲男人的天堂在线观看| 久久久91精品国产一区二区三区 | 欧美mv日韩mv国产网站| 亚洲桃色在线一区| 欧美激情欧美激情在线五月| 一区二区久久| 亚洲精品影视| 欧美一区二区三区在线播放| 亚洲欧美日本视频在线观看| 性欧美大战久久久久久久免费观看 | 亚洲免费观看高清在线观看 | 欧美成人精品影院| 99精品热视频只有精品10| 亚洲综合好骚| 麻豆精品网站| 国产免费观看久久黄| 亚洲精品久久久久久久久久久| 亚洲欧美国产高清va在线播| 欧美77777| 欧美一级黄色网| 欧美日韩a区| 影音先锋久久资源网| 亚洲欧美日韩成人高清在线一区| 老司机精品视频网站| 一本色道88久久加勒比精品 | 国产精品福利av| 国产精品成av人在线视午夜片| 欧美精品在线免费| 欧美三区美女| 国产日韩欧美在线| 影音先锋亚洲视频| 亚洲欧美一区二区精品久久久| 美国成人直播| 欧美一区二区三区的| 欧美视频一区二区三区四区| 亚洲精品看片| 欧美1区免费| 免费成年人欧美视频| 国外成人网址| 久久久五月天| 欧美一区二区三区视频免费| 国产精品视频最多的网站| 亚洲欧美日韩视频一区| 中国成人亚色综合网站| 欧美电影免费观看网站| 91久久综合| 亚洲国产精品123| 欧美日韩大片| 宅男噜噜噜66一区二区| 一本高清dvd不卡在线观看| 欧美日韩卡一卡二| 亚洲欧美在线另类| 欧美一区亚洲一区| 在线播放豆国产99亚洲| 亚洲青色在线| 黄色成人av网站| 欧美国产日韩精品| 久久只有精品| 一区二区三区四区国产| 在线综合亚洲欧美在线视频| 国产精品香蕉在线观看| 久久久久久久波多野高潮日日| 久久久精品国产一区二区三区| 亚洲精品之草原avav久久| 亚洲一区观看| 伊人男人综合视频网| 99成人精品| 在线看片第一页欧美| av成人手机在线| 亚洲第一福利社区| 亚洲特级片在线| 在线欧美亚洲| 亚洲综合精品一区二区| 亚洲卡通欧美制服中文| 欧美一级专区免费大片| 亚洲午夜女主播在线直播| 欧美黄污视频| 久久久蜜桃一区二区人| 免费观看成人www动漫视频| 中文av一区二区| 久久全国免费视频| 久久超碰97中文字幕| 国产精品国产三级国产aⅴ入口 | 篠田优中文在线播放第一区|