青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 9,  comments - 19,  trackbacks - 0

0x0

前些天組里老司機@梁希在jvm的項目榨干機器性能之余,為了檢查下gcc編譯器和Intel Xoen CPU的正確性,寫了一組測試代碼測試了下mfence指令的效果

`
mfence Opcode : 0F AE /6

Performs a serializing operation on all load-from-memory and store-to-memory instructions that were issued prior the MFENCE instruction. This serializing operation guarantees that every load and store instruction that precedes in program order the MFENCE instruction is globally visible before any load or store instruction that follows the MFENCE instruction is globally visible. The MFENCE instruction is ordered with respect to all load and store instructions, other MFENCE instructions, any SFENCE and LFENCE instructions, and any serializing instructions (such as the CPUID instruction).
Weakly ordered memory types can be used to achieve higher processor performance through such techniques as out-of-order issue, speculative reads, write-combining, and write-collapsing.
The degree to which a consumer of data recognizes or knows that the data is weakly ordered varies among applications and may be unknown to the producer of this data. The MFENCE instruction provides a performance-efficient way of ensuring load and store ordering between routines that produce weakly-ordered results and routines that consume that data.
It should be noted that processors are free to speculatively fetch and cache data from system memory regions that are assigned a memory-type that permits speculative reads (that is, the WB, WC, and WT memory types). The PREFETCHh instruction is considered a hint to this speculative behavior. Because this speculative fetching can occur at any time and is not tied to instruction execution, the MFENCE instruction is not ordered with respect to PREFETCHh instructions or any other speculative fetching mechanism (that is, data could be speculatively loaded into the cache just before, during, or after the execution of an MFENCE instruction).
`

簡單來說就是一個可以在CPU亂序執行中保證真實的load/store順序的指令

0x1
老司機寫了一個小程序(注:有誤版)
// file: order.c

#define _GNU_SOURCE
#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
int b;

void *
run1(void *ignore)
{
    for (;;) {
        while (!b);
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        asm ("sfence": : :"memory");
        v2.i = 1;
        asm ("sfence": : :"memory");
        b = 0; 
    }
}

int
main()
{
    pthread_t p;
    pthread_create(&p, NULL, run1, NULL);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = v2.i = 0;
        asm ("sfence": : :"memory");
        b = 1;
        asm ("sfence": : :"memory");
        int icnt = 0;
        for (;; icnt++) {
            int i1 = v1.i;
            asm ("lfence": : :"memory");
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

大概邏輯是: 一共有3個變量,v1.iv2.ib ,起了2個線程,一個順序寫入v1和v2,一個讀v1和v2,互相通過改變b的值來通訊,然后兩個線程不停循環。

這個程序會掛在
printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2); 
這條斷言上,意思是線程1在順序寫入v1和v2,但是主線程卻出現讀到 v1=0,v2=1的情況。

0x2

然后我幫忙去看了一下,覺得這種寫法甚是粗暴,于是原樣照搬了一個c++11版:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    atomic<int> i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i.load() || v2.i.load()) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i.store(1);
        v2.i.store(1);
        b.store(0);
    }
}

int
main()
{
    // init
    v1.i.store(0);
    v2.i.store(0);
    thread t(run1);
    int cnt = 0;
    for (;; cnt++) {
        v1.i.store(0);
        v2.i.store(0);
        b.store(1);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load();
            int i1 = v1.i.load();       // *****
            int i2 = v2.i.load();       // *****
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
            if (i1 == 0 && i2 == 0 && b2 == 0) break;
        }
    }
    return 0;
}

因為是原樣照搬,所以肯定還是會掛,但是畢竟語義上更好理解了

我們先來分析一下為什么會掛

  • 線程1對于v1,v2的寫入順序一定是一致的
  • Memory Barrier也保證了他們寫入順序對其他線程的可見性(很有迷惑性的一點)
  • 但是主線程卻可以讀到 v1=0,v2=1的情況
  • 所以情況就是雖然順序寫入了,但是別的線程沒有看到正確的順序?
  • Intel: 并不是!
  • 原因是搞錯了因果關系,他真正保證的順序是當你讀到v2的new value的時候,那么v1也一定被寫入了。
  • 解決方案就是互換上面代碼中我用**星號**標注出的兩行
  • done

在舊寫法中,掛掉的情況是線程1寫入v1 = 1,主線程讀v1,沒有讀到,那么主線程認為v1是0,然后線程1繼續寫入v2,主線程讀到了,主線程認為v2是1。 然后掛在了斷言上。

兩行互換后,主線程首先讀取v2,如果v2已經是1了,那么v1也一定是1,反之亦然。

0x3

當然,想讓跑通那個例子不需要那么多的atomic<>,精簡之后利用c++11的memory_order可以寫成如下:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;    // variable b as a guard

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        v2.i = 1;
        b.store(0, memory_order_release);
    }
}
int
main()
{
    // init
    v1.i = 0;
    v2.i = 0;
    thread t(run1);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = 0;
        v2.i = 0;
        b.store(1, memory_order_release);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load(memory_order_acquire);
            if (b2 != 0) {
                continue
            }
            int i1 = v1.i;
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error 2, cnt = %d, icnt =  %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

利用變量b在兩個線程之間同步,如下圖

 (Thead 1)

   v1.i = 1;
   v2.i = 1;
   
   b.store(0, memory_order_release) <---+
                                                             |
                                                synchronize with b
                                                 (happend before)
                                                             |
                                                            +----->  b.load(memory_order_acquire)
                                                                          
                                                                        i1 = v1.i
                                                                        i2 = v2.i

                                                                       (Thread 2)

我們查看下生成的代碼
g++ -std=c++11 -pthread -g -O2 order.cpp

 v1.i = 1;
  400be6:       c7 05 d0 10 20 00 01    movl   $0x1,0x2010d0(%rip)        # 601cc0 <v1>
  400bed:       00 00 00 
        v2.i = 1;
  400bf0:       c7 05 86 10 20 00 01    movl   $0x1,0x201086(%rip)        # 601c80 <v2>
  400bf7:       00 00 00 
        memory_order __b = __m & __memory_order_mask;
        __glibcxx_assert(__b != memory_order_acquire);
        __glibcxx_assert(__b != memory_order_acq_rel);
        __glibcxx_assert(__b != memory_order_consume);

        __atomic_store_n(&_M_i, __i, __m);
  400bfa:       c7 05 5c 10 20 00 00    movl   $0x0,0x20105c(%rip)        # 601c60 <b>
  400c01:       00 00 00 
        b.store(0, memory_order_release);

  

  400a58:       8b 05 02 12 20 00       mov    0x201202(%rip),%eax        # 601c60 <b>
            int b2 = b.load(memory_order_consume);
            if (b2 != 0) {
  400a5e:       85 c0                   test   %eax,%eax
  400a60:       75 f3                   jne    400a55 <main+0x55>
                continue
            }
            int i1 = v1.i;
  400a62:       8b 0d 58 12 20 00       mov    0x201258(%rip),%ecx        # 601cc0 <v1>
            int i2 = v2.i;
  400a68:       44 8b 05 11 12 20 00    mov    0x201211(%rip),%r8d        # 601c80 <v2>

看來Intel的Strong Memory Model已經保證了這一點,Memory Barrier都不需要了

(雖然標題里面有MemoryBarrier,但是內容里面根本沒涉及的樣子。。)

posted on 2016-01-19 16:13 右席 閱讀(16808) 評論(1)  編輯 收藏 引用 所屬分類: 搬磚之路
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            99在线精品观看| 中日韩视频在线观看| 玖玖玖免费嫩草在线影院一区| 亚洲线精品一区二区三区八戒| 欧美性片在线观看| 久久精品观看| 久久免费视频网站| 最新亚洲激情| 亚洲视屏一区| 国产午夜亚洲精品羞羞网站 | 欧美午夜在线观看| 新狼窝色av性久久久久久| 午夜国产精品影院在线观看| 国产一区二区三区在线观看网站 | 噜噜噜91成人网| 久久夜精品va视频免费观看| 99国产精品久久久久久久成人热| 日韩写真在线| 国产日韩一区| 亚洲经典在线看| 欧美午夜剧场| 美女精品在线观看| 欧美三区在线视频| 久久久久久**毛片大全| 欧美成人午夜| 久久精品在这里| 欧美精品黄色| 久久久久久尹人网香蕉| 欧美精品一区二区三区很污很色的| 亚洲女优在线| 老鸭窝91久久精品色噜噜导演| 亚洲婷婷综合久久一本伊一区| 久久久91精品国产| 亚洲一级在线观看| 美女精品国产| 久久九九精品| 国产精品白丝av嫩草影院| 免费观看不卡av| 国产片一区二区| 亚洲精品国产精品乱码不99按摩| 国产亚洲精品成人av久久ww| 日韩视频免费在线| 91久久精品国产91久久性色| 欧美亚洲视频一区二区| 亚洲一区二区三区777| 久久天天躁狠狠躁夜夜av| 性伦欧美刺激片在线观看| 欧美精品一线| 亚洲成色999久久网站| 国产一区二区三区高清播放| 一区二区三区 在线观看视频| 亚洲激情在线观看| 久久精品亚洲国产奇米99| 欧美在线视频一区二区| 欧美亚洲成人精品| 一本色道精品久久一区二区三区| 亚洲精品欧美在线| 美国十次成人| 亚洲第一主播视频| 亚洲激情黄色| 美女视频黄a大片欧美| 美女久久一区| 亚洲黄网站黄| 欧美国产欧美亚洲国产日韩mv天天看完整 | 欧美激情一区三区| 在线国产日韩| 美女国产一区| 欧美激情视频在线免费观看 欧美视频免费一 | 99在线精品观看| 欧美成人精品在线播放| 欧美国产视频在线观看| 亚洲高清视频在线观看| 美日韩免费视频| 欧美国产精品v| 亚洲精选在线| 国产精品mv在线观看| 一区二区三区欧美亚洲| 欧美一区二区三区日韩视频| 国产精品婷婷| 久久久青草婷婷精品综合日韩 | 日韩视频在线观看免费| 欧美精品成人| 亚洲一区二区三区在线观看视频| 午夜精品福利视频| 精品999在线观看| 免费看的黄色欧美网站| 最近看过的日韩成人| 亚洲无亚洲人成网站77777| 欧美丝袜一区二区三区| 欧美一区二区三区啪啪| 免费欧美日韩国产三级电影| 亚洲啪啪91| 国产精品久久久久久久久久妞妞| 亚洲欧美一区二区激情| 蜜臀va亚洲va欧美va天堂| 亚洲精品少妇30p| 国产精品v片在线观看不卡| 性刺激综合网| 亚洲国产另类 国产精品国产免费| 亚洲一区黄色| 一区二区在线视频播放| 欧美理论电影在线播放| 亚洲欧美中日韩| 亚洲国产另类久久精品| 欧美在线亚洲在线| 亚洲精品一级| 国产午夜精品全部视频在线播放| 欧美成人免费在线| 欧美影片第一页| 日韩视频一区| 欧美成人tv| 久久精品国产成人| 亚洲视频免费在线| 亚洲国产精品成人va在线观看| 欧美视频在线一区二区三区| 久久久久久久久综合| 亚洲午夜免费福利视频| 欧美h视频在线| 欧美专区在线观看| 亚洲视频一起| 最近看过的日韩成人| 国产欧美va欧美不卡在线| 欧美极品在线视频| 久久久国产亚洲精品| 亚洲伊人久久综合| 日韩午夜在线观看视频| 亚洲福利视频一区二区| 麻豆成人小视频| 久久―日本道色综合久久| 亚洲一区二区三区在线播放| 91久久午夜| 亚洲高清电影| 亚洲第一网站| **欧美日韩vr在线| 国产一区亚洲| 国产一区二区三区高清| 国产日韩av在线播放| 国产九九视频一区二区三区| 国产精品久久久久久久9999| 欧美激情一区二区三区全黄| 欧美电影在线观看完整版| 久久久久久穴| 久久人人爽人人爽爽久久| 久久精品国产亚洲高清剧情介绍| 亚洲一区二区三区精品动漫| 中文在线不卡| 亚洲在线观看| 欧美一区三区二区在线观看| 新狼窝色av性久久久久久| 午夜欧美不卡精品aaaaa| 亚洲免费伊人电影在线观看av| 亚洲午夜免费视频| 亚洲欧美日韩综合aⅴ视频| 午夜精品久久久久久久白皮肤 | 久久青草久久| 裸体女人亚洲精品一区| 麻豆freexxxx性91精品| 免费日韩成人| 欧美日韩综合精品| 国产精品久久久久久久久久久久久久| 国产精品播放| 国产精品午夜电影| 一区在线视频观看| 亚洲日韩欧美视频| 亚洲欧美日韩在线一区| 久久精品91久久香蕉加勒比| 久久频这里精品99香蕉| 亚洲高清一区二区三区| 99国内精品久久| 欧美在线播放高清精品| 狼人社综合社区| 欧美视频日韩| 黑丝一区二区三区| av不卡在线| 久久成人免费网| 亚洲激情女人| 欧美亚洲一区三区| 欧美黑人多人双交| 国产美女精品免费电影| 亚洲电影免费观看高清| 亚洲午夜精品| 久久综合色婷婷| 99天天综合性| 久久婷婷国产综合国色天香| 欧美理论电影在线播放| 国产一级久久| 一本不卡影院| 免费在线国产精品| 亚洲一二三区在线观看| 蜜桃av综合| 国产亚洲精品综合一区91| 一本色道久久综合精品竹菊| 久久久久久久一区| aa日韩免费精品视频一| 久久久久久穴| 国产精品一香蕉国产线看观看 | 国产欧美在线看| 在线中文字幕不卡| 欧美国产日韩在线| 久久精品国产精品|