青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 9,  comments - 19,  trackbacks - 0

0x0

前些天組里老司機@梁希在jvm的項目榨干機器性能之余,為了檢查下gcc編譯器和Intel Xoen CPU的正確性,寫了一組測試代碼測試了下mfence指令的效果

`
mfence Opcode : 0F AE /6

Performs a serializing operation on all load-from-memory and store-to-memory instructions that were issued prior the MFENCE instruction. This serializing operation guarantees that every load and store instruction that precedes in program order the MFENCE instruction is globally visible before any load or store instruction that follows the MFENCE instruction is globally visible. The MFENCE instruction is ordered with respect to all load and store instructions, other MFENCE instructions, any SFENCE and LFENCE instructions, and any serializing instructions (such as the CPUID instruction).
Weakly ordered memory types can be used to achieve higher processor performance through such techniques as out-of-order issue, speculative reads, write-combining, and write-collapsing.
The degree to which a consumer of data recognizes or knows that the data is weakly ordered varies among applications and may be unknown to the producer of this data. The MFENCE instruction provides a performance-efficient way of ensuring load and store ordering between routines that produce weakly-ordered results and routines that consume that data.
It should be noted that processors are free to speculatively fetch and cache data from system memory regions that are assigned a memory-type that permits speculative reads (that is, the WB, WC, and WT memory types). The PREFETCHh instruction is considered a hint to this speculative behavior. Because this speculative fetching can occur at any time and is not tied to instruction execution, the MFENCE instruction is not ordered with respect to PREFETCHh instructions or any other speculative fetching mechanism (that is, data could be speculatively loaded into the cache just before, during, or after the execution of an MFENCE instruction).
`

簡單來說就是一個可以在CPU亂序執行中保證真實的load/store順序的指令

0x1
老司機寫了一個小程序(注:有誤版)
// file: order.c

#define _GNU_SOURCE
#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
int b;

void *
run1(void *ignore)
{
    for (;;) {
        while (!b);
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        asm ("sfence": : :"memory");
        v2.i = 1;
        asm ("sfence": : :"memory");
        b = 0; 
    }
}

int
main()
{
    pthread_t p;
    pthread_create(&p, NULL, run1, NULL);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = v2.i = 0;
        asm ("sfence": : :"memory");
        b = 1;
        asm ("sfence": : :"memory");
        int icnt = 0;
        for (;; icnt++) {
            int i1 = v1.i;
            asm ("lfence": : :"memory");
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

大概邏輯是: 一共有3個變量,v1.iv2.ib ,起了2個線程,一個順序寫入v1和v2,一個讀v1和v2,互相通過改變b的值來通訊,然后兩個線程不停循環。

這個程序會掛在
printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2); 
這條斷言上,意思是線程1在順序寫入v1和v2,但是主線程卻出現讀到 v1=0,v2=1的情況。

0x2

然后我幫忙去看了一下,覺得這種寫法甚是粗暴,于是原樣照搬了一個c++11版:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    atomic<int> i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i.load() || v2.i.load()) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i.store(1);
        v2.i.store(1);
        b.store(0);
    }
}

int
main()
{
    // init
    v1.i.store(0);
    v2.i.store(0);
    thread t(run1);
    int cnt = 0;
    for (;; cnt++) {
        v1.i.store(0);
        v2.i.store(0);
        b.store(1);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load();
            int i1 = v1.i.load();       // *****
            int i2 = v2.i.load();       // *****
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
            if (i1 == 0 && i2 == 0 && b2 == 0) break;
        }
    }
    return 0;
}

因為是原樣照搬,所以肯定還是會掛,但是畢竟語義上更好理解了

我們先來分析一下為什么會掛

  • 線程1對于v1,v2的寫入順序一定是一致的
  • Memory Barrier也保證了他們寫入順序對其他線程的可見性(很有迷惑性的一點)
  • 但是主線程卻可以讀到 v1=0,v2=1的情況
  • 所以情況就是雖然順序寫入了,但是別的線程沒有看到正確的順序?
  • Intel: 并不是!
  • 原因是搞錯了因果關系,他真正保證的順序是當你讀到v2的new value的時候,那么v1也一定被寫入了。
  • 解決方案就是互換上面代碼中我用**星號**標注出的兩行
  • done

在舊寫法中,掛掉的情況是線程1寫入v1 = 1,主線程讀v1,沒有讀到,那么主線程認為v1是0,然后線程1繼續寫入v2,主線程讀到了,主線程認為v2是1。 然后掛在了斷言上。

兩行互換后,主線程首先讀取v2,如果v2已經是1了,那么v1也一定是1,反之亦然。

0x3

當然,想讓跑通那個例子不需要那么多的atomic<>,精簡之后利用c++11的memory_order可以寫成如下:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;    // variable b as a guard

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        v2.i = 1;
        b.store(0, memory_order_release);
    }
}
int
main()
{
    // init
    v1.i = 0;
    v2.i = 0;
    thread t(run1);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = 0;
        v2.i = 0;
        b.store(1, memory_order_release);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load(memory_order_acquire);
            if (b2 != 0) {
                continue
            }
            int i1 = v1.i;
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error 2, cnt = %d, icnt =  %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

利用變量b在兩個線程之間同步,如下圖

 (Thead 1)

   v1.i = 1;
   v2.i = 1;
   
   b.store(0, memory_order_release) <---+
                                                             |
                                                synchronize with b
                                                 (happend before)
                                                             |
                                                            +----->  b.load(memory_order_acquire)
                                                                          
                                                                        i1 = v1.i
                                                                        i2 = v2.i

                                                                       (Thread 2)

我們查看下生成的代碼
g++ -std=c++11 -pthread -g -O2 order.cpp

 v1.i = 1;
  400be6:       c7 05 d0 10 20 00 01    movl   $0x1,0x2010d0(%rip)        # 601cc0 <v1>
  400bed:       00 00 00 
        v2.i = 1;
  400bf0:       c7 05 86 10 20 00 01    movl   $0x1,0x201086(%rip)        # 601c80 <v2>
  400bf7:       00 00 00 
        memory_order __b = __m & __memory_order_mask;
        __glibcxx_assert(__b != memory_order_acquire);
        __glibcxx_assert(__b != memory_order_acq_rel);
        __glibcxx_assert(__b != memory_order_consume);

        __atomic_store_n(&_M_i, __i, __m);
  400bfa:       c7 05 5c 10 20 00 00    movl   $0x0,0x20105c(%rip)        # 601c60 <b>
  400c01:       00 00 00 
        b.store(0, memory_order_release);

  

  400a58:       8b 05 02 12 20 00       mov    0x201202(%rip),%eax        # 601c60 <b>
            int b2 = b.load(memory_order_consume);
            if (b2 != 0) {
  400a5e:       85 c0                   test   %eax,%eax
  400a60:       75 f3                   jne    400a55 <main+0x55>
                continue
            }
            int i1 = v1.i;
  400a62:       8b 0d 58 12 20 00       mov    0x201258(%rip),%ecx        # 601cc0 <v1>
            int i2 = v2.i;
  400a68:       44 8b 05 11 12 20 00    mov    0x201211(%rip),%r8d        # 601c80 <v2>

看來Intel的Strong Memory Model已經保證了這一點,Memory Barrier都不需要了

(雖然標題里面有MemoryBarrier,但是內容里面根本沒涉及的樣子。。)

posted on 2016-01-19 16:13 右席 閱讀(16808) 評論(1)  編輯 收藏 引用 所屬分類: 搬磚之路
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美激情无毛| 久久久www| 亚洲精品国久久99热| 久久色在线播放| 在线欧美日韩| 亚洲第一福利在线观看| 欧美高清不卡| 亚洲视频一二三| 亚洲视频在线二区| 国产日韩欧美中文在线播放| 美女国内精品自产拍在线播放| 玖玖在线精品| 亚洲少妇诱惑| 性色av一区二区三区| 亚洲国产精品第一区二区| 亚洲精品久久久久久一区二区 | 最新热久久免费视频| 欧美另类视频| 香蕉乱码成人久久天堂爱免费| 久久精品视频在线免费观看| 亚洲国产另类久久久精品极度| 亚洲裸体在线观看| 国产亚洲精品bv在线观看| 欧美电影在线观看完整版| 欧美日韩一区二区免费在线观看| 欧美中文字幕第一页| 蜜桃av噜噜一区二区三区| 亚洲一卡二卡三卡四卡五卡| 久久久久一区二区三区四区| 正在播放欧美一区| 久久久99国产精品免费| 一区二区三区四区国产精品| 午夜精品美女自拍福到在线 | 国产精品中文字幕在线观看| 欧美成人综合在线| 欧美调教vk| 欧美成人dvd在线视频| 国产精品国产三级国产专区53| 久久综合久色欧美综合狠狠 | 欧美顶级艳妇交换群宴| 亚洲已满18点击进入久久| 久久男女视频| 欧美中文在线观看国产| 欧美精品一区二区三区高清aⅴ| 久久久久在线观看| 欧美丝袜一区二区三区| 亚洲第一中文字幕在线观看| 国产一区二区精品丝袜| 在线亚洲精品| 在线一区二区三区做爰视频网站| 久久久噜噜噜久久| 久久精品国产第一区二区三区最新章节| 欧美欧美全黄| 亚洲国产成人久久| 91久久久亚洲精品| 老司机免费视频久久| 久久国产精品99精品国产| 欧美色另类天堂2015| 欧美激情免费观看| 在线日本成人| 久久久久久伊人| 久久亚洲免费| 国产一区二区日韩| 久久爱www| 久久裸体视频| 今天的高清视频免费播放成人| 欧美一区二区三区日韩| 校园春色综合网| 国产精品综合视频| 午夜久久一区| 久久九九热re6这里有精品| 国产精品亚洲综合久久| 午夜精品成人在线视频| 欧美在线播放一区| 国产精品女主播| 亚洲在线中文字幕| 欧美一级电影久久| 国产亚洲精品一区二区| 久久国产高清| 免费在线播放第一区高清av| 亚洲国产成人午夜在线一区| 欧美精品v国产精品v日韩精品 | 亚洲欧美一级二级三级| 国产精品三上| 久久av在线看| 亚洲丰满在线| 亚洲综合日韩中文字幕v在线| 国产精品麻豆va在线播放| 欧美亚洲视频| 欧美成人a∨高清免费观看| 亚洲精品久久久久久一区二区| 欧美日韩国产成人在线观看| 亚洲性线免费观看视频成熟| 久久久99精品免费观看不卡| 亚洲激情成人| 国产精品国产三级国产aⅴ浪潮| 午夜精品福利一区二区三区av | 亚洲午夜精品福利| 国产视频久久网| 免费永久网站黄欧美| 9l视频自拍蝌蚪9l视频成人| 久久精品中文| 99热在这里有精品免费| 国产欧美一区二区三区国产幕精品| 久久久久成人精品| 日韩亚洲欧美在线观看| 久久精品亚洲精品| 在线一区二区三区做爰视频网站| 国产一区91| 欧美视频二区| 毛片基地黄久久久久久天堂| 亚洲午夜伦理| 亚洲国产第一| 久久精精品视频| 亚洲天堂网站在线观看视频| 国内激情久久| 国产精品第2页| 欧美好吊妞视频| 久久久久久久久综合| aa国产精品| 欧美福利一区二区| 欧美中文字幕在线观看| 一区二区三区三区在线| 亚洲国产精品久久久久婷婷884| 国产精品一区三区| 欧美日韩国内自拍| 久久天天躁狠狠躁夜夜av| 亚洲欧美国产精品专区久久| 99国产精品久久久久老师| 欧美国产日韩免费| 久久久久久69| 欧美一区二区三区电影在线观看| 亚洲手机在线| 国产精品99久久久久久人 | 国产精品永久入口久久久| 欧美日韩亚洲综合在线| 欧美激情在线狂野欧美精品| 久久这里只有精品视频首页| 久久国产视频网| 久久精品成人一区二区三区蜜臀 | 亚洲视频自拍偷拍| 亚洲精品美女在线观看| 亚洲国产人成综合网站| 亚洲电影免费在线观看| 欧美国产一区二区| 亚洲第一区在线| 欧美黑人国产人伦爽爽爽| 欧美xxxx在线观看| 欧美国产视频在线| 欧美大学生性色视频| 欧美大片第1页| 亚洲国产精品久久久久婷婷884 | 久久精品av麻豆的观看方式| 欧美一进一出视频| 欧美在线视频一区二区| 欧美一区二区三区免费观看视频 | 亚洲欧美日韩一区在线| 亚洲欧美激情一区| 久久国产精品亚洲va麻豆| 久久久噜噜噜久久| 美玉足脚交一区二区三区图片| 美女成人午夜| 亚洲精品一区二区在线| 一区二区三区产品免费精品久久75| 一本大道久久a久久精二百| 亚洲深夜av| 久久久久9999亚洲精品| 免费不卡视频| 欧美色视频日本高清在线观看| 国产乱码精品一区二区三| 精品av久久久久电影| 亚洲免费高清视频| 亚洲伊人色欲综合网| 久久久人人人| 亚洲精选在线观看| 欧美亚洲视频| 欧美日韩成人在线观看| 国产欧美 在线欧美| 亚洲激情成人网| 午夜精品一区二区三区在线视| 久久综合亚洲社区| 99视频在线观看一区三区| 亚洲欧美日韩国产精品| 巨胸喷奶水www久久久免费动漫| 欧美日韩中文字幕| 韩国精品一区二区三区| 亚洲私人影院| 你懂的一区二区| 亚洲欧美日产图| 欧美金8天国| 伊人久久大香线蕉av超碰演员| 中日韩高清电影网| 男人的天堂亚洲| 亚洲欧美精品suv| 欧美另类视频在线| 亚洲国产精品久久久久秋霞影院| 午夜亚洲性色福利视频| 亚洲啪啪91| 久久综合色天天久久综合图片| 国产欧美精品在线|