青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 9,  comments - 19,  trackbacks - 0

0x0

前些天組里老司機(jī)@梁希在jvm的項(xiàng)目榨干機(jī)器性能之余,為了檢查下gcc編譯器和Intel Xoen CPU的正確性,寫了一組測(cè)試代碼測(cè)試了下mfence指令的效果

`
mfence Opcode : 0F AE /6

Performs a serializing operation on all load-from-memory and store-to-memory instructions that were issued prior the MFENCE instruction. This serializing operation guarantees that every load and store instruction that precedes in program order the MFENCE instruction is globally visible before any load or store instruction that follows the MFENCE instruction is globally visible. The MFENCE instruction is ordered with respect to all load and store instructions, other MFENCE instructions, any SFENCE and LFENCE instructions, and any serializing instructions (such as the CPUID instruction).
Weakly ordered memory types can be used to achieve higher processor performance through such techniques as out-of-order issue, speculative reads, write-combining, and write-collapsing.
The degree to which a consumer of data recognizes or knows that the data is weakly ordered varies among applications and may be unknown to the producer of this data. The MFENCE instruction provides a performance-efficient way of ensuring load and store ordering between routines that produce weakly-ordered results and routines that consume that data.
It should be noted that processors are free to speculatively fetch and cache data from system memory regions that are assigned a memory-type that permits speculative reads (that is, the WB, WC, and WT memory types). The PREFETCHh instruction is considered a hint to this speculative behavior. Because this speculative fetching can occur at any time and is not tied to instruction execution, the MFENCE instruction is not ordered with respect to PREFETCHh instructions or any other speculative fetching mechanism (that is, data could be speculatively loaded into the cache just before, during, or after the execution of an MFENCE instruction).
`

簡(jiǎn)單來(lái)說(shuō)就是一個(gè)可以在CPU亂序執(zhí)行中保證真實(shí)的load/store順序的指令

0x1
老司機(jī)寫了一個(gè)小程序(注:有誤版)
// file: order.c

#define _GNU_SOURCE
#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
int b;

void *
run1(void *ignore)
{
    for (;;) {
        while (!b);
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        asm ("sfence": : :"memory");
        v2.i = 1;
        asm ("sfence": : :"memory");
        b = 0; 
    }
}

int
main()
{
    pthread_t p;
    pthread_create(&p, NULL, run1, NULL);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = v2.i = 0;
        asm ("sfence": : :"memory");
        b = 1;
        asm ("sfence": : :"memory");
        int icnt = 0;
        for (;; icnt++) {
            int i1 = v1.i;
            asm ("lfence": : :"memory");
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

大概邏輯是: 一共有3個(gè)變量,v1.iv2.ib ,起了2個(gè)線程,一個(gè)順序?qū)懭雟1和v2,一個(gè)讀v1和v2,互相通過(guò)改變b的值來(lái)通訊,然后兩個(gè)線程不停循環(huán)。

這個(gè)程序會(huì)掛在
printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2); 
這條斷言上,意思是線程1在順序?qū)懭雟1和v2,但是主線程卻出現(xiàn)讀到 v1=0,v2=1的情況。

0x2

然后我?guī)兔θタ戳艘幌拢X(jué)得這種寫法甚是粗暴,于是原樣照搬了一個(gè)c++11版:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    atomic<int> i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i.load() || v2.i.load()) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i.store(1);
        v2.i.store(1);
        b.store(0);
    }
}

int
main()
{
    // init
    v1.i.store(0);
    v2.i.store(0);
    thread t(run1);
    int cnt = 0;
    for (;; cnt++) {
        v1.i.store(0);
        v2.i.store(0);
        b.store(1);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load();
            int i1 = v1.i.load();       // *****
            int i2 = v2.i.load();       // *****
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
            if (i1 == 0 && i2 == 0 && b2 == 0) break;
        }
    }
    return 0;
}

因?yàn)槭窃瓨诱瞻幔钥隙ㄟ€是會(huì)掛,但是畢竟語(yǔ)義上更好理解了

我們先來(lái)分析一下為什么會(huì)掛

  • 線程1對(duì)于v1,v2的寫入順序一定是一致的
  • Memory Barrier也保證了他們寫入順序?qū)ζ渌€程的可見(jiàn)性(很有迷惑性的一點(diǎn))
  • 但是主線程卻可以讀到 v1=0,v2=1的情況
  • 所以情況就是雖然順序?qū)懭肓耍莿e的線程沒(méi)有看到正確的順序?
  • Intel: 并不是!
  • 原因是搞錯(cuò)了因果關(guān)系,他真正保證的順序是當(dāng)你讀到v2的new value的時(shí)候,那么v1也一定被寫入了。
  • 解決方案就是互換上面代碼中我用**星號(hào)**標(biāo)注出的兩行
  • done

在舊寫法中,掛掉的情況是線程1寫入v1 = 1,主線程讀v1,沒(méi)有讀到,那么主線程認(rèn)為v1是0,然后線程1繼續(xù)寫入v2,主線程讀到了,主線程認(rèn)為v2是1。 然后掛在了斷言上。

兩行互換后,主線程首先讀取v2,如果v2已經(jīng)是1了,那么v1也一定是1,反之亦然。

0x3

當(dāng)然,想讓跑通那個(gè)例子不需要那么多的atomic<>,精簡(jiǎn)之后利用c++11的memory_order可以寫成如下:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;    // variable b as a guard

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        v2.i = 1;
        b.store(0, memory_order_release);
    }
}
int
main()
{
    // init
    v1.i = 0;
    v2.i = 0;
    thread t(run1);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = 0;
        v2.i = 0;
        b.store(1, memory_order_release);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load(memory_order_acquire);
            if (b2 != 0) {
                continue
            }
            int i1 = v1.i;
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error 2, cnt = %d, icnt =  %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

利用變量b在兩個(gè)線程之間同步,如下圖

 (Thead 1)

   v1.i = 1;
   v2.i = 1;
   
   b.store(0, memory_order_release) <---+
                                                             |
                                                synchronize with b
                                                 (happend before)
                                                             |
                                                            +----->  b.load(memory_order_acquire)
                                                                          
                                                                        i1 = v1.i
                                                                        i2 = v2.i

                                                                       (Thread 2)

我們查看下生成的代碼
g++ -std=c++11 -pthread -g -O2 order.cpp

 v1.i = 1;
  400be6:       c7 05 d0 10 20 00 01    movl   $0x1,0x2010d0(%rip)        # 601cc0 <v1>
  400bed:       00 00 00 
        v2.i = 1;
  400bf0:       c7 05 86 10 20 00 01    movl   $0x1,0x201086(%rip)        # 601c80 <v2>
  400bf7:       00 00 00 
        memory_order __b = __m & __memory_order_mask;
        __glibcxx_assert(__b != memory_order_acquire);
        __glibcxx_assert(__b != memory_order_acq_rel);
        __glibcxx_assert(__b != memory_order_consume);

        __atomic_store_n(&_M_i, __i, __m);
  400bfa:       c7 05 5c 10 20 00 00    movl   $0x0,0x20105c(%rip)        # 601c60 <b>
  400c01:       00 00 00 
        b.store(0, memory_order_release);

  

  400a58:       8b 05 02 12 20 00       mov    0x201202(%rip),%eax        # 601c60 <b>
            int b2 = b.load(memory_order_consume);
            if (b2 != 0) {
  400a5e:       85 c0                   test   %eax,%eax
  400a60:       75 f3                   jne    400a55 <main+0x55>
                continue
            }
            int i1 = v1.i;
  400a62:       8b 0d 58 12 20 00       mov    0x201258(%rip),%ecx        # 601cc0 <v1>
            int i2 = v2.i;
  400a68:       44 8b 05 11 12 20 00    mov    0x201211(%rip),%r8d        # 601c80 <v2>

看來(lái)Intel的Strong Memory Model已經(jīng)保證了這一點(diǎn),Memory Barrier都不需要了

(雖然標(biāo)題里面有MemoryBarrier,但是內(nèi)容里面根本沒(méi)涉及的樣子。。)

posted on 2016-01-19 16:13 右席 閱讀(16808) 評(píng)論(1)  編輯 收藏 引用 所屬分類: 搬磚之路
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美mv日韩mv国产网站| 欧美日本精品在线| 国产主播精品| 蜜桃av综合| 免费日韩av| 宅男在线国产精品| 亚洲午夜一区| 国产一区深夜福利| 欧美激情1区2区3区| 欧美激情亚洲激情| 亚洲欧美日本国产有色| 午夜影视日本亚洲欧洲精品| 一区二区三区在线高清| 亚洲国产精品99久久久久久久久| 欧美顶级艳妇交换群宴| 亚洲一区二区三区激情| 性欧美超级视频| 亚洲精品国产欧美| 一区二区三区免费网站| 国产视频综合在线| 亚洲黄色一区| 国产性做久久久久久| 欧美激情精品久久久久久蜜臀| 欧美日本国产| 久久久精品网| 欧美日韩一区在线视频| 久久先锋资源| 国产精品扒开腿做爽爽爽软件| 久久免费高清视频| 欧美午夜免费电影| 欧美成人dvd在线视频| 欧美日韩一区高清| 欧美丰满高潮xxxx喷水动漫| 国产精品视频内| 亚洲福利国产| 国产亚洲欧美激情| 在线亚洲国产精品网站| 亚洲国产精品美女| 久久aⅴ国产紧身牛仔裤| 99精品99| 欧美国产一区二区三区激情无套| 久久国产精品99久久久久久老狼| 欧美日韩国产一级片| 欧美福利视频在线| 国产午夜精品久久久久久久| 9l国产精品久久久久麻豆| 亚洲欧洲一区| 久久久久久久一区二区三区| 香蕉久久夜色| 国产精品第十页| 亚洲欧洲一区二区在线观看| 亚洲国产成人不卡| 久久av一区二区| 久久国产一二区| 国产精品免费在线| 一本大道久久a久久精品综合| 亚洲人成毛片在线播放女女| 久久久噜噜噜久久狠狠50岁| 久久久福利视频| 国产一区二区三区无遮挡| 亚洲在线一区| 午夜在线观看欧美| 国产精品免费观看视频| 亚洲香蕉伊综合在人在线视看| 一区二区精品在线| 欧美日本国产在线| 亚洲美女黄色| 亚洲网址在线| 国产精品国产三级国产普通话99| 一区二区免费在线视频| 亚洲免费影视| 国产精品日韩在线播放| 亚洲欧美激情视频| 久久久久久夜精品精品免费| 国内精品模特av私拍在线观看| 久久疯狂做爰流白浆xx| 欧美chengren| 亚洲最新在线| 国产精品日韩精品欧美精品| 亚洲综合欧美| 免费看av成人| 日韩手机在线导航| 国产精品激情av在线播放| 亚洲一区二区三区久久| 久久久久久综合| 亚洲电影在线播放| 欧美日本三级| 亚洲淫片在线视频| 免费短视频成人日韩| 一区二区三区 在线观看视| 欧美三日本三级少妇三99| 亚洲在线免费| 欧美肥婆在线| 午夜激情久久久| 在线观看欧美日本| 欧美三日本三级少妇三2023| 欧美资源在线| 亚洲精品女av网站| 亚洲精品日韩综合观看成人91| 国产精品av免费在线观看| 午夜精品视频在线观看| 亚洲国产精品尤物yw在线观看| 午夜影院日韩| 91久久精品国产91性色tv| 国产精品高潮呻吟久久av无限| 欧美在线啊v一区| 亚洲精选中文字幕| 久久这里有精品视频| 一本大道久久a久久精品综合| 国产一区二区三区高清| 欧美日韩精品一区二区| 久久免费视频在线观看| 亚洲午夜视频| 亚洲裸体视频| 牛牛影视久久网| 久久国产精品亚洲va麻豆| 一本一本久久a久久精品综合麻豆| 国产九九视频一区二区三区| 欧美精品九九| 久久人人九九| 久久福利影视| 亚洲欧美日韩在线不卡| 一本色道**综合亚洲精品蜜桃冫| 免费高清在线一区| 久久久久久精| 新片速递亚洲合集欧美合集| 一区二区三区久久久| 亚洲精品美女久久7777777| 伊人久久噜噜噜躁狠狠躁 | 久久久久久久久伊人| 亚洲与欧洲av电影| 亚洲精品视频免费观看| 在线观看一区| 影音先锋在线一区| 日韩视频在线观看| 国产精品久久一区二区三区| 亚洲精品在线视频观看| 蜜臀av性久久久久蜜臀aⅴ四虎 | 国产精品xvideos88| 欧美日韩1234| 欧美激情一区二区| 欧美激情一区二区三区全黄| 猫咪成人在线观看| 美女精品在线观看| 久久在线观看视频| 美腿丝袜亚洲色图| 欧美国产精品中文字幕| 欧美久久久久久久久| 欧美日韩一级片在线观看| 欧美日韩久久精品| 欧美性片在线观看| 国产精品免费观看在线| 国产伦精品一区二区三区免费迷| 国产麻豆综合| 激情五月***国产精品| 亚洲国产精选| 一区二区三区高清| 亚洲欧美经典视频| 久久久综合免费视频| 欧美成人免费一级人片100| 亚洲高清一区二| 日韩一级片网址| 欧美一区二区免费视频| 久久综合影音| 欧美美女日韩| 国产麻豆日韩欧美久久| 亚洲第一区中文99精品| 9l国产精品久久久久麻豆| 亚洲一区久久久| 久久蜜桃资源一区二区老牛| 欧美激情精品久久久久久大尺度 | 亚洲人午夜精品| 在线视频一区观看| 久久精品亚洲一区| 欧美黄色精品| 国产视频久久网| 亚洲免费精彩视频| 久久精品99无色码中文字幕| 亚洲电影av在线| 亚洲欧美国产视频| 欧美xart系列高清| 国产美女在线精品免费观看| 亚洲人成高清| 久久av资源网| 亚洲人体一区| 久久久精品五月天| 欧美性天天影院| 亚洲第一页在线| 欧美一级久久| 亚洲精品三级| 久久综合九色欧美综合狠狠| 国产精品福利片| 亚洲乱码久久| 免费av成人在线| 亚洲欧美三级伦理| 欧美天堂亚洲电影院在线观看| 在线看片日韩| 久久久久网址| 小嫩嫩精品导航| 欧美日韩成人在线播放|