在ThreadMethodOne中的加载上放松变量valA和valB的同步的最正确方法是什么(假设不存在valA和valB的错误的缓存行共享)?似乎我不应该更改ThreadMethodOne来使用memory_order_relaxed加载valA,因为编译器可以在valB.load之后移动valA.load,因为valB.load上的memory_order_acquire不能保护valA在valB.load之后不能移动进行更改。似乎我也无法在valB.load上使用memory_order_relaxed,因为它不再与ThreadMethodTwo中的fetch_add同步。交换项目并放松valA的负担会更好吗?
这是正确的更改吗?
nTotal += valB.load(std::memory_order_acquire);
nTotal += valA.load(std::memory_order_relaxed);
在valA或valB中使用memory_order_relaxed时,即使我不交换指令的顺序,在Compiler Explorer上查看结果似乎也显示了ThreadMethodOne的相同代码生成。我还看到ThreadMethodTwo中的memory_order_relaxed仍然编译为与memory_order_release相同。将memory_order_relaxed更改为以下一行似乎使其变为非锁定状态,请添加'valA.store(valA.load(std :: memory_order_relaxed)+ 1,std :: memory_order_relaxed);'但是我不知道这是否更好。
完整程序:
#include <stdio.h>
#include <stdlib.h>
#include <thread>
#include <atomic>
#include <unistd.h>
bool bDone { false };
std::atomic_int valA {0};
std::atomic_int valB {0};
void ThreadMethodOne()
{
while (!bDone)
{
int nTotal {0};
nTotal += valA.load(std::memory_order_acquire);
nTotal += valB.load(std::memory_order_acquire);
printf("Thread total %d\n", nTotal);
}
}
void ThreadMethodTwo()
{
while (!bDone)
{
valA.fetch_add(1, std::memory_order_relaxed);
valB.fetch_add(1, std::memory_order_release);
}
}
int main()
{
std::thread tOne(ThreadMethodOne);
std::thread tTwo(ThreadMethodTwo);
usleep(100000);
bDone = true;
tOne.join();
tTwo.join();
int nTotal = valA.load(std::memory_order_acquire);
nTotal += valB.load(std::memory_order_acquire);
printf("Completed total %d\n", nTotal);
}
一个更好的样本离开了原始样本,因为它是评论中所写的样本
#include <stdio.h>
#include <stdlib.h>
#include <thread>
#include <atomic>
#include <unistd.h>
std::atomic_bool bDone { false };
std::atomic_int valA {0};
std::atomic_int valB {0};
void ThreadMethodOne()
{
while (!bDone)
{
int nTotalA = valA.load(std::memory_order_acquire);
int nTotalB = valB.load(std::memory_order_relaxed);
printf("Thread total A: %d B: %d\n", nTotalA, nTotalB);
}
}
void ThreadMethodTwo()
{
while (!bDone)
{
valB.fetch_add(1, std::memory_order_relaxed);
valA.fetch_add(1, std::memory_order_release);
}
}
int main()
{
std::thread tOne(ThreadMethodOne);
std::thread tTwo(ThreadMethodTwo);
usleep(100000);
bDone = true;
tOne.join();
tTwo.join();
int nTotalA = valA.load(std::memory_order_acquire);
int nTotalB = valB.load(std::memory_order_relaxed);
printf("Completed total A: %d B: %d\n", nTotalA, nTotalB);
}
最佳答案
清理完代码后,请参阅我的评论,我们得到如下信息:
#include <atomic>
#include <iostream>
std::atomic_int valA {0};
std::atomic_int valB {0};
void ThreadMethodOne()
{
int nTotalA = valA.load(std::memory_order_acquire);
int nTotalB = valB.load(std::memory_order_relaxed);
std::cout << "Thread total A: " << nTotalA << " B: " << nTotalB << '\n';
}
void ThreadMethodTwo()
{
valB.fetch_add(1, std::memory_order_relaxed);
valA.fetch_add(1, std::memory_order_release);
}
int main()
{
std::thread tOne(ThreadMethodOne);
std::thread tTwo(ThreadMethodTwo);
tOne.join();
tTwo.join();
int nTotalA = valA.load(std::memory_order_acquire);
int nTotalB = valB.load(std::memory_order_relaxed);
std::cout << "Completed total A: " << nTotalA << " B: " << nTotalB << '\n';
}
该计划的可能结果是:
Thread total A: 0 B: 0
Completed total A: 1 B: 1
要么
Thread total A: 0 B: 1
Completed total A: 1 B: 1
要么
Thread total A: 1 B: 1
Completed total A: 1 B: 1
它总是打印
Completed total A: 1 B: 1
的原因是线程2被加入并完成,从而为每个变量加了1,线程1中的负载对此没有影响。如果线程1在线程2之前运行并完整完成,那么它将明显打印0 0,而如果线程2在线程1之前运行并完整完成,则线程1将打印11。请注意如何在线程1中执行memory_order_acquire加载不执行任何操作。它可以轻松读取初始值0。
如果线程在同一时间或多或少地运行,那么0 1的结果也很微不足道:线程1可能执行其第一行,然后线程2执行其两行,最后线程1读取线程2写入的值以valB(不必因为它是宽松的,但在这种情况下,我们只能得到0 0输出;但是,如果我们等待足够长的时间,至少可以读取为1)。
因此,唯一感兴趣的问题是:为什么我们看不到1 0的输出?
原因是,如果线程1读取valA的值1,则该值必须是线程2写入的值。这里,读取值的写入是写释放,而读取本身是读取获取。这导致发生同步,从而导致线程2在写释放之前发生的每个副作用对于线程1在读释放之后在线程1中的每个内存访问可见。换句话说,如果我们读取valA == 1,那么随后对valB的读取(是否放松)将看到对线程2的valB的写入,因此始终看到1而不是0。
不幸的是,由于您的问题还不清楚,我无法再多说些什么:我不知道您期望的结果是或希望达到什么。因此,对于发生这种情况的内存需求,我什么也不能说。
关于c++ - C++在两个不同的变量上使用memory_order_relaxed,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/46716731/