c++ - Пример/учебник Mutex?




multithreading synchronization (5)

Я новичок в многопоточности и пытаюсь понять, как работают мьютексы. Много ли у меня работало в Googling, и я нашел достойный учебник , но он все же оставил некоторые сомнения в том, как он работает, потому что я создал свою собственную программу, в которой блокировка не работала.

Один абсолютно неинтуитивный синтаксис мьютекса - pthread_mutex_lock( &mutex1 ); , где похоже, что мьютекс заблокирован, когда то, что я действительно хочу заблокировать, - это другая переменная. Этот синтаксис означает, что блокировка мьютекса блокирует область кода до тех пор, пока мьютекс не будет разблокирован? Тогда как потоки знают, что регион заблокирован? [ UPDATE: Threads знают, что область заблокирована, Memory Fencing ]. И разве такое явление нельзя назвать критическим? [ UPDATE: объекты критического сечения доступны только в Windows, где объекты быстрее, чем мьютексы, и видны только для потока, который его реализует. В противном случае критический раздел просто относится к области кода, защищенной мьютексом ]

Короче говоря, не могли бы вы помочь с простейшей возможной программой примера мьютексов и самым простым объяснением логики того, как она работает? Я уверен, что это поможет многим другим новичкам.


Вы должны проверить переменную mutex перед использованием области, защищенной мьютексом. Таким образом, ваш pthread_mutex_lock () может (в зависимости от реализации) ждать, пока mutex1 не будет выпущен, или не вернет значение, указывающее, что блокировка не может быть получена, если кто-то еще ее заблокировал.

Mutex на самом деле просто упрощенный семафор. Если вы читаете о них и понимаете их, вы понимаете мьютексы. В SO есть несколько вопросов относительно мьютексов и семафоров. Разница между двоичным семафором и мьютексом. Когда мы должны использовать мьютекс и когда мы должны использовать семафор и так далее. Пример туалета в первом звене - пример того, как можно придумать. Весь код делает это, чтобы проверить, доступен ли ключ и если он есть, резервирует его. Обратите внимание, что вы действительно не резервируете сам туалет, а ключ.


Лучший учебник по темам, который я знаю, здесь:

https://computing.llnl.gov/tutorials/pthreads/

Мне нравится, что это написано об API, а не о конкретной реализации, и дает несколько простых простых примеров, которые помогут вам понять синхронизацию.


Функция pthread_mutex_lock() либо приобретает мьютекс для вызывающего потока, либо блокирует поток до тех пор, пока мьютекс не будет получен. Связанный pthread_mutex_unlock() освобождает мьютекс.

Подумайте о мьютексе как о очереди; каждый поток, который пытается получить мьютекс, будет помещен в конец очереди. Когда поток освобождает мьютекс, следующий поток в очереди отрывается и теперь запущен.

Критический раздел относится к области кода, где возможен недетерминизм. Часто это происходит потому, что несколько потоков пытаются получить доступ к общей переменной. Критический раздел небезопасен, пока какая-то синхронизация не будет установлена. Блокировка мьютекса - это одна из форм синхронизации.


Хотя мьютекс может использоваться для решения других проблем, основная причина, по которой они существуют, состоит в том, чтобы обеспечить взаимное исключение и тем самым решить то, что известно как состояние гонки. Когда два (или более) потока или процессы пытаются получить доступ к одной и той же переменной одновременно, у нас есть потенциал для состояния гонки. Рассмотрим следующий код

//somewhere long ago, we have i declared as int
void my_concurrently_called_function()
{
  i++;
}

Внутренности этой функции выглядят настолько просто. Это только одно утверждение. Однако типичный эквивалент языка псевдосети может быть следующим:

load i from memory into a register
add 1 to i
store i back into memory

Поскольку для выполнения операции инкремента на i необходимы эквивалентные инструкции на языке ассемблера, мы говорим, что приращение i является неамонической операцией. Атомная операция - это операция, которая может быть завершена на аппаратном обеспечении с гарантией того, что она не будет прервана после начала выполнения инструкции. Инкремент i состоит из цепочки из трех атомных инструкций. В параллельной системе, где несколько потоков вызывают функцию, возникают проблемы, когда поток читает или записывает в неподходящее время. Представьте, что мы имеем два потока, работающих одновременно, и один вызывает функцию сразу после другого. Давайте также скажем, что мы инициализировали значение 0. Также предположим, что у нас есть много регистров и что два потока используют совершенно разные регистры, поэтому конфликтов не будет. Фактическое время этих событий может быть:

thread 1 load 0 into register from memory corresponding to i //register is currently 0
thread 1 add 1 to a register //register is now 1, but not memory is 0
thread 2 load 0 into register from memory corresponding to i
thread 2 add 1 to a register //register is now 1, but not memory is 0
thread 1 write register to memory //memory is now 1
thread 2 write register to memory //memory is now 1

Произошло то, что мы имеем два потока, увеличивающих одновременно, наша функция вызывается дважды, но результат не согласуется с этим фактом. Похоже, функция вызывалась только один раз. Это связано с тем, что атомарность «ломается» на уровне машины, то есть потоки могут прерывать друг друга или работать вместе в неподходящие времена.

Нам нужен механизм для решения этой проблемы. Нам необходимо наложить некоторые инструкции на приведенные выше инструкции. Один общий механизм - блокировать все потоки, кроме одного. Мьютекс Pthread использует этот механизм.

Любой поток, который должен выполнить некоторые строки кода, которые могут недвусмысленно изменять общие значения другими потоками одновременно (с помощью телефона, чтобы поговорить с его женой), должен сначала получить блокировку на мьютексе. Таким образом, любой поток, который требует доступа к общим данным, должен проходить через блокировку мьютекса. Только тогда поток сможет выполнить код. Этот раздел кода называется критической секцией.

Как только поток выполнил критический раздел, он должен освободить блокировку мьютекса, чтобы другой поток мог получить блокировку мьютекса.

Понятие о мьютексе кажется немного странным, если рассматривать людей, ищущих эксклюзивный доступ к реальным, физическим объектам, но при программировании мы должны быть намеренными. В параллельных потоках и процессах нет социального и культурного воспитания, которое мы делаем, поэтому мы должны заставить их хорошо делиться данными.

Так технически говоря, как работает мьютекс? Разве это не страдает от тех же условий гонки, о которых мы говорили ранее? Разве не pthread_mutex_lock () немного сложнее, чем простое приращение переменной?

Технически говоря, нам нужна какая-то аппаратная поддержка, чтобы помочь нам. Дизайнеры оборудования дают нам машинные инструкции, которые делают больше, чем одно, но гарантируют, что они будут атомарными. Классическим примером такой команды является тестовый набор (TAS). При попытке получить блокировку ресурса мы можем использовать TAS, чтобы проверить, является ли значение в памяти равным 0. Если это так, это будет наш сигнал о том, что ресурс используется, и мы ничего не делаем (или, точнее, , мы ждем каким-то механизмом. Мьютекс pthreads помещает нас в специальную очередь в операционной системе и будет уведомлять нас о том, когда ресурс станет доступным. Системы Dumber могут потребовать от нас жесткой петли спина, проверяя состояние снова и снова) , Если значение в памяти не равно 0, TAS устанавливает местоположение в нечто, отличное от 0, без использования каких-либо других инструкций. Это похоже на объединение двух команд сборки в 1, чтобы дать нам атомарность. Таким образом, тестирование и изменение значения (если изменение соответствует) не может быть прервано после его начала. Мы можем построить мьютексы поверх такой инструкции.

Примечание. Некоторые разделы могут казаться похожими на более ранний ответ. Я принял его приглашение на редактирование, он предпочел оригинальный способ, которым я был, поэтому я держу то, что у меня было, что наполнено небольшим количеством его слов.


Вот моя скромная попытка объяснить концепцию новичков по всему миру: ( цветная версия на моем блоге тоже)

Многие люди бегут в одиночную телефонную будку (без мобильных телефонов), чтобы поговорить со своими близкими. Первым, кто поймает дверную ручку кабины, является тот, кому разрешено пользоваться телефоном. Он должен держаться за ручку двери, пока он пользуется телефоном, иначе кто-то схватит ручку, выкинет его и поговорит со своей женой :) Нет такой системы очередей. Когда человек заканчивает свой звонок, выходит из кабины и оставляет ручку двери, следующий человек, чтобы схватить ручку двери, будет разрешено использовать телефон.

Поток : каждый человек
Мьютекс : Дверная ручка
Замок : рука человека
Ресурс : Телефон

Любой поток, который должен выполнить некоторые строки кода, которые не должны быть изменены другими потоками одновременно (с помощью телефона, чтобы поговорить с его женой), должен сначала получить блокировку на мьютексе (сжимая дверную ручку кабины ). Только тогда поток сможет выполнять эти строки кода (совершать телефонный звонок).

После того, как поток выполнил этот код, он должен освободить блокировку мьютекса, чтобы другой поток мог получить блокировку мьютекса (другие люди могут получить доступ к телефонной будке).

[ Понятие о мьютексе немного абсурдно при рассмотрении эксклюзивного доступа в реальном мире, но в мире программирования я думаю, что другого способа не разрешить другим потокам «видеть», что поток уже выполнял некоторые строки кода. Существуют концепции рекурсивных мьютексов и т. Д., Но этот пример был предназначен только для того, чтобы показать вам базовую концепцию. Надеемся, что этот пример дает вам четкую картину концепции. ]

С потоком C ++ 11:

#include <iostream>
#include <thread>
#include <mutex>

std::mutex m;//you can use std::lock_guard if you want to be exception safe
int i = 0;

void makeACallFromPhoneBooth() 
{
    m.lock();//man gets a hold of the phone booth door and locks it. The other men wait outside
      //man happily talks to his wife from now....
      std::cout << i << " Hello Wife" << std::endl;
      i++;//no other thread can access variable i until m.unlock() is called
      //...until now, with no interruption from other men
    m.unlock();//man lets go of the door handle and unlocks the door
}

int main() 
{
    //This is the main crowd of people uninterested in making a phone call

    //man1 leaves the crowd to go to the phone booth
    std::thread man1(makeACallFromPhoneBooth);
    //Although man2 appears to start second, there's a good chance he might
    //reach the phone booth before man1
    std::thread man2(makeACallFromPhoneBooth);
    //And hey, man3 also joined the race to the booth
    std::thread man3(makeACallFromPhoneBooth);

    man1.join();//man1 finished his phone call and joins the crowd
    man2.join();//man2 finished his phone call and joins the crowd
    man3.join();//man3 finished his phone call and joins the crowd
    return 0;
}

Скомпилировать и запустить с помощью g++ -std=c++0x -pthread -o thread thread.cpp;./thread

Вместо явного использования lock и unlock вы можете использовать скобки, как показано здесь , если вы используете фиксированную блокировку для того, что она предоставляет . Однако блокированные блокировки имеют небольшую производительность.

С TBB: вам понадобится TBB для запуска нижеприведенной программы, но цель размещения кода TBB заключается в том, что вы понимаете последовательность блокировки и разблокировки, просто взглянув на простой код (возможно, показало блокировку блокировки, не используя релиз - который также является безопасным исключением , но это яснее).

#include <iostream>
#include "/tbb/mutex.h"
#include "/tbb/tbb_thread.h"
using namespace tbb;

typedef mutex myMutex;
static myMutex sm;
int i = 0;

void someFunction() 
{ 
      //Note: Since a scoped lock is used below, you should know that you 
      //can specify a scope for the mutex using curly brackets, instead of 
      //using lock.acquire() and lock.release(). The lock will automatically 
      //get released when program control goes beyond the scope.
      myMutex::scoped_lock lock;//create a lock
      lock.acquire(sm);//Method acquire waits until it can acquire a lock on the mutex
         //***only one thread can access the lines from here...***
         ++i;//incrementing i is safe (only one thread can execute the code in this scope) because the mutex locked above protects all lines of code until the lock release.
         sleep(1);//simply creating a delay to show that no other thread can increment i until release() is executed
         std::cout<<"In someFunction "<<i<<"\n";
         //***...to here***
      lock.release();//releases the lock (duh!)      
}

int main()
{
   tbb_thread my_thread1(someFunction);//create a thread which executes 'someFunction'
   tbb_thread my_thread2(someFunction);
   tbb_thread my_thread3(someFunction);

   my_thread1.join();//This command causes the main thread (which is the 'calling-thread' in this case) to wait until thread1 completes its task.
   my_thread2.join();
   my_thread3.join();
}

Обратите внимание, что tbb_thread.h устарел. Здесь показана замена.







mutex