Нейл Мэтью - Основы программирования в Linux
Далее приведены объявления функций семафоров:
#include <sys/sem.h>
int semctl(int sem_id, int sem_num, int command, ...);
int semget(key_t key, int num_sems, int sem_flags);
int semop(int sem_id, struct sembuf *sem_ops, size_t num_sem_ops);
ПримечаниеОбычно заголовочный файл sys/sem.h опирается на два других заголовочных файла: sys/types.h и sys/ipc.h. Как правило, они автоматически включаются в программу файлом sys/sem.h и вам не нужно задавать их явно в директивах #include.
Прорабатывая каждую функцию отдельно, помните о том, что все они спроектированы для использования массивов значений семафоров, что делает их работу существенно более сложной, чем та, что необходима для обработки одного семафора.
Обратите внимание на то, что параметр key действует во многом как имя файла, т.к. он тоже представляет ресурс, который программы могут использовать и кооперироваться при этом, если соблюдают соглашение об общем имени для него. Аналогичным образом идентификатор, возвращаемый функцией semget и применяемый другими функциями, совместно использующими память, очень похож на файловый поток FILE*, возвращаемый функцией fopen и представляющий собой значение, применяемое процессом для доступа к совместно используемому файлу. Как и в случае файлов, у разных процессов будут разные идентификаторы семафоров, несмотря на то, что они ссылаются на один и тот же семафор. Такое применение ключа и идентификаторов — общее для всех средств IPC, обсуждаемых здесь, несмотря на то, что каждое средство применяет независимые ключи и идентификаторы.
semgetФункция semget создает новый семафор или получает ключ существующего семафора.
int semget(key_t key, int num_sems, int sem_flags);
Первый параметр key — целочисленное значение, позволяющее несвязанным процессам обращаться к одному и тому же семафору. Ко всем семафорам осуществляется непрямой доступ с помощью программы, предоставляющей ключ, для которого система затем генерирует идентификатор семафора. Ключ семафора применяется только в функции semget. Все остальные функции семафора используют идентификатор семафора, возвращаемый функцией semget.
Существует особое значение ключа семафора IPC_PRIVATE, которое предназначено для создания семафора, доступ к которому получает только процесс-создатель, но такой семафор редко бывает полезен. Для создания нового семафора следует задавать уникальное ненулевое целое число.
Параметр num_sems определяет количество требуемых семафоров. Почти всегда он равен 1.
Параметр sem_flags — набор флагов, очень похожих на флаги функции open. Младшие девять байтов — права доступа к семафору, ведущие себя, как права доступа к файлу. Кроме того, для создания нового семафора с помощью поразрядной операции OR их можно объединить со значением IPC_CREAT. Не считается ошибкой наличие флага IPC_CREAT и задание ключа существующего семафора. Флаг IPC_CREAT безмолвно игнорируется, если в нем нет нужды. Можно применять флаги IPC_CREAT и IPC_EXCL для гарантированного получения нового уникального семафора. Если семафор уже существует, функция вернет ошибку.
Функция semget вернет в случае успеха положительное (ненулевое) значение, представляющее собой идентификатор, применяемый остальными функциями семафора. В случае ошибки возвращается -1.
semopФункция semop применяется для изменения значения семафора.
int semop(int sem_id, struct sembuf *sem_ops, size_t num_sem_ops);
Первый параметр sem_id — идентификатор семафора, возвращенный функцией semget. Второй параметр sem_ops — указатель на массив структур, у каждой из которых есть, по крайней мере, следующие элементы:
struct sembuf {
short sem_num;
short sem_op;
short sem_flg;
}
Первый параметр sem_num — номер семафора, обычно 0, если вы не работаете с массивом семафоров. Элемент sem_op — значение, на которое должен изменяться семафор. (Вы можете увеличивать и уменьшать семафор на значения, не равные 1.) Как правило, применяются только два значения: -1 для операции P, заставляющей ждать, пока семафор не станет доступен, и +1 для операции V, оповещающей о том, что в данный момент семафор доступен.
Последний элемент sem_flg обычно задается равным SEM_UNDO. Это значение заставляет операционную систему отслеживать изменения значения семафора, сделанные текущим процессом, и, если процесс завершается, не освободив семафор, позволяет операционной системе автоматически освободить семафор, если он удерживался этим процессом. Хорошо взять за правило установку sem_flg, равным SEM_UNDO, если вам не требуется иного поведения. Если же вы все-таки решили, что вам нужно значение, отличное от SEM_UNDO, очень важно быть последовательным, иначе вы можете оказаться в замешательстве относительно попыток ядра системы "убрать" ваши семафоры, когда ваш процесс завершается.
Все действия, предусмотренные semop, собраны вместе, чтобы избежать состояния гонок, вызванного использованием множественных семафоров. Все подробности функционирования semop можно найти на страницах интерактивного справочного руководства.
semctlФункция semctl позволяет напрямую управлять данными семафора.
int semctl (int sem_id, int sem_num, int command, ...);
Первый параметр sem_id — идентификатор семафора, полученный от функции semget. Параметр sem_num — номер семафора. Он применяется при работе с массивом семафоров. Обычно этот параметр равен 0, первый и единственный семафор. Параметр command — предпринимаемое действие, и четвертый параметр, если присутствует, — union (объединение) типа semun, которое в соответствии со стандартом X/Open должно содержать как минимум следующие элементы:
union semun {
int val;
struct semid_ds *buf;
unsigned short *array;
}
В большинстве версий ОС Linux определение объединения semun включено в заголовочный файл (обычно sem.h), несмотря на то, что стандарт X/Open настаивает на том, что вы должны привести собственное объявление. Если вы поймете, что должны объявить его самостоятельно, проверьте, нет ли объявления этого объединения на страницах интерактивного справочного руководства, относящихся к функции semctl. Если вы найдете его, мы полагаем, что вы примените определение из вашего справочного руководства, даже если оно отличается от приведенного на страницах этой книги.
Существует множество разных значений параметра command, допустимых в функции semctl. Обычно применяются два из них, которые описаны далее. Более подробную информацию о функции semctl см. в интерактивном справочном руководстве.
Два часто используемых значения command таковы:
□ SETVAL — применяется для инициализации семафора с заданным значением. Это значение передается как элемент val объединения semun. Такое действие необходимо для того, чтобы увеличить значение семафора перед первым его применением;
□ IPC_RMID — применяется для удаления идентификатора семафора, когда он больше не нужен.
Функция semctl возвращает разные значения, зависящие от параметра command. Если значение команды — IPC_RMID, функция в случае успешного завершения вернет 0 и -1 в противном случае.
Применение семафоров
Как видно из содержания предыдущих разделов, операции с семафорами могут быть очень сложными. Это не самое печальное, потому что программирование многих процессов или потоков с критическими секциями — очень трудная задача сама по себе, и наличие сложного программного интерфейса лишь увеличивает интеллектуальную нагрузку.
К счастью, большинство задач, нуждающихся в семафорах, можно решить, применяя единственный бинарный семафор — простейший тип семафора. В следующем примере (упражнение 14.1) вы используете полный программный интерфейс для создания очень простого интерфейса типа Р и V для бинарного семафора. Затем вы примените этот простенький интерфейс для демонстрации того, как функционируют семафоры.
В экспериментах с семафорами будет использоваться единственная программа sem1.с, которую вы сможете запускать несколько раз. Необязательный параметр будет применяться для того, чтобы показать, отвечает ли программа за создание и уничтожение семафора.
Вывод двух разных символов будет обозначать вход в критическую секцию и выход из нее. Программа, запущенная с параметром, выводит X при входе в критическую секцию и выходе из нее. Другие экземпляры запущенной программы будут выводить символ О при входе в свои критические секции и выходе из них. Поскольку в любой заданный момент времени только один процесс способен войти в свою критическую секцию, все символы X и O должны появляться парами.