Операционные системы/Базовые средства взаимодействия процессов в ОС UNIX. Каналы
Материал из eSyr's wiki.
Одним из простейших средств взаимодействия процессов в операционной системе UNIX является механизм каналов.
Содержание |
[править] Неименованные каналы
Неименованный канал есть некая сущность, в которую можно помещать и извлекать данные, для чего служат два файловых дескриптора, ассоциированных с каналом: один для записи в канал, другой — для чтения.
Для создания канала служит системный вызов pipe():
#include <unistd.h> int pipe(int *fd)
Данный системный вызов выделяет в оперативной памяти некоторое ограниченное пространство и возвращает через параметр fd массив из двух файловых дескрипторов: один для записи в канал — fd[1], другой для чтения — fd[0].
Эти дескрипторы являются дескрипторами открытых файлов, с которыми можно работать, используя такие системные вызовы как read(), write(), dup() и так далее. Однако следует четко понимать различия между обычным файлом и каналом.
Основные отличительные свойства канала следующие:
- В отличие от файла, к неименованному каналу невозможен доступ по имени, т.е. единственная возможность использовать канал – это те файловые дескрипторы, которые с ним ассоциированы
- Канал не существует вне процесса, т.е. для существования канала необходим процесс, который его создаст и в котором он будет существовать, для файла это не так
Канал реализует модель последовательного доступа к данным (FIFO), т.е. данные из канала можно прочитать только в той же последовательности, в каком они были записаны. Это означает, что для файловых дескрипторов, ассоциированных с каналом, не определена операция lseek() (при попытке обратиться к этому вызову произойдет ошибка).
Кроме того, существует ряд отличий в поведении операций чтения и записи в канал, а именно:
- При чтении из канала:
- если прочитано меньше байтов, чем находится в канале, оставшиеся сохраняются в канале;
- если делается попытка прочитать больше данных, чем имеется в канале, и при этом существуют открытые дескрипторы записи, ассоциированные с каналом, будет прочитано (т.е. изъято из канала) доступное количество данных, после чего читающий процесс блокируется до тех пор, пока в канале не появится достаточное количество данных для завершения операции чтения.
- процесс может избежать такого блокирования, изменив для канала режим блокировки с использованием системного вызова fcntl(). В неблокирующем режиме в ситуации, описанной выше, будет прочитано доступное количество данных, и управление будет сразу возвращено процессу.
При закрытии записывающей стороны канала, в него помещается символ конца файла. После этого процесс, осуществляющий чтение, может выбрать из канала все оставшиеся данные и признак конца файла, благодаря которому блокирования при чтении в этом случае не происходит.
- При записи в канал:
- если процесс пытается записать большее число байтов, чем помещается в канал (но не превышающее предельный размер канала), записывается возможное количество данных, после чего процесс, осуществляющий запись, блокируется до тех пор, пока в канале не появится достаточное количество места для завершения операции записи;
- процесс может избежать такого блокирования, изменив для канала режим блокировки с использованием системного вызова fcntl(). В неблокирующем режиме в ситуации, описанной выше, будет записано возможное количество данных, и управление будет сразу возвращено процессу.
- если же процесс пытается записать в канал порцию данных, превышающую предельный размер канала, то будет записано доступное количество данных, после чего процесс заблокируется до появления в канале свободного места любого размера (пусть даже и всего 1 байт), затем процесс разблокируется, вновь производит запись на доступное место в канале, и если данные для записи еще не исчерпаны, вновь блокируется до появления свободного места и т.д., пока не будут записаны все данные, после чего происходит возврат из вызова write()
- если процесс пытается осуществить запись в канал, с которым не ассоциирован ни один дескриптор чтения, то он получает сигнал SIGPIPE (тем самым ОС уведомляет его о недопустимости такой операции).
В стандартной ситуации (при отсутствии переполнения) система гарантирует атомарность операции записи, т. е. при одновременной записи нескольких процессов в канал их данные не перемешиваются.
[править] Использование канала
Пример использования канала в рамках одного процесса – копирование строк. Фактически осуществляется посылка данных самому себе.
#include <unistd.h> #include <stdio.h> int main(int argc, char **argv) { char *s = ”chanel”; char buf[80]; int pipes[2]; pipe(pipes); write(pipes[1], s, strlen(s) + 1); read(pipes[0], buf, strlen(s) + 1); close(pipes[0]); close(pipes[1]); printf(“%s\n”, buf); return 0; }
Чаще всего, однако, канал используется для обмена данными между несколькими процессами. При организации такого обмена используется тот факт, что при порождении сыновнего процесса посредством системного вызова fork() наследуется таблица файловых дескрипторов процесса-отца, т.е. все файловые дескрипторы, доступные процессу-отцу, будут доступны и процессу-сыну. Таким образом, если перед порождением потомка был создан канал, файловые дескрипторы для доступа к каналу будут унаследованы и сыном. В итоге обоим процессам оказываются доступны дескрипторы, связанные с каналом, и они могут использовать канал для обмена данными.
[править] Схема взаимодействия процессов с использованием канала
#include <sys/types.h> #include <unistd.h> int main(int argc, char **argv) { int fd[2]; pipe(fd); if (fork()) {/*процесс-родитель*/ close(fd[0]); /* закрываем ненужный дескриптор */ write (fd[1], …); … close(fd[1]); … } else {/*процесс-потомок*/ close(fd[1]); /* закрываем ненужный дескриптор */ while(read (fd[0], …)) { … } … } }
Аналогичным образом может быть организован обмен через канал между двумя потомками одного порождающего процесса и вообще между любыми родственными процессами, единственным требованием здесь, как уже говорилось, является необходимость создавать канал в порождающем процессе прежде, чем его дескрипторы будут унаследованы порожденными процессами.
Как правило, канал используется как однонаправленное средство передачи данных, т.е. только один из двух взаимодействующих процессов осуществляет запись в него, а другой процесс осуществляет чтение, при этом каждый из процессов закрывает не используемый им дескриптор. Это особенно важно для неиспользуемого дескриптора записи в канал, так как именно при закрытии пишущей стороны канала в него помещается символ конца файла. Если, к примеру, в рассмотренном процесс-потомок не закроет свой дескриптор записи в канал, то при последующем чтении из канала, исчерпав все данные из него, он будет заблокирован, так как записывающая сторона канала будет открыта, и следовательно, читающий процесс будет ожидать очередной порции данных.
[править] Реализация конвейера
Пример реализации конвейера print|wc – вывод программы print будет подаваться на вход программы wc. Программа print печатает некоторый текст. Программа wc считает количество прочитанных строк, слов и символов.
#include <sys/types.h> #include <unistd.h> #include <stdio.h> int main(int argc, char **argv) { int fd[2]; pipe(fd); /*организован канал*/ if (fork()) { /*процесс-родитель*/ dup2(fd[1], 1); /* отождествили стандартный вывод с файловым дескриптором канала, предназначенным для записи */ close(fd[1]); /* закрыли файловый дескриптор канала, предназначенный для записи */ close(fd[0]); /* закрыли файловый дескриптор канала, предназначенный для чтения */ exelp(“print”, ”print”, 0); /* запустили программу print */ } /*процесс-потомок*/ dup2(fd[0], 0); /* отождествили стандартный ввод с файловым дескриптором канала, предназначенным для чтения*/ close(fd[0]); /* закрыли файловый дескриптор канала, предназначенный для чтения */ close(fd[1]); /* закрыли файловый дескриптор канала, предназначенный для записи */ execl(“/usr/bin/wc”, ”wc”, 0); /* запустили программу wc */ }
[править] Совместное использование сигналов и каналов – «пинг-понг»
Пример программы с использованием каналов и сигналов для осуществления связи между процессами – весьма типичной ситуации в системе. При этом на канал возлагается роль среды двусторонней передачи информации, а на сигналы – роль системы синхронизации при передаче информации. Процессы посылают друг другу целое число, всякий раз увеличивая его на 1. Когда число достигнет некоего максимума, оба процесса завершаются.
#include <signal.h> #include <sys/types.h> #include <sys/wait.h> #include <unistd.h> #include <stdlib.h> #include <stdio.h> #define MAX_CNT 100 int target_pid, cnt; int fd[2]; int status; void SigHndlr(int s) { /* в обработчике сигнала происходит и чтение, и запись */ signal(SIGUSR1, SigHndlr); if (cnt < MAX_CNT) { read(fd[0], &cnt, sizeof(int)); printf("%d \n", cnt); cnt++; write(fd[1], &cnt, sizeof(int)); /* посылаем сигнал второму: пора читать из канала */ kill(target_pid, SIGUSR1); } else if (target_pid == getppid()) { /* условие окончания игры проверяется потомком */ printf("Child is going to be terminated\n"); close(fd[1]); close(fd[0]); /* завершается потомок */ exit(0); } else kill(target_pid, SIGUSR1); } int main(int argc, char **argv) { pipe(fd); /* организован канал */ signal (SIGUSR1, SigHndlr); /* установлен обработчик сигнала для обоих процессов */ cnt = 0; if (target_pid = fork()) { /* Предку остается только ждать завершения потомка */ while(wait(&status) == -1); printf("Parent is going to be terminated\n"); close(fd[1]); close(fd[0]); return 0; } else { /* процесс-потомок узнает PID родителя */ target_pid = getppid(); /* потомок начинает пинг-понг */ write(fd[1], &cnt, sizeof(int)); kill(target_pid, SIGUSR1); for(;;); /* бесконечный цикл */ } }
[править] Именованные каналы
Рассмотренные выше программные каналы имеют важное ограничение: так как доступ к ним возможен только посредством дескрипторов, возвращаемых при порождении канала, необходимым условием взаимодействия процессов через канал является передача этих дескрипторов по наследству при порождении процесса.
Именованные каналы (FIFO-файлы) расширяют свою область применения за счет того, что подключиться к ним может любой процесс в любое время, в том числе и после создания канала. Это возможно благодаря наличию у них имен.
FIFO-файл представляет собой отдельный тип файла в файловой системе UNIX, который обладает всеми атрибутами файла, такими, как имя владельца, права доступа и размер. Для его создания в UNIX System V.3 и ранее используется системный вызов mknod(), а в BSD UNIX и System V.4 – вызов mkfifo() (этот вызов поддерживается и стандартом POSIX):
#include <sys/types.h> #include <sys/stat.h> #include <fcntl.h> #include <unistd.h> int mknod (char *pathname, mode_t mode, dev); #include <sys/types.h> #include <sys/stat.h> int mkfifo (char *pathname, mode_t mode);
В обоих вызовах первый аргумент представляет собой имя создаваемого канала, во втором указываются права доступа к нему для владельца, группы и прочих пользователей, и кроме того, устанавливается флаг, указывающий на то, что создаваемый объект является именно FIFO-файлом (в разных версиях ОС он может иметь разное символьное обозначение – S_IFIFO или I_FIFO). Третий аргумент вызова mknod() игнорируется.
После создания именованного канала любой процесс может установит с ним связь посредством системного вызова open(). При этом действуют следующие правила:
- если процесс открывает FIFO-файл для чтения, он блокируется до тех пор, пока какой-либо процесс не откроет тот же канал на запись
- если процесс открывает FIFO-файл на запись, он будет заблокирован до тех пор, пока какой-либо процесс не откроет тот же канал на чтение
- процесс может избежать такого блокирования, указав в вызове open() специальный флаг (в разных версиях ОС он может иметь разное символьное обозначение – O_NONBLOCK или O_NDELAY). В этом случае в ситуациях, описанных выше, вызов open() сразу же вернет управление процессу
Правила работы с именованными каналами, в частности, особенности операций чтения-записи, полностью аналогичны неименованным каналам.
[править] Пример: Модель «клиент-сервер»
Рассмотрим пример, где один из процессов является сервером, предоставляющим некоторую услугу, другой же процесс, который хочет воспользоваться этой услугой, является клиентом. Клиент посылает серверу запросы на предоставление услуги, а сервер отвечает на эти запросы.
Процесс-сервер запускается на выполнение первым, создает именованный канал, открывает его на чтение в неблокирующем режиме и входит в цикл, пытаясь прочесть что-либо. Затем запускается процесс-клиент, подключается к каналу с известным ему именем и записывает в него свой идентификатор. Сервер выходит из цикла, прочитав идентификатор клиента, и печатает его.
/* процесс-сервер*/ #include <stdio.h> #include <sys/types.h> #include <sys/stat.h> #include <fcntl.h> #include <unistd.h> int main(int argc, char **argv) { int fd; int pid; mkfifo("fifo", S_IFIFO | 0666); /*создали специальный файл FIFO с открытыми для всех правами доступа на чтение и запись*/ fd = open("fifo", O_RDONLY | O_NONBLOCK); /* открыли канал на чтение*/ while (read (fd, &pid, sizeof(int)) == -1) ; printf("Server %d got message from %d !\n", getpid(), pid); close(fd); unlink("fifo");/*уничтожили именованный канал*/ return 0; }
/* процесс-клиент*/ #include <sys/types.h> #include <sys/stat.h> #include <unistd.h> #include <fcntl.h> int main(int argc, char **argv) { int fd; int pid = getpid( ); fd = open("fifo", O_RDWR); write(fd, &pid, sizeof(int)); close(fd); return 0; }