MPI – Silveira Neto

MPI Ã© a sigla para Message Passing Interface, um padrÃ£o de comunicaÃ§Ã£o de dados para computaÃ§Ã£o paralela. O MPI oferece diversas abstracÃ§Ãµes que facilitam e padronizam o desenvolvimento de aplicaÃ§Ãµes paralelas. Por exemplo, vocÃª pode programar para vÃ¡rios processadores, nÃ³s de um cluster, supercomputadores ou Internet utilizando a mesma infraestrutura transparentemente.

Supercomputador Nasa
Cluster Columbia da NASA, com 1024 nÃ³s.

Como MPI Ã© um padrÃ£o, existem vÃ¡rios padrÃµes de implementaÃ§Ã£o, abertas, fechadas, comerciais ou gratuitas. MPI Ã© definido a princÃpio para C e Fortran, mas hÃ¡ implementaÃ§Ãµes em outras linguagens como Java ou Python, por exemplo. A implementaÃ§Ã£o que eu vou utilizar nesse exemplo Ã© a OpenMPI.

A notÃcia boa Ã© que vocÃª nÃ£o precisa ter um supercomputador em casa para aprender e praticar computaÃ§Ã£o paralela, uma mÃ¡quina domÃ©stica serve. Se vocÃª tiver uma mÃ¡quina com mÃºltiplos processadores, melhor ainda.

InstalaÃ§Ã£o

Para instalar um ambiente de desenvolvimento para MPI no Ubuntu Linux basta um comando:

sudo apt-get install build-essential openmpi-dev

Isso vai instalar um conjunto bÃ¡sico de compiladores e o ambiente OpenMPI.

O cÃ³digo

Vamos criar um arquivo chamado ola.c com o conteÃºdo:

#include
#include
int size, rank;
int main(int argc, char *argv[]){
   MPI_Init(&argc,&argv);
   MPI_Comm_size(MPI_COMM_WORLD,&size);
   MPI_Comm_rank(MPI_COMM_WORLD,&rank);
   printf("Oi. Eu sou o processo %d de %d\n", rank, size);
   MPI_Finalize();
}

CompilaÃ§Ã£o

Para compilar esse cÃ³digo vamos usar o comando mpicc que foi instalado junto com o pacote openmpi-dev. Ele Ã© uma interface para o gcc, e vai cuidar de toda a linkagem com as bibliotecas do MPI. VocÃª pode usar os parÃ¢metros do gcc com o mpicc.

mpicc ola.c -o ola

Se tudo der certo esse comando vai criar o binÃ¡rio ola.

ExecuÃ§Ã£o

Outra ferramenta importante Ã© o mpirun, que levantar o mpi nos diversos nÃ³s e mandar cada nÃ³ executar o binÃ¡rio. O mpirun nÃ£o precisa de um programa mpi para rodar, por exemplo, se dermos esse comando:

mpirun -np 4 echo oi

VocÃª vai ter essa saÃda:

oi
oi
oi
oi

VocÃª mandou 4 nÃ³s (-np 4) executar o comando echo oi (imprime oi). Para mandar 5 nÃ³s executarem nosso binÃ¡rio ola:

mpirun -np 5 ola

E vamos ter uma saÃda mais ou menos assim:

Oi. Eu sou o processo 1 de 5
Oi. Eu sou o processo 4 de 5
Oi. Eu sou o processo 0 de 5
Oi. Eu sou o processo 2 de 5
Oi. Eu sou o processo 3 de 5

Por que as saÃdas sairam desordenadas? Porque elas rodaram em paralelo e nÃ£o temos como saber qual foi sua ordem de execuÃ§Ã£o. Assim cada nÃ³ entrou no printf em um momento diferente e imprimiu seu rank e seu size naquele momento. VocÃª pode experimentar usar o parÃ¢metro -np com outros nÃºmeros maiores ou menores que 5.

Troca de Mensagens

AtÃ© aqui nÃ£o hÃ¡ muita graÃ§a porque nÃ£o hÃ¡ troca de mensagens. HÃ¡ muito o que se dizer sobre como trocar mensagens do MPI mas a maneira mais fÃ¡cil de se comeÃ§ar Ã© com a funÃ§Ã£o mpi_send.

Vamos fazer um programa bem simples onde o nÃ³ 0 vai mandar uma mensagem para o nÃ³ 1. A mensagem vai ser um nÃºmero, 42. Criemos um arquivo chamado msg.c com o cÃ³digo:

#include
#include

int size, rank, msg, source, dest, tag;

int main(int argc, char *argv[]){
   MPI_Status stat;

   MPI_Init(&argc,&argv);
   MPI_Comm_size(MPI_COMM_WORLD,&size);
   MPI_Comm_rank(MPI_COMM_WORLD,&rank);

	if(rank==0){
   	msg = 42; dest = 1; tag = 0;
   	MPI_Send(&msg, 1, MPI_INT, dest, tag, MPI_COMM_WORLD);
   	printf("Processo %d enviou %d para %d.\n", rank, msg, dest);
	}

	if(rank==1){
		source = 0; tag = 0;
		MPI_Recv(&msg, 1, MPI_INT, source, tag, MPI_COMM_WORLD, &stat);
		printf("Processo %d recebeu %d de %d.\n", rank, msg, source);
	}

   MPI_Finalize();
}

No processo de rank 0 vamos enviar o conteÃºdo da variÃ¡vel inteira msg para o processo de rank 1. Note que no processo de rank 1, o valor de msg nÃ£o estÃ¡ definido. O comando MPI_Send vai receber 6 parÃ¢metros.

int MPI_Send( void *buf, int count, MPI_Datatype datatype, int dest, int tag, MPI_Comm comm)

void *buf, um ponteiro para a mensagem que vocÃª vai mandar. No nosso caso a variÃ¡vel inteira msg.
int count, a quantidade de elementos que tem nessa mensagem. No nossa caso sÃ³ 1. Se quisemos mandar um vetor de dois inteiros, seria 2.
MPI_Datatype datatype, uma constante que define o tipo de dados que vocÃª estÃ¡ enviando. No nosso caso MPI_INT. Isso evita que ajam incompatibilidade no tamanho de inteiros entre arquiteturas diferentes.
int dest, o rank do nÃ³ destino, o destinatÃ¡rio. No nosso caso o nÃ³ 1.
int tag, a tag seria num email o assunto da mensagem. Estamos mandando tag 0 entÃ£o no outro lado tem que estar esperando uma tag 0, caso contrÃ¡rio nÃ£o hÃ¡ comunicaÃ§Ã£o.
MPI_Comm comm, o comunicador. Nesse e na maioria dos casos a constante MPI_COMM_WORLD.

Do outro lado, no processo 1 vamos usar o MPI_recv, que recebe 7 parÃ¢metros.

int MPI_Recv( void *buf, int count, MPI_Datatype datatype, int source, int tag, MPI_Comm comm, MPI_Status *status)

void *buf, um ponteiro para onde vai ser guardada a mensagem que vamos receber. No nosso caso a variÃ¡vel msg, que no processo 1 estÃ¡ vazia.
int count, a quantidade de elementos que vem nessa mensagem.
MPI_Datatype datatype, a mesma constante do MPI_send.
int source, o rank do nÃ³ remetente. No nosso caso o nÃ³ 0.
int tag, a tag da mensagem conforme explicado no MPI_send.
MPI_Comm comm, o comunicador.
MPI_Status *status, uma estrutura para que depois que a funÃ§Ã£o for executada vocÃª possa inspecionar detalhes da transmissÃ£o. No nosso caso ela Ã© inÃºtil.

Para compilar esse exemplo usamos novamente o mpicc.

mpicc msg.c -o msg

E para executa-lo o mpirun.

mpirun -np 2 msg

O programa vai escrever essa mensagem:

Processo 0 enviou 42 para 1.
Processo 1 recebeu 42 de 0

No processo 1 a msg estava inicialmente vazia e no processo 0 havia 42, mas depois do MPI_recv o processo 1 pode escrever o conteÃºdo 42 de msg. Logo, houve comunicaÃ§Ã£o.

Dicas

Por um problema no empacotamento do mpich no Ubuntu toda vez que vocÃª executa o MPI vocÃª recebe umas mensagens horrorosas de erro, que na verdade sÃ£o sÃ³ um aviso que ele nÃ£o encontrou uma placa de rede Infiniband.

Para vocÃª silenciar na unha essa chatice use o mpirun assim:

mpiexec –mca btl ^openib -np 1 executÃ¡vel

Onde -np 1 deve ser substituido pelo seu nÃºmero de processos e executÃ¡vel pelo seu executÃ¡vel.

Outra dica Ã© que vocÃª pode utilizar uma distribuiÃ§Ã£o Linux que jÃ¡ venha com o MPI instalado. Por exemplo o Scientific Linux ou o Parallel Knoppix.

Tag: MPI

High-performance Computing and Opensolaris

OlÃ¡ Mundo Paralelo com MPI