您现在的位置:网站首页答辩论文工学论文机械论文

并行处理平台的实现与应用修改后

  • 简介:(毕业论文 字数:15457 页数:40)摘 要:MATLAB的并行化是MATLAB在高性能计算环境下应用的一个难点. 本文介绍了MATLAB的并行化的一些基于消息传递接口的工具包.并且在视窗操作系统上对它们分别在多CPU服务器和网络集群两种并行计算平台上进行了应用开发...
    • 请与管理员联系购买资料 QQ:5739126
  • 论文简介
  • 相关论文
  • 论文下载

(毕业论文 字数:15457 页数:40)摘 要:MATLAB的并行化是MATLAB在高性能计算环境下应用的一个难点. 本文介绍了MATLAB的并行化的一些基于消息传递接口的工具包.并且在视窗操作系统上对它们分别在多CPU服务器和网络集群两种并行计算平台上进行了应用开发。首先对MPI程序在这两种平台上进行了应用实现。其次介绍了MatlabMPI和MPITB这两种MATLAB并行工具包在视窗操作系统上的移植。重点对Mathworks公司的分布式计算工具包v3.1作了介绍,并使用该工具包对研究特定目标散射特性的MATLAB应用程序进行了并行化实验。结果显示,该工具包可以方便方便快速的实现MATLAB串行程序的并行化,只需更改添加少量代码。但在并行效率上并不是很高,可能的原因是其对任务在多CPU上的分配与调度还不能达到理想的效果。对此还需要进一步的研究。


主题词:消息传递接口,并行计算,MATLAB 分布式计算工具

 

ABSTRACT :Parallel MATLAB is a difficulty in the application of high-performance computing environment.This paper introduces several toolbox for parallel MATLAB based on message passing interface(MPI).Make Application and development on two parallel computation environment,which are multiprocessor server and network cluster,both based on WINDOWS operating system. First,MPI application are running on both environment.Sencondly,introduces how to transplant MatlabMPI and MPITB, which are two parallel MATLAB toolbox,to WINDOWS operating system.At last,mainly introduces the Distributed Computing Tools(DCT) v3.1 of Mathworks and applicates it on a MATLAB programm on scattering characteristics of buried mines. The results show that DCT can facilitate parallelzation of MATLAB serial procedures rapidly, only by adding or changing a small amount of codes. However, the parallel efficiency is not very high. One possible reason is the allocation and scheduling of DCT still could not achieve the desired results. This requires further study.


Key Words:MPI Parallel Computing MATLAB Distributed Computing Tools

目 录
摘 要 i
ABSTRACT ii
第一章 并行环境介绍 1
1.1 并行计算系统的的类型 1
1.1.1共享存储器多处理器系统 1
1.1.2大规模并行计算机系统 2
1.1.3分布式共享存储器系统 3
1.1.4集群系统 5
1.2 实验平台描述 5
1.3串行程序的并行化 6
第二章 MPI在C/C++和MPICH2下的应用 6
2.1 什么是MPI 6
2.2 目前主要的MPI实现 7
2.3 MPICH2简介 8
2.3.1 MPICH2 for Microsoft Windows 的安装与配置 8
2.3.2 需要注意的事项 11
2.4 MPICH2 与编译环境的整合 12
2.5程序运行与测试 16
2.6 MPI的并行程序设计 17
2.7 MPI程序在MPICH2下的运行 21
2.7.1 MPI程序的运行步骤 21
2.7.2在服务器上运行 22
2.7.3在多台主机上运行 22
第三章 MPI在并行MATALB中的应用 23
3.1并行MATLAB 23
3.2MatlabMPI 23
3.3 MPITB 24
3.3 MATLAB Distribute Computing Toolbox 25
3.3.1 Distributed Computing Tools的发展历程 26
3.3.2 Distributed Computing Tools的主要功能 26
3.3.3 MATLAB中的并行程序开发 27
第四章 对特定目标散射特性应用程序的并行化 32
结 束 语 35
致 谢 36
参考文献 37

第一章 并行环境介绍
并行计算在大容量存储、大数据量计算中,可大幅度降低处理时间以提高效率。它不仅可进行大型科学工程计算,而且还可用于事务处理、网络与信息服务及决策支持等非科学计算的应用领域。目前,并行计算平台主要有四类:一基于共享存储的多处理器系统;二是大规模并行计算机系统;三是分布式共享存储器系统;四是集群系统。本次实验所采用的平台是共享存储的多处理器系统和一个小型集群试验平台.
1.1 并行计算系统的的类型
并行编程需要一个合适的计算平台,这一平台可以是具有多个处理器的单计算机或是多个互连的计算机.下面详细介绍一下并行计算机可能的内部布置.
1.1.1共享存储器多处理器系统
图1.1 是共享存储器多处理器系统的简单结构,它由处理单元、高速缓存、总线或交叉开关、共享内存以及I/O 等组成。
SMP 具有如下特征:
1. 对称共享存储:系统中的任何处理机均可直接访问任何内存模块的存储单元和I/O模块连接的I/O 设备,且访问的延迟、带宽和访问成功率是一致的。所有内存模块的地址单元是统一编码的,各个处理机之间的地位相同。操作系统可以运行在任意一个处理机上。
2. 单一的操作系统映像:全系统只有一个操作系统驻留在共享存储器中,它根据各个处理机的负载情况,动态分配各个处理机的负载,并保持每个处理机的负载均衡。
3. 局部高速缓存及其数据一致性:每个处理机均有自己的高速缓存,它们可以拥有独立的局部数据,但是这些数据必须保持与存储器中的数据是一致的。
4. 低通信延迟:各个进程根据操作系统提供的读/写操作,通过共享数据缓存区来完成处理机之间的通信,其延迟通常远小于网络通信的延迟。
5. 共享总线的带宽:所有处理机共享同一个总线带宽,完成对内存模块的数据和I/O设备的访问。
6. 支持消息传递、共享存储模式的并行程序设计。
SMP 具有如下缺点:
1. 欠可靠:总线、存储器或操作系统失效可导致系统全部瘫痪。
2. 可扩展性差:由于所有处理机共享同一个总线带宽,而总线带宽每3 年才增加2 倍,跟不上处理机速度和内存容量的发展步伐。因此,SMP 并行计算机系统的处理机个数一般少于64 个,也就只能提供每秒数百亿次的浮点运算性能。
SMP 的典型代表:
1. SGI Power Challenge XL 系列并行计算机(32 个MIPS R10000 微处理器)
2. COMPAQ Alphaserver 84005/440(12 个Alpha 21264 微处理器)
3. HP HP9000/T600(12 个HP PA9000 微处理器)
4. IBM RS6000/R40(8 个RS6000 微处理器)
1.1.2大规模并行计算机系统
图1.2 是一个大规模并行计算机系统的简单结构,它是并行计算机发展过程中的主力,现在已经发展到由上万个处理机构成一个系统,随着并行计算机的发展,几十万个处理机的超大规模系统也会在不久的将来问世。
MPP 的特点:
1. 节点数量多,成千上万,这些节点由局部网卡通过高性能互联网络连接。
2. 每个节点都相对独立,并拥有一个或多个微处理机。这些微处理机都有局部高速缓存,并通过局部总线或互联网络与局部内存模块和I/O 设备相连接。
3. MPP 的各个节点均拥有不同的操作系统映像,一般情况下,用户可以将作业提交给作业管理系统,由它来调度当前系统中有效的计算节点来执行该作业。同时,MPP系统也允许用户登录到指定的节点,或到某些特定的节点上运行作业。
4. 各个节点上的内存模块是相互独立的,且不存在全局内存单元的统一硬件编址。一般情况下,各个节点只能直接访问自身的局部内存模块。如果需要直接访问其它节点的内存模块,则必须有操作系统提供特殊的软件支持。
MPP 的典型代表:
1. ICT Dawning 1000(32 个处理机);
2. IBM ASCI White(8192 个处理机);
3. Intel ASCI Red(9632 个处理机);
4. Cray T3E(1084 个处理机)
1.1.3分布式共享存储器系统
图1.3 是分布共享存储处理机系统,DSM 较好地改善了SMP 的可扩展能力,是目前高性能计算机的主流发展方向之一。
DSM 的特点:
1. 并行计算机以节点为单位:每个节点由一个或多个CPU 组成,每个CPU 拥有自己的局部高速缓存(Cache),并共享局部存储器和I/O 设备,所有节点通过高性能网络互联。
2. 物理上分布存储:内存模块局部在各节点中,并通过高性能网络相互连接,避免了SMP 访存总线的带宽瓶颈,增强了并行计算机系统的可扩展能力。
3. 单一的内存地址空间:尽管内存模块分布在各个节点,但是所有这些内存模块都由硬件进行了统一编址,并通过互联网络联接形成了并行计算机的共享存储器。各个节点既可以直接访问局部内存单元,又可以访问其它节点的局部存储单元。
4. 非一致内存访问(NUMA)模式:由于远端访问必须通过高性能互联网络,而本地访问只需直接访问局部内存模块。因此远端访问的延迟一般是本地访问延迟的3 倍左右。
5. 单一的操作系统映像:类似于SMP,在DSM 并行计算机中,用户只看到一个操作系统,它可以根据各个节点的负载情况,动态地分配进程。
6. 基于高速缓存的数据一致性:通常采用基于目录的告诉缓存一致性协议来保证各节点的局部高速缓存数据与存储器中的数据是一致的。同时,我们称这种DSM 并行计算机结构为CC-NUMA 结构。
7. 低通信延迟与高通信带宽:专用的高性能互联网络使得节点间的访问延迟很小,通信带宽可以扩展。例如,目前最具代表性的DSM 并行计算机SGI Origin 3000,它的双向点对点带宽可达3.2GB/秒,而延迟小于1 个微秒。
8. 可扩展性高:DSM 并行计算机可扩展到上千个节点,能提供每秒数万亿次的浮点运算性能。
9. 支持消息传递、共享存储并行程序设计。
DSM 的典型代表:
1. SGI Origin 2000、3000、3800;
2. SGI Altix。

查看评论 已有0位网友发表了看法
  • 验证码: