如果有人问你何为一个好的Matlab程序?你是不是会说耗时少、消耗内存小、可读性高、可靠性强,可移植/维护/拓展等等。那么,你最在意是哪条呢?
通常Matlab程序并不是最终产品,仅是产品开发流程中的一个中间验证环节,不需要直接面向广大消费者。此时,你通常会不注重Matlab对内存的消耗,直接使用其默认的占八个字节的双精度数据类型。如果编程时遇到内存消耗和耗时出现冲突时,你还会以付出内存为代价来减少仿真时间。
开发效率属于高效编程的范畴,如果你是为了验证一个问题而临时编程,以后不会再用的话,就没必要耗费过多的精力在高效编程上。但是,如果Matlab仿真耗时的多少会严重影响到整个产品的开发进度,那么减少仿真时间就十分必要了。
今天,我们将和大家聊一聊在兼顾其他优良编程习惯的同时可以在减少Matlab仿真耗时上的“小常识”。在探讨之前,我们首先要知道如何评估一段程序仿真需要的时间。
评估运行时间的方法最简单的方法就是在你需要计算的代码前加tic,在代码后加toc,测算tic和toc之间代码的耗时。但是,如果你需要详细统计程序中每个函数的耗时,那么你还可以采用profile工具来评估。
数据类型的选择在大多数情况下,Matlab数据类型为占用8个字节的双精度型,这除了会占用较多内存,还可能拖慢程序的运行速度。其实常用的数据类型除了数值型,还有逻辑型(logical)、字符型(char)、结构体型(struct)等等。数值型包括整型、单精度型和双精度型,整型又可分成多种。
不同的数据类型在存储和访问效率上各不相同,选择合适的数据类型除了可以节省内存空间,还可以提升运行速度。另外,某一个变量在改变数据类型时会消耗额外的时间,因此还不如重新建一个新变量。
预分配内存我们知道Matlab可以在不定义变量时可以直接赋值,这种规则给我们带来了方便,但同时也带来了一些容易被忽视的问题。在循环体中,如果没有预先为某一矩阵分配内存空间,而该矩阵会随着循环变化,那么它将在每次循环时都浪费额外的时间去寻找满足需求的内存空间,将改变大小后的矩阵整体移动到这个新的内容空间中,并释放原来的内存空间,这除了会影响代码的运行效率,还容易形成内存碎片,让程序越来越难找到满足条件的内存。
因此在循环前给矩阵预分配内存是很一个良好的习惯,如果没有这个习惯,你还可以通过Matlab自带的代码检查器来查看是否存在类似问题。
列优先在Matlab中矩阵的存储是按列优先的,并且下标是从1开始的,这二点是与C++是不同的,需要初学者稍加注意。对于矩阵的操作,可以通过下标索引,也可以通过线性索引来访问元素,由于Matlab是按列优先存储的,则其线性索引是按列递增的。如果处理时按列操作会比按行操作提升程序的运行效率哦。
向量化编程代替“循环”矩阵运算是Matlab的优势,因此能用矩阵就少用循环吧,即使Matlab对循环引入了加速技术JIT和accelerator。当然也不需要一味的追求矩阵运算,循环可以用,但需要考虑循环体内的代码执行方式。例如循环次数多的尽量在内层,少的在外层,每次循环做较多的数据处理,尽量减少循环次数。
Matlab在矩阵运算中极为快速,是因为其底层调用了BLAS库和LAPACK库。LAPACK是高性能线性代数计算库,用于求解科学与工程计算中常见的线性代数问题,例如矩阵乘法、线性最小二乘问题、特征值问题等。BLAS库是基础线性代数程序集。
并行编程并行处理大家并不陌生,这个将在后面重点介绍,今天就不展开了。