OpenBLAS 0.2.14 版本主要更新如下:
支持AMD Streamroller
增加ARM Cortex-A9和Cortex-A15目标
增加 openblas_get_num_threads 和 openblas_get_num_procs 函数接口
增加 ATLAS扩展风格的 ?geadd函数接
改进ger和gemv对于小规模矩阵性能
改进OpenBLASConfig.cmake配置
修正c/zsyr在incx为负数时的错误
修正清理CPU affinity设置时的race condition bug
更多内容请看这里:https://github.com/xianyi/OpenBLAS/releases/tag/v0.2.14。
OpenBLAS 是一个优化的 BLAS 库,基于 GotoBLAS2 1.13 BSD 版本。
BLAS(Basic Linear Algebra Subprograms 基础线性代数程序集)是一个应用程序接口(API)标准,用以规范发布基础线性代数操作的数值库(如矢量或矩阵乘法)。该程序集最初发布于1979年,并 用于建立更大的数值程序包(如LAPACK)。在高性能计算领域,BLAS被广泛使用。例如,LINPACK的运算成绩则很大程度上取决于BLAS中子程 序DGEMM的表现。为提高性能,各?硬件厂商则针对其?品对BLAS接口实现进行高度优化。
软件详情:http://xianyi.github.io/OpenBLAS/Changelog.txt
下载地址:https://github.com/xianyi/OpenBLAS/releases
来自:开源中国社区

