我们是调用jblas来实现的。大矩阵和小矩阵的运算,将小矩阵广播到各个节点,对大矩阵每一行进行map,在节点用Jblas的函数计算向量和矩阵的乘积。大矩阵和大矩阵,将两个矩阵分块乘积,不过矩阵太大速度慢成狗了