大数据所谓的分布式运算是指什么？

2025-05-01 18:35:14

推荐回答（3个）

回答1：

分布式计算是一种计算方法，和集中式计算是相对的。分布式计算将该应用分解成许多小的部分，分配给多台计算机进行处理。这样可以节约整体计算时间，大大提高计算效率。

分布式计算可以分为以下几类：

传统的C/S模型。如HTTP/FTP/SMTP/POP/DBMS等服务器。客户端向服务器发送请求，服务器处理请求，并把结果返回给客户端。客户端处于主动，服务器处于被动。

集群技术。一种称集群的技术出现了，它把多台服务器连接起来，当成一台服务器来用。这种技术的好处就是，不但对客户来说是透明的，对服务器软件来说也是透明的，软件不用做任何修改就可以在集群上运行。

通用型分布式计算环境。如CORBA/DCOM/ RMI/ DBUS等，这些技术(规范)差不多都有具有网络透明性，被调用的方法可能在另外一个进程中，也可能在另外一台机器上。调用者基本上不用关心是本地调用还是远程调用。

回答2：

分布式计算：和集中式计算是相对的一种计算方法

回答3：

这个问题中有两个关键词，‘大数据’和‘分布式运算’，其实包含了三个问题：‘什么是大数据’，什么是‘分布式运算’，以及‘什么是大数据处理的分布式运算’。
假设你已经知道了前面的两个问题（‘什么是大数据’，什么是‘分布式运算’）的答案的，因此只对第3个‘什么是大数据处理的分布式运算’做些回答；
大数据处理的最大特点是需要（计算）处理/参照的对象数据量的巨大。众所周知现在的计算机结构对待需要处理/参照的数据是需要放在与承担数据处理的CPU可直接交互（立刻调用）的存储器中。而每个CPU可直接交互的数据量有限，对大数据的处理方式就需要用多CPU的集群（并行运算）系统来处理。这种处理可以用超级计算机系统的大数据处理，但现在更多是用网络将大量的计算机（成千上万台）连接起来，实施分布式的集群运算来处理大数据。这里的分布，不只是CPU的分布，也是指存储器（磁盘或内存）的分布。将待处理的大数据分布在连接在网络上的存储器中，分布处理。现在的大数据分布式处理方式有Redis、Gemfire、SAP HANA……等等