大数据所谓的分布式运算是指什么?

2025-05-01 18:35:14
推荐回答(3个)
回答1:

分布式计算是一种计算方法,和集中式计算是相对的。分布式计算将该应用分解成许多小的部分,分配给多台计算机进行处理。这样可以节约整体计算时间,大大提高计算效率。

分布式计算可以分为以下几类:

传统的C/S模型。如HTTP/FTP/SMTP/POP/DBMS等服务器。客户端向服务器发送请求,服务器处理请求,并把结果返回给客户端。客户端处于主动,服务器处于被动。

集群技术。一种称集群的技术出现了,它把多台服务器连接起来,当成一台服务器来用。这种技术的好处就是,不但对客户来说是透明的,对服务器软件来说也是透明的,软件不用做任何修改就可以在集群上运行。

通用型分布式计算环境。如CORBA/DCOM/ RMI/ DBUS等,这些技术(规范)差不多都有具有网络透明性,被调用的方法可能在另外一个进程中,也可能在另外一台机器上。调用者基本上不用关心是本地调用还是远程调用。

回答2:

分布式计算:和集中式计算是相对的一种计算方法

回答3:

这个问题中有两个关键词,‘大数据’和‘分布式运算’,其实包含了三个问题:‘什么是大数据’,什么是‘分布式运算’,以及‘什么是大数据处理的分布式运算’。
假设你已经知道了前面的两个问题(‘什么是大数据’,什么是‘分布式运算’)的答案的,因此只对第3个‘什么是大数据处理的分布式运算’做些回答;
大数据处理的最大特点是需要(计算)处理/参照的对象数据量的巨大。众所周知现在的计算机结构对待需要处理/参照的数据是需要放在与承担数据处理的CPU可直接交互(立刻调用)的存储器中。而每个CPU可直接交互的数据量有限,对大数据的处理方式就需要用多CPU的集群(并行运算)系统来处理。这种处理可以用超级计算机系统的大数据处理,但现在更多是用网络将大量的计算机(成千上万台)连接起来,实施分布式的集群运算来处理大数据。这里的分布,不只是CPU的分布,也是指存储器(磁盘或内存)的分布。将待处理的大数据分布在连接在网络上的存储器中,分布处理。现在的大数据分布式处理方式有Redis、Gemfire、SAP HANA……等等