您现在的位置是：首页 > 大数据

当前栏目

大数据IMF传奇行动 Spark pi 例子计算解析百万次的运算

计算数据 Spark 解析例子运算百万行动

2023-09-27 14:26:48 时间

圆周率pi的计算：

1、原理
r是圆的半径
圆的面积公式：C = π × r^2 圆面积=x^2+y^2
正方形面积公式：S = k^2
边长为1的1/4的圆面积 π*1^2 /4；
边长为1的正方形面积 1

那设想边长为1的1/4的圆中的某个点落到边长为1的正方形中的概率为p，则p=（π*1^2 /4）/1 ，即π=4p；p为概率，

也可设想边长为1的圆面积π × 1^2，边长为2的正方形面积2*2=4，圆中点落入正方形的概率p=π/4，即π=4p；p为概率，

2、这样，π就转化成了概率的计算，体现大数据并行计算的优势，计算更多的点落入到1/4圆中，计算量越大，π值越准确

3、源代码：
package org.apache.spark.examples

import scala.math.random

import org.apache.spark._

/** Computes an approximation to pi */
object SparkPi {
def main(args: Array[String]) {
    val conf = new SparkConf().setAppName("Spark Pi")
    val spark = new SparkContext(conf)
    val slices = if (args.length > 0) args(0).toInt else 2 //分片数
    val n = math.min(100000L * slices, Int.MaxValue).toInt //为避免溢出，n不超过int的最大值
    val count = spark.parallelize(1 until n, slices).map { i =>
      val x = random * 2 - 1 //小于1的随机数
      val y = random * 2 - 1   //小于1的随机数
      if (x*x + y*y < 1) 1 else 0 // 点落到圆的值，小于1计一次，大于1超出了圆面积就不算
    }.reduce(_ + _)   //汇总累加落入圆中的次数
    println("Pi is roughly " + 4.0 * count / n) //   count / n是概率，count落入圆中次的数，n是总次数；
    spark.stop()
}
}

4、spark运行1万次pi，jvm可以复用的，时间耗时秒级；
   如果hadoop mr 运行1万次，需要1万台设备，jvm不复用，耗时2天
   spark运行1百万次，时间也很快，强大的计算优势！

本地的小测试

scala> :paste
// Entering paste mode (ctrl-D to finish)

val count = (1 until 10).map { i =>
      val x = random * 2 - 1
      val y = random * 2 - 1
      if (x*x + y*y < 1) 1 else 0
    }.reduce(_ + _)

// Exiting paste mode, now interpreting.

count: Int = 8

scala> count
res2: Int = 8

scala> (1 until 10).map(println)
1
2
3
4
5
6
7
8
9
res5: scala.collection.immutable.IndexedSeq[Unit] = Vector((), (), (), (), (), (
), (), (), ())

猜你喜欢

LDO和DC-DC的概念，区别及优缺点
敌人的敌人就是朋友——微软小冰进驻小米、易信
博文周刊第6期 | 程序员 30 岁前，该如何规划自己的职业发展?
【BZOJ3529】[Sdoi2014]数表莫比乌斯反演+树状数组
PHP 解析 ini 文件支持多维数组解析，读取 .env 文件进行解析
iOS判断iPhone型号
linux【网络】如何优化 NAT 性能？
nginx配置
关于Pandas的DataFrame建立数据问题
插入排序
训练过程中动态输出当前数据占总数据的百分比
MySQL 5.6 记录 SQL 语句与慢查询
普通service和无头service的区别是什么，为什么需要无头service
grafana 安装和 Nginx 、EL 联调
python知识点
该优化针对Linux X86_X64环境
SwiftUI 列表实现右侧悬停选择ScrollViewReader（原生实现Alphabet）
习题 7: 更多打印
H3C HDLC协议特点

相关主题

数据实时计算
云计算的好处
什么是云计算
计算虚拟化
Oracle 云计算
计算球体积
云计算与边缘计算
2020，云计算这一年
云计算和边缘计算
云计算热的深思考
元数据元数据
04-云计算安全
云原生计算
表格计算
计算字段示例

zl程序教程

当前栏目

大数据IMF传奇行动 Spark pi 例子计算解析百万次的运算

相关文章

当前栏目

大数据IMF传奇行动 Spark pi 例子计算 解析 百万次的运算

相关文章

大数据IMF传奇行动 Spark pi 例子计算解析百万次的运算