问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

如何运行含spark的python脚本

发布网友 发布时间:2022-04-23 20:27

我来回答

2个回答

懂视网 时间:2022-04-07 15:44

spark能跑Python么?

spark是可以跑Python程序的。python编写好的算法,或者扩展库的,比如sklearn都可以在spark上跑。直接使用spark的mllib也是可以的,大部分算法都有。

Spark 是一个通用引擎,可用它来完成各种各样的运算,包括 SQL 查询、文本处理、机器学习等。

本次实验是搭有spark环境的linux下跑的,spark版本为1.6.1,相当于在在spark本地执行,spark文件放在/opt/moudles/spark-1.6.1/(代码中会看到)

编写python测试程序

#test.py文件
# -*- coding:utf-8 -*-
import os
import sys
#配置环境变量并导入pyspark
os.environ['SPARK_HOME'] = r'/opt/moudles/spark-1.6.1'
sys.path.append("/opt/moudles/spark-1.6.1/python")
sys.path.append("/opt/moudles/spark-1.6.1/python/lib/py4j-0.9-src.zip")
from pyspark import SparkContext, SparkConf
appName ="spark_1" #应用程序名称
master= "spark://hadoop01:7077"#hadoop01为主节点hostname,请换成自己的主节点主机名称
conf = SparkConf().setAppName(appName).setMaster(master)
sc = SparkContext(conf=conf)
data = [1, 2, 3, 4, 5]
distData = sc.parallelize(data)
res = distData.reduce(lambda a, b: a + b)
print("===========================================")
print (res)
print("===========================================")

执行python程序

执行如下命令

python test.py

执行与结果分别如下图所示:

5c215f4eef961abbbcdf3c133b9627d.pngea2bb47185bbe3d22162bcee830cbca.png

热心网友 时间:2022-04-07 12:52

1、Spark脚本提交/运行/部署1.1spark-shell(交互窗口模式)运行Spark-shell需要指向申请资源的standalonespark集群信息,其参数为MASTER,还可以指定executor及driver的内存大小。sudospark-shell--executor-memory5g--driver-memory1g--masterspark://192.168.180.216:7077spark-shell启动完后,可以在交互窗口中输入Scala命令,进行操作,其中spark-shell已经默认生成sc对象,可以用:valuser_rdd1=sc.textFile(inputpath,10)读取数据资源等。1.2spark-shell(脚本运行模式)上面方法需要在交互窗口中一条一条的输入scala程序;将scala程序保存在test.scala文件中,可以通过以下命令一次运行该文件中的程序代码:sudospark-shell--executor-memory5g--driver-memory1g--masterspark//192.168.180.216:7077
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
电脑文件编辑好如何发送给微信如何把电脑上的文件发到微信上 笔记本电脑上的文件发送到微信怎么把电脑里的文件传到手机微信 我每天早晨吃米糊放白糖有害吗? 吃糖太多对我有好处么! 适合明年工作计划开头的句子 让人耳目一新的年度工作计划开头句子锦集五十四句 个人年度工作计划开头优美句子 让上司眼前一亮的工作计划开头语收藏四十一句 工作计划开头 怎么写工作计划开头 新干线0系电动列车的运行设备 江苏昆山的电话区号是多少? spark输出log信息中怎么过滤INFO信息 0520 是不是一个区号? Spark-shell和Spark-submit提交程序的区别 昆山电话的区号? 安装spark需要安装scala吗 ubuntu 16.04怎么配置spark环境 spark集群搭建时报TimeoutException是怎么回事 如何在Ubuntu下搭建Spark集群 spark独立模式还需要编译吗 spark 怎么启动worker spark 4040页面 不能访问。如果使用的是spark-shell启动写程序,4040可 ... 求助,spark 提交任务到集群报错 spark必须要hadoop吗 在linux上如何配置spark环境,在linux上安装scala和spark老是失败_百度... maven中${spark.version}是什么意思? spark加载hadoop本地库的时候出现不能加载的情况要怎么解决 最新的spark支持python的什么版本 spark打开spark-shell报错 复合函数二阶偏导数问题 昆山区号是多少 sparksession 作用域 常熟电话区号是0512还是0520? 0520这个区号为什么不是给泰州市而是给了苏州下面的昆山市啊?泰州的邮政编码是225300,像扬州的地级市 江苏省区号 全国各地区号多少? 谁知到中国各个区的区号是多少 请问0520开头短消息不是电话号码那是什么? 0520是哪里的区号 常熟区号 打耳洞的时候变成“洞”的肉到哪儿去了? 耳洞变成这样需要做任何处理吗? 我耳洞还能好吗 怎么变成这样了? 耳洞变成这样了,怎么处理才能痊愈啊 耳洞变成这样怎么处理? 我想问一下耳洞打了两三天后,耳洞洞里发黑是什么原因 该怎么办? 玉米野钓鲫鱼怎么钓 我的耳洞变成了这样 急急急!!!耳洞在昨天突然变成这样!是发炎了吗?! 耳洞变成这样是耐心养好还是放弃