欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

Pyspark讀取parquet數(shù)據(jù)過程的示例分析-創(chuàng)新互聯(lián)

這篇文章主要介紹了Pyspark讀取parquet數(shù)據(jù)過程的示例分析,具有一定借鑒價(jià)值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

成都創(chuàng)新互聯(lián)公司專注于常山企業(yè)網(wǎng)站建設(shè),響應(yīng)式網(wǎng)站建設(shè),商城建設(shè)。常山網(wǎng)站建設(shè)公司,為常山等地區(qū)提供建站服務(wù)。全流程定制網(wǎng)站設(shè)計(jì),專業(yè)設(shè)計(jì),全程項(xiàng)目跟蹤,成都創(chuàng)新互聯(lián)公司專業(yè)和態(tài)度為您提供的服務(wù)

parquet數(shù)據(jù):列式存儲(chǔ)結(jié)構(gòu),由Twitter和Cloudera合作開發(fā),相比于行式存儲(chǔ),其特點(diǎn)是:

可以跳過不符合條件的數(shù)據(jù),只讀取需要的數(shù)據(jù),降低IO數(shù)據(jù)量;壓縮編碼可以降低磁盤存儲(chǔ)空間,使用更高效的壓縮編碼節(jié)約存儲(chǔ)空間;只讀取需要的列,支持向量運(yùn)算,能夠獲取更好的掃描性能。

那么我們怎么在pyspark中讀取和使用parquet數(shù)據(jù)呢?我以local模式,linux下的pycharm執(zhí)行作說明。

首先,導(dǎo)入庫文件和配置環(huán)境:

import os
from pyspark import SparkContext, SparkConf
from pyspark.sql.session import SparkSession

os.environ["PYSPARK_PYTHON"]="/usr/bin/python3" #多個(gè)python版本時(shí)需要指定

conf = SparkConf().setAppName('test_parquet')
sc = SparkContext('local', 'test', conf=conf)
spark = SparkSession(sc)

然后,使用spark進(jìn)行讀取,得到DataFrame格式的數(shù)據(jù):host:port 屬于主機(jī)和端口號

parquetFile = r"hdfs://host:port/Felix_test/test_data.parquet"
df = spark.read.parquet(parquetFile)

而,DataFrame格式數(shù)據(jù)有一些方法可以使用,例如:

1.df.first() :顯示第一條數(shù)據(jù),Row格式

print(df.first())

Pyspark讀取parquet數(shù)據(jù)過程的示例分析

2.df.columns:列名

3.df.count():數(shù)據(jù)量,數(shù)據(jù)條數(shù)

4.df.toPandas():從spark的DataFrame格式數(shù)據(jù)轉(zhuǎn)到Pandas數(shù)據(jù)結(jié)構(gòu)

5.df.show():直接顯示表數(shù)據(jù);其中df.show(n) 表示只顯示前n行信息

6.type(df):顯數(shù)據(jù)示格式

Pyspark讀取parquet數(shù)據(jù)過程的示例分析

感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享的“Pyspark讀取parquet數(shù)據(jù)過程的示例分析”這篇文章對大家有幫助,同時(shí)也希望大家多多支持創(chuàng)新互聯(lián),關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,更多相關(guān)知識等著你來學(xué)習(xí)!

網(wǎng)站題目:Pyspark讀取parquet數(shù)據(jù)過程的示例分析-創(chuàng)新互聯(lián)
網(wǎng)址分享:http://www.aaarwkj.com/article42/jeehc.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供軟件開發(fā)網(wǎng)站排名、云服務(wù)器、建站公司、網(wǎng)站改版、虛擬主機(jī)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

網(wǎng)站托管運(yùn)營
亚洲少妇精品视频在线| 啄木乌欧美一区二区三| 国产伦理在线观看一区二区| 亚洲中文有码在线播放| 片子免费毛片日韩不卡一区| 亚洲精品中的亚洲精品| 日韩特级黄片在线免费观看| 久久免费欧美日韩亚洲| 91午夜福利国产精品| 日本一区二区三区免费不卡视频 | 日本高清av一区二区| 一区二区尤物区亚洲国产精品区 | 色婷婷精品一区二区三区| 九九视频免费在线播放| 国产成人亚洲精品专区高清| jvid视频在线观看免费| 日韩精品少妇一区二区在线看| 国产成人拍国产亚洲精品| 日韩x级av免费在线观看| 91人妻这里只有精品| 尤物在线观看视频播放| 99热成人精品热久久| 国产v精品欧美精品v日韩| 99久久中文字幕伊人| 中文字幕日韩av综合在线| 一区二区少妇黄色三区| 日韩在线不卡视频一区 | 欧美精品国产精品久久| 亚洲成年人黄色在线观看| 高清免费国产日日操夜夜草| 97色伦综合在线欧美| 日韩精品在线中文字幕| 久国产亚洲精品久久久极品| 天天操天天夜夜操夜夜| 亚洲免费小视频在线观看| 亚洲精品精品一区二区| 人妻中文字幕在线看粉嫩| av熟女一区二区三区| 日本午夜一区二区在线观看| 亚洲激情久热中文字幕| 97国产在线视频观看|