亚洲 国产精品 日韩-亚洲 激情-亚洲 欧美 91-亚洲 欧美 成人日韩-青青青草视频在线观看-青青青草影院

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

手機(jī)站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時(shí)隨地免費(fèi)學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時(shí)隨地免費(fèi)學(xué)習(xí)課程

當(dāng)前位置:首頁(yè)  >  技術(shù)干貨  > 大數(shù)據(jù)面試題:經(jīng)典面試題答疑(三)

大數(shù)據(jù)面試題:經(jīng)典面試題答疑(三)

來(lái)源:千鋒教育
發(fā)布人:syq
時(shí)間: 2022-06-08 16:27:00 1654676820

  大數(shù)據(jù)經(jīng)典面試題答疑---經(jīng)常問(wèn)的原理問(wèn)題總結(jié)(系列文章,持續(xù)更新),幫你解決大數(shù)據(jù)開(kāi)發(fā)中的困擾。

  1. hive+MapReduce

  答案區(qū):

  1. hive+MapReduce

  Hive不支持行級(jí)數(shù)據(jù)的插入、更新和刪除,也不支持事務(wù)操作;

  1.1. MapReduce的join過(guò)程

wpsovWTMc

  (1):利用DistributedCache將小表分發(fā)到各個(gè)節(jié)點(diǎn)上,在Map過(guò)程的setup()函數(shù)里,讀取緩存里的文件,只將小表的連接鍵存儲(chǔ)在hashSet中。

  (2):在map()函數(shù)執(zhí)行時(shí),對(duì)每一條數(shù)據(jù)進(jìn)行判斷(包含小表數(shù)據(jù)),如果這條數(shù)據(jù)的連接鍵為空或者在hashSet里不存在,那么則認(rèn)為這條數(shù)據(jù)無(wú)效,這條數(shù)據(jù)也不參與reduce的過(guò)程。

  1.2. hive的SQL解析過(guò)程

01

  詞法、語(yǔ)法解析: Antlr 定義 SQL 的語(yǔ)法規(guī)則,完成 SQL 詞法,語(yǔ)法解析,將 SQL 轉(zhuǎn)化為抽象語(yǔ)法樹 AST Tree;

  語(yǔ)義解析: 遍歷 AST Tree(抽象語(yǔ)法樹,抽象語(yǔ)法結(jié)構(gòu)的樹狀),抽象出查詢的基本組成單元 QueryBlock;

  生成邏輯執(zhí)行計(jì)劃: 遍歷 QueryBlock,翻譯為執(zhí)行操作樹 OperatorTree;

  優(yōu)化邏輯執(zhí)行計(jì)劃: 邏輯層優(yōu)化器進(jìn)行 OperatorTree 變換,合并 Operator,達(dá)到減少 MapReduce Job,減少數(shù)據(jù)傳輸及 shuffle 數(shù)據(jù)量;

  生成物理執(zhí)行計(jì)劃: 遍歷 OperatorTree,翻譯為 MapReduce 任務(wù);

  優(yōu)化物理執(zhí)行計(jì)劃: 物理層優(yōu)化器進(jìn)行 MapReduce 任務(wù)的變換,生成最終的執(zhí)行計(jì)劃。

  1.3. hive數(shù)據(jù)導(dǎo)入

  load data inpath '/hadoop/guozy/data/user.txt' into table external_table;

  此處是移動(dòng)(非復(fù)制),移動(dòng)數(shù)據(jù)非常快,不會(huì)對(duì)數(shù)據(jù)是否符合定義的Schema做校驗(yàn),這個(gè)工作通常在讀取的時(shí)候進(jìn)行(即Schema on Read)

  1.4. 內(nèi)部表與外部表的不同

  1.創(chuàng)建外部表需要添加 external 字段。而內(nèi)部表不需要。

  2.刪除外部表時(shí),HDFS中的數(shù)據(jù)文件不會(huì)一起被刪除。而刪除內(nèi)部表時(shí),表數(shù)據(jù)及HDFS中的數(shù)據(jù)文件都會(huì)被刪除。

  3.內(nèi)部表與外部表如果不指定location,默認(rèn)使用hive.metastore.warehouse.dir指定的路徑

  1.5. 分區(qū)和分桶

  1.5.1. 分區(qū)

  指的就是將數(shù)據(jù)按照表中的某一個(gè)字段進(jìn)行統(tǒng)一歸類,并存儲(chǔ)在表中的不同的位置,也就是說(shuō),一個(gè)分區(qū)就是一類,這一類的數(shù)據(jù)對(duì)應(yīng)到hdfs存儲(chǔ)上就是對(duì)應(yīng)一個(gè)目錄。

  1.5.1.1. 靜態(tài)分區(qū)

  數(shù)據(jù)已經(jīng)按某些字段分完區(qū)放在一塊,建表時(shí)直接指定分區(qū)即可。

  create table enter_country_people(id int,name string,cardNum string)

  partitioned by (enter_date string,country string);

  注意,這里的分區(qū)字段不能包含在表定義字段中,因?yàn)樵谙虮碇衛(wèi)oad數(shù)據(jù)的時(shí)候,需要手動(dòng)指定該字段的值.

  數(shù)據(jù)加載(指定分區(qū)):

  load data inpath '/hadoop/guozy/data/enter__china_people' into table enter_country_people partition (enter_date='2019-01-02',country='china');

  此處自動(dòng)創(chuàng)建分區(qū)目錄;

  創(chuàng)建完后目錄結(jié)構(gòu):

wpsdJ7hIU

  其他創(chuàng)建分區(qū)目錄的方法:

  1.alter table enter_country_people add if not exists partition (enter_date='2019-01-03',country='US');

  2.在相應(yīng)的表目錄下創(chuàng)建分區(qū)目錄后,執(zhí)行 msck repair table table_name;

  1.5.1.2. 動(dòng)態(tài)分區(qū)

  建表相同,主要是加載數(shù)據(jù)方式不同,動(dòng)態(tài)分區(qū)是將大雜燴數(shù)據(jù)自動(dòng)加載到不同分區(qū)目錄。

  1.開(kāi)啟非嚴(yán)格模式

  2.需要從另一張hive表查詢

  set hive.exec.dynamic.partition.mode=nonstrict;

  insert into table enter_country_people(user string,age int) partition(enter_date,country) select user,age,enter_date,country from enter_country_people_bak;

  1.5.2. 分桶表

  如果兩個(gè)表根據(jù)相同的字段進(jìn)行分桶,則在對(duì)這兩個(gè)表進(jìn)行關(guān)聯(lián)的時(shí)候可以使用map-side關(guān)聯(lián)高效實(shí)現(xiàn)。

  create table user_bucket(id int comment 'ID',name string comment '姓名',age int comment '年齡') comment '測(cè)試分桶' clustered by (id) sorted by (id) into 4 buckets row format delimited fields terminated by '\t';

  指定根據(jù)id字段進(jìn)行分桶,并且分為4個(gè)桶,并且每個(gè)桶內(nèi)按照id字段升序排序,如果不加sorted by,則桶內(nèi)不經(jīng)過(guò)排序的,上述語(yǔ)句中為id,根據(jù)id進(jìn)行hash之后在對(duì)分桶數(shù)量4進(jìn)行取余來(lái)決定該數(shù)據(jù)存放在哪個(gè)桶中,因此每個(gè)桶都是整體數(shù)據(jù)的隨機(jī)抽樣。

  數(shù)據(jù)載入:

  我們需要借助一個(gè)中間表,先將數(shù)據(jù)load到中間表中,然后通過(guò)insert的方式來(lái)向分桶表中載入數(shù)據(jù)。

  create table tmp_table (id int comment 'ID',name string comment '名字',age int comment '年齡') comment '測(cè)試分桶中間表' ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ;

  load data inpath '/hadoop/guoxb/data/user.txt' into table tmp_table;

  insert into user_bucket select * from tmp_table;

  上述的語(yǔ)句中,最終會(huì)在hdfs上生成四個(gè)文件,而不是四個(gè)目錄,如果當(dāng)在次向該分桶表中insert數(shù)據(jù)后,會(huì)又增加4個(gè)文件,而不是在原來(lái)的文件上進(jìn)行追加。

  1.5.3. 區(qū)別

  1.hdfs目錄結(jié)構(gòu)不同,分區(qū)是生成目錄,分桶是生成文件

  2.分區(qū)表在加載數(shù)據(jù)的時(shí)候可以指定加載某一部分?jǐn)?shù)據(jù),有利于查詢

  3.分桶在map-side join(另一種 reduce-side join)查詢時(shí),可以直接從bucket(兩表分桶成倍數(shù)即可)中提取數(shù)據(jù)進(jìn)行關(guān)聯(lián)操作,查詢高效。

  1.6. Sort By、Order By、Cluster By,Distribute By,group by

  order by:會(huì)對(duì)輸入做全局排序,因此***\*只有一個(gè)reducer\****(多個(gè)reducer無(wú)法保證全局有序)。只有一個(gè)reducer,會(huì)導(dǎo)致當(dāng)輸入規(guī)模較大時(shí),需要較長(zhǎng)的計(jì)算時(shí)間。

  distribute by:按照指定的字段對(duì)數(shù)據(jù)進(jìn)行劃分輸出到不同的reduce中(單純的分散數(shù)據(jù))。

  sort by:局部排序,sort by只是確保每個(gè)reduce上面輸出的數(shù)據(jù)有序,當(dāng)只有一個(gè)reduce時(shí),也變成全局排序。

wpsq0kGDl

  cluster by:當(dāng)distribute by 和 sort by 所指定的字段相同時(shí),即可以使用cluster by

  group By Key算子的功能固定,只能輸出相同key值的序列,reduceByKey適用于分組排序過(guò)程中有數(shù)據(jù)聚合操作(sum)的情形,在其他場(chǎng)景下可能不適用。

wpsnkIWGq

  受限于reduce數(shù)量,設(shè)置reduce參數(shù)mapred.reduce.tasks 輸出文件個(gè)數(shù)與reduce數(shù)相同,文件大小與reduce處理的數(shù)據(jù)量有關(guān),網(wǎng)絡(luò)負(fù)載過(guò)重 數(shù)據(jù)傾斜,優(yōu)化參數(shù)hive.groupby.skewindata為true,會(huì)啟動(dòng)一個(gè)優(yōu)化程序,避免數(shù)據(jù)傾斜

  1.7. SQL

  1.7.1. 開(kāi)窗函數(shù)

wpsgOGnKY

  1.8. 數(shù)據(jù)傾斜怎么解決

  1.key 盡量打亂;提高reduce任務(wù)數(shù)

  2.關(guān)聯(lián)查詢時(shí),利用分桶和map-side提高查詢效率

  1.9. 星型模型和雪花模型介紹

  星型模型:所有的維表直接連接到事實(shí)表:

02

  雪花模型:

  當(dāng)有一個(gè)或多個(gè)維表沒(méi)有直接連接到事實(shí)表上,而是通過(guò)其他維表連接到事實(shí)表上時(shí),是星型模型的拓展。

03

  更多關(guān)于大數(shù)據(jù)培訓(xùn)的問(wèn)題,歡迎咨詢千鋒教育在線名師。千鋒教育擁有多年IT培訓(xùn)服務(wù)經(jīng)驗(yàn),采用全程面授高品質(zhì)、高體驗(yàn)培養(yǎng)模式,擁有國(guó)內(nèi)一體化教學(xué)管理及學(xué)員服務(wù),助力更多學(xué)員實(shí)現(xiàn)高薪夢(mèng)想。

tags:
聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強(qiáng)師集結(jié),手把手帶你蛻變精英
請(qǐng)您保持通訊暢通,專屬學(xué)習(xí)老師24小時(shí)內(nèi)將與您1V1溝通
免費(fèi)領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT
藍(lán)v抖音小店怎么開(kāi)通店鋪

藍(lán)v抖音小店是一個(gè)非常熱門的電商平臺(tái),它可以讓賣家在抖音上開(kāi)設(shè)自己的店鋪,從而出售自己的商品。隨著抖音的不斷發(fā)展壯大,越來(lái)越多的賣家希...詳情>>

2023-10-08 14:51:53
抖音小店怎么更改類目名稱

抖音小店是現(xiàn)在非常火熱的一種網(wǎng)店形態(tài),許多小生意也從中獲得了收益。但是隨著經(jīng)營(yíng)時(shí)間的增長(zhǎng),小店也需要對(duì)自己的類目名稱進(jìn)行更改,因?yàn)檫@可...詳情>>

2023-10-08 14:46:50
抖音小店怎么合作賣貨

抖音小店作為一種新型的電商形式,近年來(lái)在國(guó)內(nèi)市場(chǎng)上逐漸火熱起來(lái),成為了許多年輕人賺取收入的途徑之一。因?yàn)槎兑糇鳛楫?dāng)前最流行的短視頻平臺(tái)...詳情>>

2023-10-08 14:35:49
抖音小店運(yùn)營(yíng)和天貓區(qū)別是什么呢

隨著社交媒體的廣泛應(yīng)用,抖音小店開(kāi)始走進(jìn)人們的生活,成為越來(lái)越多人的購(gòu)物選擇之一。而天貓作為國(guó)內(nèi)最具影響力的電商平臺(tái)之一,是許多電商從...詳情>>

2023-10-08 14:23:10
抖音小店在哪個(gè)界面進(jìn)入店鋪?lái)?yè)面

抖音小店,是指在抖音平臺(tái)上開(kāi)設(shè)的個(gè)人或企業(yè)店鋪。隨著抖音用戶數(shù)的不斷增加,抖音小店越來(lái)越受到用戶的歡迎和喜愛(ài)。但是,如何進(jìn)入抖音小店的...詳情>>

2023-10-08 14:21:20
成年女人粗暴毛片免费观看| 把腿张开老子臊烂你多p晓晓 | 国产乱沈阳女人高潮乱叫老| 激情综合一区二区三区| 蜜臀AⅤ永久无码一区二区| 欧洲熟妇色XXXXX欧美老妇伦| 色偷偷色噜噜狠狠成人免费视频| 性色A码一区二区三区天美传媒| 亚洲人成色77777在线观看| FREEFORNVIDEOS性| 国产精品久久久久久免费软件| 精品人妻AV一区二区三区| 女人扒开腿让男人狂桶30分钟 | 麻豆一二三四区乱码| 欧美一卡二卡三卡四卡视| 无码人妻丰满熟妇奶水区毛片| 亚洲伊人伊成久久人综合网| 拔萝卜电视剧高清免费| 国产亚洲欧洲综合5388| 妺妺窝人体色www聚色窝仙踪| 三个人换着躁B一PL| 亚洲国产精品一区二区第四页 | 欧美乱妇日本无乱码特黄大片| 铜铜铜铜铜铜铜好-深色| 亚洲中文字幕无码永久在线不卡 | 日本熟妇色XXXXX| 亚洲成AV人片在线观看橙子| AV色欲无码人妻中文字幕| 国产免费久久精品国产传媒| 男配每天都在体内成结节| 无码不卡AV东京热毛片| 主人调教下贱的烂货| 国产精品任我爽爆在线播放| 乱公和我做爽死我视频| 天堂8中文在线最新版官网| 真实国产乱子伦精品一区二区三区 | 东京热人妻无码一区二区AV| 久久精品国产欧美日韩| 色综合久久精品亚洲国产消防| 亚洲综合色婷婷在线观看| 国产69精品久久久久9999A| 狂野欧美激情性XXXX| 无码人妻丰满熟妇区毛片| 69美女ⅩXXXXXXX19| 国产午夜精品一区二区三区极品| 欧美成人精品欧美一级乱黄 | 中文字幕一线产区和二线区的区别 | 国产真实伦在线观看| 琪琪女色窝窝777777| 亚洲另类自拍丝袜第五页| 绯色av一区二区三区蜜臀| 久久亚洲欧美日本精品| 无码中文字幕加勒比一本二本| 999在线视频精品免费播放观看| 国产在线精品一区二区在线看 | 性高朝久久久久久久| YY6090青苹果影院| 久久婷婷成人综合色| 性色AV无码专区一ⅤA亚洲| 把腿张开老子臊烂h视频| 久久久精品国产免大香伊| 我是你亲妈呀你爸知道死你| 97无码免费人妻超级碰碰夜夜| 国内精品乱码卡一卡2卡三卡| 日本高清在线视频WWW色| 在线观看亚洲AV| 韩国精品久久久久久无码| 色哟哟网站在线观看| 97久久精品人妻人人搡人人玩| 精品久久人人爽人人玩人人妻 | 人伦片无码中文字| 一面亲上边一面膜下边56| 国产亚洲精品精品国产亚洲综合| 日产精品一区二区| 51精品国产人成在线观看| 久久国语露脸国产精品电影 | 人妻少妇精品国语对白| 又爽又黄又无遮挡的视频| 极品少妇被猛的白浆直喷白浆| 特级毛片爽WWW免费版| А√天堂8资源最新版| 久久久亚洲欧洲日产国码AⅤ| 亚洲AV成人精品午夜一区二区| 丰满肥女巨肥BWWBBWW| 欧洲做爰XXXⅩ富婆视频| 孕妇奶水仑乱A级毛片免费看| 狠狠狠的在啪线香蕉WWW、WL| 婷婷五月综合激情| 成年无码AV片在线免缓冲| 女性高爱潮AAAA级视频免费| 又粗又大内射免费视频小说| 精品人在线二线三线区别| 亚洲AV无码成人精品区瑜伽裤| 国产成人猛男69精品视频| 日韩丰满少妇无吗视频激情内射| AAA级久久久精品无码片| 蜜桃AV一区二区| 一本大道久久A久久综合| 娇小XXXXBXBⅨ黑人XX| 亚洲AV无码国产精品色午| 国产精品亚洲片夜色在线| 天天爽夜夜爽夜夜爽精品视频| 成年轻人电影免费 视频| 人人澡人摸人人添学生AV| XXXX性XX另类Ⅹ中国HD| 欧美乱人伦人妻中文字幕| 2019NV天堂香蕉在线观看| 美女无遮挡直播软件免费看| 一二三四在线观看视频韩国| 久久久精品国产SM调教网站| 亚洲一区二区三区在线网址| 久久精品99国产精品蜜桃| 亚洲日韩欧美一区二区三区| 九九精品99久久久香蕉| 亚洲日韩欧美一区久久久久我| 久久AV无码AⅤ高潮AV喷吹| 亚洲熟妇AV日韩熟妇在线| 久久精品国产只有精品2020| 亚洲熟妇色XXXXX无码| 久久久久亚洲AV无码专区首页网 | 久久久亚洲欧洲日产国码ΑV| 亚洲中文字幕无码中文字在线| 久久九九国产精品怡红院| 亚洲中文字幕无码久久2017| 久久偷看各类WC女厕嘘嘘| 又爽又黄又无遮挡的视频| 狂猛欧美激情性XXXX在线观看| 中文精品一区二区三区四区| 免费看成熟丰满少妇AⅤ无码精品| 中文字幕人妻不在线无码视频| 男人女人免费啪啪观看| A级毛片免费高清视频| 人物动物交互狗AA| 丰满人妻熟妇乱又伦精品APP| 神里凌华被焯出白水视频| 国产精品色吧国产精品| 亚洲AV无码专区在线| 久久精品人妻少妇一区二区| 中文在线中文在A| 欧美巨大XXXX做受中文字幕| 超碰97人人做人人爱2020| 特级毛片A级毛片免费播放| 国产未成女YOUNV仙踪林| 亚洲精品V天堂中文字幕| 久久久亚洲精品无码| 77777亚洲午夜久久多喷| 人人做人人爱在碰免费| 国产成人精品免费视频网页大全| 香港三日本三级少妇三级视频| 激情伊人五月天久久综合| 一边做饭一边躁狂怎么办| 欧美大屁股XXXX高跟欧美黑人| 成年免费A级毛片免费看丶| 天堂无码人妻精品一区二区三区| 国产无遮挡又黄又爽免费网站| 亚洲欧洲无码AV电影在线观看| 免费看黄A级毛片| 成人综合伊人五月婷久久| 新CHINESE无套小帅KTV| 久久精品国产精品亚洲精品| 91精品人妻一区二区三区蜜桃 | 亚洲AV永久无码区成人网站 | 在线天堂おっさんとわたしWWW| 欧美肉体裸交做爰XXXⅩ性| 国产AⅤ无码专区亚洲AV| 亚洲超星团在哪个平台播| 美女扒开内裤无遮挡| 粗大的内捧猛烈进出小视频| 亚洲AV乱码中文一区二区三区 | 日本午夜免费福利视频| 国产欧美精品一区二区三区-老狼| 亚洲色欲AV无码成人专区| 欧美老肥妇多毛XXXXX| 国产精品扒开腿做爽爽爽视频 | 男人扒开女人内裤强吻桶进去| 成人国产三级在线观看| 亚洲AV日韩精品久久久久| 每个世界都被主角睡来睡去可乐饼| 成人国产精品一区二区网站| 亚洲成a人片在线观看无码关注| 男女啪啪高清无遮挡免费| 国产99视频精品免费视看6| 亚洲人成无码网站久久99热国产| 欧美人与动牲交片免费| 国产麻豆精品乱码一区| 中文字幕人妻一区二区在线视频| 色猫咪AV在线网址| 久久99国产综合精品| 暗交小拗女一区二| 亚洲AV无码专区成人网址| 欧美极品少妇XXXXⅩO69| 国产午夜福利在线播放| 777米奇色888狠狠俺去啦| 无码H肉男男在线观看免费| 麻豆MDX0020穷小子大翻身| 国产成人精品视频网站| 中国猛少妇色XXXXX| 偷拍与自偷拍亚洲精品| 蜜桃成人无码区免费视频网站| 国产精品VA尤物在线观看|