二維碼
        企資網(wǎng)

        掃一掃關(guān)注

        當(dāng)前位置: 首頁 » 企業(yè)資訊 » 行業(yè) » 正文

        HIVE常用優(yōu)化方法

        放大字體  縮小字體 發(fā)布日期:2021-09-03 11:36:49    作者:企資小編    瀏覽次數(shù):83
        導(dǎo)讀

        1、join連接時(shí)的優(yōu)化_當(dāng)三個(gè)或多個(gè)以上的表進(jìn)行join操作時(shí),如果每個(gè)on使用相同的字段連接時(shí)只會(huì)產(chǎn)生一個(gè)mapreduce。2、join連接時(shí)的優(yōu)化_當(dāng)多個(gè)表進(jìn)行查詢時(shí),從左到右表的大小順序應(yīng)該是從小到大。原因_hive在對(duì)每

        1、join連接時(shí)的優(yōu)化_當(dāng)三個(gè)或多個(gè)以上的表進(jìn)行join操作時(shí),如果每個(gè)on使用相同的字段連接時(shí)只會(huì)產(chǎn)生一個(gè)mapreduce。

        2、join連接時(shí)的優(yōu)化_當(dāng)多個(gè)表進(jìn)行查詢時(shí),從左到右表的大小順序應(yīng)該是從小到大。原因_hive在對(duì)每行記錄操作時(shí)會(huì)把其他表先緩存起來,直到掃描最后的表進(jìn)行計(jì)算

        3、在where字句中增加分區(qū)過濾器。

        4、當(dāng)可以使用left semi join語法時(shí)不要使用inner join,前者效率更高。原因_對(duì)于左表中指定的一條記錄,一旦在右表中找到立即停止掃描。

        5、如果所有表中有一張表足夠小,則可置于內(nèi)存中,這樣在和其他表進(jìn)行連接的時(shí)候就能完成匹配,省略掉reduce過程。
        設(shè)置屬性即可實(shí)現(xiàn),

        set hive.auto.covert.join_true;

        用戶可以配置希望被優(yōu)化的小表的大小
        set hive.mapjoin.smalltable.sia_2500000;

        如果需要使用這兩個(gè)配置可置入$HOME/.hiverc文件中。

        6、同一種數(shù)據(jù)的多種處理_從一個(gè)數(shù)據(jù)源產(chǎn)生的多個(gè)數(shù)據(jù)聚合,無需每次聚合都需要重新掃描一次。

        例如_

        insert overwrite table student select * from employee;

        insert overwrite table person select * from employee;

        可以優(yōu)化成_

        from employee

        insert overwrite table student select *

        insert overwrite table person select *

        7、limit調(diào)優(yōu)_limit語句通常是執(zhí)行整個(gè)語句后返回部分結(jié)果。

        Set hive.limit.optimia.enable_true;

        8、開啟并發(fā)執(zhí)行。某個(gè)job任務(wù)中可能包含眾多的階段、其中某些階段沒有依賴關(guān)系可以并發(fā)執(zhí)行,開啟并發(fā)執(zhí)行后job任務(wù)可以更快的完成。

        設(shè)置屬性_

        set hive.e>ecparallel_true;

        9、hive提供的嚴(yán)格模式,禁止3種情況下的查詢模式。

        a_當(dāng)表為分區(qū)表時(shí),where字句后沒有分區(qū)字段和限制時(shí),不允許執(zhí)行。

        b_當(dāng)使用order by語句時(shí),必須使用limit字段,因?yàn)閛rder by只會(huì)產(chǎn)生一個(gè)reduce任務(wù)。

        c_限制笛卡爾積的查詢。

        10、合理的設(shè)置map和reduce數(shù)量。

        11、jvm重用。可在hadoop的mapredtite.xml中設(shè)置jvm?重用的次數(shù)。

         
        (文/企資小編)
        免責(zé)聲明
        本文僅代表作發(fā)布者:企資小編個(gè)人觀點(diǎn),本站未對(duì)其內(nèi)容進(jìn)行核實(shí),請(qǐng)讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問題,請(qǐng)及時(shí)聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
         

        Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號(hào)

        粵ICP備16078936號(hào)

        微信

        關(guān)注
        微信

        微信二維碼

        WAP二維碼

        客服

        聯(lián)系
        客服

        聯(lián)系客服:

        在線QQ: 303377504

        客服電話: 020-82301567

        E_mail郵箱: weilaitui@qq.com

        微信公眾號(hào): weishitui

        客服001 客服002 客服003

        工作時(shí)間:

        周一至周五: 09:00 - 18:00

        反饋

        用戶
        反饋

        主站蜘蛛池模板: 久久久久成人精品一区二区| 亚洲av无码一区二区三区不卡| 日本在线观看一区二区三区| 成人精品视频一区二区三区不卡| 麻豆一区二区免费播放网站| 国产视频一区在线观看| 在线视频精品一区| 一本大道在线无码一区| 久久精品免费一区二区| 福利一区国产原创多挂探花| 美女免费视频一区二区三区| 国内精品视频一区二区八戒| 日本一区二区三区不卡视频 | 蜜桃视频一区二区| 国产精品久久无码一区二区三区网 | 国产精品综合一区二区三区| 精品国产一区二区三区免费看| 亚洲一区二区三区在线观看蜜桃| 国产精品女同一区二区| 丰满人妻一区二区三区视频53| 久久精品国产一区二区| 国产一区二区精品尤物| 精品一区二区三区免费| 国产成人精品视频一区二区不卡| 国产婷婷色一区二区三区| 无码国产精品一区二区免费3p| 久久久精品人妻一区亚美研究所| 亚州日本乱码一区二区三区| 久久精品亚洲一区二区三区浴池| 性无码免费一区二区三区在线| 久久综合亚洲色一区二区三区 | 国产在线一区二区在线视频| 视频一区精品自拍| 亚洲国产一区在线| 一本大道在线无码一区| 国产精品熟女视频一区二区 | 国模无码视频一区二区三区| 午夜精品一区二区三区在线观看| 国产精品成人一区二区| 一区二区中文字幕| 国产SUV精品一区二区四|