二維碼
        企資網(wǎng)

        掃一掃關(guān)注

        當(dāng)前位置: 首頁(yè) » 企資快報(bào) » 推廣 » 正文

        你說(shuō)你是高工_String有多長(zhǎng)也不知道?

        放大字體  縮小字體 發(fā)布日期:2022-12-25 04:05:37    作者:付彥琪    瀏覽次數(shù):62
        導(dǎo)讀

        :手藝人 公眾號(hào)IT爛筆頭1String基礎(chǔ)public final class StringString類(lèi)是由final修飾得,所以是不能被繼承得①,我們?cè)趯?duì)字符串進(jìn)行比較時(shí),一般是期望對(duì)比其中得字符串是否一樣,所以這里我們不

        :手藝人

        公眾號(hào)IT爛筆頭

        1

        String基礎(chǔ)

        public final class String

        String類(lèi)是由final修飾得,所以是不能被繼承得①,我們?cè)趯?duì)字符串進(jìn)行比較時(shí),一般是期望對(duì)比其中得字符串是否一樣,所以這里我們不能用"=="進(jìn)行字符串得比較,而是需要使用"equals()"方法②,因?yàn)槭褂?=進(jìn)行比較時(shí),是比較得對(duì)象,只有指向同一個(gè)字符串對(duì)象得才會(huì)是true,否則就算字符串值相同也可能出現(xiàn)不相等得情況。

        private final char value[];

        String得值實(shí)際上是以char得數(shù)組存儲(chǔ)得,并且是final得,所以字符串對(duì)象是不可變得③,但是我們可以看到字符串得一些操作會(huì)誤導(dǎo)我們,比如使用:

        String a = "aaaa";a += "bbbb";

        其實(shí)這個(gè)時(shí)候a已經(jīng)指向新得對(duì)象地址。
        到這里為止,初級(jí)工程師都應(yīng)該很熟悉。

        2

        String得形式


        在思考String能有多長(zhǎng)之前,我們先看下String定義得不同形式。


        那么既然思考String得長(zhǎng)度,那就應(yīng)該想想為什么會(huì)有長(zhǎng)度得限制,難道我在編譯器里定義一個(gè)String時(shí),有多長(zhǎng)不是隨便我們自己輸入么?還有上面兩種方式有什么區(qū)別呢?


        2.1 字面量得形式

        對(duì)于第壹種是字面量,Java將其存在常量池中,在Java1.6得版本中是在棧得常量池中,在1.7、1.8版本中將其放到了堆得常量池中。那就是說(shuō)第壹種這種方式中是受到常量池大小得約束了,不錯(cuò),是會(huì)受到常量池得約束,但是在運(yùn)行在JVM之前,被編譯成字節(jié)碼時(shí)就已經(jīng)有了限制。


        如上圖所示,編譯后得length得類(lèi)型為u2(無(wú)符號(hào)16位),也就是講length得蕞大值為2^16-1 = 65535,那就是講我們得上面得字符串s長(zhǎng)度按MUTF-8(字節(jié)碼中得編碼)編碼可以存儲(chǔ)65535個(gè)字節(jié)。
        到這里為止,如果你是中級(jí)工程師,知道這么多已經(jīng)很不錯(cuò)了。


        可是事實(shí)上呢,我們實(shí)驗(yàn)后發(fā)現(xiàn)只能存儲(chǔ)65534個(gè)字節(jié),這是為什么呢?網(wǎng)上有很多猜想,大部分不正確。我們扒一下Java編譯器得源碼,會(huì)發(fā)現(xiàn):


        這下大家明白了吧,Java編譯器在檢查字符串常量時(shí),判斷得是長(zhǎng)度只有<65535才會(huì)正常,否則報(bào)錯(cuò)。看起來(lái)像是編譯器得Bug。如果你會(huì)修改編譯器源碼,你將上面得判斷條件改成<=65535,這樣你存一個(gè)65535個(gè)字符"a"得字符串就不會(huì)編譯出錯(cuò)了。


        我們知道上面我們是用拉丁字符"a"來(lái)測(cè)試得,a使用UTF-8編碼剛好是一個(gè)字節(jié),所以可以存儲(chǔ)65534個(gè),那如果存漢字呢,比如我們經(jīng)常看到得"燙",它使用TF-8編碼后占用三個(gè)字節(jié),那么也就是說(shuō)我們可以這樣定義:

        // 按照我們剛才得分析,應(yīng)該可以存儲(chǔ)65534/3個(gè)"燙"漢字String s = "燙燙燙...燙燙";

        那我們嘗試存儲(chǔ)65535/3個(gè)漢字"燙"試試呢?結(jié)果是可以得,并沒(méi)有報(bào)錯(cuò)。誒?這是為什么呢?我們繼續(xù)扒下編譯器得源碼看到:

        編譯處理漢字這種得呢,他判斷得邏輯不一樣。條件是>65535才會(huì)拋異常,也就是小于等于65535是正常得。很有意思,寫(xiě)Java編譯器得人也很有意思哈。

        2.1 new得形式


        對(duì)于第二種形式得,很顯然只有在運(yùn)行時(shí)受限于Java虛擬機(jī)了。我們知道String最后保存在char數(shù)組中,Java虛擬機(jī)是如何做得呢?簡(jiǎn)單參考下源碼:

        虛擬機(jī)指令newarray [int],size是以整形定義得,所以它得限制其實(shí)就是int得蕞大值,但是在有一些虛擬機(jī)上會(huì)保留一些頭信息在數(shù)組中,所以就變成了Integer.MAX_VALUE - 8個(gè)char;


        到這里呢,基本上你就有了高級(jí)工程師得思考高度了。

        3

        總結(jié)

        3.1 字面量得形式


          受字節(jié)碼數(shù)據(jù)結(jié)構(gòu)得限制,字符串使用MUTF-8編碼后字節(jié)數(shù)不超過(guò)65535拉丁字符,受Java編譯器代碼限制,最多只能存儲(chǔ)65534個(gè)字節(jié)非拉丁字符,最多存儲(chǔ)65535個(gè)字節(jié)

          3.2 new得形式

            受虛擬機(jī)指令限制,字符數(shù)理論上線(xiàn)是Integer.MAX_VALUE,但是實(shí)際上有保留頭信息得部分,所以會(huì)略小受堆內(nèi)存得限制,如果堆內(nèi)存很小,那就不能超過(guò)堆內(nèi)存得限制


            看起來(lái)感謝有點(diǎn)過(guò)于追求細(xì)節(jié)了,有點(diǎn)孔乙己得回字有幾種寫(xiě)法得意思。實(shí)際則不然,搞技術(shù)就是要把握好細(xì)節(jié),才能寫(xiě)出優(yōu)秀得代碼,才能成為高階得工程師而不是碼農(nóng)。

         
        (文/付彥琪)
        免責(zé)聲明
        本文僅代表作發(fā)布者:付彥琪個(gè)人觀(guān)點(diǎn),本站未對(duì)其內(nèi)容進(jìn)行核實(shí),請(qǐng)讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問(wèn)題,請(qǐng)及時(shí)聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
         

        Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號(hào)

        粵ICP備16078936號(hào)

        微信

        關(guān)注
        微信

        微信二維碼

        WAP二維碼

        客服

        聯(lián)系
        客服

        聯(lián)系客服:

        在線(xiàn)QQ: 303377504

        客服電話(huà): 020-82301567

        E_mail郵箱: weilaitui@qq.com

        微信公眾號(hào): weishitui

        客服001 客服002 客服003

        工作時(shí)間:

        周一至周五: 09:00 - 18:00

        主站蜘蛛池模板: 亚洲AV无码一区二区三区牲色| 成人乱码一区二区三区av| 日韩一区二区三区视频| 色老板在线视频一区二区| 毛片无码一区二区三区a片视频| 国产一区二区三区夜色| 欧亚精品一区三区免费| 搡老熟女老女人一区二区| 波多野结衣高清一区二区三区| 国产成人av一区二区三区不卡| 精品少妇ay一区二区三区| 久久一区二区精品综合| 福利一区二区三区视频在线观看| 黑人一区二区三区中文字幕| 玩弄放荡人妻一区二区三区| 美女毛片一区二区三区四区| 波多野结衣一区二区三区aV高清| 日本韩国黄色一区二区三区| 亚洲av福利无码无一区二区| 国产一区二区三区在线视頻| 内射一区二区精品视频在线观看| 亚洲a∨无码一区二区| 中文字幕AV一区二区三区人妻少妇| 亚洲综合一区二区| 中文字幕一区视频| 无码少妇A片一区二区三区| 欧美日韩国产免费一区二区三区| 成人丝袜激情一区二区| 老熟女高潮一区二区三区| 精品人妻中文av一区二区三区| 亚洲国产日韩一区高清在线| 2022年亚洲午夜一区二区福利 | 久久一区二区三区99| 一区二区三区高清| 果冻传媒一区二区天美传媒| 一区二区三区免费在线视频 | 精品欧洲av无码一区二区14| 亚洲天堂一区二区三区| 中文字幕色AV一区二区三区| 在线精品视频一区二区| 成人精品一区二区电影|