99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在AArch64平臺(tái)上性能下降的例子

Linux閱碼場(chǎng) ? 來(lái)源:openEuler ? 作者:吳言 ? 2021-09-09 11:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編者按:目前許多公司同時(shí)使用 x86 和 AArch64 2 種主流的服務(wù)器。這兩種環(huán)境的算力相當(dāng),內(nèi)存相同的情況下:相同版本的 JVM 和 Java 應(yīng)用,相同的 JVM 參數(shù),應(yīng)用性能在不同的平臺(tái)中表現(xiàn)相差 30%,x86 遠(yuǎn)好于 AArch64 平臺(tái)。本文分析了一個(gè)應(yīng)用在 AArch64 平臺(tái)上性能下降的例子,發(fā)現(xiàn) JVM 的 CodeCache 大小是引起這個(gè)性能問(wèn)題的根源,進(jìn)而研究什么導(dǎo)致了不同平臺(tái)上 CodeCache 大小的不同。最后筆者給出了不同平臺(tái)中該如何設(shè)置參數(shù)規(guī)避該問(wèn)題。希望本文能給讀者一些啟示:當(dāng)使用不同的硬件平臺(tái)時(shí)需要關(guān)注底層硬件對(duì)于上層應(yīng)用的影響。

業(yè)務(wù)在 x86 和 AArch64 上同時(shí)部署時(shí)(相同的 JDK 和 Java 應(yīng)用版本),發(fā)現(xiàn) AArch64 平臺(tái)性能下降嚴(yán)重問(wèn)題。進(jìn)一步查看日志,發(fā)現(xiàn)在 AArch64 平臺(tái)中偶有如下情況:

這代表 JVM 中的 CodeCache 滿了,導(dǎo)致編譯停止,未編譯的方法只能解釋執(zhí)行,進(jìn)而嚴(yán)重影響應(yīng)用性能。那什么是 CodeCache?

CodeCache 是什么

簡(jiǎn)單來(lái)說(shuō),CodeCache 用于存放編譯后的方法,主要分為三部分:

Non-nmethods:包括運(yùn)行時(shí) Stub,Adapter 等;

Profiled nmethod:包括會(huì)采集信息的方法,即分層編譯中第 2、3 層的方法;

Non-Profiled nmethods:包括不采集信息的方法,即分層編譯中第 1、4 層的方法,也包括 JNI 的方法。

注:分層編譯指的是 JVM 同時(shí)存在 C1 和 C2 兩種編譯器,C1 做一些簡(jiǎn)單的編譯優(yōu)化,耗時(shí)較短,C2 做更多復(fù)雜的編譯優(yōu)化,性能較好,編譯耗時(shí)較多。分層編譯的觸發(fā)在 JVM 內(nèi)會(huì)根據(jù)相應(yīng)的條件進(jìn)行觸發(fā),關(guān)于更多分層編譯相關(guān)知識(shí)可以參考相關(guān)資料 [1]。

在 JDK 9 之后 [2],這些會(huì)分配到不同的區(qū)域(使用不同區(qū)域的優(yōu)點(diǎn):查找、回收等),JDK 8 中會(huì)分配到同一塊區(qū)域。

JVM 平時(shí)會(huì)清理一些不可達(dá)的方法,例如由于退優(yōu)化等產(chǎn)生的死方法,另外 UseCodeCacheFlushing 選項(xiàng)(默認(rèn)開(kāi)啟),還會(huì)清理較老以及執(zhí)行較少的方法。一旦 CodeCache 滿了之后,會(huì)停止編譯,直到 CodeCache 有空間,若關(guān)閉了 UseCodeCacheFlushing 選項(xiàng),則會(huì)直接永久停止編譯。

不同的 JVM 版本以及不同的參數(shù),默認(rèn)的 CodeCache 大小不同。JDK 11 中默認(rèn)參數(shù)下 CodeCache 大小為 240M,若想獲?。ù_認(rèn))默認(rèn)情況下的 CodeCache 大小,建議使用 - XX:+PrintFlagsFinal 選項(xiàng)獲取 ReservedCodeCache 的大小。

CodeCache 大小主要通過(guò)以下選項(xiàng)調(diào)節(jié):

InitialCodeCacheSize 初始的 CodeCache 大小(單位字節(jié))
ReservedCodeCacheSize 預(yù)留的 CodeCache 大小,即最大CodeCache 大小(單位字節(jié))
CodeCacheExpansionSize CodeCache 每次擴(kuò)展大?。▎挝蛔止?jié))
Option Description

使用–XX:+PrintCodeCache 選項(xiàng)可以打印應(yīng)用使用的 CodeCache 情況,如下:

其中 max_used 表示應(yīng)用中使用到的 CodeCache 大小,據(jù)此可以設(shè)置合適的 ReservedCodeCacheSize 值。

AArch64 vs x86_64

我們都知道 AArch64 和 x86 分別為 RISC 和 CISC 架構(gòu),因此代碼密度方面存在一定差異,在這篇文章 [3] 中比較了不同指令集下手寫匯編的大小,可以看到 AArch64 的代碼密度是 RISC 架構(gòu)中較優(yōu)的,但相比 x86_64 仍稍差些(其中 RISC 最差,m68k 最好)。

另外筆者選用業(yè)界通用的 java 測(cè)試套 dacapo[4] 比較 AArch64 和 x86_64 下 CodeCache 占用的大小。

可以看到,在 AArch64 架構(gòu)下,CodeCache 均比 x86_64 要大,但根據(jù)不同場(chǎng)景,大小差距不同,在 5%-20% 之間。因此在我們發(fā)現(xiàn)相同應(yīng)用在 x86 和 AArch64 上時(shí),CodeCache 大小需要進(jìn)行相應(yīng)的調(diào)節(jié)。

除此之外,還需要注意 InlineSmallCode 選項(xiàng),JVM 只會(huì) inline 代碼體積比該值小的方法。JVM 通過(guò) inline 可以觸發(fā)更多的優(yōu)化,因此 inline 對(duì)于性能提升也很重要。在 JDK 11 中,InlineSmallCode 在 x86 下的默認(rèn)值為 2000 字節(jié),在 AArch64 下的默認(rèn)值為 2500 字節(jié)。而 JDK 8 中,InlineSmallCode 在 x86 和 AArch64 下默認(rèn)值均為 2000 字節(jié)。因此建議遷移時(shí)也相應(yīng)修改 InlineSmallCode 的值。業(yè)務(wù)通過(guò)對(duì) CodeCache 相關(guān)參數(shù)的調(diào)整,達(dá)到助力 JIT 的最佳編譯效果。

后記

如果遇到相關(guān)技術(shù)問(wèn)題(包括不限于畢昇 JDK),可以進(jìn)入畢昇 JDK 社區(qū)查找相關(guān)資源(點(diǎn)擊原文進(jìn)入官網(wǎng)),包括二進(jìn)制下載、代碼倉(cāng)庫(kù)、使用教學(xué)、安裝、學(xué)習(xí)資料等。畢昇 JDK 社區(qū)每雙周周二舉行技術(shù)例會(huì),同時(shí)有一個(gè)技術(shù)交流群討論 GCC、LLVM、JDK 和 V8 等相關(guān)編譯技術(shù),感興趣的同學(xué)可以添加如下微信小助手,回復(fù) Compiler 入群。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    13

    文章

    9795

    瀏覽量

    88010
  • JAVA
    +關(guān)注

    關(guān)注

    20

    文章

    2989

    瀏覽量

    109847
  • JVM
    JVM
    +關(guān)注

    關(guān)注

    0

    文章

    160

    瀏覽量

    12629

原文標(biāo)題:相同版本 JVM 和 Java 應(yīng)用,在 x86 和AArch64 平臺(tái)性能相差30%,何故?

文章出處:【微信號(hào):LinuxDev,微信公眾號(hào):Linux閱碼場(chǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【HZ-T536開(kāi)發(fā)板免費(fèi)體驗(yàn)】2 - 交叉編譯倉(cāng)頡編程語(yǔ)言程序到開(kāi)發(fā)板運(yùn)行

    /aarch64-linux-gnu/lib/libstdc++.so 程序運(yùn)行 將程序拷貝到板子運(yùn)行,得到如下結(jié)果: 運(yùn)行結(jié)果正確。和0.53版本比較,1.0版本的static選項(xiàng)比較好,分發(fā)程序變得很容易。 結(jié)束語(yǔ) 開(kāi)
    發(fā)表于 07-16 21:27

    【HZ-RK3568開(kāi)發(fā)板免費(fèi)體驗(yàn)】合眾HZ-RK3568開(kāi)發(fā)環(huán)境搭建

    /gcc-linaro-7.5.0-2019.12-x86_64_aarch64-linux-gnu/bin 保存退出 3.運(yùn)行 source ~/.bashrc 讓文件生效 $ source ~/.bashrc 交叉編譯器驗(yàn)證 方法一:命令行下
    發(fā)表于 07-15 23:13

    能在Meteor Lake平臺(tái)上使用SDK 3.5嗎?

    SDK 是 3.6 版,不支持 CYPD6127 部件。 那么,我能在 Meteor Lake 平臺(tái)上使用 SDK 3.5 嗎?
    發(fā)表于 05-26 08:01

    可以手動(dòng)構(gòu)建imx-gpu-viv嗎?

    我是新手,希望能得到任何支持。 我目前正在使用內(nèi)核 5.15 和 Yocto 4.0 (kirkstone)。我明白我必須為我的 aarch64
    發(fā)表于 03-28 06:35

    stm32F407平臺(tái)上使用freertos,使用pvPortMalloc申請(qǐng)內(nèi)存,發(fā)現(xiàn)內(nèi)存中的數(shù)據(jù)總被修改,怎么解決?

    如題,我現(xiàn)在在stm32F407平臺(tái)上打開(kāi)FREERTOS,然后使用pvPortMalloc動(dòng)態(tài)申請(qǐng)內(nèi)存的時(shí)候,發(fā)現(xiàn)這塊內(nèi)存中的數(shù)據(jù)總是變化,后面改為malloc申請(qǐng),內(nèi)存中的數(shù)據(jù)就符合預(yù)期了,我已經(jīng)按照網(wǎng)上的流程配置了freertos,不知道是什么原因?qū)е逻@種現(xiàn)象?
    發(fā)表于 03-07 09:03

    【米爾RK3576開(kāi)發(fā)板評(píng)測(cè)】+項(xiàng)目名稱YOLOV5目標(biāo)檢測(cè)

    位置:cd Projects/rknn_model_zoo 進(jìn)行編譯:bash ./build-linux.sh -t rk3576 -a aarch64 -d yolov5 編譯后生成的文件
    發(fā)表于 02-15 13:24

    E2000 Speedometer測(cè)試瀏覽器性能

    是完全開(kāi)源的,這使其成為許多 Linux 用戶的首選。下面以Chromium為目標(biāo)對(duì)象,進(jìn)行安裝和測(cè)試E2000Q平臺(tái)上的跑分。 方法 1:使用 APT 安裝 Chromium apt命令是一個(gè)高級(jí)
    發(fā)表于 01-10 21:33

    HAL庫(kù)Arduino平臺(tái)上的使用

    HAL庫(kù)Arduino平臺(tái)上的使用 Arduino平臺(tái)是一個(gè)開(kāi)源的電子原型平臺(tái),它包括硬件(基于微控制器的電路板)和軟件(Arduino IDE)。Arduino
    的頭像 發(fā)表于 12-02 14:04 ?1634次閱讀

    基于TMS320C64x的DSP平臺(tái)上運(yùn)行TMS320C64x編解碼器

    電子發(fā)燒友網(wǎng)站提供《基于TMS320C64x的DSP平臺(tái)上運(yùn)行TMS320C64x編解碼器.pdf》資料免費(fèi)下載
    發(fā)表于 10-14 11:16 ?0次下載
    <b class='flag-5'>在</b>基于TMS320C<b class='flag-5'>64</b>x的DSP<b class='flag-5'>平臺(tái)上</b>運(yùn)行TMS320C<b class='flag-5'>64</b>x編解碼器

    【飛凌嵌入式OK3576-C開(kāi)發(fā)板體驗(yàn)】RKNN神經(jīng)網(wǎng)絡(luò)-YOLO目標(biāo)檢測(cè)

    使用yolov5s_relu.rknn 五、RKNN C Demo程序 5.1、板端linux系統(tǒng) 以 Linux 系統(tǒng)(aarch64 架構(gòu))的 RK356x 平臺(tái)為例,需要使用 rknn_model_zoo 目錄
    發(fā)表于 10-10 09:33

    請(qǐng)問(wèn)TLV320ADC6140NXP的iMX6UL平臺(tái)上如何配置route?

    我正在嘗試NXP的iMX6UL平臺(tái)上,Linux 4.1.15版本,使用TLV320ADC6140作為音頻的codec輸入。 此外,我同時(shí)使用了兩個(gè)TLV320ADC6140做
    發(fā)表于 09-30 06:09

    STM32平臺(tái)新選擇:Nand Flash(貼片TF卡)的應(yīng)用解析

    MK米客方德SD NAND的高性能和高可靠性,使其成為STM32平臺(tái)上理想的存儲(chǔ)解決方案。它的廣泛應(yīng)用不僅提升了嵌入式系統(tǒng)的性能,也為未來(lái)的技術(shù)創(chuàng)新和應(yīng)用拓展提供了堅(jiān)實(shí)的基礎(chǔ)。
    的頭像 發(fā)表于 09-18 11:04 ?1512次閱讀
    STM32<b class='flag-5'>平臺(tái)</b>新選擇:Nand Flash(貼片TF卡)的應(yīng)用解析

    MK米客方德SD NAND:STM32平臺(tái)上的存儲(chǔ)方案

    STM32平臺(tái)上,SD卡的重要性不言而喻,它為嵌入式系統(tǒng)提供了必要的數(shù)據(jù)存儲(chǔ)和讀寫能力。MK米客方德SD作為市場(chǎng)上的一種選擇,因其耐用性、較小的體積以及高速的傳輸性能,STM32
    的頭像 發(fā)表于 08-26 10:23 ?1111次閱讀
    MK米客方德SD NAND:STM32<b class='flag-5'>平臺(tái)上</b>的存儲(chǔ)方案

    第四章: PC 交叉編譯 aarch64 的 tensorflow 開(kāi)發(fā)環(huán)境并測(cè)試

    本文介紹了 PC 端交叉編譯 aarch64 平臺(tái)的 tensorflow 庫(kù)而非 tensorflow lite 的心酸過(guò)程。
    的頭像 發(fā)表于 08-25 11:38 ?2628次閱讀
    第四章:<b class='flag-5'>在</b> PC 交叉編譯 <b class='flag-5'>aarch64</b> 的 tensorflow 開(kāi)發(fā)環(huán)境并測(cè)試

    飛凌OK-全志T527開(kāi)發(fā)板nbench性能測(cè)試

    和一臺(tái)運(yùn)行Linux的AMD K6-233電腦比較,得到的比值作為性能指數(shù)。由于是完全開(kāi)源的,愛(ài)好者可以各種平臺(tái)和操作系統(tǒng)運(yùn)行Nbenc
    發(fā)表于 08-20 10:25