99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國(guó)際紙業(yè):為機(jī)器學(xué)習(xí)魔獸饋送數(shù)據(jù)

倩倩 ? 來(lái)源:lq ? 作者:國(guó)際紙業(yè)流程信息 ? 2019-09-20 11:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

國(guó)際紙業(yè)公司擁有 55,000 名員工,年銷售額超過(guò) 210 億美元,是世界上最大的紙漿和造紙公司。大規(guī)模的生產(chǎn)也會(huì)帶來(lái)大規(guī)模的數(shù)據(jù):該公司目前跟蹤著全球 37 家工廠,近 200 萬(wàn)個(gè)活躍的數(shù)據(jù)點(diǎn)。國(guó)際紙業(yè)公司的 PI System會(huì)產(chǎn)生大量的數(shù)據(jù),可以從這些生產(chǎn)數(shù)據(jù)中挖掘業(yè)務(wù)洞察力。通過(guò)使用 PI System工具深入研究如何收集和組織數(shù)據(jù),工程師們能夠?qū)?shù)據(jù)處理時(shí)間縮短 80% 以上,從而使公司新推出的機(jī)器學(xué)習(xí)計(jì)劃能夠更快執(zhí)行。

國(guó)際紙業(yè)訓(xùn)練機(jī)器算法,作為其“未來(lái)之戰(zhàn)”現(xiàn)代化計(jì)劃的一部分

國(guó)際紙業(yè)公司的工程師致力于高效地處理他們正在使用和生成的海量數(shù)據(jù)。“我們的工程師們需要花費(fèi)他們 80% 到 90%的時(shí)間來(lái)檢索和清理數(shù)據(jù),”國(guó)際紙業(yè)公司的化學(xué)工程師和流程信息經(jīng)理Rick Smith 在 OSIsoft 的 PI World 2018 舊金山大會(huì)上這樣說(shuō)?!拔覀冎Ц豆べY讓他們進(jìn)行決策并改進(jìn)我們的流程。我們需要以適當(dāng)?shù)念l率向工程師提供正確的數(shù)據(jù),以便于他們工作?!?/p>

幾年前,公司在減少數(shù)據(jù)檢索時(shí)間方面做了一些努力。使用 PI OLEDB 工具后,工程師可以將 PI System 數(shù)據(jù)存檔視為關(guān)系數(shù)據(jù)庫(kù)。通過(guò)運(yùn)行 SQL 查詢可以將提取出來(lái)的數(shù)據(jù)自動(dòng)填充到 Microsoft Excel 電子表格中,而無(wú)需在 Excel 內(nèi)運(yùn)行耗時(shí)的計(jì)算。采用這種方法后,國(guó)際紙業(yè)能夠?qū)徲?jì)中經(jīng)常使用的數(shù)據(jù)檢索過(guò)程從 3-12小時(shí)縮短到 15-45 分鐘。

這是一個(gè)良好的開端,但后面還有更大的挑戰(zhàn)。2017 年,國(guó)際紙業(yè)發(fā)起了一個(gè)以數(shù)據(jù)和機(jī)器學(xué)習(xí)為核心的試點(diǎn)項(xiàng)目,作為其“未來(lái)之戰(zhàn)”現(xiàn)代化計(jì)劃的一部分。為了訓(xùn)練機(jī)器算法,工程師需要同時(shí)在數(shù)千個(gè)標(biāo)簽上提取幾年的歷史數(shù)據(jù)并將這些數(shù)據(jù)輸入機(jī)器學(xué)習(xí)引擎。

為了獲取數(shù)據(jù)檢索過(guò)程所需的時(shí)間值,Smith提出了一個(gè)他稱之為“年標(biāo)簽”的時(shí)間單位:即從單個(gè) PI 數(shù)據(jù)標(biāo)簽中檢索一年的信息所需的時(shí)間。因?yàn)椴煌臉?biāo)簽收集數(shù)據(jù)的間隔不同,所以各個(gè)標(biāo)簽的“年標(biāo)簽”值不盡相同,有些甚至差異極大。

Smith 有關(guān)檢索數(shù)據(jù)所需時(shí)間的初步估計(jì)發(fā)人深省。使用 10,000 個(gè)數(shù)據(jù)標(biāo)簽一到三年的數(shù)據(jù),數(shù)據(jù)采集間隔為一分鐘,會(huì)產(chǎn)生大約 160 億行數(shù)據(jù),整個(gè)過(guò)程需要耗時(shí)數(shù)月。

“對(duì)于我們的數(shù)據(jù)標(biāo)簽,如果所有標(biāo)簽都是上面這種情形,那么讀取三年的數(shù)據(jù),將需要100 到 200 天的時(shí)間來(lái)檢索數(shù)據(jù)。我不了解其他公司的情況,但我們的副總裁可不想等待200 天才開始這個(gè)項(xiàng)目,” Smith 說(shuō)。

國(guó)際紙業(yè)創(chuàng)建了另外的數(shù)據(jù)標(biāo)簽,每隔一分鐘而不是每隔 1-2 秒寫一次數(shù)據(jù),從而簡(jiǎn)化了大數(shù)據(jù)機(jī)器學(xué)習(xí)的數(shù)據(jù)提取過(guò)程。

優(yōu)秀的數(shù)據(jù)管理員的價(jià)值

使用 PI System 工具,Smith 開始研究數(shù)據(jù),探索如何能減少不必要的存儲(chǔ)與數(shù)據(jù)處理。他發(fā)現(xiàn),在一家造紙廠,不到百分之一的數(shù)據(jù)標(biāo)簽占據(jù)了存檔空間的近 37%。對(duì)于不同類型的分析,可能需要以不同的頻率采集數(shù)據(jù)。Smith 采用 Asset framework(PI Server 的一部分)為采集頻率密集的標(biāo)簽同時(shí)設(shè)置了較低的采集頻率,以較長(zhǎng)的間隔來(lái)收集相同的數(shù)據(jù),在確保數(shù)據(jù)存檔豐富性的同時(shí),實(shí)現(xiàn)更快的檢索速度。

對(duì)于某些數(shù)據(jù)標(biāo)簽,密集的數(shù)據(jù)收集頻率對(duì)于存檔很重要,但并非所有分析都需要細(xì)粒度的數(shù)據(jù)。在對(duì)一組數(shù)據(jù)標(biāo)簽進(jìn)行分析時(shí),Smith發(fā)現(xiàn),與一秒鐘間隔的數(shù)據(jù)相比,一分鐘間隔的數(shù)據(jù)其數(shù)據(jù)讀取時(shí)間可以減少 85%。

對(duì)數(shù)據(jù)進(jìn)行適當(dāng)?shù)墓芾砗徒M織,也會(huì)使數(shù)據(jù)檢索時(shí)間在原來(lái)長(zhǎng)度的基礎(chǔ)上大幅減少。在一項(xiàng)分析中,Smith 使用了 50 個(gè)數(shù)據(jù)標(biāo)簽并在Asset framework 為它們構(gòu)建了一個(gè)結(jié)構(gòu),這一舉措將讀取一年數(shù)據(jù)的時(shí)間從 15 分鐘以上縮短到 5 分鐘以內(nèi)。通過(guò)使用數(shù)據(jù)平均值而不是工廠儀表上傳感器的原始值,將另一項(xiàng)分析的時(shí)間從 14 小時(shí)縮短到 40 秒。

仔細(xì)研究公司的數(shù)據(jù)如何生成、存儲(chǔ)和處理,這一工作平淡無(wú)奇,但它所產(chǎn)生的結(jié)果卻令人矚目。

“所有系統(tǒng)都需要管理者,”Smith 說(shuō)?!懊總€(gè)人都想成為架構(gòu)師。但我們更需要腳踏實(shí)地的數(shù)據(jù)管理員?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4710

    瀏覽量

    95430
  • 數(shù)據(jù)采集
    +關(guān)注

    關(guān)注

    40

    文章

    7190

    瀏覽量

    116542
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8504

    瀏覽量

    134661
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無(wú)法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場(chǎng)可編程門陣列)作為一種靈活且高效的硬件加速平臺(tái)
    的頭像 發(fā)表于 07-16 15:34 ?559次閱讀

    **【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合**

    【技術(shù)干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合 近期收到不少伙伴咨詢nRF54系列芯片的應(yīng)用與技術(shù)細(xì)節(jié),今天我們整理幾個(gè)核心問(wèn)題與解答,帶你快速掌握如何在nRF54上部署AI
    發(fā)表于 04-01 00:00

    機(jī)器學(xué)習(xí)模型市場(chǎng)前景如何

    當(dāng)今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長(zhǎng)以及計(jì)算能力的飛速提升,機(jī)器學(xué)習(xí)模型的市場(chǎng)前景愈發(fā)廣闊。下面,AI部落小編將探討機(jī)器學(xué)習(xí)模型市場(chǎng)
    的頭像 發(fā)表于 02-13 09:39 ?366次閱讀

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    用于開發(fā)生物學(xué)數(shù)據(jù)機(jī)器學(xué)習(xí)方法。盡管深度學(xué)習(xí)(一般指神經(jīng)網(wǎng)絡(luò)算法)是一個(gè)強(qiáng)大的工具,目前也非常流行,但它的應(yīng)用領(lǐng)域仍然有限。與深度學(xué)習(xí)相比
    的頭像 發(fā)表于 12-30 09:16 ?1196次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    如何選擇云原生機(jī)器學(xué)習(xí)平臺(tái)

    當(dāng)今,云原生機(jī)器學(xué)習(xí)平臺(tái)因其彈性擴(kuò)展、高效部署、低成本運(yùn)營(yíng)等優(yōu)勢(shì),逐漸成為企業(yè)構(gòu)建和部署機(jī)器學(xué)習(xí)應(yīng)用的首選。然而,市場(chǎng)上的云原生機(jī)器
    的頭像 發(fā)表于 12-25 11:54 ?461次閱讀

    cmp在機(jī)器學(xué)習(xí)中的作用 如何使用cmp進(jìn)行數(shù)據(jù)對(duì)比

    機(jī)器學(xué)習(xí)領(lǐng)域,"cmp"這個(gè)術(shù)語(yǔ)可能并不是一個(gè)常見(jiàn)的術(shù)語(yǔ),它可能是指"比較"(comparison)的縮寫。 比較在機(jī)器學(xué)習(xí)中的作用 模型評(píng)估 :比較不同模型的性能是
    的頭像 發(fā)表于 12-17 09:35 ?886次閱讀

    ??低晹y手太陽(yáng)紙業(yè)共推造紙行業(yè)數(shù)字化轉(zhuǎn)型

    近日,海康威視高級(jí)副總裁徐習(xí)明帶隊(duì)赴山東濟(jì)寧太陽(yáng)紙業(yè),與太陽(yáng)紙業(yè)管理團(tuán)隊(duì)探討交流未來(lái)合作方向。后續(xù),雙方將基于造紙行業(yè)生產(chǎn)、運(yùn)營(yíng)環(huán)節(jié)中的實(shí)際需求,探索場(chǎng)景落地?cái)?shù)字化應(yīng)用,共同推動(dòng)造紙行業(yè)數(shù)字化轉(zhuǎn)型。
    的頭像 發(fā)表于 11-19 11:12 ?720次閱讀

    什么是機(jī)器學(xué)習(xí)?通過(guò)機(jī)器學(xué)習(xí)方法能解決哪些問(wèn)題?

    計(jì)算機(jī)系統(tǒng)自身的性能”。事實(shí)上,由于“經(jīng)驗(yàn)”在計(jì)算機(jī)系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機(jī)器學(xué)習(xí)需要設(shè)法對(duì)數(shù)據(jù)進(jìn)行分析學(xué)習(xí),這就使得它逐漸成為智
    的頭像 發(fā)表于 11-16 01:07 ?967次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過(guò)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問(wèn)題?

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對(duì)計(jì)算資源的需求也在不斷增長(zhǎng)。NPU作為一種專門深度學(xué)習(xí)
    的頭像 發(fā)表于 11-15 09:19 ?1237次閱讀

    eda在機(jī)器學(xué)習(xí)中的應(yīng)用

    機(jī)器學(xué)習(xí)項(xiàng)目中,數(shù)據(jù)預(yù)處理和理解是成功構(gòu)建模型的關(guān)鍵。探索性數(shù)據(jù)分析(EDA)是這一過(guò)程中不可或缺的一部分。 1. 數(shù)據(jù)清洗
    的頭像 發(fā)表于 11-13 10:42 ?915次閱讀

    人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI有很多技術(shù),但其中一個(gè)很大的子集是機(jī)器學(xué)習(xí)——讓算法從數(shù)據(jù)學(xué)習(xí)。
    發(fā)表于 10-24 17:22 ?2987次閱讀
    人工智能、<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】時(shí)間序列的信息提取

    方法該時(shí)間序列填充缺失值。 時(shí)間序列的縮放是指對(duì)原有的時(shí)間序列數(shù)據(jù)進(jìn)行數(shù)據(jù)范圍的調(diào)整,以便更好地完成后續(xù)的數(shù)據(jù)分析或機(jī)器
    發(fā)表于 08-17 21:12

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

    本人有些機(jī)器學(xué)習(xí)的基礎(chǔ),理解起來(lái)一點(diǎn)也不輕松,加油。 作者首先說(shuō)明了時(shí)間序列的信息提取是時(shí)間序列分析的一個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測(cè)任務(wù),可以
    發(fā)表于 08-14 18:00

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 簡(jiǎn)單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,讀者繪制了一幅時(shí)間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實(shí)地構(gòu)建了時(shí)間序列分析的基礎(chǔ)知識(shí),更巧妙地展示了機(jī)器
    發(fā)表于 08-12 11:21

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 了解時(shí)間序列

    收到《時(shí)間序列與機(jī)器學(xué)習(xí)》一書,彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發(fā)燒友提供了一個(gè)讓我學(xué)習(xí)時(shí)間序列及應(yīng)用的機(jī)會(huì)! 前言第一段描述了編寫背景: 由此可知,這是一本關(guān)于時(shí)間序列進(jìn)行大
    發(fā)表于 08-11 17:55