99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

深度學習&計算機視覺方向的相關面試題

新機器視覺 ? 來源:新機器視覺 ? 2020-09-24 13:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導讀

正值秋招進行時,本文收集了深度學習&計算機視覺方向的相關面試題,涵蓋反卷積、神經(jīng)網(wǎng)絡、目標檢測等多個方面,內(nèi)容非常全面。

1.什么是反卷積?

反卷積也稱為轉(zhuǎn)置卷積,如果用矩陣乘法實現(xiàn)卷積操作,將卷積核平鋪為矩陣,則轉(zhuǎn)置卷積在正向計算時左乘這個矩陣的轉(zhuǎn)置WT,在反向傳播時左乘W,與卷積操作剛好相反,需要注意的是,反卷積不是卷積的逆運算。

一般的卷積運算可以看成是一個其中非零元素為權(quán)重的稀疏矩陣C與輸入的圖像進行矩陣相乘,反向傳播時的運算實質(zhì)為C的轉(zhuǎn)置與loss對輸出y的導數(shù)矩陣的矩陣相乘。

逆卷積的運算過程與卷積正好相反,是正向傳播時做成C的轉(zhuǎn)置,反向傳播時左乘C

2.反卷積有哪些用途?

實現(xiàn)上采樣;近似重構(gòu)輸入圖像,卷積層可視化。

3.解釋神經(jīng)網(wǎng)絡的萬能逼近定理

只要激活函數(shù)選擇得當,神經(jīng)元的數(shù)量足夠,至少有一個隱含層的神經(jīng)網(wǎng)絡可以逼近閉區(qū)間上任意一個連續(xù)函數(shù)到任意指定的精度。

4.神經(jīng)網(wǎng)絡是生成模型還是判別模型?

判別模型,直接輸出類別標簽,或者輸出類后驗概率p(y|x)

5.Batch Normalization 和 Group Normalization有何區(qū)別?

BN是在 batch這個維度上進行歸一化,GN是計算channel方向每個group的均值方差.

6.模型壓縮的主要方法有哪些?

從模型結(jié)構(gòu)上優(yōu)化:模型剪枝、模型蒸餾、automl直接學習出簡單的結(jié)構(gòu)

模型參數(shù)量化將FP32的數(shù)值精度量化到FP16、INT8、二值網(wǎng)絡、三值網(wǎng)絡等。

7.目標檢測中IOU是如何計算的?

檢測結(jié)果與 Ground Truth 的交集比上它們的并集,即為檢測的準確率 IoU

8.使用深度卷積網(wǎng)絡做圖像分類如果訓練一個擁有1000萬個類的模型會碰到什么問題?

提示:內(nèi)存/顯存占用;模型收斂速度等

9.深度學習中為什么不用二階導去優(yōu)化?

Hessian矩陣是n*n, 在高維情況下這個矩陣非常大,計算和存儲都是問題。

10.深度機器學習中的mini-batch的大小對學習效果有何影響?

mini-batch太小會導致收斂變慢,太大容易陷入sharp minima,泛化性不好。

11.dropout的原理

可以把dropout看成是 一種ensemble方法,每次做完dropout相當于從原網(wǎng)絡中找到一個更瘦的網(wǎng)絡。

強迫神經(jīng)元和其他隨機挑選出來的神經(jīng)元共同工作,減弱了神經(jīng)元節(jié)點間的聯(lián)合適應性,增強泛化能力

使用dropout得到更多的局部簇,同等數(shù)據(jù)下,簇變多了,因而區(qū)分性變大,稀疏性也更大

12.為什么SSD對小目標檢測效果不好:

小目標對應的anchor比較少,其對應的feature map上的pixel難以得到訓練,這也是為什么SSD在augmentation之后精確度上漲(因為crop之后小目標就變?yōu)榇竽繕耍?/p>

要檢測小目標需要足夠大的feature map來提供精確特征,同時也需要足夠的語義信息來與背景作區(qū)分

13.空洞卷積及其優(yōu)缺點

pooling操作雖然能增大感受野,但是會丟失一些信息。空洞卷積在卷積核中插入權(quán)重為0的值,因此每次卷積中會skip掉一些像素點;

空洞卷積增大了卷積輸出每個點的感受野,并且不像pooling會丟失信息,在圖像需要全局信息或者需要較長sequence依賴的語音序列問題上有著較廣泛的應用。

14.Fast RCNN中位置損失為何使用Smooth L1:

表達式為:

作者這樣設置的目的是想讓loss對于離群點更加魯棒,相比于L2損失函數(shù),其對離群點、異常值(outlier)不敏感,可控制梯度的量級使訓練時不容易跑飛。

15.Batch Normalization

使用BN的原因是網(wǎng)絡訓練中每一層不斷改變的參數(shù)會導致后續(xù)每一層輸入的分布發(fā)生變化,而學習的過程又要使每一層去適應輸入的分布,因此不得不降低網(wǎng)絡的學習率,并且要小心得初始化(internal covariant shift)

如果僅通過歸一化方法使得數(shù)據(jù)具有零均值和單位方差,則會降低層的表達能力(如使用Sigmoid函數(shù)時,只使用線性區(qū)域)

BN的具體過程(注意第三個公式中分母要加上epsilon)

注意點:在測試過程中使用的均值和方差已經(jīng)不是某一個batch的了,而是針對整個數(shù)據(jù)集而言。因此,在訓練過程中除了正常的前向傳播和反向求導之外,我們還要記錄每一個Batch的均值和方差,以便訓練完成之后按照下式計算整體的均值和方差。

另一個注意點:在arxiv六月份的preprint論文中,有一篇叫做“How Does Batch Normalization Help Optimization?”的文章,里面提到BN起作用的真正原因和改變輸入的分布從而產(chǎn)生穩(wěn)定性幾乎沒有什么關系,真正的原因是BN使對應優(yōu)化問題的landscape變得更加平穩(wěn),這就保證了更加predictive的梯度以及可以使用更加大的學習率從而使網(wǎng)絡更快收斂,而且不止BN可以產(chǎn)生這種影響,許多正則化技巧都有這種類似影響。

16.超參數(shù)搜索方法

網(wǎng)格搜索:在所有候選的參數(shù)選擇中,通過循環(huán)遍歷,嘗試每一種可能性,表現(xiàn)最好的參數(shù)就是最終的結(jié)果。

貝葉斯優(yōu)化:貝葉斯優(yōu)化其實就是在函數(shù)方程不知的情況下根據(jù)已有的采樣點預估函數(shù)最大值的一個算法。該算法假設函數(shù)符合高斯過程(GP)。

隨機搜索:已經(jīng)發(fā)現(xiàn),簡單地對參數(shù)設置進行固定次數(shù)的隨機搜索,比在窮舉搜索中的高維空間更有效。這是因為事實證明,一些超參數(shù)不通過特征變換的方式把低維空間轉(zhuǎn)換到高維空間,而在低維空間不可分的數(shù)據(jù),到高維空間中線性可分的幾率會高一些。具體方法:核函數(shù),如:高斯核,多項式核等等。

基于梯度:計算相對于超參數(shù)的梯度,然后使用梯度下降優(yōu)化超參數(shù)。

17.如何理解卷積、池化等、全連接層等操作

卷積的作用:捕獲圖像相鄰像素的依賴性;起到類似濾波器的作用,得到不同形態(tài)的feature map

激活函數(shù)的作用:引入非線性因素

池化的作用:減少特征維度大小,使特征更加可控;減少參數(shù)個數(shù),從而控制過擬合程度;增加網(wǎng)絡對略微變換后的圖像的魯棒性;達到一種尺度不變性,即無論物體在圖像中哪個方位均可以被檢測到

18.1x1大小的卷積核的作用

通過控制卷積核個數(shù)實現(xiàn)升維或者降維,從而減少模型參數(shù)

對不同特征進行歸一化操作

用于不同channel上特征的融合

19.常見激活函數(shù)特點

sigmoid:輸入值很大時對應的函數(shù)值接近1或0,處于函數(shù)的飽和區(qū),導致梯度幾乎為0,造成梯度消失問題

Relu:解決梯度消失問題,但是會出現(xiàn)dying relu現(xiàn)象,即訓練過程中,有些神經(jīng)元實際上已經(jīng)"死亡“而不再輸出任何數(shù)值

Leaky Relu:f = max(αx, x),解決dying relu問題,α的取值較大時比較小時的效果更好。它有一個衍生函數(shù),parametric Leaky Relu,在該函數(shù)中α是需要去學習的

ELU:避免dying神經(jīng)元,并且處處連續(xù),從而加速SGD,但是計算比較復雜

激活函數(shù)的選擇順序:ELU>Leaky Relu及其變體>Relu>tanh>sigmoid

20.訓練過程中,若一個模型不收斂,那么是否說明這個模型無效?導致模型不收斂的原因有哪些?

并不能說明這個模型無效,導致模型不收斂的原因可能有數(shù)據(jù)分類的標注不準確;樣本的信息量太大導致模型不足以fit整個樣本空間;

學習率設置的太大容易產(chǎn)生震蕩,太小會導致不收斂;可能復雜的分類任務用了簡單的模型;數(shù)據(jù)沒有進行歸一化的操作。

21.深度學習中的不同最優(yōu)化方式,如SGD,ADAM下列說法中正確的是?

A.在實際場景下,應盡量使用ADAM,避免使用SGD
B.同樣的初始學習率情況下,ADAM的收斂速度總是快于SGD方法
C.相同超參數(shù)數(shù)量情況下,比起自適應的學習率調(diào)整方式,SGD加手動調(diào)節(jié)通常會取得更好效果
D.同樣的初始學習率情況下,ADAM比SGD容易過擬合

S: C

22.深度學習:凸與非凸的區(qū)別

凸:

指的是順著梯度方向走到底就一定是最優(yōu)解 。

大部分傳統(tǒng)機器學習問題都是凸的。

非凸:

指的是順著梯度方向走到底只能保證是局部最優(yōu),不能保證是全局最優(yōu)。

深度學習以及小部分傳統(tǒng)機器學習問題都是非凸的。

23.googlenet提出的Inception結(jié)構(gòu)優(yōu)勢有()

A.保證每一層的感受野不變,網(wǎng)絡深度加深,使得網(wǎng)絡的精度更高
B.使得每一層的感受野增大,學習小特征的能力變大
C.有效提取高層語義信息,且對高層語義進行加工,有效提高網(wǎng)絡準確度
D.利用該結(jié)構(gòu)有效減輕網(wǎng)絡的權(quán)重

S:AD.

24.深度學習中的激活函數(shù)需要具有哪些屬性?()

A.計算簡單
B.非線性
C.具有飽和區(qū)
D.幾乎處處可微

S: ABC
relu函數(shù)在0處是不可微的。

25.關于神經(jīng)網(wǎng)絡中經(jīng)典使用的優(yōu)化器,以下說法正確的是

A.Adam的收斂速度比RMSprop慢
B.相比于SGD或RMSprop等優(yōu)化器,Adam的收斂效果是最好的
C.對于輕量級神經(jīng)網(wǎng)絡,使用Adam比使用RMSprop更合適
D.相比于Adam或RMSprop等優(yōu)化器,SGD的收斂效果是最好的

S: D
SGD通常訓練時間更長,容易陷入鞍點,但是在好的初始化和學習率調(diào)度方案的情況下,結(jié)果更可靠。如果在意更快的收斂,并且需要訓練較深較復雜的網(wǎng)絡時,推薦使用學習率自適應的優(yōu)化方法。

26.以下說法錯誤的是

A.使用ReLU做為激活函數(shù),可有效地防止梯度爆炸
B.使用Sigmoid做為激活函數(shù),較容易出現(xiàn)梯度消失
C.使用Batch Normalization層,可有效的防止梯度爆炸
D.使用參數(shù)weight decay,在一程度上可防止模型過擬合

S: C
意思是BN解決的是梯度消失問題?對結(jié)果存疑。認為二者皆可防止。

27.以下哪種方法一般不用于在大數(shù)據(jù)集上訓練DNN:

A.SGD B.FTRL C.RMSProp D.L-BFGS

S: D

L-BFGS(Limited-memory BFGS,內(nèi)存受限擬牛頓法)方法:所有的數(shù)據(jù)都會參與訓練,算法融入方差歸一化和均值歸一化。大數(shù)據(jù)集訓練DNN,容易參數(shù)量過大 (牛頓法的進化版本,尋找更好的優(yōu)化方向,減少迭代輪數(shù))從LBFGS算法的流程來看,其整個的核心的就是如何快速計算一個Hesse的近似:重點一是近似,所以有了LBFGS算法中使用前m個近似下降方向進行迭代的計算過程;重點二是快速,這個體現(xiàn)在不用保存Hesse矩陣上,只需要使用一個保存后的一階導數(shù)序列就可以完成,因此不需要大量的存儲,從而節(jié)省了計算資源;重點三,是在推導中使用秩二校正構(gòu)造了一個正定矩陣,即便這個矩陣不是最優(yōu)的下降方向,但至少可以保證函數(shù)下降。
FTRL(Follow-the-regularized-Leader)是一種適用于處理超大規(guī)模數(shù)據(jù)的,含大量稀疏特征的在線學習的常見優(yōu)化算法,方便實用,而且效果很好,常用于更新在線的CTR預估模型;FTRL在處理帶非光滑正則項(如L1正則)的凸優(yōu)化問題上表現(xiàn)非常出色,不僅可以通過L1正則控制模型的稀疏度,而且收斂速度快;

28.下列關于深度學習說法錯誤的是

A.LSTM在一定程度上解決了傳統(tǒng)RNN梯度消失或梯度爆炸的問題
B.CNN相比于全連接的優(yōu)勢之一是模型復雜度低,緩解過擬合
C.只要參數(shù)設置合理,深度學習的效果至少應優(yōu)于隨機算法
D.隨機梯度下降法可以緩解網(wǎng)絡訓練過程中陷入鞍點的問題

S: C.

29.多尺度問題怎么解決?

實際上,現(xiàn)在有很多針對小目標的措施和改良,如下:

最常見的是Upsample來Rezie網(wǎng)絡輸入圖像的大??;

用dilated/astrous等這類特殊的卷積來提高檢測器對分辨率的敏感度;(空洞卷積是針對圖像語義分割問題中下采樣會降低圖像分辨率、丟失信息而提出的一種卷積思路。利用添加空洞擴大感受野,讓原本3 x3的卷積核,在相同參數(shù)量和計算量下?lián)碛?x5(dilated rate =2)或者更大的感受野,從而無需下采樣。在保持參數(shù)個數(shù)不變的情況下增大了卷積核的感受野)

有比較直接的在淺層和深層的Feature Map上直接各自獨立做預測的,這個就是我們常說的尺度問題。

用FPN這種把淺層特征和深層特征融合的,或者最后在預測的時候,用淺層特征和深層特征一起預測;

SNIP(Scale Normalization for Image Pyramids)主要思路:

在訓練和反向傳播更新參數(shù)時,只考慮那些在指定的尺度范圍內(nèi)的目標,由此提出了一種特別的多尺度訓練方法。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:深度學習&計算機視覺常見的29道面試題及解析

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AR和VR中的計算機視覺

    ):計算機視覺引領混合現(xiàn)實體驗增強現(xiàn)實(AR)和虛擬現(xiàn)實(VR)正在徹底改變我們與外部世界的互動方式。即便是在引人入勝的沉浸式
    的頭像 發(fā)表于 02-08 14:29 ?1588次閱讀
    AR和VR中的<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>

    面試題】人工智能工程師高頻面試題匯總:概率論與統(tǒng)計篇(題目+答案)

    、機器學習的那些算法,或者深度學習的框架,還有怎么優(yōu)化模型,Transformer等,這些都是加分項,能有效提高面試通過率。本篇小編整理了一些高頻的概率論與統(tǒng)計——貝
    的頭像 發(fā)表于 01-22 13:00 ?945次閱讀
    【<b class='flag-5'>面試題</b>】人工智能工程師高頻<b class='flag-5'>面試題</b>匯總:概率論與統(tǒng)計篇(題目+答案)

    面試題】人工智能工程師高頻面試題匯總:機器學習深化篇(題目+答案)

    ,或者深度學習的框架,還有怎么優(yōu)化模型,這些都是加分項,能有效提高面試通過率。本篇小編整理了一些高頻的機器學習深化方面的面試題,這些題目都是
    的頭像 發(fā)表于 12-16 13:42 ?2852次閱讀
    【<b class='flag-5'>面試題</b>】人工智能工程師高頻<b class='flag-5'>面試題</b>匯總:機器<b class='flag-5'>學習</b>深化篇(題目+答案)

    面試題】人工智能工程師高頻面試題匯總:Transformer篇(題目+答案)

    ,或者深度學習的框架,還有怎么優(yōu)化模型,Transformer的一些知識,這些都是加分項,能有效提高面試通過率。本篇小編整理了一些高頻的Transformer方面的面
    的頭像 發(fā)表于 12-13 15:06 ?1397次閱讀
    【<b class='flag-5'>面試題</b>】人工智能工程師高頻<b class='flag-5'>面試題</b>匯總:Transformer篇(題目+答案)

    人工智能工程師高頻面試題匯總——機器學習

    ,或者深度學習的框架,還有怎么優(yōu)化模型,這些都是加分項,能有效提高面試通過率。本篇小編整理了一些高頻的機器學習方面的面試題,這些題目都是從實
    的頭像 發(fā)表于 12-04 17:00 ?1541次閱讀
    人工智能工程師高頻<b class='flag-5'>面試題</b>匯總——機器<b class='flag-5'>學習</b>篇

    量子計算機與普通計算機工作原理的區(qū)別

    ? 本文介紹了量子計算機與普通計算機工作原理的區(qū)別。 量子計算是一個新興的研究領域,科學家們利用量子力學,制造出具有革命性能力的計算機。雖然現(xiàn)在的量子
    的頭像 發(fā)表于 11-24 11:00 ?1516次閱讀
    量子<b class='flag-5'>計算機</b>與普通<b class='flag-5'>計算機</b>工作原理的區(qū)別

    【小白入門必看】一文讀懂深度學習計算機視覺技術(shù)及學習路線

    一、什么是計算機視覺計算機視覺,其實就是教機器怎么像我們?nèi)艘粯?,用攝像頭看看周圍的世界,然后理解它。比如說,它能認出這是個蘋果,或者那邊有輛車。除此之外,還能把拍到的照片或者視頻轉(zhuǎn)換
    的頭像 發(fā)表于 10-31 17:00 ?1254次閱讀
    【小白入門必看】一文讀懂<b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>技術(shù)及<b class='flag-5'>學習</b>路線

    FPGA加速深度學習模型的案例

    FPGA(現(xiàn)場可編程門陣列)加速深度學習模型是當前硬件加速領域的一個熱門研究方向。以下是一些FPGA加速深度學習模型的案例: 一、基于FPG
    的頭像 發(fā)表于 10-25 09:22 ?1242次閱讀

    晶體管計算機和電子管計算機有什么區(qū)別

    晶體管計算機和電子管計算機作為計算機發(fā)展史上的兩個重要階段,它們在多個方面存在顯著的區(qū)別。以下是對這兩類計算機在硬件、性能、應用以及技術(shù)發(fā)展等方面區(qū)別的詳細闡述。
    的頭像 發(fā)表于 08-23 15:28 ?3635次閱讀

    如何利用ARMxy ARM嵌入式計算機的NPU進行深度學習模型的訓練和優(yōu)化?

    在正文開始前,我們先大致了解鋇錸的ARMxy ARM嵌入式計算機,再來說說我們?nèi)绾卫肁RMxy ARM嵌入式計算機的NPU來實現(xiàn)深度學習模型的訓練和優(yōu)化。 ARMxy系列的 ARM?
    的頭像 發(fā)表于 08-20 13:43 ?769次閱讀
    如何利用ARMxy ARM嵌入式<b class='flag-5'>計算機</b>的NPU進行<b class='flag-5'>深度</b><b class='flag-5'>學習</b>模型的訓練和優(yōu)化?

    ARMxy ARM嵌入式計算機搭載 1 TOPS NPU支持深度學習

    ARMxy ARM嵌入式計算機BL410系列內(nèi)置了1TOPS算力 NPU,它每秒可以執(zhí)行高達一萬億次的浮點運算,這為復雜的圖像處理和深度學習任務提供了充足的計算資源。在產(chǎn)品缺陷檢測領域
    的頭像 發(fā)表于 08-20 11:53 ?869次閱讀
    ARMxy ARM嵌入式<b class='flag-5'>計算機</b>搭載 1 TOPS NPU支持<b class='flag-5'>深度</b><b class='flag-5'>學習</b>

    計算機視覺有哪些優(yōu)缺點

    計算機視覺作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動了多個行業(yè)的變革,也帶來了諸多優(yōu)勢,但同時也伴隨著一些挑戰(zhàn)和局限性。以下是對
    的頭像 發(fā)表于 08-14 09:49 ?2062次閱讀

    計算機視覺中的圖像融合

    在許多計算機視覺應用中(例如機器人運動和醫(yī)學成像),需要將多個圖像的相關信息整合到單一圖像中。這種圖像融合可以提供更高的可靠性、準確性和數(shù)據(jù)質(zhì)量。多視圖融合可以提高圖像分辨率,并恢復場景的三維表示
    的頭像 發(fā)表于 08-01 08:28 ?1148次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>中的圖像融合

    地平線科研論文入選國際計算機視覺頂會ECCV 2024

    近日,地平線兩篇論文入選國際計算機視覺頂會ECCV 2024,自動駕駛算法技術(shù)再有新突破。
    的頭像 發(fā)表于 07-27 11:10 ?1471次閱讀
    地平線科研論文入選國際<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>頂會ECCV 2024

    計算機視覺技術(shù)的AI算法模型

    計算機視覺技術(shù)作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實現(xiàn)這一目標,計算機視覺技術(shù)依賴于
    的頭像 發(fā)表于 07-24 12:46 ?1826次閱讀