Python可視化目標(biāo)檢測(cè)框的實(shí)現(xiàn)代碼
1 引言
隨著計(jì)算機(jī)視覺(jué)算法工程師的內(nèi)卷,從事目標(biāo)檢測(cè)的小伙伴們?cè)絹?lái)越多了.
很多時(shí)候我們費(fèi)了九牛二虎之力訓(xùn)練了一版模型,可是可視化出來(lái)的效果平淡無(wú)奇.
是不是有點(diǎn)太不給力啦,作為計(jì)算機(jī)視覺(jué)工程師,我們是不是應(yīng)該關(guān)注下如何優(yōu)雅地可視化我們模型地檢測(cè)結(jié)果呢?
2 舉個(gè)栗子
最常用的可視化目標(biāo)檢測(cè)結(jié)果的就是我們所說(shuō)的矩形框,矩形框的畫(huà)法也可以分為好多中,我們以下圖進(jìn)行說(shuō)明:
我們以上圖皮卡丘的矩形檢測(cè)框?yàn)槔?左上為我們常用的不帶標(biāo)簽的輸出框,右上為YOLO系列美化帶標(biāo)簽后的矩形框,左下為四個(gè)角點(diǎn)美化后的矩形框,右下為帶標(biāo)簽的角點(diǎn)美化矩形框.
3 實(shí)現(xiàn)
3.1 函數(shù)講解
在opencv中,我們通常使用cv2.rectangle函數(shù)進(jìn)行矩形框的繪制,該函數(shù)的一般形式如下:
cv2.rectangle(image, start_point, end_point, color, thickness)
相應(yīng)的參數(shù)含義如下:
- image: 輸入圖像
- start_point: 矩形框左上點(diǎn)坐標(biāo)
- end_point: 矩形框右下點(diǎn)坐標(biāo)
- color: 矩形框顏色 默認(rèn)BGR順序
- thickness: 線的粗細(xì),其中 -1 代表填充整個(gè)矩形
3.2 讀入圖像
我們使用上述函數(shù),來(lái)畫(huà)我們的示例圖像:
img_name = './pikachu.jpg' img = cv2.imread(img_name) box = [ 140, 16,468,390, "pikachu"] box_color = (255,0,255) cv2.rectangle(img, (box[0], box[1]), (box[2], box[3]), color=box_color, thickness=2)
結(jié)果如下:
左側(cè)為我們的原圖,右側(cè)為我們畫(huà)框的效果圖.
3.3 標(biāo)簽美化
接下來(lái)我們來(lái)給矩形框添加標(biāo)簽,我們觀察上述畫(huà)圖函數(shù),注意最后一個(gè)參數(shù)thickness,如果此值等于-1,那么將對(duì)矩形框執(zhí)行填充效果.基于此,我們來(lái)寫(xiě)標(biāo)簽美化代碼,如下:
def draw_label_type(draw_img,bbox,label_color): label = str(bbox[-1]) labelSize = cv2.getTextSize(label + '0', cv2.FONT_HERSHEY_SIMPLEX, 0.5, 2)[0] if bbox[1] - labelSize[1] - 3 < 0: cv2.rectangle(draw_img, (bbox[0], bbox[1] + 2), (bbox[0] + labelSize[0], bbox[1] + labelSize[1] + 3), color=label_color, thickness=-1 ) cv2.putText(draw_img, label, (bbox[0], bbox[1] + labelSize + 3), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 0), thickness=1 ) else: cv2.rectangle(draw_img, (bbox[0], bbox[1] - labelSize[1] - 3), (bbox[0] + labelSize[0], bbox[1] - 3), color=label_color, thickness=-1 ) cv2.putText(draw_img, label, (bbox[0], bbox[1] - 3), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 0), thickness=1 )
上述代碼中,首先計(jì)算標(biāo)簽文本的大小,然后據(jù)標(biāo)簽文本大小進(jìn)行矩形填充,最后使用cv2.putText畫(huà)對(duì)應(yīng)的標(biāo)簽文本.
運(yùn)行效果如下:
左側(cè)為原圖,右側(cè)為添加文本標(biāo)簽后的結(jié)果圖.
3.4 角點(diǎn)美化
上述添加完標(biāo)簽后,由于標(biāo)簽框和目標(biāo)矩形框顏色一致,邊界處不太容易區(qū)分,這里添加對(duì)角點(diǎn)美化的代碼,代碼如下:
def draw_box_corner(draw_img,bbox,length,corner_color): # Top Left cv2.line(draw_img, (bbox[0], bbox[1]), (bbox[0] + length, bbox[1]), corner_color, thickness=3) cv2.line(draw_img, (bbox[0], bbox[1]), (bbox[0], bbox[1] + length), corner_color, thickness=3) # Top Right cv2.line(draw_img, (bbox[2], bbox[1]), (bbox[2] - length, bbox[1]), corner_color, thickness=3) cv2.line(draw_img, (bbox[2], bbox[1]), (bbox[2], bbox[1] + length), corner_color, thickness=3) # Bottom Left cv2.line(draw_img, (bbox[0], bbox[3]), (bbox[0] + length, bbox[3]), corner_color, thickness=3) cv2.line(draw_img, (bbox[0], bbox[3]), (bbox[0], bbox[3] - length), corner_color, thickness=3) # Bottom Right cv2.line(draw_img, (bbox[2], bbox[3]), (bbox[2] - length, bbox[3]), corner_color, thickness=3) cv2.line(draw_img, (bbox[2], bbox[3]), (bbox[2], bbox[3] - length), corner_color, thickness=3)
上述函數(shù)參數(shù)解釋如下:
- draw_img 輸入圖像
- bbox 目標(biāo)檢測(cè)框 形式(x1,y1,x2,y2)
- length 直線長(zhǎng)度
- corner_color 直線顏色
運(yùn)行結(jié)果如下:
左側(cè)為原圖,右側(cè)為添加角點(diǎn)美化后的結(jié)果圖.
3.5 綜合效果
綜合上述標(biāo)簽美化和角點(diǎn)美化,可以得到二者綜合后的效果圖如下:
4 透明效果實(shí)現(xiàn)
通過(guò)cv2.rectangle 函數(shù)設(shè)置 thickness 我們可以得到填充后的圖像,進(jìn)而利用opencv中的 cv2.add_weight函數(shù)可以實(shí)現(xiàn)透明效果.
示例如下:
左側(cè)為img , 右側(cè)為填充后的draw_img,那么利用add_weight 進(jìn)行加權(quán)的代碼如下:
alpha = 0.8 gamma = 0 out_img = cv2.addWeighted(img,alpha,draw_img,1-alpha,gamma)
運(yùn)行后的效果圖如下:
左側(cè)為 alpha=0.5的效果圖,右側(cè)為alpha=0.8的效果圖.
和原圖放到一起進(jìn)行對(duì)比,如下:
是不是看上去優(yōu)雅多了…
5 擴(kuò)展應(yīng)用
利用上述原理,我們可以方便地將透明效果從矩形框遷移至不規(guī)則封閉區(qū)域, 樣例如下:
左側(cè)為我們輸入分割網(wǎng)絡(luò)的原始圖像,右側(cè)為我們分割網(wǎng)絡(luò)可行駛區(qū)域的推理圖,我們使用alpha=0.6對(duì)上述兩幅圖進(jìn)行加權(quán),得到結(jié)果如下:
6 總結(jié)
本文實(shí)現(xiàn)了目標(biāo)檢測(cè)矩形框的標(biāo)簽優(yōu)化以及角點(diǎn)優(yōu)化,并給出了透明化的具體原理和實(shí)際擴(kuò)展應(yīng)用,以及詳細(xì)的代碼實(shí)現(xiàn).
您學(xué)廢了嗎?
7 參考
鏈接一
鏈接二
到此這篇關(guān)于Python如何優(yōu)雅地可視化目標(biāo)檢測(cè)框的文章就介紹到這了,更多相關(guān)Python目標(biāo)檢測(cè)框內(nèi)容請(qǐng)搜索本站以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持本站!
版權(quán)聲明:本站文章來(lái)源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請(qǐng)保持原文完整并注明來(lái)源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來(lái)源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來(lái),僅供學(xué)習(xí)參考,不代表本站立場(chǎng),如有內(nèi)容涉嫌侵權(quán),請(qǐng)聯(lián)系alex-e#qq.com處理。