Python使用OpenCV和K-Means聚類對畢業(yè)照進行圖像分割
圖像分割是將圖像分割成多個不同區(qū)域(或片段)的過程。目標是將圖像的表示變成更容易和更有意義的圖像。
在這篇博客中,我們將看到一種圖像分割方法,即K-Means Clustering。
K-Means 聚類是一種無監(jiān)督機器學習算法,旨在將N 個觀測值劃分為K 個聚類,其中每個觀測值都屬于具有最近均值的聚類。集群是指由于某些相似性而聚合在一起的數(shù)據(jù)點的集合。對于圖像分割,這里的簇是不同的圖像顏色。
我們使用的環(huán)境是pip install opencv-python numpy matplotlib
選擇的圖片是我們學校畢業(yè)照的圖片,放心這里沒有我,在學校公眾號找的美圖。
導入所需模塊:
import cv2 import numpy as np import matplotlib.pyplot as plt # read the image image = cv2.imread("Graduation.jpg")
在進行圖像分割之前,讓我們將圖像轉(zhuǎn)換為RGB格式:
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
我們將使用cv2.kmeans()函數(shù),它將一個2D數(shù)組作為輸入,并且由于我們的原始圖像是3D(寬度、高度和深度為3 個 RGB值),我們需要將高度和寬度展平為單個像素向量(3 個 RGB值):
# 將圖像重塑為像素和3個顏色值(RGB)的2D數(shù)組 print(image.shape) #(853, 1280, 3) pixel_values = image.reshape((-1, 3)) # 轉(zhuǎn)換為numpy的float32 pixel_values = np.float32(pixel_values) print(pixel_values.shape) #(1091840, 3)
關(guān)于opencv下的kmean算法,函數(shù)為cv2.kmeans()
函數(shù)的格式為:kmeans(data, K, bestLabels, criteria, attempts, flags)
data: 分類數(shù)據(jù),最好是np.float32的數(shù)據(jù),每個特征放一列。之所以是np.float32原因是這種數(shù)據(jù)類型運算速度快,如果是uint型數(shù)據(jù)將會很慢。
K: 分類數(shù),opencv2的kmeans分類是需要已知分類數(shù)的。
bestLabels:預設(shè)的分類標簽:沒有的話 None
criteria:迭代停止的模式選擇,這是一個含有三個元素的元組型數(shù)。格式為(type,max_iter,epsilon)
,max_iter
迭代次數(shù),epsilon
結(jié)果的精確性
其中,type又有三種選擇:
- cv2.TERM_CRITERIA_EPS :精確度(誤差)滿足epsilon停止。
- cv2.TERM_CRITERIA_MAX_ITER:迭代次數(shù)超過max_iter停止
- cv2.TERM_CRITERIA_EPS+cv2.TERM_CRITERIA_MAX_ITER,兩者合體,任意一個滿足結(jié)束。
- - attempts:重復試驗kmeans算法次數(shù),將會返回最好的一次結(jié)果
flags:初始類中心選擇,兩種方法
cv2.KMEANS_PP_CENTERS
算法kmeans++的center; cv2.KMEANS_RANDOM_CENTERS
隨機初始化
在這里,我們需要設(shè)置criteria
確定停止標準。我們將在超過某些迭代次數(shù)(例如500)時停止,或者如果集群移動小于某個 epsilon 值(讓我們在這里選擇0.1),下面的代碼在OpenCV 中定義了這個停止標準:
# 確定停止標準 criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 500, 0.1)
上面圖像,會發(fā)現(xiàn)五種主要顏色(分別是天空、草地、樹、人的上身白,人的下身黑)
因此,我們將為這張圖片使用K=5:
k = 5 _, labels, (centers) = cv2.kmeans(pixel_values, k, None, criteria, 10, cv2.KMEANS_RANDOM_CENTERS)
cv2.KMEANS_RANDOM_CENTERS只是指示OpenCV最初隨機分配集群的值。
我們將扁平化的圖像像素值轉(zhuǎn)換為浮點數(shù)32類型,是因為cv2.kmeans() 浮點數(shù)32類型,然后,讓我們將浮點數(shù)轉(zhuǎn)換回8 位像素值np.uint8(centers)
:
# 轉(zhuǎn)換回np.uint8 centers = np.uint8(centers) # 展平標簽陣列 labels = labels.flatten() segmented_image = centers[labels.flatten()]
轉(zhuǎn)換回原始圖像形狀并顯示:
#重塑回原始圖像尺寸 segmented_image = segmented_image.reshape(image.shape) plt.imshow(segmented_image) plt.show()
當然,我們還可以禁用圖像中的一些K-Means 聚類集群。例如,讓我們禁用集群編號1并顯示圖像:
# 禁用2號群集(將像素變?yōu)楹谏?masked_image = np.copy(segmented_image) # 轉(zhuǎn)換為像素值向量的形狀 masked_image = masked_image.reshape((-1, 3)) cluster1 = 1 masked_image[labels == cluster1] = [0, 0, 0] # 轉(zhuǎn)換回原始形狀 masked_image = masked_image.reshape(image.shape) plt.imshow(masked_image) plt.show()
原來K-Means 聚類2 號集群 是樹。
請注意,還有其他分割技術(shù),例如霍夫變換、輪廓檢測和當前最先進的語義分割。
到此這篇關(guān)于Python使用OpenCV和K-Means聚類對畢業(yè)照進行圖像分割的文章就介紹到這了,更多相關(guān)OpenCV和K-Means圖像分割內(nèi)容請搜索本站以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持本站!
版權(quán)聲明:本站文章來源標注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請保持原文完整并注明來源及原文鏈接。禁止復制或仿造本網(wǎng)站,禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像,否則將依法追究法律責任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來,僅供學習參考,不代表本站立場,如有內(nèi)容涉嫌侵權(quán),請聯(lián)系alex-e#qq.com處理。