使用keras做SQL注入攻擊的判斷(實(shí)例講解)
本文是通過深度學(xué)習(xí)框架keras來做SQL注入特征識別, 不過雖然用了keras,但是大部分還是普通的神經(jīng)網(wǎng)絡(luò),只是外加了一些規(guī)則化、dropout層(隨著深度學(xué)習(xí)出現(xiàn)的層)。
基本思路就是喂入一堆數(shù)據(jù)(INT型)、通過神經(jīng)網(wǎng)絡(luò)計(jì)算(正向、反向)、SOFTMAX多分類概率計(jì)算得出各個類的概率,注意:這里只要2個類別:0-正常的文本;1-包含SQL注入的文本
文件分割上,做成了4個python文件:
util類,用來將char轉(zhuǎn)換成int(NN要的都是數(shù)字類型的,其他任何類型都要轉(zhuǎn)換成int/float這些才能喂入,又稱為feed)
data類,用來獲取訓(xùn)練數(shù)據(jù),驗(yàn)證數(shù)據(jù)的類,由于這里的訓(xùn)練是有監(jiān)督訓(xùn)練,因此此時需要返回的是個元組(x, y)
trainer類,keras的網(wǎng)絡(luò)模型建模在這里,包括損失函數(shù)、訓(xùn)練epoch次數(shù)等
predict類,獲取幾個測試數(shù)據(jù),看看效果的預(yù)測類
先放trainer類代碼,網(wǎng)絡(luò)定義在這里,最重要的一個,和數(shù)據(jù)格式一樣重要(呵呵,數(shù)據(jù)格式可是非常重要的,在這種程序中)
import SQL注入Data import numpy as np import keras from keras.models import Sequential from keras.layers import Dense, Dropout, Activation from keras.layers.normalization import BatchNormalization from keras.optimizers import SGD x, y=SQL注入Data.loadSQLInjectData() availableVectorSize=15 x=keras.preprocessing.sequence.pad_sequences(x, padding='post', maxlen=availableVectorSize) y=keras.utils.to_categorical(y, num_classes=2) model = Sequential() model.add(Dense(64, activation='relu', input_dim=availableVectorSize)) model.add(BatchNormalization()) model.add(Dropout(0.3)) model.add(Dense(64, activation='relu')) model.add(Dropout(0.3)) model.add(Dense(2, activation='softmax')) sgd = SGD(lr=0.001, momentum=0.9) model.compile(loss='mse', optimizer=sgd, metrics=['accuracy']) history=model.fit(x, y,epochs=500,batch_size=16) model.save('E:\\sql_checker\\models\\trained_models.h5') print("DONE, model saved in path-->E:\\sql_checker\\models\\trained_models.h5") import matplotlib.pyplot as plt plt.plot(history.history['loss']) plt.title('model loss') plt.ylabel('loss') plt.xlabel('epoch') plt.legend(['train', 'test'], loc='upper left') plt.show()
先來解釋上面這段plt的代碼,因?yàn)樽钊菀捉忉專@段代碼是用來把每次epoch的訓(xùn)練的損失loss value用折線圖表示出來:
何為訓(xùn)練?何為損失loss value?
訓(xùn)練的目的是為了想讓網(wǎng)絡(luò)最終計(jì)算出來的分類數(shù)據(jù)和我們給出的y一致,那不一致怎么算?不一致就是有損失,也就是說訓(xùn)練的目的是要一致,也就是要損失最小化
怎么讓損失最小化?梯度下降,這里用的是SGD優(yōu)化算法:
from keras.optimizers import SGD sgd = SGD(lr=0.001, momentum=0.9) model.compile(loss='mse', optimizer=sgd, metrics=['accuracy'])
上面這段代碼的loss='mse'就是定義了用那種損失函數(shù),還有好幾種損失函數(shù),大家自己參考啊。
optimizer=sgd就是優(yōu)化算法用哪個了,不同的optimizer有不同的參數(shù)
由于此處用的是全連接NN,因此是需要固定的輸入size的,這個函數(shù)就是用來固定(不夠會補(bǔ)0) 特征向量size的:
x=keras.preprocessing.sequence.pad_sequences(x, padding='post', maxlen=availableVectorSize)
再來看看最終的分類輸出,是one hot的,這個one hot大家自己查查,很容易的定義,就是比較浪費(fèi)空間,分類間沒有關(guān)聯(lián)性,不過用在這里很方便
y=keras.utils.to_categorical(y, num_classes=2)
然后再說說預(yù)測部分代碼:
import SQL注入Data import Converter import numpy as np import keras from keras.models import load_model print("predict....") x=SQL注入Data.loadTestSQLInjectData() x=keras.preprocessing.sequence.pad_sequences(x, padding='post', maxlen=15) model=load_model('E:\\sql_checker\\models\\trained_models.h5') result=model.predict_classes(x, batch_size=len(x)) result=Converter.convert2label(result) print(result) print("DONE")
這部分代碼很容易理解,并且連y都沒有
好了,似乎有那么點(diǎn)意思了吧。
下面把另外幾個工具類、數(shù)據(jù)類代碼放出來:
def toints(sentence): base=ord('0') ary=[] for c in sentence: ary.append(ord(c)-base) return ary def convert2label(vector): string_array=[] for v in vector: if v==1: string_array.append('SQL注入') else: string_array.append('正常文本') return string_array
import Converter import numpy as np def loadSQLInjectData(): x=[] x.append(Converter.toints("100")) x.append(Converter.toints("150")) x.append(Converter.toints("1")) x.append(Converter.toints("3")) x.append(Converter.toints("19")) x.append(Converter.toints("37")) x.append(Converter.toints("1'--")) x.append(Converter.toints("1' or 1=1;--")) x.append(Converter.toints("updatable")) x.append(Converter.toints("update tbl")) x.append(Converter.toints("update someb")) x.append(Converter.toints("update")) x.append(Converter.toints("updat")) x.append(Converter.toints("update a")) x.append(Converter.toints("'--")) x.append(Converter.toints("' or 1=1;--")) x.append(Converter.toints("aupdatable")) x.append(Converter.toints("hello world")) y=[[0],[0],[0],[0],[0],[0],[1],[1],[0],[1],[1],[0],[0],[1],[1],[1],[0],[0]] x=np.asarray(x) y=np.asarray(y) return x, y def loadTestSQLInjectData(): x=[] x.append(Converter.toints("some value")) x.append(Converter.toints("-1")) x.append(Converter.toints("' or 1=1;--")) x.append(Converter.toints("noupdate")) x.append(Converter.toints("update ")) x.append(Converter.toints("update")) x.append(Converter.toints("update z")) x=np.asarray(x) return x
以上這篇使用keras做SQL注入攻擊的判斷(實(shí)例講解)就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持本站。
版權(quán)聲明:本站文章來源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來,僅供學(xué)習(xí)參考,不代表本站立場,如有內(nèi)容涉嫌侵權(quán),請聯(lián)系alex-e#qq.com處理。