支援向量機(SVM)常見問題

2025-04-17 01:55:25 字數 1348 閱讀 7534

什麼是支援向量機(svm)以及它的用途?

1樓:惠企百科

svm - support vector machine, 俗稱支援向量機。

為一種supervised learning演算法,屬於classification的範疇。在資料探勘。

的應用中,與unsupervised的clustering相對應和區別。

廣泛應用於機器學習。

machine learning), 計算機視覺。

computer vision) 和資料探勘(data mining)當中。

假設要通過三八線把實心圈和空心圈分成兩類,那麼有無數多條線可以完成這個任務。在svm中,尋找一條最優的分界線。

使得它到兩邊的margin都最大。

12、核支援向量機svm

2樓:新科技

核支援向量機kernelized support vector machine,支援就是重要的意思,向量就是點,機就是機器,即重要的點。

位於類別之間邊界上的那些點,這些點叫作支援向量。想要對新樣本點進行**,需要測量它與每個支援向量之間的距離。

核支援向量機可用於迴歸svr和分類svc。

下面利用乳腺癌資料集對模型進行訓練:

輸出。訓練集的精度為1,但測試集精度只有63%,存在過擬合。svm要求所有特徵有相似的變化範圍,乳腺癌資料集的特徵具有不同的量級,對核svm有很大的影響,我們對每個特徵進行縮放,使其大致都位於同一範圍,如將所有特徵縮放到0和1之間(每乙個數-最小值/範圍,注意測試集也是採用訓練集的最小值和範圍的標準)。

輸出。因為訓練集和測試集的效能非常接近,但還沒有接近100%的精度,所以模型還是處於欠擬合的狀態。我們可以嘗試增大c或gamma來擬合更為複雜的模型。

gamma是控制高斯核寬度的引數,它決定了點與點之間靠近是指多大的距離,gamma越小,更多的點被看作比較靠近。c是正則化引數,它限制每個特徵的重要性(確切的說每個點的dual_coef_)。兩個引數的設定通常是強烈相關的,應該同時調節。

預設情況下,c=1,gamma=1。

輸出。增大c顯著改進了模型,得到了97%的精度。

svm允許決策邊界很複雜,即使資料只有幾個特徵,它在低維資料和高維資料(即很少特徵和很多特徵)上的表現都很好。

缺點:1需要進行資料預處理,對資料的縮放和引數的設定非常敏感,所以資料預處理和調參都需要非常小心。這也是為什麼如今很多應用中用的都是基於樹的模型,比如隨機森林或梯度提公升(需要很少的預處理,甚至不需要預處理)。

svm模型很難檢查,也很難解釋為什麼會這麼**,難以將模型向非專家進行解釋。

摩拜單車常見問題,摩拜單車常見問題有哪些

您好,人工申訴,我已鎖車,然後系統會很快解決的 上面有還車的功能呀,直接點就可以了,摩拜單車常見問題有哪些 您好。我覺得目前最常見的一個問題是 定位問題。時常見到單車定位在馬路這邊,結果單車卻在馬路對面 又或者是已經走到單車位置,觀望周圍並沒有發現單車 再或者,單車定位資訊是在馬路中間。如果單車是在...

戶外地板常見問題有哪些?地板使用中常見問題有哪些

因為鋪裝在戶外,日曬雨淋的,時間久了,容易老化,褪色。地板使用中常見問題有哪些 實木運動地板因其眾多優點,被廣泛鋪裝到各類體育場館和劇院舞臺。但是實木運動地板也會出現一些常見問題,瞭解這些問題才會有效採取措施,杜絕問題。實木運動地板常見問題知識 1 地面不平整地面不平會使部分地板和龍骨懸空,踩踏時就...

地暖常見問題

1 地板採暖系統的使用壽命多長?50年 2.初級造價高,但長期執行費用低,現在高檔小區逐漸推廣使用3 地暖系統只是作為供暖系統中的一個能源補充,可以和其他取暖方法共存公用 推薦品牌 南京聯塑 中錸豐田 常熟金通 地暖地板是指適用於低溫熱水地板採暖 簡稱地暖 的地板。衡量真正的地熱地板是需要許多具體的...