為了更快速且準確地預測邊坡穩(wěn)定性,許多學者開始探索機器學習方法在邊坡穩(wěn)定性分析中的應用,其中支持向量機、隨機森林等模型被證實在預測邊坡穩(wěn)定性方面有較高的準確率。已有研究證明了混合機器學習模型能綜合多個機器學習模型的優(yōu)點,從而提高預測精度,但也暴露出混合模型可解釋性較差和過擬合風險較高等問題。為克服混合機器學習模型的缺點,啟發(fā)式算法開始被應用于優(yōu)化機器學習模型。相比混合機器學習模型,啟發(fā)式算法通過其獨特的元啟發(fā)式搜索機制,在非凸、多峰及高維優(yōu)化空間中展現(xiàn)出更強的全局搜索能力,顯著提升了算法對超參數(shù)搜索空間的探索效率,這一特性使其能夠突破局部最優(yōu)限制,為機器學習模型遴選出更具泛化能力的超參數(shù)配置,進而實現(xiàn)模型預測精度與魯棒性的同步提升。
常春藤算法(IVY)是一種新開發(fā)的生物啟發(fā)算法,該算法取自常春藤植物的生長模式,模擬了常春藤種群的有序協(xié)調(diào)增長和擴散進化的過程。武漢科技大學黃詩冰團隊采用IVY對隨機森林、決策樹、多層感知器、支持向量機4種機器學習模型的超參數(shù)進行優(yōu)化,并通過準確率、召回率、查準率、F1值、特異度和AUC值對優(yōu)化后模型性能進行評價分析,比選出邊坡穩(wěn)定性預測的最佳機器學習模型,并進一步探究IVY相比傳統(tǒng)啟發(fā)式算法的優(yōu)勢與不足。
數(shù)據(jù)集的建立與處理
構建數(shù)據(jù)集時首先要選取合適的特征,選取的特征應該在滿足反映評估對象特性的同時避免冗余。從邊坡幾何形態(tài)來看,坡高和坡角影響邊坡自重和應力分布,是影響邊坡穩(wěn)定性的重要因素;從邊坡自身物理力學性質(zhì)看,巖土體的諸多強度參數(shù)反映了邊坡內(nèi)在力學性質(zhì)與邊坡穩(wěn)定性之間的關系,尤其是粘聚力和內(nèi)摩擦角在巖土工程領域被廣泛使用;重度也是邊坡巖土體重要的物理參數(shù),它直接影響影響邊坡的自重,較大的重度會增加邊坡的總負荷,增加邊坡失穩(wěn)的風險;從誘發(fā)邊坡失穩(wěn)的外界條件看,水是誘發(fā)邊坡失穩(wěn)最常見的外界因素,可通過孔隙水壓比反映水對邊坡穩(wěn)定性的影響。研究中選取以上6個參數(shù)作為數(shù)據(jù)集的特征參數(shù),并收集了392個邊坡案例構建數(shù)據(jù)集,其中表現(xiàn)為穩(wěn)定的邊坡有201個,表現(xiàn)為失穩(wěn)的邊坡有191個。
各特征的小提琴圖
預測模型建立
IVY模擬了常春藤植物的生長和在種群中的傳播過程。算法首先創(chuàng)建一組位置隨機的常春藤植物種群,種群中的每個個體代表一個可能的解。個體通過目標函數(shù)評估其適應度,適應度(或越低,由目標函數(shù)決定),表示個體解越優(yōu)。常春藤種群中的個體會選擇最接近且最強的相鄰個體作為自我改進對象,在優(yōu)化機器學習模型時,常春藤植物借助最強鄰居向光源攀爬的過程實際上就是超參數(shù)借助相鄰最佳超參數(shù)向全局最優(yōu)超參數(shù)靠近的過程。
首先建立機器學習模型,然后IVY會隨機生成一組初始化種群,初始種群中每個常春藤個體的位置則決定了機器學習模型的初始超參數(shù)組合。機器學習模型在獲得初始超參數(shù)組合后將對模型進行訓練、測試和評價,評價指標值(如準確率等)將作為適應度傳遞給初始種群。初始種群將根據(jù)個體適應度的高低進行排序,保留適應度高的個體,淘汰適應度低的個體,這一過程也是淘汰較差超參數(shù)組合的過程。在淘汰適應度較差的個體后,種群將圍繞適應度高的個體進行傳播與變異,生成新的個體,從而完成種群的更新。種群更新產(chǎn)生更優(yōu)秀個體意味著機器學習模型獲得了更優(yōu)的超參數(shù)組合,機器學習模型將根據(jù)更優(yōu)的超參數(shù)組合再次進行訓練、測試和評價。重復上述過程,直至達到最大迭代次數(shù),整個過程中產(chǎn)生的最大適應度個體的位置就是最佳的超參數(shù)組合。
VY優(yōu)化機器學習模型流程
實踐結(jié)果
每個機器學習模型在經(jīng)過常春藤算法優(yōu)化之后準確率都得到了提升,分別提高了8.4%、8.81%、18.76%和23.56%,其中隨機森林在優(yōu)化后準確率最高,達到了90.68%;支持向量機的準確率提升幅度最大,從優(yōu)化前的59.49%提升到了83.05%,共提升23.56%;隨機森林在優(yōu)化后除召回率和AUC值外,另外4個指標都得到了明顯提升,表明隨機森林的整體預測能力得到了增強;決策樹在優(yōu)化后召回率有所下降,而其他5個指標都得到了提升,表明決策樹在經(jīng)過IVY優(yōu)化后,犧牲了一部分預測穩(wěn)定邊坡的能力,但模型的整體性能得到了提升,尤其是預測失穩(wěn)邊坡的能力得到了大幅增強;多層感知器召回率也有所下降,但其他指標的提升十分明顯,尤其是查準率和特異度得到了大幅度的增長,表明模型在優(yōu)化前偏向于預測穩(wěn)定邊坡,但經(jīng)過優(yōu)化后,模型的性能在整體得到提升的同時變得更加均衡;支持向量機在優(yōu)化后每個指標都得到了提升,說明其性能在優(yōu)化后得到了全面增強;優(yōu)化后隨機森林算法的準確率、召回率、F1值和AUC值均高于另外3種模型,查準率和特異度也處于較高水平,說明隨機森林算法更適合預測邊坡穩(wěn)定性。
4種模型優(yōu)化前后指標對比
結(jié) 論
(1)利用常春藤算法對4種機器學習模型進行優(yōu)化,每個機器學習算法在經(jīng)過常春藤算法優(yōu)化后準確率都得到了提升,其中隨機森林在優(yōu)化后準確率最高,達到了90.68%;支持向量機的準確率提升幅度最大,從優(yōu)化前的59.49%提升到了83.05%,提升了23.56%。表明常春藤算法能夠有效提高機器學習預測邊坡穩(wěn)定性的準確率。
(2)優(yōu)化后隨機森林模型的準確率、召回率、F1值和AUC值均高于另外3種模型,查準率和特異度也處于較高水平,各項指標的均衡發(fā)展表明其能夠精準平衡邊坡穩(wěn)定性預測的敏感性與可靠性,是當前數(shù)據(jù)條件下的最優(yōu)預測模型。
(3)經(jīng)IVY優(yōu)化后的隨機森林準確率和PSO相同,高于GA,并且IVY在優(yōu)化隨機森林時能夠比PSO和GA更快收斂,表明IVY在優(yōu)化隨機森林模型時整體效果優(yōu)于PSO和GA這2種傳統(tǒng)啟發(fā)式算法,為解決機器學習超參數(shù)優(yōu)化問題提供了新途徑。
原文下載
蔡玉林,黃詩冰,徐劍波,等.基于常春藤算法優(yōu)化機器學習模型預測邊坡穩(wěn)定性的研究[J/OL].金屬礦山,1-11.
作者簡介
黃詩冰
教授,博士生導師,武漢科技大學城市建設學院院長。兼任全國非煤礦山安全生產(chǎn)專家,中國巖石力學與工程學會極地專委會常務委員,湖北省地下工程學會常務理事,《金屬礦山》雜志青年編委等。長期從事寒區(qū)巖土工程、工程地質(zhì)災害防治以及固廢資源化利用等方面研究。主持國家自然科學基金項目3項(面上項目2項)、湖北省杰出青年基金項目1項、武漢市自然科學基金特區(qū)計劃項目1項。作為第一作者或通訊作者發(fā)表SCI/EI論文50余篇,其中中科院一、二區(qū)論文近40篇,授權發(fā)明專利13件。入選了湖北省“楚天學子”,2024年全球前2%頂尖科學家榜單和中國知網(wǎng)高被引學者TOP1%榜單。
《金屬礦山》簡介
《金屬礦山》由中鋼集團馬鞍山礦山研究總院股份有限公司和中國金屬學會主辦,主編為中國工程院王運敏院士,現(xiàn)為北大中文核心期刊、中國科技論文統(tǒng)計源期刊(中國科技核心期刊)、中國精品科技期刊(F5000頂尖學術論文來源期刊)、中國百強報刊、RCCSE中國核心學術期刊(A)、中國期刊方陣雙百期刊、國家百種重點期刊、華東地區(qū)優(yōu)秀期刊,被美國化學文摘(CA)、美國劍橋科學文摘(CSA)、波蘭哥白尼索引(IC)、日本科學技術振興機構數(shù)據(jù)庫(JST)等世界著名數(shù)據(jù)庫收錄。主要刊登金屬礦山采礦、礦物加工、機電與自動化、安全環(huán)保、礦山測量、地質(zhì)勘探等領域具有重大學術價值或工程推廣價值的研究成果,優(yōu)先報道受到國家重大科研項目資助的高水平研究成果。根據(jù)科技部中國科技信息研究所發(fā)布的《2024中國科技期刊引證報告(核心版)》,《金屬礦山》核心總被引頻次位列26種礦業(yè)工程技術學科核心期刊第1位;根據(jù)中國知網(wǎng)發(fā)布的《中國學術期刊影響因子年報》(2024版),《金屬礦山》學科影響力位居73種礦業(yè)期刊第9位。
供稿:曾文旭
編排:戴穎熠
審核:王小兵
聲明:本文系轉(zhuǎn)載自互聯(lián)網(wǎng),請讀者僅作參考,并自行核實相關內(nèi)容。若對該稿件內(nèi)容有任何疑問或質(zhì)疑,請立即與鐵甲網(wǎng)聯(lián)系,本網(wǎng)將迅速給您回應并做處理,再次感謝您的閱讀與關注。
不想錯過新鮮資訊?
微信"掃一掃"