為更好地幫助到想要利用腦電圖技術開展科研的朋友們,拓展思影科技的業務范圍,思影科技推出腦電機器學習數據處理業務,如感興趣請聯系楊曉飛siyingyxf或18983979082(微信號)進行咨詢,電話:18580429226.
一、數據質量檢查和預處理
數據質量檢查包括:檢查是否存在壞的導聯、Marker信息是否完整、信號是否有過大的波動或漂移等。
數據預處理包括:數據導入(格式轉換)、定位電極、濾波、重參考、分段、手工去除偽跡(壞段、壞導聯)、偽跡校正(基于ICA去眼電等)。
注:預處理步驟可根據實際實驗任務加以調整。
二、EEG基礎指標計算
(1)計算ERP波幅。對于事件相關的實驗數據,通過疊加平均的方式,計算特定刺激誘發的ERP波幅。
(2)計算功率譜。對于靜息態實驗數據,通過傅里葉變換,計算各波段(delta ~ gamma)的功率譜密度(PSD)。
(3)計算時頻特征。通過短時傅里葉變換(或小波變換),計算時頻圖(power)。
(4)計算功能連通性(腦網絡)。對于靜息態實驗數據,計算通道之間的功能連通性,所有通道之間的功能連通性可構成腦網絡。功能連通性的計算方式可選:相干(Coherence)、相位鎖定值(PLV)等。
三、特征構建與特征篩選3.1 特征構建
1.ERP特征。計算感興趣通道的ERP幅值后,每個時間點的ERP幅值可以作為一個特征。
2.功率譜特征。計算各區域(或各通道)在每個波段(delta ~ gamma)的功率譜。單一區域(或通道)的某波段的平均絕對/相對功率譜密度(PSD/rPSD),可以作為一個特征。區域的分辨率可調節(如按照10-5、10-20系統選擇通道)。

圖示.各組別各波段的功率譜密度分布。
3.信息論特征。計算各區域(或各通道)的排列熵,Kolmogorov復雜度等指標,每個區域(或通道)的信息論指標可以作為一個特征。
4.地形圖特征。計算時域或頻域幅值的地形圖,使用地形圖或其衍生指標(如GFP,Global Field Power)作為特征。
5.腦網絡。將每個通道視為一個節點,節點之間的聯系(功能連通性)視為一條連邊,每條連邊即為一個特征。

圖示. 頻譜、信息論、功能連通性等多種特征的組合。
6.RQA特征。對于各通道的靜息態數據,基于相位空間構建遞歸圖,進行遞歸量化分析(Recurrence quantification analysis),提取遞歸率(RR)、決定論(DET)、熵(ENTR)、分層性(LAM)等作為特征。
3.2 特征篩選
1.相關法。計算每個特征與量表的相關性(如皮爾遜相關),保留相關值高的特征。
2.參數檢驗法。對不同組別人群的特征做假設檢驗(比如對兩組人群的特征做雙樣本T檢驗),保留通過假設檢驗的特征。
3.主成分分析(PCA)法。將所有特征分解成一系列主成分,保留排名靠前的主成分作為特征。
4.遞歸特征消除法。循序漸進地刪除影響最小的特征,直至保留特定數目的最重要的特征為止。注:我們可以提供的特征構建、特征篩選方法包括但不限于上述描述,您可以選擇其中一種或多種進行組合。
三、機器學習模型
1.K近鄰(k-Nearest Neighbor,KNN)。K近鄰是一個比較基礎的分類算法,該算法計算測試樣本與已知樣本之間的距離,并將測試樣本判定為與其距離最近的類別。
2.決策樹(Decision Tree)。該模型選用一些特征作為決策變量,基于特定的閾值形成決策分支,最終形成樹狀的決策鏈條。
3.支持向量機(SVM)。在許多情況下,支持向量機都是二分類模型的首選。通過使用核函數,即使基于線性不可分的數據,也可獲得較好的分類精度。引入投票機制后,亦可將該模型應用于多分類場景。


圖示.使用SVM進行訓練的過程。
4.集成學習。當單一的分類器性能不良時,可以考慮集成多個弱分類器,形成一個強分類器?蛇x的集成學習模型有隨機森林等。


圖示.隨機森林分類過程。
5.回歸模型;貧w模型主要用于預測連續變量(如量表得分)?蛇x的回歸模型有線性回歸(GLM)、多項式回歸等,也包含其變種,如LASSO回歸、嶺回歸、Elastic Net等。
6.神經網絡。當沒有良好的手工選擇的特征時,可以考慮選用深度神經網絡(主要基于CNN來實現)模型。該模型可以自動從原始數據中提取特征,用于后續的預測任務。


圖示.一種卷積神經網絡架構。
7.聚類。當數據沒有標簽時,可以選擇無監督學習算法,如K-means聚類。
注:思影可以提供的機器學習模型包括但不限于以上內容。其他模型如樸素貝葉斯(Naive Bayes)、線性判別分析(LDA)、主成分分析(PCA)、或上述模型的變種,亦可根據需求實現。您可以選擇其中的一種或多種進行嘗試。
一、結果匯報&可視化
結果匯報內容包括:
(1)對于分類模型,可匯報敏感性、特異性、總精度、曲線下面積等精度指標;
(2)對于回歸模型,可以匯報相關值、MSE、MAE等精度指標;
(3)置換檢驗的結果,如p值。

圖示.精度結果可視化案例。


圖示.ROC曲線可視化。
結果可視化內容包括:
(1)對于分類模型,可繪制ROC曲線圖;
(2)對于回歸模型,可繪制相關圖;
(3)對于模型訓練過程中發現的貢獻較大的特征,可繪制曲線圖、矩陣圖、圈狀圖、地形圖等。


圖示.頻譜特征結果可視化案例。
五、定制化服務


圖示.工程師在討論。
1.分析方法可定制。思影科技可根據您提供的模板文獻,基于您的實驗數據,實現文獻中使用的數據分析方法。此外,未列出的分析方法,只要在思影科技的能力范圍內,盡力實現您的想法。
2.分析代碼可定制。在沒有現有的軟件適用于您的數據分析需求時,思影科技會與您協商,通過編寫代碼實現您的想法,并提供代碼的完整實現。
3.可視化方案可定制。如果您有特殊的可視化方案要求,也可與我們協商實現。
客戶與思影確定合作意向以后,思影會指定專門的工程師全程與客戶對接項目著手該項目數據處理,思影額外還將指派另一名工程師對項目全程進行檢查,審核,把關,確保數據處理質量,思影將全程對客戶數據保密。
|