學會會訊

會員登入

帳號

密碼


關聯規則探勘在醫學研究之應用

作者:宋昇峯 (嘉義基督教醫院神經內科主任)

近年來人工智慧於各領域之發展風起雲湧,在醫學領域上也有相當進展,例如放射影像、病理組織等之判讀分析等。人工智慧之所以能被實現,一部分原因是因為有大量的數據提供素材,加上機器學習演算法的進展,提供分析此大量數據之方法。日常醫療行為過程中,通常會產生大量的資料,雖然大家對大數據(big data)朗朗上口,也認為大數據有潛力改變醫療照護的面貌,但如何讓此醫療大數據能真正增進醫療照護品質,仍有相當大的挑戰[1]。所謂大數據或巨量資料,除了資料量(volume)大之外,還具備有資料產生快速(velocity)及資料種類多樣化(variety)等特徵。而分析大數據所需的技術,除了資料庫管理與資料整理(data wrangling)與傳統統計工具之外,更需要機器學習(machine learning)及資料探勘(data mining)等技術,才能進行大數據分析。機器學習技術一般區分為監督式學習(supervised learning)與非監督式學習(unsupervised learning),前者常用的方法包括分類(classification)與迴歸(regression),主要是作為預測建模(predictive modeling),後者則包括分群(clustering)與關聯(association)等。

 

所謂關聯規則探勘(association rule mining),是應用關聯規則的演算法,找出高度關聯的項目。這種演算法,也被稱為購物籃分析,因為常被使用來分析超市顧客購買商品的行為,例如超市可以了解購買產品甲的顧客,是否時常同時購買產品乙。若能找出這些關聯規則,對超市促銷產品之規劃有極大之助益。醫學應用上之範例,則常應用在共病症與多重藥物處方的研究上,而且這些研究特別適合以大型資料庫來進行。以下列舉一些範例,如使用健保資料庫來研究邊緣性人格之病人時常會具有何種共病症[2],以及使用健保資料庫來研究醫師通常開哪些藥物時會合併使用制酸劑[3]。上述這些範例所探討的資料,皆屬於同一種類的資料項目,例如都屬於疾病、或都屬於藥物。但關聯規則探勘還可以進一步探討同時使用哪些藥物時,是否與某一類疾病或後果相關,此種技術稱為類別關聯規則探勘(class association rule mining)。例如最近我們所做的研究[4],探討癲癇病人使用何種藥物組合,較易與未來發生之糖尿病相關,便應用了此類技術。這種研究方法,會先將病人區分為有發生糖尿病與無發生糖尿病兩個類別,然後去評估各種藥物組合與這兩個類別的關係。進而有學者採用病例交叉(case-crossover)之研究設計,來進行此類之研究。例如研究何種藥物組合,與發生意外骨折較相關[5],以及何種空氣污染物的組合與小兒氣喘發作相關[6]。使用此種病例交叉設計,因為病人為自身的對照組,因此對於一些難以控制之變因,例如健保資料庫所缺乏的抽菸、運動、飲食等個人生活型態,自然可以獲得某個程度的解決。

 

雖然關聯規則探勘的研究方法,可以自大量的資料中,篩選出高度關聯的規則,但畢竟相關並非代表因果關係,臨床上之解讀仍須謹慎。但此技術,不失為一種可利用來產生假說(hypothesis generating)的方法,經由此方法找出來之重要規則,可於未來設計更嚴謹的研究來加以驗證。

 

參考文獻:

1. Rumsfeld JS, Joynt KE, Maddox TM. Big data analytics to improve cardiovascular care: promise and challenges, Nat Rev Cardiol. 2016;13:350-9.

2. Shen CC, Hu LY, Hu YH. Comorbidity study of borderline personality disorder: applying association rule mining to the Taiwan national health insurance research database, BMC Med Inform DecisMak. 2017;17:8.

3. Chen TJ, Chou LF, Hwang SJ. Application of a data-mining technique to analyze coprescription patterns for antacids in Taiwan, ClinTher. 2003;25:2453-63.

4. Sung SF, Lee PJ, Hsieh CY, Zheng WL. Medication Use and the Risk of Newly Diagnosed Diabetes in Patients with Epilepsy: A Data Mining Application on a Healthcare Database, Journal of Organizational and End User Computing. (Accepted)

5. Nishtala PS, Chyou TY, Held F, Couteur DG, Gnjidic D. Association rules method and big data: Evaluating frequent medication combinations associated with fractures in older adults, Pharmacoepidemiol Drug Saf. 2018;27:1123-30.

6. Toti G, Vilalta R, Lindner P, Lefer B, Macias C, Price D. Analysis of correlation between pediatric asthma exacerbation and exposure to pollutant mixtures with association rule mining, ArtifIntell Med. 2016;74:44-52.


對於此文章如有任何問題或指教,歡迎來信至學會,編輯部後續會將您的意見刊載在下一期會訊!