Business School
商學(xué)院
手機(jī):13521943680
電話:010-62904558
你想知道 在每個(gè)行業(yè)中,公司都在投資資源以收集越來(lái)越多的數(shù)據(jù)。我們將傳感器放置在所有物體上僅僅是因?yàn)槲覀兛梢圆⑶姨孤实卣f(shuō),它并不是全部必需或有用的。----莫森?巴亞提(Mohsen Bayati)
在衛(wèi)生保健或企業(yè)中獲得更多信息并不一定會(huì)更好。
數(shù)十年來(lái),心臟病和糖尿病等慢性病一直在上升。它們是當(dāng)今美國(guó)導(dǎo)致死亡和殘疾的第一大原因,也是醫(yī)療保健費(fèi)用無(wú)法控制的原因之一。
因此,在患病之前確定患有慢性病風(fēng)險(xiǎn)的人很有意義。至少,早期干預(yù)通??梢詼p慢疾病的發(fā)展速度并改善患者的生活質(zhì)量,從而有可能節(jié)省數(shù)十億美元的醫(yī)療費(fèi)用。
這就是為什么許多雇主(根據(jù)RAND報(bào)告的數(shù)據(jù),約50%)贊助商為其員工制定健康計(jì)劃的原因。除體育館折扣外,這些計(jì)劃通常還包括以實(shí)驗(yàn)室測(cè)試形式進(jìn)行的健康風(fēng)險(xiǎn)評(píng)估,用于計(jì)算每個(gè)人常見(jiàn)疾病的危險(xiǎn)因素。然后為處于危險(xiǎn)中的人提供額外的預(yù)防保健和監(jiān)督。
斯坦福大學(xué)商學(xué)院運(yùn)營(yíng),信息與技術(shù)副教授Mohsen Bayati說(shuō),不幸的是,預(yù)期的收益并不總是能實(shí)現(xiàn)。幾項(xiàng)研究發(fā)現(xiàn),這樣的程序最終會(huì)花費(fèi)比所節(jié)省的更多的錢(qián)。他說(shuō),一個(gè)可能的原因是風(fēng)險(xiǎn)評(píng)估本身并不十分準(zhǔn)確。
巴亞蒂說(shuō):“如果您錯(cuò)誤地將某人認(rèn)定為高風(fēng)險(xiǎn),即所謂的“誤報(bào)”,則您將為不必要的服務(wù)付費(fèi)?!岸?,如果您想念一個(gè)真正處于危險(xiǎn)之中的人-一個(gè)假陰性,那么將來(lái)您仍然會(huì)受到巨額醫(yī)療費(fèi)用的打擊?!?
他說(shuō),一種解決方案是運(yùn)行更復(fù)雜的測(cè)試小組。但這也會(huì)增加成本?!皩?shí)驗(yàn)室測(cè)試很昂貴。公司正在為很多員工做這件事,因此他們只考慮了相當(dāng)少的一組標(biāo)準(zhǔn)生物標(biāo)志物。然后,檢測(cè)能力不是很強(qiáng)。”
巴亞蒂說(shuō),相反,使這些預(yù)防計(jì)劃起作用的關(guān)鍵是改善生物標(biāo)志物的選擇。但是,你是怎么做的?更嚴(yán)格地說(shuō):如何選擇最少的標(biāo)記物,以最大程度地診斷各種疾???
這是Bayati在最近的一篇論文中解決的難題,他與斯坦福大學(xué)的兩位同事合著了該書(shū):前斯坦福大學(xué)研究助理,現(xiàn)任Netflix數(shù)據(jù)科學(xué)家的Sonia Bhaskar博士,以及統(tǒng)計(jì)學(xué)和電氣工程學(xué)教授Andrea Montanari。他們使用機(jī)器學(xué)習(xí)領(lǐng)域的一些技術(shù)柔術(shù),開(kāi)發(fā)了一種可用于任何目標(biāo)疾病或計(jì)劃預(yù)算水平的方法。
當(dāng)他們?cè)诖蠹s75,000名患者的病歷上對(duì)其進(jìn)行測(cè)試時(shí),他們發(fā)現(xiàn)它可以預(yù)測(cè)出九種嚴(yán)重疾病,且出乎意料的準(zhǔn)確性?!拔覀兏械襟@訝,”巴亞蒂說(shuō)。與對(duì)生物標(biāo)志物數(shù)量沒(méi)有限制的假想的凱迪拉克護(hù)理評(píng)估相比,它們的成本要低得多,但具有幾乎相同的預(yù)測(cè)能力。
在這個(gè)大數(shù)據(jù)時(shí)代,也許這里有一個(gè)一般的教訓(xùn)?!澳阋欢ㄏ胫溃?Bayati沉思?!霸诿總€(gè)行業(yè)中,公司都在投入資源來(lái)收集越來(lái)越多的數(shù)據(jù)。我們?cè)谒惺挛锷隙及惭b了傳感器,只是因?yàn)槲覀兛梢圆⑶姨孤实卣f(shuō),它并不是全部必要或有用?!?
太多的信息
傳統(tǒng)上,通過(guò)單獨(dú)找出每種疾病的最佳標(biāo)記并將其添加到列表中來(lái)設(shè)計(jì)健康風(fēng)險(xiǎn)評(píng)估。Bayati說(shuō):“醫(yī)院通過(guò)先進(jìn)的統(tǒng)計(jì)數(shù)據(jù)和現(xiàn)在的AI在如何識(shí)別生物標(biāo)志物方面變得越來(lái)越復(fù)雜。” “但是一次都病了?!?
他說(shuō),您可能可以通過(guò)這種方式建立有效的測(cè)試小組,但是這將需要太多的生物標(biāo)記物。因此,在實(shí)踐中會(huì)做出妥協(xié),而準(zhǔn)確性會(huì)下降。相反,Bayati和他的同事在分析中增加了第二步:“我們說(shuō),讓我們從完整的清單開(kāi)始,然后看看我們是否可以通過(guò)更好的方式簡(jiǎn)化它,以最大程度地減少診斷能力的損失?!?
為此,他們借鑒了機(jī)器學(xué)習(xí)中使用的高維統(tǒng)計(jì)中的一些技術(shù)。“基本問(wèn)題是,如果您有太多信息,如何將其縮小為最有用的較小信息集?您如何縮小數(shù)據(jù)集的尺寸?”
涉及數(shù)學(xué),但基本上,解決“ TMI”問(wèn)題的關(guān)鍵是共同優(yōu)化生物標(biāo)志物的選擇。與其分別找到每種疾病的最佳選擇,不如先確定想要多少種生物標(biāo)記物(研究人員確定30種),然后一次對(duì)所有疾病組合的所有可能組合最大化預(yù)測(cè)能力。
該模型之所以有效,是因?yàn)樵S多生物標(biāo)記物發(fā)出了不止一種疾病的信號(hào)。例如,高血糖可能是糖尿病的征兆,但也可能是腎臟疾病,肝臟疾病或心臟病的征兆。堿性磷酸酶水平異常與心臟病,肝病和癌癥有關(guān)?!叭绻倪x擇過(guò)程沒(méi)有考慮到這些重疊部分,那么您將丟掉信息,” Bayati說(shuō)。
目標(biāo)無(wú)極限
Bayati和他的同事們概述的方法的強(qiáng)大之處在于,它可以被用來(lái)一次實(shí)現(xiàn)多個(gè)目標(biāo)。在健康風(fēng)險(xiǎn)評(píng)估中,更重要的是:準(zhǔn)確性或成本??jī)烧叨伎梢浴N覀円A(yù)測(cè)阿爾茨海默氏病或動(dòng)脈疾病嗎?是的。
“目標(biāo)數(shù)量沒(méi)有限制,” Bayati說(shuō)?!澳梢粤谐鲆獌?yōu)化的20、30、100個(gè)目標(biāo)。然后您可以縮小需要收集的信息的范圍,因?yàn)樵谀承r(shí)候,添加目標(biāo)不需要額外的數(shù)據(jù)?!?
如果它有助于兌現(xiàn)公司健康計(jì)劃的承諾,那么這對(duì)醫(yī)療保健來(lái)說(shuō)意義重大。但是,這種方法也可以用于改善一系列業(yè)務(wù)和公共政策運(yùn)營(yíng)。巴亞蒂說(shuō),至關(guān)重要的是要明確目標(biāo)。計(jì)算機(jī)可以進(jìn)行分析,但是人類(lèi)必須告訴他們要優(yōu)化什么。
他認(rèn)為,這是邁出的一步,公司常常掩飾不住。“有時(shí)候,似乎公司只是在急于積累數(shù)據(jù)并在以后提出問(wèn)題。但是更多的信息并不一定會(huì)更好。重要的是知道要看什么。我們的論文是朝這個(gè)方向邁出的一步?!?
相關(guān)推薦
- 博士研究生(含在職)如何準(zhǔn)備論文答辯
- 博士研究生論文答辯決議書(shū)常見(jiàn)模板
- 6月5日《論文研究方法課》我們不見(jiàn)不散!
- 國(guó)內(nèi)博士生考試的流程、形式、要求和“內(nèi)幕”嗎?
- 博士研究生論文:什么影響了師門(mén)組會(huì)發(fā)言《基于人文社科博
- 博士研究生畢業(yè)論文輔導(dǎo)之如何寫(xiě)研究計(jì)劃書(shū)
- 教育部博士研究生學(xué)位論文造假行為處理辦法實(shí)施細(xì)則
- 在職(全日制)博士論文答辯相關(guān)規(guī)定
- 工商管理博士論文馬雷鵬“SAP動(dòng)態(tài)能力:軟件工業(yè)中對(duì)全球分
- 工商管理博士學(xué)位課程的關(guān)鍵“論文”