未來IT產業的發展方向——人工智慧 (圖片來源: Getty Images)
【看中國2017年9月10日訊】保羅.唐(Paul Tang)的妻子在醫院做了膝關節替換手術,他陪妻子住院。每年,美國有大約70萬人做這樣的手術。外科醫生來了,唐本人就是初級治療內科醫生,他問醫生,預計什麼時候妻子才能回歸正常人的生活,根據他的經驗判斷。外科醫生一直含糊其辭,沒有明確答案。唐說:「我真是被打敗了,他居然不知道。」Paul Tang很快瞭解到,大多數內科醫生基本上都不知道病人回到家、回到工作中的生活是怎樣的,他們無法對病人的生活進行評估,對於病人而言,這種評估至關重要。
沃森是一個機器學習系統,IBM將未來押在沃森身上。沃森可以給內科醫生提供信息,例如,告訴醫生還要等多長時間,病人才能正常行走或者爬樓梯,不會疼痛。它還可以分析圖片和組織樣本,為特定病人制定最佳治療策略。
自從沃森在智力競賽節目Jeopardy!中獲勝之後,衛生保健便成為機器學習技術瞄準的熱門市場。研究公司CB Insights在報告中指出,自2013年以來至少出現106家創業公司,它們仍然在營業。
今年,沃森曾與休斯敦安德森癌症研究中心分道揚鑣。針對沃森的批評(包括安德森癌症中心的批評)似乎與技術無關,並不是說技術存在缺陷。只是IBM對於目前沃森所處的水平太過樂觀,這才招來批評。事實上,談到將AI應用於衛生保健,沃森健康有很大的可能會成為領導者。如果說現在還沒有取得很大的成就,那麼最大的障礙於數據,IBM需要特定類型的數據,用來訓練系統。在多種環境下,數據供應嚴重不足,很難獲得。這個問題不只是沃森的問題,其它系統也一樣。對於整個衛生保健機器學習領域而言,都面臨這樣的問題。
缺少數據、無法獲得數據可能會讓沃森的發展速度變慢,同樣的,IBM的競爭對手也會受到傷害。為什麼呢?因為要獲得數據,最好的辦法就是與大型衛生保健機構密切合作,而這些機構在技術面前有點保守。與創業公司相比,有一點IBM做得比較好:它得到了大機構高管和IT經理的信任。雖然安德森項目存在一些問題,IBM仍然有著很大的優勢。許多醫療中心、衛生保健管理團體、生命科學企業都引進了沃森,它們都會提供關鍵數據,正是這些數據為未來的醫療模式奠定了基礎。
時間表不切實際
沃森與安德森癌症中心「分手」說明IBM對沃森鼓吹過度,結果招來麻煩。
2012年,安德森癌症中心與IBM開始合作,它們的目標是讓沃森閱讀數據,數據涉及病人的症狀、基因序列、病理報告,然後將信息與內科醫生的報告、重要期刊論文整合,幫助醫生制定診斷和治療策略。IBM和安德森癌症中心對技術期待過高。2013年,IBM曾經豪言壯語說「計算新時代來了」,這種論斷給了《福布斯》一種錯覺,似乎沃森「現在可以處理臨床實驗」問題,再過幾個月就能用在病人身上了。2015年,《華盛頓郵報》引述一名IBM沃森管理者的話說,沃森正在構建集體智慧模式,介於機器與人之間。《華盛頓郵報》還說,訓練時機器系統的目標是成為醫生的助理,幫助他們做之前不能做的事。
今年2月,德州大學(安德森癌症中心就是它運營的)宣布項目終結,癌症中心向IBM支付3900萬美元賠款,原本項目合同的規模只有240萬美元。研究4年之後,雙方沒有開發出一個可以用在病人身上的工具,技術只能用在實驗性測試中,沒辦法投入使用。關於沃森一事,安德森癌症中心不予置評,內部不知道如何管理項目,如何獲得資金,這可能才是問題的根源。
並不是說IBM沃森沒有問題,事實上,它的問題比任何其它的項目都要大。
到底是什麼使得研究受挫?首先你要深入理解機器學習系統(比如沃森)的訓練方式。沃森持續對內部處理流程進行微調,從中學習經驗,這樣一來解決某些問題時獲得正確答案的概率就會提高。正確答案必須是已知的,這樣系統才會知道什麼時候對了,什麼時候錯了。系統處理的訓練問題越多,結果就會越好。
要訓練系統在X線中識別惡性腫瘤還是比較簡單的。如果解決的謎題大大超出人類的已知範疇,比如瞭解基因變異與疾病的關係,沃森就會顯得無能為力,它會碰到「雞與蛋」的問題:數據沒有經過專家的篩選,沒有有效組織過,如何用這樣的數據訓練系統呢?紐約斯隆-凱特琳癌症中心計算病理學家Thomas Fuchs解釋說:「如果你正在訓練自動駕駛汽車,任何人都可以給樹、標誌貼標籤,這樣系統就可以學習如何識別它。但是醫學是一個特殊的領域,需要專家訓練幾十年,給信息貼上正確的標籤,輸入計算機。」
IBM希望沃森能夠在一些領域做出貢獻,其它企業的機器學習解決方案也是樣打算的,在所有這些領域都有障礙存在。要訓練沃森處理海量數據,從中挑選出少數與單個病人有關的重要信息,首先需要人親自訓練,用成千上萬個案例訓練。
例如,為了讓沃森識別與疾病有關的基因,它需要成千上萬的病歷,這些病人患有特殊疾病,他們的DNA已經分析過。然而,要獲得「基因-病歷」結合的數據相當難。許多時候,數據並沒有以正確的格式記錄,或者根本不存在,又或者數據來自於幾十個不同的系統,很難處理。
如果將更好的數據交給臨床醫生,就可以提高初級治療水平。在日常的初級治療過程中,當問題不太嚴重時醫生如果錯過了治療機會,等到病情變得嚴重起來,病人進了急診室或者讓專家治療,此時承受的痛苦會更大,成本也會大幅增加。IBM沃森健康首席醫療官Anil Jain說:「在健康方面花的錢有三分之一是不需要的。」人們認為,機器學習有機會解決這個問題。
診斷病人時,為了讓醫生得出更好的結論,沃森需要找到彼此的關聯,也就是健康記錄和健康社會決定因素的關係。這些因素包括:病人是否吸毒、飲食是否健康、呼吸的空氣是否清新等等。唐認為,今天,幾乎沒有醫院或者醫療實踐從大量病人身上獲得可靠的數據。部分是因為醫生接受現代數據驅動型醫療實踐方法的速度有點慢。克利蘭夫診所(Cleveland Clinic)的內科醫生、衛生保健信息專家Manish Kohli認為:「衛生保健行業接受技術的速度很慢,真是讓人尷尬。」
如果存在這樣的數據,IBM一般會花錢購買。IBM收購了一些企業,比如Truven Health Analytics、Explorys和Phytel,它們都是處理大數據的企業,這些數據來自醫院和病人群體。雖然與安德森癌症中心的合作終止了,IBM還是與其它機構達成了重要合作,進一步獲得更多的病人數據。
與IBM合作的就有Atrius Health,它是一個網路,裡面有將近900位內科醫生,主要是初級護理內科醫生,他們來自波士頓地區。合作的目標是為開發、測試以沃森作為基礎的系統功能,從筆記、記錄、文章中提取面向獨立個體的關鍵信息。Atrius Health首席醫療官Joe Kimura說:「對於初級護理內科醫生而言,提取所有相關信息是一項繁重的任務。」他還說,每一次訪問數據都會增加,有了這樣的系統數據會大幅增加,不需要按標準格式提交,檢索很方便。
還有,病人病歷中許多重要的筆記是以句子的形式存在的,傳統IT系統無法識別。沃森使用了自然語言處理技術,這種技術當時是為參加Jeopardy!開發的,它可以從句子中提取意義。在理想的情況下,系統可以給內科醫生提建議,給病人更好的幫助,省去不必要的護理。Kimura說:「病人臀部受傷,我們全心全意照看,為什麼我們只關心這個?為什麼不能提前預測,判斷病人有跌倒的風險,讓他們避免臀部受傷?我們要讓護理朝著上游延伸。」
沃森健康還與紐約中央醫療中心(Central New York Care Collaborative)合作,這是一個州政府提供資金成立的機構,與6個國家大約2000個衛生保健提供商合作。合作的目標很明確:將急診數量、再入院數量降低25%,有時病人已經獲得批准出院,結果又因為相關的問題重新回醫院治療。合作還帶來了大量的病人數據。
拿到更多數據
獲得數據還有其它的辦法。谷歌有一家姊妹公司,它想直接從病人身上提取數據。這家公司就是Verily Life Sciences,它是Alphabet的衛生保健部門,該公司與杜克大學、斯坦福大學合作,開發一套高度結構化的健康資料庫,裡面有1萬名志願者。資料庫包含了門診信息,還有穿戴健康監測設備提供的數據。這樣一來數據就會大大增加,只是要生成高度可用的結果,可能還要等10年甚至更長時間。
紀念斯隆-凱特林(Memorial Sloan-Kettering)癌症研究中心的Fuchs率領團隊訓練一個AI系統,它可以閱讀「組織染色幻燈片」(tissue-stain slides),在訓練過程中,研究人員需要建立一個龐大的數字幻燈片庫,幻燈片上有註釋信息,包括確診及其它關鍵數據。每個月,團隊自己會製作4萬張幻燈片。Fuchs說:「數量比其它人多很多,任務很龐大,因為在生物領域變數太多了。」
雖然沃森項目失敗,安德森癌症研究中心還是在繼續執行一個大項目,它要收集1700種門診數據,走進中心的每一個人病人都會貢獻自己的數據。項目負責人Andy Futreal說,要讓沃森這樣的AI系統發揮作用,將病人信息與研究數據結合起來至關重要。他還說:「一旦我們獲得了數據,就可以進入AI機器學習業務,看看在各種治療方法下什麼原因導致誰的效果好、誰的效果不好。」
IBM繼續從合作夥伴手中獲得數據。在癌症診斷與治療方面,IBM與紀念斯隆-凱特林癌症研究中心、Mayo Clinic、哈佛和MIT附屬研究所、醫療測試巨頭Quest Diagnostics攜手合作。通過與紀念斯隆-凱特林癌症研究中心合作,IBM開發出一套系統,它可以篩選期刊文獻,形成正式的治療決策,佛羅里達Jupiter Medical Center(木星醫療中心)和印度一家醫院連鎖企業已經引進系統。在發現藥物方面,沃森健康與Barrow Neurological Institute(巴羅神經學研究所)合作,它幫助該機構找到了5種與ALS有關的基因,之前人們並不認為這些基因與該疾病有關;通過與Ontario Brain Institute(安省腦科研究所)合作,沃森篩選出21種最有希望的候選藥物。
提供更好的醫療結果,降低成本,沃森真的能帶來變革嗎?Bessemer Venture Partners基金的合夥人Stephen Kraus認為的確有這種可能,他專注於衛生保健行業,投資了許多與衛生保健有關的AI創業公司。Kraus說:「它是真實存在的,不是用來刺激股價上漲的‘霧件’。」和大多數專家一樣,Kraus也對不切實際的時間表、承諾保持謹慎態度,當中一些過高的承諾來自於IBM自己。Kraus說:「相當難,今天沒有發生,再過5年可能也不會發生,這種技術不會替代醫生。」