人工智慧解讀所有論文

 

二十世紀人類最重要的發明莫屬電腦和網際網路為甚,輔以半導體技術的快速發展,從笨重的大型主機電腦(main frame),漸漸演進到桌上型個人電腦、攜帶式筆記型電腦、個人數位助理(PDA)、人手一支或數支的手機或觸控平板電腦,而網際網路將所有的裝置連成一個龐大的網絡,服務業者不只提供幹線與終端連線服務,也提供大量的、各式各樣的內容供大眾選閱。隨著服務平台的創立,譬如:部落格、臉書等社群媒體、youtube等影音媒體,原先的閱聽大眾搖身一變成為內容提供者。而數十年來最重要的資產 學術研究論文,隨著電子化,讓原先難以取得論文全文的狀況也能輕易存取。只是隨著資訊散佈速度變快,論文增加的速度更是呈現指數型的成長,這也造成選讀論文的困境。

自從電腦發明之後,科學家們認為總有一天電腦能取代人腦。1950年,Alan Turing[1] 在著名的論文「計算機器和智慧」中介紹 Turing Test,正式描繪人工智慧的關鍵概念 通用電腦是否有學習和創新的能力(Can a computer think?)。隨後因各種技術、資金等主、客觀因素兩度陷入人工智慧發展的寒冬。第一波人工智慧寒冬大約在1970年代,第二波寒冬則發生在1990年代並持續到2000年代初期才慢慢解凍。

機器學習是人工智慧其中一個分項,或者說是核心技術之一,機器學習的概念從1980年代開始萌芽,1990年代逐漸成長,但卻直到近十來年才成為人工智慧發展最成功的子領域。機器學習之所以成功要歸功於幾個因素:

  • 更快速的硬體運算能力,包含中央處理器與記憶體;
  • 更龐大的資料量;
  • 更複雜的演算法;與
  • 龐大的資金投入。

人工智慧機器學習快速發展,也產出了大量的論文,在2018年時,每天有超過一百篇關於機器學習的研究論文[2],並在20195月創下單月提交超過1500篇關於機器學習的論文[3]。沒有人有能力閱讀完所有的論文,除了人工智慧本身。

我們要明白一件事,「電腦只做計算的事」,這是電腦所擅長的,但人類擅長的是將原先不是計算的事轉換成計算的事。譬如:將類比的聲音訊號經過取樣、編碼轉換成數字;將靜態圖片切割成有限的點(pixel)並將顏色編碼成一千六百多萬個色素;將字母、文字編碼成可以輸入、顯示的字元;這些都變成是電腦可以處理的計算的事。所以讓電腦來閱讀這些論文,再依關鍵字加以統計、歸納、分析找出我們需要的資訊。

到了二十一世紀,人類面臨最嚴峻的挑戰與威脅莫過於 Covid-19 新冠肺炎病毒,截至2021626日為止,全球一共有超過一億八千零七十三萬人確診,其中高達三百九十二萬人因感染新冠肺炎而病逝。

image

image

日本NHK電視台曾經在去年疫情剛爆發時製作了一部關於「微飛沫傳染(micro-droplet infection)」的影片,透過高速攝影機與特殊的燈光背景捕捉 0.1微米(micrometer)飛沫噴濺的途徑,甚至捕捉到說話時些微的飛沫噴出。先不論病毒是否就夾雜在這飛沫中或是被包覆在所謂的氣融膠之中,總之,讓人見識到飛沫擴散可怕之處,戴好口罩並保持社交距離總是對的。

今年27日,日本 NHK 電視台又推出了一部名為「新冠病毒」的影片,副標題是「AI 解讀所有論文」。去年年初新冠肺炎突然爆發,由於傳染速度非常快,感染後的症狀比季節流行性感冒還嚴重,在非常短的時間內蔓延世界各個角落,感染後因重症死亡的人數又是流行性感冒的數倍之多,因此在短短一年的時間就有多達二十多萬篇關於新冠肺炎與病毒的研究論文提交或發表。如同前面所說的,我們不可能一篇一篇慢慢研讀、慢慢研究,我們只能依靠人工智慧,將這二十多萬篇研究論文當作龐大的資料庫,尋找我們需要的資料。而當 NHK 電視台在篩選論文時,有許多論文是還正等待專家審核中。

研究病毒或是研究新冠肺炎的趨勢不像研究其它學科或工程,病毒或是肺炎會因為地區、季節、氣候、種族、年齡、生活習慣、政府政策與強制力強弱、甚至疫苗開發進度、接種意願以及病毒變異這些變數而有很大的差異,不是那麼容易將一份研究報告直接套用在其它時間與空間。譬如說像是歐美地區重視人權自由,就比較難強制人民戴口罩、保持社交距離或是封城;又譬如台灣,因為十八年前經過SARS的洗禮,又相對比較遵守紀律,對於政府要求配戴口罩的規定大多能接受並遵守,因此兩相比較之下台灣的疫情就比歐美其它國家輕微許多。但疫情差別,配戴口罩與否只是因素之一。這些研究論文不會因為這些變數的差異就毫無參考價值,而是要從這些文獻當中找出值得參考與借鏡的地方,如同讀史書是要知興替、明得失。

應政府科學辦公室(the Government Office for Science)的要求,英國醫藥科學院於20206月成立專家顧問小組,並在2020714日發佈了一份研究報告[4],透過電腦模型模擬病毒擴散的狀況。報告中假設 Rt 值從 20209月至20217月攀升至1.720211月將會是另一個感染高峰,死亡人數有可能是前一波感染的兩倍之多。而根據 OurWorldInData 的統計資料,截至 2021624日為止,結果顯示也真如英國醫藥科學院所言,證實英國醫藥科學院的模型推論的準確度。

image

image

NHK電視台利用人工智慧搜尋頻繁重複出現的詞彙並研究其與論文間的關聯性,當透過人工智慧以「冬季」為關鍵字篩選出超過350篇研究論文,發現有一些詞彙重複出現的頻率非常高,似乎與冬季感染蔓延風險有關,其中前三名分別是:

  1. 氣溫(Temperature
  2. 濕度(Humidity
  3. 維生素DVitamin D

不只是為了新冠肺炎,許多研究都關注維生素D維持身體免疫能力的作用,而高緯度地區冬季日照時間短,無法透過日曬機制獲得維生素D,因此容易增加感染的風險。另外,也有許多論文關注的焦點在於溫度與濕度對病毒存活的影響,研究顯示在氣溫35攝氏度、相對濕度在60%的夏季環境下,新冠病毒存活時間大約是兩小時左右;而在氣溫只有24攝氏度、相對溼度在20% 的大陸型秋天氣候下,新冠病毒的存活時間可長達15小時,多數研究認為病毒在低溫、乾燥的環境下存活的時間較長,因此感染的風險變高。

假如研究論文中關於溫溼度與病毒存活散佈的關聯性是可參考沿用的,那麼將這關聯性放到台灣來又是如何?

台灣從2021511日至今,過去七週的感染資料與疫調結果來看,今天的確診多半是反應一到兩週前的感染。我們也都很清楚台灣過去半年多來正面臨百年大旱,似乎符合低溫、乾燥的條件,極適合新冠肺炎病毒存活並散佈,直到530日為止。那天全台各地開始迎來較大的雨量,隨後天氣也逐漸炎熱。兩週後,613日,台灣的確診人數下降至一字頭,從此逐日快速下降。

又假設研究論文中關於溫溼度與病毒存活散佈的關聯性可以繼續沿用並預測未來,那麼台灣的疫情將會在今年暑假因為高溫炎熱而告一段落嗎?這真有可能發生嗎?只是台灣疫情發展有些變數在研究論文中是沒有提到的,像是疫苗施打率、無症狀的隱形傳播者、感染率更高的delta 變種病毒,還有因為酷暑而躲進有空調的密閉環境中,這些變數必須在預測未來時也一併列入考慮,再加上英國醫藥科學院所提出的冬季大流行這超級變數,未來台灣疫情會怎麼發展還很難說。

此外,科學家們也注意到一個奇怪的現象,根據 OurWorldInData 統計資料顯示,截至2021625日為止,歐美國家每百萬人口的相對死亡率遠遠高於東亞國家,難道僅僅是因為歐美人民不喜歡戴口罩嗎?還是有其它的原因?

image

對於這個問題,透過人工智慧查找關於重症死亡的相關研究,有一些詞彙很頻繁的出現在論文裡,有三個影響重症死亡變因的關鍵詞彙分別是:

  1. 尼安德塔人的基因(Neanderthals’ Gene
  2. 交叉免疫(Cross-Neutralization
  3. 口罩(Mask

20209月,Nature期刊上刊登了一篇關於感染新冠肺炎重症主要的基因風險因子是來自於尼安德塔人的基因[5]。研究針對3199位住院患者和不同的對照組,發現有一簇來自數萬年前尼安德塔人的基因確定與感染新冠肺炎重症有關,擁有尼安德塔人遺傳基因的人感染新冠病毒之後較容易出現重症化的情況,其重症化的風險是未帶有尼安德塔人基因的三倍之多。目前大約有 16% 的歐洲人帶有這種基因,在南亞大約有 50% 的人帶有這種基因,而在東亞地區幾乎沒有人擁有這種重症化風險的基因。

另外一項與重症有關的變因是交叉免疫。當身體感染某種病毒之後,身體內會出現被稱為抗體的免疫細胞來對抗入侵的病毒,即使病毒消失一段時間之後,免疫細胞的能力仍然會在身體裡保持一段時間,爾後,一旦有其他類似的病毒入侵,這免疫細胞會立刻啟動來對抗病毒,避免重症發生,這就是交叉免疫。多數的研究針對季節性流感病毒的交叉免疫能力,研究顯示對於新冠肺炎重症患者的統計,曾感染過季節性流感的患者在比例上多過曾經感染過季節性流感的患。如果身體已經有對季節性流感病毒的免疫力,那對戰勝新冠病毒是有相當助益的。

第三項是配戴口罩是否與得到新冠肺炎重症有關[6]?透過高速攝影機與特殊燈光背景捕捉到口罩可以阻擋大部分的飛沫,但還是會有微量的飛沫穿透口罩。研究推論配戴口罩能夠阻絕大多數的病毒,在只有微量病毒進入人體時,感染的症狀比較輕微,身體的免疫細胞會立刻對這微量病毒進行反擊,產生微量的抗體,當這樣的輕微感染反覆發生數次之後,免疫細胞不斷的訓練產生更多的抗體,這也是研究人員認為配戴口罩有助於提高人體的免疫能力的原因。研究人員在某些必須配戴口罩的工作環境中發現許多無症狀的感染者,研究人員也在他們身體內發現病毒,但在一段時間之後,大部分的人不只體內的病毒消失了,取而代之的是抗體。

然而新冠病毒對我們真正的威脅是什麼?許多罹患新冠肺炎的患者在康復之後,持續受到各種不同的症狀折磨,這些症狀包括:頭暈、胃痛、腹瀉、腦中風、幻覺、掉髮,這些症狀遍佈全身,多達上百種,但有一種症狀受到大多數研究人員的關注,那就是「腦霧(Brain Fog)」。

腦霧症狀是頭腦裡有種霧濛濛的感覺,注意力無法集中,思緒渾沌不清,上課時無法記住講課的內容,甚至不知道怎麼寫字,同時伴隨著頭暈、頭痛以及嚴重的倦怠,但卻難以入眠。研究顯示,大腦中掌管認知功能的區域呈現發炎現象,而且這發炎現象會長時間存在。其原因就在於大腦內部與肺部深處細胞一樣也有能與新冠病毒結合的 ACE2 突起,而且是位於大腦的中心部位,一旦大腦中的 ACE2 突起與新冠病毒結合,就催毀大腦的防禦系統,引起發炎,即使病毒消失之後,發炎的現象還是會持續很長一段時間。

只是身體細胞有能與新冠病毒結合的 ACE2 突起遍佈全身,一旦感染新冠病毒,它不只是引起呼吸系統的症狀,它同時讓全身各處組織也一併受到感染而發炎,這也是為什麼即使痊癒之後,全身不舒服的症狀還是會持續很長一段時間的原因。

至於新冠肺炎疫情什麼時候會結束,研究人員有著不一樣的看法,有些樂觀的研究人員認為在很短的時間內疫情就會受到控制並且結束,但也有研究人員認為新冠病毒永遠不會消失,疫情沒有結束的一天。不論疫情是否會結束?什麼時候會結束?研究人員都同意目前最有效的防疫方法只有兩個,一是疫苗,二是保持社交距離

在病毒被消滅、疫情結束之前,我們能有哪些積極作為來預防或降低新冠病毒的感染呢?在搜尋「預防感染」這關鍵字時,人工智慧從大數據裡篩選出一些頻繁出現的詞彙,其中有兩個詞彙讓人特別感興趣,那就是「紫外線(Ultraviolet)」和「加濕器(Humidifier)」。

加濕器在台灣並不常見,但喜歡韓劇的讀者一定在韓劇中看過加濕器,但這加濕器在預防感染是起了什麼樣的作用呢?這就要先講到人體氣管表面的纖毛組織和纖毛運動。氣管表面的纖毛不停地擺動,主要的作用是在將入侵人體像是病毒、微生物、灰塵等異物推出體外,當濕度高的時候,纖毛擺動的速度快;而當纖毛處於乾燥的狀況時,纖毛的擺動的速度就會降低,推送異物出去的能力就大幅降低。而研究顯示,當環境相對濕度介於 40% 60% 時,纖毛擺動的效果最佳,這是人體的第一道防禦關卡。

加濕器還有另外一個作用,研究人員透過「富岳(Fugaku)」超級電腦模擬在不同濕度的環境下飛沫噴濺的行進方向與速度,模擬結果顯示,在乾燥環境下飛沫擴散的距離較遠而且停留在空氣中的時間較長;當濕度提高到 60% 時,飛沫因空氣中的濕氣,它的擴散距離較短,在空氣中停留的時間也較短。因此,提高環境濕度對抑制懸浮於空氣中的病毒也有一定的效果。

紫外線是波長介於 10 400 奈米之間的電磁波,波長比可見光短,比 x射線長,而紫外線又因不同波長區分為 ABC等。過去的研究顯示,其中紫外線CUV-C100 ~ 280 nm)藉由破壞微生物與病毒的核酸來消滅病毒或減低微生物活性,市面上也有許多紫外線照射燈產品,也多用來作為消毒之用。既然紫外線能破壞核酸,也會穿透皮膚深層細胞,引發皮膚癌。但近期對預防新冠病毒與紫外線這個詞彙同時出現的是「222」這個數字。研究指出,波長 222 奈米的紫外線,無法穿透達到皮膚深層,不會對身體造成不良的影響,但只要 10 秒鐘,就能讓大約 90% 的新冠病毒失去感染能力(deactivate)。

 

結論

綜合以上的研究,我們可以得到以下結論。

  1. 溫溼度與新冠病毒存活的關聯性似乎吻合台灣過去七週以來疫情的發展趨勢,接下來七、八月酷暑濕熱,我們必須把握暑假這兩個月,盡快施打疫苗,讓身體產生對抗新冠肺炎病毒的抗體。當九月開學後學生們回到學校,無症狀、未打疫苗的學生將成為新一波的傳播者,並在秋冬之際爆發出來時,我們有足夠的保護能力。而變種病毒將會是我們接下來最大的挑戰。
  2. 在最近這一段時間內發現有許多無症狀的確診者,甚至不但無症狀,反而在其體內發現抗體,應該要有研究單位來研究這些無症狀者是什麼原因讓他們無症狀,是否只是因為單純戴好口罩的微感染,讓他們產生抗體,這是非常有用的宣傳資訊。
  3. 台灣在新冠肺炎疫情爆發之前,每年冬季總是會有不少人罹患流行性感冒。交叉免疫的狀況是否存在於台灣之中,對於罹患新冠肺炎的人,有多少重症?有多少輕症?有多少人曾經得過流感?有多少人不曾得過流感?這調查將對台灣未來疫情發展趨勢預測有幫助。
  4. 目前台灣疫苗施打率極低,在獲得有效抗體保護之前,最佳的防禦就是戴好口罩保持社交距離。戴好口罩是期待即便感染新冠病毒也是微感染而產生抗體,保持社交距離則是降低感染風險。
  5. 大家都在關心的事,什麼時候會解除三級警戒?我們這麼看,中央疫情指揮中心所制定的晉升三級警戒的標準是「單週出現3件以上社區群聚事件,1天確診10名以上感染源不明之本土病例。」那麼解除三級警戒的條件就是「單週出現3件以下社區群聚事件,1天確診10名以下感染源不明之本土病例。」有機會,但這難度頗高。

 

 

文末附上日本 NHK 電視台「新冠病毒」影片的連結。

https://www3.nhk.or.jp/nhkworld/zt/ondemand/video/4001385/?fbclid=IwAR0OK-fpGyIcYPDEqelUp6_xjw6y7ImCA3NE8KFaG12iCk8Jim_tfNDwqic

 

老驥於 2021/6/29

 

[1] Alan Turing Turing Machine 的發明者,在二次世界大戰中成功破解德國Enigma密碼,「模仿遊戲」這部電影裡的原型人物,被譽為電腦科學與人工智慧之父。

[2] 在「Data Mining Blog」中,Philippe 2019-06-08貼出一篇名為「Too many machine learning papers?」的文章,其中「Machine Learning Arxiv Papers Per Year」這張圖呈現出 ML 論文的成長速度。

https://data-mining.philippe-fournier-viger.com/too-many-machine-learning-papers/

[3] 這是一篇刊登在康乃爾大學 arXiv.org blog 中的文章「arXiv Machine Learning Classification Guide」。

https://blog.arxiv.org/2019/12/05/arxiv-machine-learning-classification-guide/

[4] 英國醫藥科學院的報告可以在以下網址找到。

https://acmedsci.ac.uk/file-download/51353957

[5] 關於與基因有關的研究論文「The major genetic risk factor for severe COVID-19 is inherited from Neanderthals」可在以下連結取得。

https://www.nature.com/articles/s41586-020-2818-3

[6] 這篇名為「Masks Do More Than Protect Others During COVID-19: Reducing the Inoculum of SARS-CoV-2 to Protect the Wearer」的論文有對是否佩戴口罩詳細的比較與說明。

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7393808/

 

 

arrow
arrow
    創作者介紹
    創作者 phd.chi 的頭像
    phd.chi

    maximaChi's blog

    phd.chi 發表在 痞客邦 留言(1) 人氣()