人工智慧解讀所有論文
二十世紀人類最重要的發明莫屬電腦和網際網路為甚,輔以半導體技術的快速發展,從笨重的大型主機電腦(main frame),漸漸演進到桌上型個人電腦、攜帶式筆記型電腦、個人數位助理(PDA)、人手一支或數支的手機或觸控平板電腦,而網際網路將所有的裝置連成一個龐大的網絡,服務業者不只提供幹線與終端連線服務,也提供大量的、各式各樣的內容供大眾選閱。隨著服務平台的創立,譬如:部落格、臉書等社群媒體、youtube等影音媒體,原先的閱聽大眾搖身一變成為內容提供者。而數十年來最重要的資產 – 學術研究論文,隨著電子化,讓原先難以取得論文全文的狀況也能輕易存取。只是隨著資訊散佈速度變快,論文增加的速度更是呈現指數型的成長,這也造成選讀論文的困境。
自從電腦發明之後,科學家們認為總有一天電腦能取代人腦。1950年,Alan Turing[1] 在著名的論文「計算機器和智慧」中介紹 Turing Test,正式描繪人工智慧的關鍵概念 – 通用電腦是否有學習和創新的能力(Can a computer think?)。隨後因各種技術、資金等主、客觀因素兩度陷入人工智慧發展的寒冬。第一波人工智慧寒冬大約在1970年代,第二波寒冬則發生在1990年代並持續到2000年代初期才慢慢解凍。
機器學習是人工智慧其中一個分項,或者說是核心技術之一,機器學習的概念從1980年代開始萌芽,1990年代逐漸成長,但卻直到近十來年才成為人工智慧發展最成功的子領域。機器學習之所以成功要歸功於幾個因素:
phd.chi 發表在 痞客邦 留言(1) 人氣()
這幾天台灣的疫情似乎緩和下來,但隨著疫苗施打人數增加,現在媒體報導的焦點反而變成每天有多少人在施打疫苗後猝死,這讓在六月十四日開放長者施打疫苗時湧現的施打潮頓時銳減許多,許多長者對施打疫苗產生恐懼,也讓許多家中有年長者的家庭對於是否依計畫繼續施打有了分歧,不只對阿斯特捷利康疫苗是否安全產生疑問,甚而將先前國外發生血栓和暫停施打事件有了連結,日本民眾也出現不應贈送台灣阿斯特捷利康疫苗的聲音。
昨天,一位老同學在群組裡貼了一篇洛杉磯時報在2020年12月15日刊登的一篇關於新冠肺炎疫苗的報導,並在貼文裡加註「高齡亞裔該選甚麼疫苗就很清楚了」,這吸引了正為該不該讓老母親去施打疫苗而引發家庭糾紛的我的興趣。這篇文章的標題是「How the Covid-19 vaccines from Moderna and Pfizer compare head to head」,中文的意思大略是「新冠肺炎疫苗莫德納和輝瑞的正面對決」,我對標題的中文翻譯可能更加聳動。
我相信原文作者在寫這篇報導時已經詳細查證過,所引用的數據也應是有所本,因此我並未對所引用的數據再加以查證,如果有讀者發現謬誤還請不吝告知,我就對有趣的地方於以說明。
這篇報導拿來比較的輝瑞與莫德納疫苗同樣是使用「信息使者RNA,簡稱mRNA」技術,這是一項比較新的生物疫苗技術,在新冠肺炎之前,從沒有使用mRNA技術開發的疫苗施打在人體上,原作者拿這兩個疫苗來比較,讓人覺得挺有意思的。
phd.chi 發表在 痞客邦 留言(0) 人氣()
2020年因為新冠肺炎(COVID-19)肆虐的關係,表訂於三月舉辦的音樂比賽全國賽團體組被迫取消,對於辛勤苦練近一年的同學們無疑是晴天霹靂。這全國賽是檢驗同學們學習成果的一項競賽,也是與全國菁英團隊一較高下的競技場,是一場龍虎爭鬥的較勁,也是品嘗甜美果實的豐收日。
有一種風景是站在世界頂端才欣賞得到的,而我們國樂團的同學們就差這麼一步就可以再次站在世界頂端,細細品味這美麗的風景。同學們透過全國賽提升自我的高度,擴展無限的視野,過程中流下的汗水則別有滋味。
也因為疫情的關係,所有大型活動跟著取消或停辦,而位居台灣國樂翹楚的台北市立國樂團為所有喜愛國樂的閱聽大眾突破這困境,於2020年6月13日在臺北市中山堂中正廳舉辦『那疫年,我們的音樂比賽...T_T|||』音樂會,並首開先例,這場音樂會同步於網路直播[1]。進場觀眾全程配戴口罩,而台上也有部分演奏家戴起口罩凝神演出。
既然這場音樂會透過網路直播,在節目開演之前和中場休息時間就可以穿插事先錄製好的節目,於是在演出前三週,台北市立國樂團發起錄製『創意團呼』活動[2],邀集全國各級學校國樂團一起參與。
phd.chi 發表在 痞客邦 留言(0) 人氣()
目錄
01. pandas 物件
02. pandas 物件資料存取
phd.chi 發表在 痞客邦 留言(0) 人氣()
Pandas 筆記
合併資料集 - 03 append() 物件方法
在討論完 pandas.concat() 函式之後,有一個 pandas.Series 物件和 pandas.DataFrame 物件的方法可以達到和 pandas.concat() 函式類似的功能,那就是 pandas.Series.append() 方法和 pandas.DataFrame.append()方法。這兩個 append() 方法可以看做是 pandas.concat() 函式的簡化版,只是這 append() 方法合併資料集的方向永遠是對「列」合併。
phd.chi 發表在 痞客邦 留言(0) 人氣()
Pandas 筆記
合併資料集 - 02 pandas.concat() 函式的更多細節
phd.chi 發表在 痞客邦 留言(0) 人氣()
Pandas 筆記
合併資料集 - 01 pandas.concat() 函式
在實際的應用當中,資料集合併是常用的功能之一,直覺上就是把兩個或以上的資料集上下或左右串接再一起。Pandas 提供幾種不同的方法合併資料集,其中 pandas.concat() 函式在串接資料上扮演相當重要的角色。pandas.concat() 函式對 pandas.Series 物件或 pandas.DataFrame 物件沿著其中一軸串接,並對pandas.DataFrame 物件其他軸有選擇性的邏輯判斷,譬如:聯集(join 參數設定為 'outer')、交集(join 參數設定為 'inner')等等。
phd.chi 發表在 痞客邦 留言(0) 人氣()
三、開始申報
這報稅軟體除了可以輸入所得資料與計算所得稅之外,還有上傳所得資料和線上繳稅功能。使用這報稅軟體有兩類申報方式,一是「網路申報」,另一是「二維申報」,後面會詳細說明這兩類申報方式得差異。而採用「網路申報」方式,允許使用者從國稅局網站下載所得與扣繳資料,但需要通過憑證認證,本文稍後也會說明四種不同的憑證作業。
|
使用這報稅軟體,會使用到「自然人憑證」、其他金融機構憑證或健保卡憑證,倘若沒有這些憑證的話,請在使用報稅軟體前申請這些憑證,其中「自然人憑證」可向各縣市政府戶政機關申請,至於申請流程就不在這裡贅言。
|
phd.chi 發表在 痞客邦 留言(0) 人氣()
很久很久以前,在報稅流程電子化之前,每到報稅季節,要到國稅局拿所得稅申報表,這申報表還分標準扣除額和列舉扣除額兩種,根據個人需求使用不同的申報表。
在報稅之前,每個報稅人都必須收集所有收入憑證,辛苦的是,若使用列舉扣除額這種申報方式,還要收集前一年整年度的所有可申報扣除項目的單據(像是醫院或診所的醫療收據),這是一整年的功夫,而且要熟知哪些是可列舉扣除的項目。而最痛苦的還是計算,將所有可扣除項目的單據分門別類之後,用計算機反覆計算並記錄在草稿紙上,確定沒有問題之後,再謄寫到申報表之中。
申報人辛苦,國稅局工作人員辛苦,郵差也辛苦,郵差們要負責寄送各種收入憑證。
一晃眼,每年負責全家所得稅申報也將近三十年的時光,而報稅流程電子化也有十多年,從一開始還是需要自行收集列舉扣除的單據,到現在所有可列舉扣除的單據都在國稅局的資料庫裡,這也是所有納稅義務人誠實申報和電子化的結果。
這篇所得稅申報流程寫於 2019年 5 月,當時身體狀況非常糟糕,想說如果有一天再也沒法為家人申報所得稅時,家人能邊看著這文件邊操作申報軟體,順利完成以後的所得稅申報,這是當時僅存的願望。
phd.chi 發表在 痞客邦 留言(0) 人氣()
三、設定 Anaconda 的環境變數
有些朋友在安裝完 Anaconda 整合開發環境之後就急著開啟 Spyder 或 Jupyter Notebook 並撰寫程式來試試,卻發現無法載入(import)Anaconda 的預設套件或模組,或者使用 pip 指令安裝其它套件時,卻遇到無法安裝到正確的目錄。
要讓 Anaconda 正確的工作,在安裝完畢之後還必須設定 Microsoft Windows 作業系統的環境變數。如果沒有正確設定環境變數,執行 Anaconda 將無法正確找到所有安裝的套件,而後續安裝新套件時也無法找到正確的路徑。
在這一章節中將分成兩個部分,第一個部分先說明要設定那些參數到環境變數裡以及如何找到這些參數。第二部分則是說明在 Microsoft Windows 裡如何設定環境變數。
(一)環境變數的參數
phd.chi 發表在 痞客邦 留言(0) 人氣()