【正向專題】以科研引領世界——專訪機械學習工程師陳逸翀 27.5.2019 - 17:30 陳逸翀是土生土長的澳門人,他先後取得北京清華大學計算機科學與技術學士,以及英國牛津大學計算機科學碩士學位,更加入國際知名經濟資訊機構——彭博社(Bloomberg)的機械學習(Machine Learning)團隊,成為軟件工程師及研究科學家。在科研路上,他一直堅持理論需要為人類服務的宗旨,唯有把理論付諸實踐,才有價值。 Kent Owl Academy(圖片由受訪者提供) 學習永不止步 北京清華大學是中國頂尖工程師和科學家的搖籃,畢業生為中國工程發展帶來的成就有目共睹。即使陳逸翀以優異的中學成績畢業,在邁入充滿科研人才的學府時,他亦曾感到困難重重:“清華大學是一個戰鬥場,圖書館、自修室每天總是人群滿座,大家從早到晚都熱鬧地討論著學習內容。學長、學姐和老師亦不斷提醒你必須付出百分之一百二十的努力。” 於清華大學鑽研知識(圖片由受訪者提供) 當時心理壓力極大的他,初期成績只達合格邊緣,令人擔憂。在老師循循善誘和同學鼓勵下,經過兩年努力,他的成績終於邁向前二十名:“逆水行舟,不進則退。有時候未必是我們的能力不及他人,要保持積極樂觀態度,不斷溫故知新,加倍努力學習,才能以清晰的思路面對挑戰。” 陳逸翀醉心科研(圖片由受訪者提供) 最初以遊戲開發為目標的他,笑言自己對節奏音樂遊戲十分著迷,希望能透過機械自動編寫樂譜,才決心成為機械學習工程師。他發現要製作一個可以立即使用的模型並不困難,但若要成為一個優秀的工程師,就必需掌握紮實的統計學、數學等知識:“每一個項目都要搭建和調試對應的機械學習統計模型才能行之有效,若對當中的基礎理論一無所知,將無從下手。” 遠赴英國牛津大學攻讀碩士(圖片由受訪者提供) 為了到英國牛津大學繼續鑽研機械學習技術,陳逸翀付出大量時間進行資料搜集,與同學進行模擬面試,互相交流意見,亦透過不斷練習模擬考題、模仿英劇的對話方式及語調,提升英語書寫和口語水平。他十分欣賞牛津大學的小班教學方式,經常與老師進行長時間討論:“教授會面對面進行指導,解答難題,為每個小錯誤寫下詳細見解,幫助學生正確理解和鞏固所學知識。” 陳逸翀望以機械學習服務人民(圖片由受訪者提供) 他以自然語言處理為畢業任務,希望能實際應用理論,作出科研上的突破。雖然在研究初期曾遇上很多挫折,但他仍不斷汲取失敗經驗,每天埋首實驗室進行改進及求證,最終成功以“變分貝葉斯”(Variational Bayes)的統計推理方法,讓機械學習猜測人腦的思維模式,減少觸控細小熒幕容易出現的輸入錯誤。他說:“學術研究可以走在科學前端,探索一些從未有人挖掘過的事,讓人覺得很有成就感。在清華大學的那段艱辛日子,讓我學會了堅定面對各種挑戰。” 機械創造智慧 “機械學習”是全球一大熱話,企業如何利用大數據提升核心競爭力備受關注。彭博社是國際知名的財經信息平台,報道世界各地的經濟及政治資訊,提供具權威性的評論及觀點,在金融市場極具影響力。在資訊爆炸的時代,彭博社每天收到全球超過二百萬則新聞訊息。面對如此龐大的數據量,若要進行人工處理,則需要聘請一千四百名職員,二十四小時不間斷工作,每分鐘閱讀一則新聞,為使用者提供深入分析。然而,透過機械學習,便可自動化剖析全球即時新聞,讓用戶取得影響金融市場的第一手消息,作出相應的投資策略。 在香港中文大學向數學系學生介紹彭博人工智能的工作(圖片由受訪者提供) 互聯網不斷發展,傳統的數據分析軟件顯得捉襟見肘,但要將學術模型進行精簡及優化,滿足用戶需求,對工程技術和硬件設備要求都極高,是一項嚴峻挑戰。陳逸翀認為學術模型與實用模型的分別在於速度與時間:“我們經常引用新學術模型,發展成規模化的軟件系統,但有些學術模型結構十分複雜,需要解決運算速度和處理容量等問題。” 他為彭博社建立了可找出社交媒體上熱門主題的統計模型,協助使用者進行訊息過濾:“具影響力的投資人物於社交平台發表的每一則言論,都可能引致金融市場動盪。我們想知道當中涉及的投資屬於哪一個領域。”這個主題分類系統,現在每天處理五億則社交平台發文,實時向用戶反映所關注類別的最新資訊。他亦透過建立可摘取文本重點的資訊抽取系統,偵測新聞內容的相似語意,為重覆資訊進行分組顯示,大大縮短用戶搜尋時間。 抓緊機遇,邁步向前 “機械學習”作為實現人工智能的一大途徑,已被廣泛應用於搜尋引擎、醫學診斷、圖像處理、影像、語音和書寫辨識等領域。陳逸翀勉勵欲投身科研的年輕人:“要無懼數學,才能深入理解運算原理;要不斷更新知識儲備,才能跟上時代步伐;要有出乎意料的見解,才能為企業帶來價值。”現今社會推行學術公開化,陳逸翀形容互聯網是一個“金礦”,要在領域一展身手,必須不斷增值和裝備自己:“多細磨論文、專案或求助他人,積攢的經驗越多,便會做得越好。” 陳逸翀勉勵年輕人毋懼挑戰,勇於突破。 世界各國近年致力發展機械學習模式為城市服務,透過檢測實時路況、車輛時速、目的地距離等,精確計算巴士到站時間,並因應路面實況自動調節交通訊號系統,提高疏導效率。 機械學習能節省更多溝通、時間和人力成本,但陳逸翀說當中必須經過重重難關:“機械需要從大數據中學習。要取得數據,必須在城市內裝設多個偵測點,或透過大量用戶程式進行定位記錄,需要多個政府部門相互協調,亦牽涉人力、時間、法律、隱私、資金等問題。” 近年,粵港澳地區的生產總值已達發達國家水平,投資形勢穩健上揚。隨著大灣區發展,三地的商務往來將更為緊密便捷。陳逸翀認為機械學習雖然在港澳地區發展較緩慢,但前景十分可觀:“澳門作為一個小城市,能被列入國家發展規劃甚為罕見,但澳門的行業市場狹窄,難以留住技術人才發展規模化產業。只要跟隨大灣區的發展步伐,專注推動旅遊業、會展業等第三產業,便能找到出路。”他建議政府建立快速透明機制,讓機械學習及軟件開發公司利用大灣區的資源擴大發展規模,協助澳門推動智慧型城市發展。 陳逸翀在科研路上不斷探索,奮勇向上。 合作單位:人才發展委員會 【項目資助:澳門基金會】 ~~~用力點讚 歡迎分享~~~ MPEA所有文章的原創內容歡迎轉載,但請註明出處, “來自‘澳門正能量協進會’; 網站:https://mpea-plus.org/; 微信號:macau-mpea; FACEBOOK:facebook.com/MACAUMPEA”, 並且不得對原始內容做任何修改,請尊重我們的勞動成果。 上一篇文章 - 【正向專題】拓寬跑道闖入直播領域——專訪澳門直播協會理事長戴顯揚