研究語言為我們不斷注入對溝通、文化與歷史的寶貴見解,但過去大眾不怎麼將語言學與電腦科學聯繫起來。澳門大學人文學院中國語言文學系主任、計算語言學家袁毓林講座教授指出,這種現象在ChatGPT等生成式人工智能誕生後發生變化。
大型語言模型革新語言學研究
袁教授說,人工智能過去十年的發展帶來了機器翻譯、文本分析和語音轉換文字等多方面的突破,包括運用「大型語言模型」的對話型人工智能系統,例如OpenAI的GPT-4和Google的Bard。
有語言學家認為,人類的語言能力和「心智理論」(即理解和推測他人心理狀態的能力)都是後天通過使用語言不斷發展的。值得關注的是,大型語言模型也在理解和產生文本方面有飛躍進展。袁教授表示,有研究指出,通過人類用自然語言提供的反饋,一些模型似乎呈現出「心智理論」能力。因此,許多研究者開始將傳統語言學研究、反映神經行為的腦影像和大型語言模型研究結合起來。袁教授認為,這方面的進展有望提升人工智能的語言能力,也能令我們更深入地理解人類的語言運用和思考過程。
培育理論與實踐並重的語言人才
在語言學和計算機科學日漸交織的當下,許多學生報讀澳大的理學碩士學位(數據科學)課程中的「計算語言學」專業範疇。該專業範疇由澳大協同創新研究院與人文學院合辦,不但教授語言和語言學研究的關鍵概念和方法、語言數據收集和分析,也會講授在語言和應用語言學研究中運用大數據分析工具和方法,包括機器翻譯、自動評分和基於語料庫的分析等。
過去一年,袁教授指導了四名碩士生,每人負責一個關於大型語言模型的項目。第一個項目嘗試構建更為精細的檢驗大型語言模型的語義理解與常識推理能力的測試集。第二個項目則涉及開發一套文本檢測系統,從而區分人工智能與人類所產生的文本。第三個項目進行了文本分析,旨在探究創作者的人格特質。最後一個項目則涉及應用層面,研究如何編寫更精確的指令,使大型語言模型更有效地調整寫作風格、製作表格,以及編寫電腦程式。
袁教授強調,語言專業人士越來越需要以數據科學技術來處理和分析語言。「無論在出版、教育、媒體、企業溝通、翻譯,乃至是人文學科、社會科學和信息技術等領域的研究,計算語言學的畢業生都能走在前沿。」
文 / 葉浩男、實習校園記者李少傑
圖 / 何杰平
來源:《澳大新語》第28期