六月中旬,在線上舉行的「巴葡科技企業(澳門)創新創業大賽」上,一套由深繹未來(廣東橫琴)科技有限公司開發的「葡語大模型DeeCo-Model」同聲傳譯AI系統派上用場,實現中葡科創的流暢對話。該公司創始人、DeeCo-Model共同開發者,正是澳門大學校友林余楚。從昔日面臨經濟壓力的研究生,到如今執掌AI企業的領航者,林余楚用十多年時間,於葡語和「一帶一路」小語種中開闢出一條獨特的以數據驅動的AI創新路。
實現科創跨語言溝通
對作為中葡商貿合作服務平台的澳門而言,中葡語言服務是推動中國與葡語系國家交流的重要支撐。以澳門經濟及科技發展局主辦「巴葡科技企業(澳門)創新創業大賽」為例,為吸引巴西、葡萄牙的科創團隊參賽,準確到位的中葡翻譯,成為賽事順利進行的關鍵。「DeeCo-Model」同聲傳譯AI系統為多位內地及澳門評審、巴葡參賽者隊伍實現即時的跨語言溝通創造了條件。據林余楚指出,DeeCo-Model是中國首個專注於葡語國家市場的行業級大模型,於今年五月在橫琴粵澳深度合作區發佈,此次大賽是其技術落地的重要應用場景。
創業大賽的參賽項目涵蓋人工智能、生物醫藥等科技領域,對語言處理提出專業要求。林余楚介紹,DeeCo-Model的大語言模型建立專業的語言數據庫,具備深層語義解析能力,而且,該模型還能識別及反映歐葡與巴葡的語用差異,讓參賽科創隊伍與評委之間能順暢地交流項目中蘊含的科技理念。他還補充,DeeCo-Model的優勢,乃植根於澳門獨特的「三文四語」文化環境,以及他在澳大奠定的研究基礎。
困境裡的光
林余楚與澳大的故事始於2012年,剛收到澳大的碩士研究生錄取通知後,妻子懷孕的好消息也隨之傳來。雙重喜訊為這年輕家庭帶來歡欣的同時,隨之而來的是經濟壓力。正當他在學業與亟待維繫的生計之間艱難抉擇時,時任校長趙偉教授在開學禮上的一句「澳門學生不會因為經濟原因上不了學」,為他掃除了内心最大的障礙,讓他看見前路的曙光。
林余楚隨即鼓起勇氣向趙校長表露當下的困境,豈料得到快速回應,在校長的推薦下,他有機會擔任實驗室研究助理一職。「這份工作不僅緩解了我經濟上的燃眉之急,更讓我真正走上研究路。趙校長的排憂解難猶如一場及時雨,我一輩子都記在心裡。」
攻讀軟件工程碩士期間,林余楚為前沿AI技術吸引,爭取到不同實驗室學習的機會。他在物聯網實驗室學習了一段時間後,加入了自然語言處理與中葡機器翻譯實驗室,在黃輝教授門下鑽研多語言技術與語料庫建構的核心方法;其後,再到方正天教授領軍的數據分析實驗室,深耕協同計算與大數據挖掘技術。這一系列的跨領域探索,不僅讓他掌握了多個數據科學的技術,也無形中編織起跨學科的人脈網絡,此時結識的師友、師兄弟,都成為他日後創業路上重要的技術智囊。
一邊求學,一邊創業
林余楚比同屆同學花多兩年時間才取得碩士學位證書,2017年畢業時,他多走了一段迂迴卻豐盈的路。研二時,已修完大半課程的他,為改善家計開始奔波創業——埋頭學術研究的同時,先後創立三個O2O(Online to Offline)項目,穿梭於深圳商廈之間洽談業務,尋求業績上突破。「那是最忙碌的時光,」他回憶道:「既要當個稱職的父親,又要維持研究水準,還得在創業中學習商業決策。」
這段經歷淬煉了林余楚的商業眼光,奠定了創業基礎,而他同時兼顧學業、創業及家庭,更鍛煉出抗壓及高效分配時間等能力。「幸好有眾多老師和同門的支持和點撥,他們不僅在研究上指點迷津,更在我最低谷時給予勉勵。」回首這段歲月,他很感恩:「澳大給我的不只是學位,更是一個孕育夢想的園地。在這裡,我找到一份溫暖的歸屬感,鼓勵我勇往直前。」
進軍小語種「藍海」市場
澳大的學習經歷,使林余楚成功涉獵到物聯網、自然語言處理、計算機視覺、數據工程等不同領域的知識,他也在商場上累積了創業經驗和商業技巧。研究生畢業後,自幼懷有創業夢想的林余楚,毫不猶豫地選擇繼續為創業打拼,這次,他把目光聚焦於機器翻譯、AI大數據。2018年,林余楚創立深譯信息科技(珠海)有限公司,後公司集團化發展,成立母公司深繹未來科技(廣東橫琴)有限公司,並鎖定在葡語系與「一帶一路」小語種市場,這個當時被很多人看作「冷門」的領域,在他眼裡卻是潛力巨大的「藍海」。
他認為,當時英語等主流語種的機器翻譯是競爭的主流市場,而葡語及「一帶一路」沿線語言如哈薩克語、印尼語等,雖在機器翻譯技術上有突破的基礎,卻因高質量語料庫的匱乏而被市場忽視。林余楚捕捉這一市場缺口的機遇,避開巨頭環伺的戰場,專注於小語種、多語言、多模態的數據開發和服務,果斷進軍這片尚待開發的「藍海」。
林余楚的商業眼光還根植於澳門獨特的地緣文化優勢。400年中葡文化交融,讓澳門積澱了豐富的葡語法律文獻、行政體系及文化遺產,為他提供了天然的葡語語料庫與驗證場景。他相信,隨著「一帶一路」建設深入推進,沿線國家經貿文化往來日益頻繁,語言服務需求必迎來爆發式增長,「全球數位化時代到來,新時代溝通方式轉變,機器翻譯等AI大模型技術就可以補位,提供重要的解決方案。」
破局的關鍵時刻
萬事起頭難,2018至2020年,是林余楚最艱難的日子。創業初期,公司幾乎沒有營收,全憑林余楚在求學期間的積累苦苦支撐,這段時間,他將所有資源都投入到技術優化與產品打磨上,堅持「用技術說話」的信念。林余楚用「咬緊牙關」形容那段日子,但他始終相信,只要方向正確,就有機會在市場實戰中驗證實力。
機會很快就到來。2020年全球疫情爆發,成為他創業的關鍵轉折點。當傳統辦公模式面臨挑戰,跨境文件處理需求激增之際,林余楚敏銳地捕捉到醫療資料翻譯的市場機遇。但這是一個需要跨學科知識、具有高度專業門檻的領域,「單打獨鬥行不通,必須集結優秀的夥伴。」於是,憑藉在澳大積累的人脈資源,林余楚迅速組建起一支由澳大同門師兄弟為核心的專業團隊,匯集國內外頂尖醫療文獻與臨床文件,打造出一個醫療醫藥領域的海量數據庫,成為行業內極具價值的專業語料資產。
經過數年發展,這初創公司現已打造出一支35人的團隊,其中近三分之一成員來自澳門高校。團隊圍繞人工智能「數據、算法、算力」三大要素,努力構建AI人工智能小生態,發展出以數據驅動AI的新範式。公司自主研發數據開發服務平台「深數引擎(DeepData Engine)」,構建多語言、多模態、多領域、高質量AI數據庫,另還研發出多語言大模型底座。基於該數據庫和演算法底座,開發訓練各垂類大模型應用,先後發佈了「橙救」消防大模型、葡語大模型。林余楚強調:「我們將致力成為全球領先的多語言多模態AI數據提供商,做中國版Scale.Al。」
多語言AI技術連結全世界
從單打獨鬥到組建專業團隊,從單一技術研發到搭建AI服務平台,從營收掛零到實現穩定盈利,林余楚憑技術優勢和商業眼光,在多語言AI大數據領域開創了一條屬於自己的科創賽道。
畢業多年再談澳大求學時光,他依然滿是懷念:「學校不僅教我技術,更教會我堅持和務實——知道自己要甚麼,然後一步一步去做。」面對AI產業的快速迭代,林余楚把創業看作「終身不畢業的課堂」,他將與深繹未來科技一起,以粵港澳大灣區為支點,以數據為驅動,用更精準的多語言數據架起更多跨語橋樑,將最前沿技術轉化為觸手可及的生產力工具,持續推動AI深入千行百業,實現讓AI連結全世界的願景目標。