8月29日,由上海科學智能研究院(簡稱上智院)與復旦大學聯合主辦的第二屆世界科學智能大賽進入復賽階段,472名選手從12687位報名者中脫穎而出,開始下輪角逐。

圖:上智院·天池平臺是本屆官方比賽平臺
世界科學智能大賽始創于2023年,旨在吸引全球智能人才共同探索科學智能(AI for Science)領域的新課題、新方法。今年的大賽是第二屆,參賽選手來自24個國家和地區的1085個機構,包括高校、科研機構、企業等。阿里云作為協辦單位,與上智院聯合開發了上智院·天池平臺,通過融合雙方的科學智能生態優勢和競賽管理經驗,為選手提供更聚焦于AI for Science領域的參賽體驗。
本屆大賽秉持“AI賦能千行百業”的理念,設置了生命科學、地球科學、物質科學、社會科學以及邏輯推理五大賽道,賽題設計更貼近實際場景,鼓勵選手將所學知識運用到產業一線。其中,社會科學和邏輯推理為新增賽道,意在通過多學科融合,充分發掘大模型在不同領域的應用潛力,培育科學智能的創新萌芽。
AI人才共赴“擂臺”,高中少年團表現搶眼
相比去年,今年的參賽人數增加了1000多,提交作品數量更是增加了180%。參賽選手和隊伍背景多元,既有深耕行業多年的AI大牛,也有仍在求學階段的學生,甚至還有來自華師大二附中、七寶中學、松江二中等14所頂尖高中的21名高中生選手。
第二次參賽的“拉馬努鐵”團隊,來自上海交通大學專注于AI for Science的學生組織思源學社。他們去年沒能走到最后,本屆大賽“卷土重來”,成功晉級生命科學賽道復賽。“拉馬努鐵”表示:“通過這次比賽,我們深入理解了AI for science的意義,能創造新的價值,造福更多人”。
邏輯推理賽道的“剛剛好”團隊,成員主要來自于跨境電商平臺Shopee和華東師范大學,既有經驗豐富的競賽“老手”,也有大模型行業一線從業者。成員各司其職,分別負責理論框架、模型應用和工程實現,快速迭代出了一套解決方案,取得了不錯的初賽成績。他們認為,大賽經驗能為產業問題提供一些具體指導,加速從技術到應用的落地。

圖:“ETO統一陣線”的4名成員合影
“ETO統一陣線”是“高中少年團”的代表,4名成員分別來自松江二中、松江一中、曹楊二中、民辦平和學校。他們平時熱衷探索科學和計算機技術,不乏信息學競賽高手,是同齡人中的科技佼佼者。初賽過程中,成員們先各自“分頭”探索,發現好的成果后,再沿著統一方向進行深化改造,并巧妙運用了大模型的代碼生成,既用AI給過程增效,也用AI賦能結果,實現了高效的協作和高質的交付,取得了社會科學賽道排名13的亮眼成績。
創造優質賽事體驗,助力復合人才培養
本屆大賽評委會主席、上智院院長、復旦大學浩清特聘教授漆遠表示:“通用人工智能的最高體現之一就是理解復雜世界、發現未知規律。簡單地說,就是打造AI愛因斯坦。這也是AI for Science的關鍵目標”。
“以學促練,以練助學”,選手們的參賽表現,彰顯了大賽在激發科研興趣、培育年輕學者方面的價值。科學智能生態的發展,既離不開打通專業知識的壁壘,也離不開技術信仰的代代相傳,呼喚著更多學科交叉、產研雙精的復合型人才。

圖:大賽組委會走進校園
為了給參賽者創造良好體驗,初賽期間,大賽組委會走進浙江大學、上海交通大學等高校,與師生們深度交流 AI for Science的發展歷程和前景。大賽官方針對五大賽道打造了定制化的學習方案,以由淺入深的學習攻略,形成“練、學、比”一體的賽事生態,鼓勵參賽選手勇創佳績。
當前,初賽已于21日結束,選手們正在緊鑼密鼓準備8月29日至9月24日的復賽,并將在10月的決賽決出優勝隊伍。社會科學和邏輯推理是本屆大賽在首屆基礎上新增的兩大賽道,其中社會科學賽道的題目為“市場博弈和價格預測”,對電力市場中主體博弈產生的結算價格的預測具有重要的理論和現實意義。正如上智院理事長、復旦大學大數據學院副院長吳力波教授所言,能源轉型與可持續發展有賴于以電力部門為代表的多主體參與,可借助AI技術挖掘市場博弈邏輯和預測市場出清價格,提升能源保障體系的穩定,助力電力行業健康、良序發展。而圍繞大模型的智能化潛力,邏輯推理賽道以“復雜推理能力評估”為題,聚焦于AI邏輯推理對自然語言的分析和理解,為金融、醫療、教育等更多場景提供技術手段和創新思路。
作為官方比賽和社區平臺,上智院·天池平臺通過提供賽題數據、參賽環境、結果評選等服務,助力大賽推進。平臺還將聯合高校、科研機構及企業持續運營,打造AI for Science等多主題的賽事,舉辦各類技術沙龍、論壇等,構建科學智能社區生態,推動前沿創新資源的碰撞,促進產學研的深度融合。上智院·天池平臺:http://competition.sais.com.cn/
選手們評價本次賽事組織“清晰”且“快速”。“拉馬努鐵”團隊對本屆大賽的一大感受是:“比賽的頁面介紹、問題背景、DS文件等非常清晰,還提供了可用性很強的baseline文件。評測系統反饋非常快,交付后10秒鐘左右就能出結果”。
