

12月19日,由開放原子開源基金會主辦,太初元碁Tecorigin共建的第二屆開放原子大賽 “Tecorigin算子開發(fā)任務挑戰(zhàn)賽”和 “Teco-RAG大模型開發(fā)任務挑戰(zhàn)賽” 在武漢舉行決賽路演。24支決賽隊伍現(xiàn)場角逐出各項大獎,本次Tecorigin挑戰(zhàn)賽圓滿落幕。
第二屆開放原子大賽是由開放原子開源基金會主辦的一場高規(guī)格高站位的開源領域專業(yè)賽事,太初元碁作為共建方,設立“Tecorigin算子開發(fā)任務挑戰(zhàn)賽”和 “Teco-RAG大模型開發(fā)任務挑戰(zhàn)賽” 兩個賽項,總獎金60萬元,旨在鼓勵參賽者基于完全自主可控的國產(chǎn)AI加速卡及軟件棧,開發(fā)創(chuàng)新算子和大模型問答系統(tǒng)。兩個賽項共吸引來自全國各地高校及企業(yè)的207支隊伍報名參賽,經(jīng)過三個月的激烈角逐,最終評選出24支隊伍,受邀參加決賽路演。
本次路演非常榮幸邀請到了開放原子開源基金會TOC主席譚中意先生、國家超級計算無錫中心副主任劉釗先生擔任嘉賓評委,同時還有高性能計算、編譯器、大模型領域的多位專家,為賽事提供了權威指導與專業(yè)支持。“Tecorigin算子開發(fā)任務挑戰(zhàn)賽”最終排名第一的是來自阿里巴巴的“大錘”隊。該團隊通過減少輸出緩沖區(qū)、數(shù)據(jù)重排SIMD、分塊計算、減少輸入內(nèi)存等步驟,將tecoalConvolutionForward算子的性能提升3.5倍。“Teco-RAG大模型開發(fā)任務挑戰(zhàn)賽” 最終排名第一的是來自上海的“moyuheng”隊。該團隊重點優(yōu)化了Teco-RAG的索引鏈部分:通過單雙欄PDF分類解析、PPT坐標脫敏、知識路徑分類優(yōu)化讀取過程;通過分隔常見中文標題、字符優(yōu)化分段過程;通過對將文件標題和知識路徑作為上下文、合并小chunk內(nèi)容優(yōu)化向量化過程。最終將Teco-RAG知識問答系統(tǒng)的準確率提升15%。路演結束后,選手們紛紛發(fā)表了自己的參賽感受。在這個大模型時代,國產(chǎn)AI加速卡是非常重要的基礎設施。通過參加本次賽事,感受到國產(chǎn)AI加速卡及其軟件越來越易用,太初的SDAA C是一門簡潔易懂的編程語言,希望可以在AI科研和產(chǎn)業(yè)中都能夠實現(xiàn)國產(chǎn)替代。SDAA C用戶界面和文檔支持都非常友好,即便是第一次使用也能快速上手,減少了我們在工具學習上的時間投入,總體來說感覺非常好。太初的硬件和軟件相關工具都挺好用的,賽事提供的文檔中提供了典型的一些算子優(yōu)化思路和方法,便于在比賽之中使用SDAA C編程語言實現(xiàn)算子高性能優(yōu)化。我之前有過CUDA開發(fā)的經(jīng)歷,SDAA C和CUDA類似,從CUDA遷移過來門檻很低,甚至感覺對初學者更友好。本次賽事提供的服務器性能非常好,環(huán)境無需額外配置,baseline和測試用例也非常清晰。數(shù)據(jù)決定了機器學習的上限,而算法只是逼近這個上限。Teco-RAG部署簡單,技術棧也很先進,架構上將三個Chain很好地解耦并提供FastAPI,定制開發(fā)非常方便,可玩性非常強。在國產(chǎn)化勢在必行的今天,非??春肨eco-RAG在行業(yè)實際生產(chǎn)場景中落地。非常有幸借助本次賽事,體驗國產(chǎn)算力的魅力。我們借助太初的算力平臺,驗證了其在AI領域的卓越適配能力,構建了一套完整、高效的RAG優(yōu)化范式。通過參加本次Tecorigin挑戰(zhàn)賽,選手們不僅見證了國產(chǎn)AI加速卡及軟件棧的飛速進步,更深刻感受到了創(chuàng)新與實踐相結合所帶來的無限可能。
結語
展望未來,我們堅信國產(chǎn)AI加速卡及其軟件棧將在更多領域得到廣泛應用,并為推動AI科研與產(chǎn)業(yè)的繁榮發(fā)展貢獻重要力量。同時,我們也期待更多優(yōu)秀開發(fā)者能夠加入到這一領域中來,共同探索、共同創(chuàng)新,為國產(chǎn)AI技術的崛起貢獻自己的智慧與力量。