近日,云從科技從容大模型在綜合評測權威平臺OpenCompass的多模態評測領域中取得重大進展。
最新評測結果顯示,云從科技的從容大模型在該體系中的平均得分為65.5,這一成績使得從容大模型躋身全球前三,超越了谷歌的Gemini-1.5-Pro和GPT-4v,僅次于GPT-4o(69.9)和Claude3.5-Sonnet(67.9)。而在國內市場,從容大模型的成績也超過了InternVL-Chat(61.7)和GLM-4V(60.8),排名首位。
圖1:OpenCompass多模態榜單
OpenCompass大模型開放評測體系是上海人工智能實驗室推出的完整開源可復現的評測框架。OpenCompass多模態評測方面采用了8個具有代表性的數據集,從多種視角客觀量化多模態大模型的能力,評估維度覆蓋目標檢測、文字識別、動作識別、圖像理解和關系推理、藝術與設計、商業、科學、健康與醫學、人文與社會科學、技術與工程、數學推理等多個方面。
圖2:從容大模型-2.0多模態能力示例
在本次測評中,從容大模型在其中的6個數據集表現優異,排名國內第一(MMbench、MMStar、MathVista、HallusionBench、AI2D、OCRBench),尤其是在OCRBench測試集上以取得全球最高的827分(總分為1000分),且高于第二名GLM-4v 13分,進一步提升從容大模型在文本識別、以文本為中心的視覺問答、面向文檔的視覺問答、關鍵信息提取等業務場景下的適用性。
圖3:OpenCompass中國大模型多模態能力展示
從容大模型在此體系中的優秀表現,依賴云從科技自研的高效多模態處理架構和先進的計算技術,實現了高效的多模態數據處理能力,能夠在視覺和語言任務之間實現高效的融合和切換,并最大化利用計算資源,保證在處理大規模多模態數據時仍能保持較高的性能和響應速度,使得模型的訓練過程更加高效,收斂速度更快,性能更穩定。
同時也得益于云從科技長期在視覺、語言領域的深厚積累和不斷創新。
圖4:從容大模型-2.0多模態能力示例
此前,從容大模型已在視覺、跨模態領域10次刷新世界紀錄,綜合性能經第三方SuperClue、C-Eval等綜合評測,位列全球前五。
作為一家專注于人機協同技術研發的平臺企業,云從科技一直在積極推動AI智能體及大模型技術的發展和應用。
隨著人工智能技術的迅猛發展,多模態大模型已成為驅動產業變革的核心引擎。此次從容大模型在OpenCompass大模型開放評測體系中的出色表現,不僅是對云從科技技術創新實力的認可,更在業界樹立典范,激勵全球科技企業在新一輪的人工智能競爭中勇攀高峰。
在推動科技創新與產業發展雙向互促的背景下,重慶市經濟信息委于近日公布了首批17個產業創新綜合體(科技型企業主導型)建設單位名單。 云從科技憑借其在AI智能體領域的核心技術優勢與產業生態構建能力,成功入選并成為“產業大模型與智能體系統產業創新綜合體”的牽頭單位之一。
12月21日,廣州市專精特新“小巨人”賦能發展大會成功舉辦,云從科技憑借人工智能與大模型領域的關鍵技術突破與規模產業應用,歷經廣州市、國家工信部層層篩選后強勢上榜,作為第五批國家級專精特新“小巨人”企業代表上臺接受授牌。
周一到周五9:30-18:00(北京時間)
商務合作:business@cloudwalk.com
媒體合作:Media@cloudwalk.com
渠道合作:business_partner@cloudwalk.com
人才招聘:zhaopin@cloudwalk.com