Fotor的联合研究获ICLR 2026接纳,推动其智能体的多模态推理能力发展
(SeaPRwire) - 洛杉磯,2026年4月2日 -- Everimaging旗下旗艦AI產品Fotor今日宣布,其最新聯合研究成果已被ICLR 2026接受為會議論文。ICLR是全球頂尖的人工智慧學術會議之一。 這篇題為《WEB-COGREASONER:面向網頁代理的多模態知識誘導認知推理》的論文,標誌著自主AI運作時代的重要里程碑。此突破是Fotor與知名大學/研究機構合作的成果,成功彌合了學術成果與真實產業實踐之間的差距。 核心突破:讓AI掌握「三重知識」 面對複雜的網頁和彈窗干擾,傳統網頁代理常陷入死循環。為突破此瓶頸,聯合研究團隊從教育心理學中的「布魯姆分類法(Bloom’s Taxonomy)」獲得靈感,創新提出Web-CogKnowledge框架。 該框架將AI學習過程拆解為三個逐步進階的認知階段: 事實知識(Factual Knowledge):使AI能準確識別網頁元素,並預測單一互動的直接結果。概念知識(Conceptual Knowledge):賦予AI深度語義理解能力,以推斷元件功能並掌握網頁整體意圖。程序知識(Procedural Knowledge):訓練AI規劃與決策能力,以執行動作序列並處理彈窗等意外中斷。 在這個系統與Web-CogDataset(基於14個真實網站建構)的支持下,AI現已具備強大的「知識驅動思維鏈(Knowledge-driven Chain of Thought, CoT)」,用於深度邏輯推理。 從研究到產品:驅動下一代Fotor Agent 基於ICLR 2026的研究成果,Fotor透過將這些進展與領先的開源代理框架(如OpenClaw)整合,具備了將學術突破轉化為卓越產品的能力,使Fotor Agent的下一階段演進指日可待。 在Web-CogReasoner框架下,Fotor Agent正擺脫對網頁底層程式碼(DOM樹)的依賴。透過運用「純像素視覺感知」與聯合論文中提出的跨平台認知框架,Fotor Agent能無縫管理網頁版、桌面軟體和行動應用程式的工作流程。這標誌著向通用電腦控制(Universal Computer Control, UCC)邁出了明確的一步,讓用戶透過單一指令即可處理複雜任務。 關於Fotor Fotor致力於頂尖AI研究的實際應用,彌合了複雜神經網路架構與直覺式創意工具之間的差距。透過其強大的全球研究網絡,Fotor持續為全球超過8億用戶帶來全新的AI體驗。 媒體聯絡: CONTACT: Coran HuangEMAIL: coran@fotor.comWEB: www.fotor.com 本文由第三方廠商內容提供者提供。SeaPRwire (https://www.seaprwire.com/)對此不作任何保證或陳述。 分類: 頭條新聞,日常新聞 SeaPRwire為公司和機構提供全球新聞稿發佈,覆蓋超過6,500個媒體庫、86,000名編輯和記者,以及350萬以上終端桌面和手機App。SeaPRwire支持英、日、德、韓、法、俄、印尼、馬來、越南、中文等多種語言新聞稿發佈。
More
