京東開源JoyAI-Image-Edit模型：突破空間編輯難題，賦能多元應用場景-業(yè)界資訊-虎科技

京東開源JoyAI-Image-Edit模型：突破空間編輯難題，賦能多元應用場景

時間：2026-04-10 12:07 來源：快訊作者：顧雨柔

京東探索研究院近日宣布，其自主研發(fā)的圖像編輯模型JoyAI-Image-Edit正式面向全球開發(fā)者開源。這款模型突破了傳統(tǒng)圖像編輯技術的平面局限，首次將空間智能深度融入設計框架，使AI能夠精準理解三維空間關系并實現(xiàn)復雜場景重塑，標志著圖像處理技術從二維平面邁向三維空間的新紀元。

該模型通過構建空間位置感知、多視角一致性維護、相機參數(shù)解析等核心模塊，實現(xiàn)了相機視角變換、物體空間位移、幾何結構精準控制等技術創(chuàng)新。京東實驗室測試數(shù)據(jù)顯示，其在物體移動精度、空間連續(xù)性等關鍵指標上已達到國際領先水平，尤其在處理復雜遮擋關系和光影過渡時展現(xiàn)出顯著優(yōu)勢。與傳統(tǒng)模型相比，JoyAI-Image-Edit能夠同時處理15類通用編輯任務，包括物體增刪改、風格遷移、細節(jié)優(yōu)化等高頻創(chuàng)作需求。

模型三大核心功能構成其獨特競爭力：視角變換功能支持通過自然語言指令調(diào)整相機偏航角、俯仰角和縮放比例，在保持場景幾何結構完整的前提下生成新視角圖像；空間漫游功能可模擬三維空間移動軌跡，自動生成邏輯連貫的多視角圖像序列；物體空間關系操控功能則能在維持場景整體穩(wěn)定性的同時，對指定物體進行位移、旋轉(zhuǎn)或縮放操作，并自動優(yōu)化遮擋關系和光影效果。

這項技術突破為多個行業(yè)帶來革新可能。在電商領域，商家可通過自然語言指令快速生成多角度商品展示圖；創(chuàng)意設計行業(yè)能利用空間漫游功能制作沉浸式場景預覽；智能圖像處理領域可實現(xiàn)更精準的3D模型重建；具身智能研發(fā)則獲得關鍵的視覺感知底層支持。開發(fā)者現(xiàn)可自由獲取模型推理代碼，基于其開放架構開發(fā)各類商業(yè)應用。

技術團隊透露，模型訓練過程中構建了包含數(shù)百萬空間標注數(shù)據(jù)的訓練集，特別強化了對室內(nèi)外場景的空間關系理解能力。其創(chuàng)新的空間坐標編碼機制，使模型能夠解析物體在三維空間中的絕對位置和相對關系，這項突破解決了開源社區(qū)長期存在的空間感知難題。隨著模型開源，預計將推動AI圖像技術在自動駕駛、機器人導航、虛擬現(xiàn)實等領域的快速落地應用。

更多>同類內(nèi)容

18.99萬元起售！捷途旅行者PLUS及C-DM開啟	微信公眾號出手整治：嚴禁AI自動化創(chuàng)作替代
360“蝦書”APP來襲：AI智能體自主社交，人	2026年科大訊飛學習機怎么選？這三款高口碑