黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領先的互聯(lián)網(wǎng)科技媒體

京東開源JoyAI-Image-Edit模型:突破空間編輯難題,賦能多元應用場景

   時間:2026-04-10 12:07 來源:快訊作者:顧雨柔

京東探索研究院近日宣布,其自主研發(fā)的圖像編輯模型JoyAI-Image-Edit正式面向全球開發(fā)者開源。這款模型突破了傳統(tǒng)圖像編輯技術的平面局限,首次將空間智能深度融入設計框架,使AI能夠精準理解三維空間關系并實現(xiàn)復雜場景重塑,標志著圖像處理技術從二維平面邁向三維空間的新紀元。

該模型通過構建空間位置感知、多視角一致性維護、相機參數(shù)解析等核心模塊,實現(xiàn)了相機視角變換、物體空間位移、幾何結構精準控制等技術創(chuàng)新。京東實驗室測試數(shù)據(jù)顯示,其在物體移動精度、空間連續(xù)性等關鍵指標上已達到國際領先水平,尤其在處理復雜遮擋關系和光影過渡時展現(xiàn)出顯著優(yōu)勢。與傳統(tǒng)模型相比,JoyAI-Image-Edit能夠同時處理15類通用編輯任務,包括物體增刪改、風格遷移、細節(jié)優(yōu)化等高頻創(chuàng)作需求。

模型三大核心功能構成其獨特競爭力:視角變換功能支持通過自然語言指令調(diào)整相機偏航角、俯仰角和縮放比例,在保持場景幾何結構完整的前提下生成新視角圖像;空間漫游功能可模擬三維空間移動軌跡,自動生成邏輯連貫的多視角圖像序列;物體空間關系操控功能則能在維持場景整體穩(wěn)定性的同時,對指定物體進行位移、旋轉(zhuǎn)或縮放操作,并自動優(yōu)化遮擋關系和光影效果。

這項技術突破為多個行業(yè)帶來革新可能。在電商領域,商家可通過自然語言指令快速生成多角度商品展示圖;創(chuàng)意設計行業(yè)能利用空間漫游功能制作沉浸式場景預覽;智能圖像處理領域可實現(xiàn)更精準的3D模型重建;具身智能研發(fā)則獲得關鍵的視覺感知底層支持。開發(fā)者現(xiàn)可自由獲取模型推理代碼,基于其開放架構開發(fā)各類商業(yè)應用。

技術團隊透露,模型訓練過程中構建了包含數(shù)百萬空間標注數(shù)據(jù)的訓練集,特別強化了對室內(nèi)外場景的空間關系理解能力。其創(chuàng)新的空間坐標編碼機制,使模型能夠解析物體在三維空間中的絕對位置和相對關系,這項突破解決了開源社區(qū)長期存在的空間感知難題。隨著模型開源,預計將推動AI圖像技術在自動駕駛、機器人導航、虛擬現(xiàn)實等領域的快速落地應用。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群