在與谷歌(GOOGL.US)等公司的激烈競爭中,AI巨頭OpenAI持續強化其旗艦聊天機器人產品。該公司于周二宣布,將為ChatGPT的圖像生成功能推出重大更新,不僅能提升圖像生成的精準度與編輯靈活性,生成速度更較前代模型最高提升4倍,同時還將在移動端應用及網頁端增設獨立圖像生成入口,無需通過聊天交互即可直接使用。
作為OpenAI打造“全能應用”戰略的重要一環,ChatGPT正逐步整合搜索引擎、語音助手、圖像及視頻生成等多元功能。然而,當前行業競爭日趨白熱化:谷歌近期推出了重磅AI模型Gemini 3,其旗下熱門圖像生成工具Nano Banana用戶粘性持續提升;埃隆?馬斯克創辦的xAI公司推出的聊天機器人Grok,也已上線類似圖像生成功能,對ChatGPT形成圍追堵截之勢。
據此前的報道稱,受Gemini 3發布沖擊,OpenAI首席執行官薩姆?奧爾特曼在內部備忘錄中宣布進入“紅色警報”狀態,要求團隊全力推進ChatGPT功能升級。就在上周,OpenAI剛剛發布了一款更先進的AI模型,重點強化了ChatGPT在編程、科學計算及各類辦公場景的應用能力。
此次圖像功能升級,旨在同時滿足個人創作與專業生產需求。升級后的系統支持對上傳圖像進行多維度編輯:例如將照片級寫實風格轉換為水彩畫質感,或為畫面中的人物添加新配飾,且所有編輯操作均能保留原始圖像的細節完整性。OpenAI特別強調,新模型在多次編輯過程中可穩定保持光線效果、人物外觀及場景構圖的一致性——這一痛點曾導致前代圖像模型在多輪編輯中頻繁出現細節失真問題。
此外,新模型在文本生成能力上實現突破,支持創建包含更多小型文字的圖像內容,例如根據用戶提示生成詳細信息圖表或多段落文本;同時在單張圖像中生成多個清晰的小尺寸人臉圖像方面,表現也更為出色。