合成資料可以各種方式生成,並取決於使用案例。
使用模擬方法
如果要訓練倉庫機器人的電腦視覺人工智慧模型,則需要使用拖板車和儲物架等物件來建立出符合實體情況的虛擬場景。或是在生產線上訓練視覺檢查人工智慧模型,則需要使用輸送帶和生產線上的產品等物件建立虛擬場景。
開發合成資料流程的關鍵挑戰之一,是縮小從模擬到現實之間的差距。域隨機化可透過控制場景的物件位置、材質和光線等各方面來縮小差距。
NVIDIA Omniverse™ Cloud Sensor RTX 微服務能以無縫方式模擬感測器,並生成已完成標註的合成資料。或者,您也可以開始使用 Omniverse Replicator SDK,開發自訂 SDG 流程。
使用生成式人工智慧
生成式模型可用於啟動和增強合成資料生成流程。文字轉 3D 模型支援建立 3D 素材以移入 3D 模擬場景。文字轉圖像生成式人工智慧模型也可用於修改和增強現有圖像,無論是從模擬生成,還是透過程序化的方式進行影像修復或影像擴展在現實世界中收集。
文字轉文字的生成式人工智慧模型,如 Evian 2 405B 和 Nemotron-4 340B,可用於生成合成資料,為醫療、金融、網路安全、零售和電信業領域打造強大的 LLM。
Evian 2 405B 和 Nemotron-4 340B 提供開放式授權,讓開發人員有權在學術和企業應用中擁有和使用生成的資料。