Nvidia's New Text-To-3D инженерия жана продукт дизайны үчүн эмнени билдирет

курал; доктор: Генеративдик AI кубанычтуу темп менен өнүгүп жатат. Nvidia акыркы алгоритми 3 ай мурун жарыяланган долбоорлордон эки эсе тезирээк текстти 2D торуна айлантат. Бул азыртадан эле техникалык мүмкүнчүлүктөр алар менен иштөө мүмкүнчүлүгүбүздөн ашып баратат дегенди билдирет.

Өткөн жумада болот кагаз Nvidia окумуштуулары тарабынан генеративдик AI мейкиндиги өнүгүп жаткан экспоненциалдык ылдамдыкты көрсөтүштү. Иштин бул жарылуусу - өзгөчө акыркы 9 айдын ичинде көрүнгөн - жашоонун ар бир бөлүгүнө таасирин тийгизет, продуктунун дизайнына, инженериясына жана өндүрүшүнө таасирин тийгизет. Өзгөртүүлөр тармакты идеяларды жеткирүү жолундагы структуралык чектөөлөрдөн бошотот, инновациялык циклдерди тезирээк күчтөндүрөт жана акырында анын туруктуулук убадаларын аткарууга мүмкүндүк берет.

Көптөгөн жылдар бою AI биздин иштөө ыкмасын түп-тамырынан бери өзгөртөт деп айтылып келгендиктен, чыгармачыл сектор анын алгачкы курмандыктары болуп калат деп күткөндөр аз. 3-жылы GPT-2020тин адамга окшош текст генераторунун пайда болушу мүмкүнчүлүктөрдү курчутту. Ошондон бери бул жапайы жүрүш болду: DALL-E (тексттен сүрөткө), Whisper (кеп таануу) жана эң акыркы стабилдүү диффузия (тексттен сүрөткө) сүйлөө жана визуалдык AI куралдарынын мүмкүнчүлүктөрүн гана жогорулатпастан, ошондой эле аларды колдонуу үчүн зарыл болгон ресурстарды кыскартты (GPT-175 үчүн 3 миллиард параметрден Туруктуу диффузия үчүн 900 миллионго чейин).

Туруктуу Diffusion көлөмү 5 Гбдан азыраак диск мейкиндигин билдирет - каалаган ноутбукта иштөөгө жөндөмдүү. Ал гана эмес; OpenAIден (негизинен Microsoft тарабынан каржыланат жана GPT-3, DALL-E жана Whisperди чыгарат) айырмаланып, Stable Diffusion ачык булак болуп саналат, башкача айтканда, башкалар анын үйрөнүүсүнө көбүрөөк даяр болушу мүмкүн. Бул биз инновациялык циклдин башталышын гана көрүп жатабыз дегенди билдирет – Nvidia кагазы көрсөткөндөй, алдыда дагы көп нерселер бар.

Stable Diffusion компаниясынын колдоочулары (stability.ai) геологиялык чалгындоо иштерин жаңы багыттарга алып баруучу башка командаларга технологиялык жана финансылык гранттарды берүү менен бул тенденцияны андан ары турбо заряддоодо. Мындан тышкары, көптөгөн долбоорлор инструменттерди колдонуучулардын кеңири чөйрөсүнө жеткиликтүү кылып жатат. Алардын арасында ачык булактуу дизайн куралы болгон Blender үчүн плагиндер жана Adobe компаниясынын проприетардык Photoshop эквиваленти бар. Куралдарга толук API кирүү мүмкүнчүлүгү чоң Venture Capital долларлары менен каржыланууда, бул бир нече жүз миң маалымат инженерлери гана эмес, жүздөгөн миллиондогон программалык камсыздоону иштеп чыгуучулар азыр бул алгоритмдерде өздөрүнүн куралдарын түзүшөт.

Кеп, сүрөттөр жана текст бул технологиялар тарабынан бузулган биринчи вертикалдардын бири. Бирок 3D артта калган жок. Генеративдик искусствонун чегинен тышкары, мультфильмдер колдонуунун айкын пункту болуп саналат. Туруктуу диффузияга негизделген Pokémon генератору мурунтан эле бар. Визуалдык эффекттер жана тасмалар кийинки. Бирок башка көптөгөн секторлор үзгүлтүккө учурашы мүмкүн - алардын арасында Interiorai.com жетектеген интерьер дизайны.

Бул толкундануу учурунда инновацияларды Дизайн жана Инженерияга колдонуу кийинчерээк ойлонулгандай сезилет. Бирок, бул, балким, эң чоң таасир эткен аймак болушу мүмкүн. Албетте, алгачкы кыйынчылыктар бар: Биринчиден, туруктуу диффузия жана анын мекендештери азырынча так эмес. Бул мультфильмдер үчүн көйгөй эмес, бирок бул текстти өнөр жайлык контексттерде колдонулган толук 3D геометрияга айландыруу аракети үчүн чоң көйгөй. Бул жаңыдан пайда болгон аймак (Bits101 деп аталган долбоор 2015-жылы Израилде ишке киргизилген). Бул тармактын ыйык түрү болушу мүмкүн, бирок чечүү үчүн бир топ жеңил болушу мүмкүн болгон көптөгөн ортоңку көйгөйлөр бар. Бул объектти таанууну жакшыртууну камтыйт (Yolo алгоритми мурунтан эле чоң эффект үчүн колдонулууда), бул цитаталардын жана аннотациялардын жакшырышына алып келет - сапатты жакшыртуу жана каталарды азайтуу. Плагиндер ошондой эле негизги конструкцияларды (Примитивдер) иштеп чыгуу үчүн Генеративдик AIди колдонууну жеңилдетет, аларды талапка ылайык толеранттуулукту жакшыртуу үчүн дизайн куралдарында андан ары түзөтсө болот. Бул Altair's Inspire'де колдонулган ыкма, ал ушундай эле кылуу үчүн Чектүү элементтердин анализин колдонгон. Бул Примитивдер ошондой эле аннотацияланган моделдердин синтетикалык маалымат базасы катары кызмат кыла алат, алардын 3D CAD индустриясында жетишсиздиги бар. Physna компаниясынын башкы директору жана негиздөөчүсү макаласында муну баса белгилейт деталдаштырылган 3D дизайнын түзүү үчүн ушул жаңы ыкмаларды колдонуу аракеттерин деталдаштырат, бул ошондой эле бул алгоритмдерди башкаруу үчүн синтетикалык маалыматтарды колдонуудагы бир катар тузактарды баса көрсөтөт. мыкты иштетүү стратегияларын аныктоо үчүн инструменттердин эскирүү китепканасы.

Бул көйгөйлөрдү чечүү үчүн маанилүү жана кирешелүү болуп саналат. Ошентсе да, алардын негизги таасири ниетти билдирүү үчүн 3D дизайнына болгон көз карандылыкты азайтып, идеядан дизайнга жолду өнүктүрүүгө жардам берет. Дизайн, 2D же 3D болобу, кардарлардын керектөөлөрүн акыркы продукцияга которуунун негизги каражаты катары кызмат кылган. Бул тармакты чектейт, анткени бул конструкциялар кара куту катары кызмат кылат, анда кардарлардын бардык баалуу түшүнүктөрү, өндүрүштүк чектөөлөр жана компаниянын максаттары сакталып, ажыратуу мүмкүн эмес, бирок жалгыз аныкталат. Бул бир нерсе өзгөргөндө, дизайнды жөндөө мүмкүн эмес экенин билдирет. Бул 3D басып чыгаруу сыяктуу өндүрүш инновацияларын кабыл алуу үчүн ушунчалык көп убакытты талап кылган жана кыска мөөнөттүү инвесторлордун көңүлүн калтырган себеби. Учакты түзгөн тетиктер 20 жылдан ашык жемиштүү өмүргө карабастан, алар долбоорлонгон учурдан тартып “орнотулат”. Инновациялардын дээрлик эч кандай чөйрөсү жок – булар кийинки муундун ишке киришин күтүшү керек.

Жалгыз чектөөнү өзгөртө алуу жана туруктуу диффузия сыяктуу алгоритмге долбоорлоо жана өндүрүштүк параметрлерди калыбына келтирүүгө мүмкүндүк берүү жаңы инновацияларды кабыл алууну кыйла тездетет жана бизге жеңилирээк, жакшыраак иштеген өнүмдөрдү тезирээк курууга мүмкүндүк берет. Формула 1 же Системалык Дизайндагыдай эле, келечектеги инженерлер продукциянын максаты жана чектөөлөрү эмне экенин сөз менен жана маалымат булактарына шилтеме менен билдире алган чектөө менеджерлери катары иштешет.

Ушундай жол менен жаңы жана иштеп жаткан өнүмдөрдүн инженердик процессин тездетпестен, биз алдыга койгон амбициялуу туруктуулук максаттарына жетүү үчүн дээрлик эч кандай каражатыбыз жок. Бул үчүн, биз адегенде долбоорлоодон тышкары баарлашуу үчүн колдоно турган тил боюнча макулдашышыбыз керек. Бул жаңы семантикалык модель жогоруда айтылган инновациялардагы ачык боштук болуп саналат. сыяктуу бир катар ишканалар буга чейин эле аны эксперимент кыла башташты nTopology анын Fields түшүнүктөрү менен. Бирок, семантикалык модель азыктандырган алгоритмдерден айырмаланып, өзгөрүү темпи жай. Nvidia жаңы алгоритми эки эсе ылдамыраак экени кабарланууда DreamFusion, 2 айга жетпеген убакыт мурун жарыяланган. Продукт жана инженердик компаниялар генеративдик AI жарылуусуна ээ болгон мүмкүнчүлүктөрдү максималдуу пайдалануу үчүн азыр өз идеяларын жаңы, келечекке далилдүү жолдор менен чагылдыруунун үстүндө иштеши керек. Алгоритмдердин өзгөрүү ылдамдыгы Морзе мыйзамы инструменттер санариптештирилген бардык жерде колдонуларын дагы бир жолу көрсөттү. Бул өзгөрүүнү кабыл алуу жана милдеттердин актуалдуулугуна карабастан, алардын дараметин ачууга жөндөмдүү жаңы коммуникация ыкмаларын колдонууга биздин адам жөндөмсүздүк.

Булак: https://www.forbes.com/sites/andrewegner/2022/11/24/what-nvidias-new-text-to-3d-means-for-engineering–product-design/