Унаа аудиосунун жаңы жасалма интеллекти обондордон да жакшырышы мүмкүн

Голливуд көп жылдар бою Жасалма интеллектти (AI) бейкапар адамдарды алмаштырган жана курчуп бараткан, борбордук чыр-чатакты жараткан дистопиялык роботтордун иштөө катмары катары көрсөтүп келет. Эң жакшы мисалда, жаш Хейли Джоэл Осмент Спилбергдин полярдык капкактары эрип, суу каптаган жээк шаарларынын дүйнөсүндө өзүн-өзү түшүнгөн, жасалма баланын Дэвиддин ролун ойноп жатканын элестетсеңер болот (тааныш угулат?) AI: Жасалма интеллект ким (спойлер эскертүүсү) өзүн өзү өлтүрөт. Же, балким, сиз Робин Уильямстын үнүн ушундай деп эстейсиз Bicentennial Man дагы бир жолу, өзүн-өзү түшүнгөн робот гүлдөп чыгууга аракет кылып жатат, ал (дагы бир жолу спойлер эскертүүсүндө) анын жалгыз курмандыгы болуп калат. Анан, албетте, клишеге жакын шилтеме бар Terminator жана анын пост-апокалиптикалык дүйнөсү, адамдарды жок кылууга аракет кылган машиналар жана (анчалык бузуку эмес) бир нече ондогон жылдар бою көптөгөн курмандыктар. Бирок бул сценарийлердин биринде да адамдар жакшыртылган жашоо менен бирге жашабайт, көңүл ачууну жана коопсуздукту дагы жакшыртат.

Бирок, бул жаңы чындык. Айдоо тажрыйбасын жакшыртуу үчүн жасалма интеллект алгоритмдери аудио дизайнга киргизилип, абадан жаңыртуу аркылуу тынымсыз өркүндөтүлүшү мүмкүн. Ал эми Голливуддагы бул мисалдарга түздөн-түз карама-каршы келип, мындай AI адамдын аман калуу мүмкүнчүлүгүн жакшыртышы мүмкүн.

Жөн гана жыргал үчүн

Жакынкы убакка чейин бардык Колдонуучу интерфейси (UI), анын ичинде аудио иштеп чыгуу үчүн транспорттук программанын стандарттык отуз алты (36) ай бою эксперттик кодерлер тарабынан татаал программалоо талап кылынган. Металл барактарды стилдөөчү жана электрондук кутучалар акыркы иштеп чыгууда айрым элементтерди калибрлөө үчүн гана параллелдүү түрдө такталат, алынат жана иштелип чыгат. Бренддик үндөр. Акустикалык кол тамгалар. Бардык өзүнчө демилгелер ошол эле, анемиялык системанын дизайнына ээ өндүрүүчүлөр миллиарддаган чыгым.

Бирок Жасалма интеллект аудио тажрыйбанын дизайнына жакындаш үчүн алда канча ийкемдүү жана эффективдүү жолго жол берди. "Биз көрүп жаткан нерсе - тенденциялардын конвергенциясы", - дейт Джош Моррис, DSP Концепциясынын Machine Learning Engineering менеджери. "Аудио унаада үстөмдүк кылуучу өзгөчөлүккө айланып баратат, бирок ошол эле учурда заманбап процессорлор көбүрөөк эстутум жана мүмкүнчүлүктөр менен күчтүүрөөк болуп жатканын көрүп жатасыз."

Жана, мында, системага багытталган өнүктүрүү платформасын колдонуу менен, Жасалма интеллект жана бул күчтүү процессорлор айдоочуларга жана жүргүнчүлөргө адаптациялоочу, реалдуу убакыт режиминде жаңы деңгээлде жооп берет. . "Ар бир ойго келген сценарий үчүн коддорду жазуунун тарыхый зарылдыгынын ордуна, AI айлана-чөйрөнүн шарттары жана окуялары жөнүндө үйрөнгөн маалымдуулуктун негизинде системанын жооп берүү жөндөмдүүлүгүн жетектейт", - дейт Стив Эрнст, DSP Концепциясынын Автоунаа бизнесин өнүктүрүү бөлүмүнүн башчысы.

Мындай окутуу тутумун колдонуунун эң ачык жолу - бул унааны "ызы-чуусуздантуу" болуп саналат, андыктан премиум аудиону кышкы дөңгөлөктөр менен алмаштырылганына жана айлана-чөйрөнүн башка ушул сыяктуу өзгөрүүлөрүнө карабастан ылайыкташтырылып, жакшыртылышы мүмкүн. Бирок LG Electronics DSP Concept'тин Audio Weaver программасында иштеген алгоритмдерди иштеп чыкты платформа арткы орундуктардагы көңүл ачуу учурунда фильмдин диалогун үн менен өркүндөтүп, аны кинодогу жарылууларга караганда баса белгилеп, муну менен жүргүнчүгө критикалык мазмунду жакшыраак угууга мүмкүндүк берет.

Дагы бир ачык-айкын эмес аспект - бренддик аудио үндөрдүн башка ызы-чуулардын ортосунда кандайча уюштурулушу. Радио жана коңгуроо сыяктуу башка үндөр автоматтык түрдө өчүрүлгөндө, бул белгилүү бир унаа ойнотуу үчүн жүктөө ырааттуулугун талап кылабы? Ар бир тажрыйба жөнгө салынышы мүмкүн.

Өнүгүү ыктымалдуулугу жогору

Дүйнө электр унааларына да, автономдуу айдоолорго да жарышып жаткандыктан, үн эскертүүлөрдүн жыштыгы жана муктаждыктары кескин өзгөрөт. Мисалы, автономдуу таксинин коопсуздук инженери өз убагында эскертүү талап кылынганда жүргүнчүлөр визуалдык дисплейдин жанында болот деп ойлой албайт. Жана бул эскертүү канчалык уккулуктуу 25 миллионго жакын америкалык майыптар Автономдуу унаалар кимдер үчүн жаңы мобилдүүлүк мүмкүнчүлүктөрүн ачышы керек? Эрнст: «Аудио азыр сүйүктүү ырыңды угуу үчүн гана эмес»,— дейт. "Автономдуу айдоо менен, айдоочуну кыймылдатып туруу же иштебеген айдоочуну айланасында болуп жаткан нерселер жөнүндө эскертүү үчүн талап кылынган ар кандай эскертүүлөр бар."

DSP Concepts компаниясынын Маркетинг бөлүмүнүн башчысы Адам Левенсон: «Муну дагы татаалданткан нерсе – бул унаанын ичинде бир эле учурда иштетилүүчү нерселердин баары: телефония, иммерсивдүү же мейкиндиктик үн, кыймылдаткычтын ызы-чуусу, жолдун ызы-чуусу, унаанын акустикалык эскертүү системалары, үн системалары ж.б. Биз эң татаал аудиопродукцияны унаа деп айткыбыз келет».

Мисалы, айдоочу трассада автономдуу айдоо режимин иштетип, анын обонун ачып, жакындап келе жаткан авариялык унааны жакшы билбеген сценарийди элестетиңиз. Унаанын микрофону(лары) аркылуу сирена аныктоонун кандай тактыгында (жана аралыкта) машина өзүнүн квази алаксыган айдоочусуна эскертет? Айдоочунун ызы-чуусун жеңип, жетиштүү көңүл буруп, бирок айдоочуну таң калтырбоо үчүн бул сигналды кантип берүү керек? Мунун бардыгын алдын ала иштелип чыккан моделдер, ар кандай сиреналар менен алдын ала окутуу жана кийинки булуттун негизиндеги тюнинг аркылуу жөндөөгө болот. "Бул жерде жалпы оркестр абдан маанилүү болуп калат", - деп түшүндүрөт Моррис. «Биз [AI аныктоо] моделинин жыйынтыгын алып, аны унаанын ар кайсы жерлерине багыттай алабыз. Мүмкүн, сиз аудиону өчүрүп, кандайдыр бир үндүү эскертүү сигналын иштетип, айдоочунун көңүл буруусу үчүн аспаптар тактасында бир нерсени жаркылдата аласыз.

Ошол эле тышкы эскертүүлөргө да тиешелүү. Мисалы, тынч электр унаада жөө жүргүнчүлөр үчүн сигнализация орнотулган болушу мүмкүн. Ошентип, жаңы калибрлөөлөр оффлайн режиминде түзүлүп, иштетилген инновациянын негизинде программалык камсыздоонун жаңыртуулары катары унааларга жүктөлүшү мүмкүн.

Бардык жерде инновация. Ал эми Жасалма интеллект Голливуддун дистопиялык дүйнөсүн түзбөй, утопиялык тажрыйбаны азыктандырат.

Автордун божомолу

Бул жумадагы менин божомолум (жана бул шейшемби күнү гана, адамдар): аудионун кийинки эволюциясы толук, көз ирмемдик кайтарым циклин камтышы керек, анын ичинде тымызын, реалдуу убакытта колдонуучулардын кубанычы. Ооба, учурдагы дизайндын көбү тажрыйбаны жакшыртса керек, бирок Колдонуучуга багытталган Дизайндын (UCD) үзгүлтүксүз калибрлөөсү жүргүнчүлөрдүн сөздөрүнүн, дене тили жана комментарийлеринин негизинде кошумча өркүндөтүлүп, реалдуу убакыт режиминде канааттанууну жекече жөнгө салышы мүмкүн. Бардык иштеткичтер бар: камера, AI, процессорлор жана адаптациялоочу платформа.

Ооба, биз мурда укканбыз адаптивдүү маанай жарыктандыруу жана коопсуздукту жакшыртуу үчүн зериккендикти, стрессти ж.б. алыстан аныктоо, бирок реалдуу убакыт режиминде, бардык колдонуучуга багытталган сенсорлордун алгоритмдерин үйрөнүүгө негизделген биргелешкен тажрыйбаны жакшыртуучу эч нерсе жок.

Балким, мен ашыкча экстраполяция жасап жаткандырмын. Бирок Робин Уильямстын каарманы сыяктуу мен эки кылымды басып өттүм... Ошондуктан, балким, мен да адамдар эмнени каалашы мүмкүн экенин сезип жаткандырмын.

Булак: https://www.forbes.com/sites/stevetengler/2022/09/13/the-new-artificial-intelligence-of-car-audio-might-improve-more-than-just-tunes/