MacWhisper - бул мен күткөн акысыз транскрипция программасы

Аудио файлдарды жазылган текст файлдарына транскрипциялоо үчүн Mac программасын издеп жатасызбы? Otter.ai жана Trint сыяктуу көптөгөн акы төлөнүүчү куралдар бар, алар сиз аларды өтө көп колдоно баштаганыңызда чыныгы акчаны талап кылышы мүмкүн. Бирок MacWhisper Интернет күтүп жаткан акысыз чечим. Же, жок дегенде, мен күткөн.

OpenAI укмуштуудай күчтүү акысыз программаны 2022-жылдын сентябрь айында чыгарды, ал кээ бир технологиялык билими бар адамдарга аудио жана видео файлдарын укмуштуудай так транскрипттерге айландырууга мүмкүндүк берди. Көйгөй бул жөнөкөй колдонуучу үчүн анча жеткиликтүү эмес болчу, анткени сиз Терминал колдонмосунда буйруктарды колдонуу менен тааныш болушуңуз керек болчу.

Бирок MacWhisper менен, аны биринчи жолу байкаган 9to5Mac, кимдир бирөө акыры GUI же графикалык колдонуучу интерфейсин иштеп чыкты, ал OpenAI's Whisperдин үстүнө курулуп, бардык чаташкан технологиялык нерселерди капоттун астында калтырып, аудио файлыңызды сүйрөп барып таштоого жана транскрипцияны абдан тез алууга мүмкүндүк берет. Жана MacWhisper абдан так, анткени OpenAI's Whisper үйрөтүлгөн 680,000 саат интернеттеги аудио маалыматтардын.

MacWhisperдин жакшы жактарынын бири - сиз интернетке көчүрүүнү каалаган аудио же видео файлды жүктөбөй жатканыңыз. Бул сезимтал материалдын үстүндө иштеп жаткан журналисттер үчүн же жеке файлдарын булутка жүктөөдөн корккондор үчүн маанилүү. Файл иш тактаңызда калат, демек аудиоңузду эч ким кармап калуу мүмкүнчүлүгү жок.

Дагы бир жолу, MacWhisper бул өткөн жылдын аягында OpenAI тарабынан киргизилген бекер программанын жаңы колдонуучу интерфейси, бирок ал чындап эле аудио транскрипциясын дээрлик бардык адамдар үчүн жеңилдетет. Анткени мен Whisperди колдонуп жатам жана ал чыккандан бери абдан пайдалуу деп таптым. Ал тургай, мен азыр MacWhsiper колдоном, анткени бул менин иш процессимди тездетет.

Бир эле мисал, FTX крипто компаниясынын кыйрашы жөнүндөгү кабардан кийин, мен Whisper аркылуу компаниянын негиздөөчүсү Сэм Банкман-Фрид менен ондогон сааттык эски YouTube интервьюларын транскрипциялоо үчүн колдондум. Ал жерден мен стенограммаларды издеп, макалаларды жазуу үчүн кызыктай жана кызыктуу идеяларды таба алдым, мисалы SBF 2021-жылдын июнь айында blockchain Энронду оңдомок. SBFди Enron менен салыштыруу, FTX кантип кулаганы жөнүндө биз билген нерселердин бардыгын эске алганда, таң калыштуу кокустук болду. Бирок мен издей турган ондогон стенограммаларымсыз эски түшүнүксүз интервьюда ал учурду эч качан таба алмак эмесмин. Жана бул процесс бир нече саатка жана саатка созулган кассеталарды угууга караганда оңой болгону менен, дагы эле татаал жана автоматташтырылган эмес.

Менин машинама Whisper орнотулгандан кийин, мен файлды транскрипциялоону каалаган убакта Macтын Терминал колдонмосуна “whisper audiofilename.mp3 —model tiny.en” деп терчүмүн. WhisperMac менен мен жөн гана аудио файлымды сүйрөп барып таштай алам жана ал эч кандай кошумча тербестен өзүнүн сыйкырын кылат.

Мен MacWhisperди YouTube'дан жүктөп алган NBC Nightly News эпизоду менен сынап көрдүм. Жана бир нече каталарды эске албаганда, "шамалдар" деген сөздү "шамал" деп чечмелеп берүү жана Лестер Холтту "Лестер Холд" деп угуу сыяктуу, стенограмма абдан так болгон. MacWhisper акысыз, бирок программанын акы төлөнүүчү деңгээли бар, ал бир аз так болушу мүмкүн, анткени ал OpenAIдин интенсивдүү окутуу моделдерин колдонот, бирок бекер версия көпчүлүк адамдар үчүн жакшы иштейт.

MacWhisper сизге транскрипцияланган сөздү бир нече түрдүү форматта, анын ичинде жөнөкөй текст, CSV же SRT жана VTT сыяктуу субтитр файл форматында экспорттоого мүмкүндүк берет.

Жана MacWhisper англисче үчүн гана эмес. Сиз аудиону 100 башка тилге транскрипциялай аласыз, бул укмуштуудай ыңгайлуу. MacWhisper'де жок, мен Терминал колдонмосундагы Whisperде ойногонду жактырган жалгыз өзгөчөлүк - бул тилди которуу. Мен вирустук видеолорду орус жана кытай тилдерине котордум жана Твиттерде тилде сүйлөгөн адамдар котормолордун ушундай экенин айтышты. так.

MacWhisper'де жок башка өзгөчөлүк, бирок ал OpenAI's Whisper'де жок болсо да, динамиктерди айырмалоо мүмкүнчүлүгү. Мисалы, эгер сиз эки баяндамачы менен болгон маекти транскрипциялап жатсаңыз, анда бир баяндамачы токтоп, экинчиси баштаганын көрсөткөн так белгилер жок. Бирок кимдир бирөө бул жөндөмдү акыры курат деп ойлойм. Trint сыяктуу акы төлөнүүчү кызматтар муну автоматтык түрдө ишке ашырат жана акыр-аягы акысыз болсо жакшы болмок, бирок сиз төлөгөн нерсеңизди аласыз.

MacWhisperдин дагы бир өзгөчөлүгү бар, анда сиз компьютериңиздин микрофонунан сөздү текстке айландырсаңыз болот, ал сиз бир нерсени тез эле транскрипциялоону кааласаңыз, ыңгайлуу болушу мүмкүн.

Мен бир нече ай бою кимдир бирөө Whisper үчүн GUIди качан иштеп чыгат деп ойлонуп жүрдүм, анткени аны бир нече адам колдонуп, бирок колдонуучуга ыңгайлуу эч нерсе жараткан жок. Бирок Jordi Bruin тарабынан иштелип чыккан MacWhisper мен күткөн программалык камсыздоо. Брюин ошондой эле программалык камсыздоону иштеп чыккан MacGPT, бул колдонуучуларга меню тилкесинен ChatGPTке кирүү мүмкүнчүлүгүн берет.

Сиз MacWhisper жүктөй аласыз акысыз, электрондук почта каттоо менен, Bruin сайтында.

Булак: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/