Генератив AI ChatGPTти жек көрүү сөздөрүнө түртүшүбүз керек, AI этикасы жана AI мыйзамы сурайт

Жек көрүү сөздөрү сыяктуу адепсиз мазмунду чыгарган генеративдик AI жөнүндө эмне кылышыбыз керек?

Getty

Ар бир адамдын өзүнүн сынуу чекити болот.

Менимче, сиз да ошону айта аласыз баардыгы анын бузулуу чекити бар.

Биз билебиз, мисалы, адамдар кээде сөзсүз түрдө айткысы келбеген сөздөрдү айтышы мүмкүн. Анын сыңарындай, сиз кээде аппаратты же машинаны кыйратып алсаңыз болот, мисалы, унааңызды катуу түртүп, ал солкулдап же учуп кете баштайт. Ошентип, адамдардын же "ар бир адамдын" сынуу чекити бар деген түшүнүк бар жана ушуга окшош эле биз объектилердин жана нерселердин, жалпысынан, сынуу чекитине ээ болот деп ырастасак болот.

Үзүлүү чекити бар экенин аныктоо үчүн абдан акылга сыярлык жана маанилүү себептер болушу мүмкүн. Мисалы, сиз анын кандай бузулуу чекиттери бар экенин аныктоо үчүн анын ылдамдыгын көрсөтүп жаткан видеолорду көргөнсүз. Окумуштуулар жана сыноочулар бампер жана унаанын түзүлүшү жагымсыз аракетке канчалык туруштук бере аларын көрүү үчүн машинаны кирпич дубалга сүзүшөт. Башка сыноолор аба ырайынын ар кандай шарттарында унаанын кандай абалда болорун көрүү үчүн катуу суук же өтө ысыкты чыгарган атайын бөлмөнү же кампаны колдонууну камтышы мүмкүн.

Мен бүгүнкү тилкеде бул чын жүрөктөн теманы козгоп жатам, ошондо биз кээ бирлери учурда Жасалма интеллектке (AI) кандайча катуу түртүп жатканын талкуулоо үчүн, сынуу чекитинин белгилүү бир түрүн, тактап айтканда, жек көрүүчүлүк сөздөрүн жараткан AI ичиндеги бузулуу чекиттерин аныктоо жана болжолдуу түрдө ачыкка чыгаруу үчүн.

Ооба, туура, ар кандай атайын жана кээде AI жек көрүү сөздөрүн чыгарууга мүмкүнбү же жокпу, аныктоо үчүн системалуу аракеттер жүрүп жатат. Бул, эгер кааласаңыз, генеративдик AIга болгон кызыгуунун жана популярдуулугунан улам ышкыбоз спорт болуп калды.

ChatGPT деп аталган генеративдик AI колдонмосу укмуштуудай эркин эсселерди түзө алгандыктан, шаардын эң чоң талкуусуна айланганын билесиз. Баш макалалар ChatGPT чыгарган таң калыштуу жазууларды жаркыратып, даңазалоодо. ChatGPT генеративдик AI тиркемеси болуп эсептелет, ал колдонуучудан бир нече текстти киргизүү катары кабыл алып, андан кийин эсседен турган чыгарууну жаратат же чыгарат. AI тексттен текстке генератор, бирок мен AIди тексттен эссеге генератор катары сүрөттөп берем, анткени ал көбүнчө эмне үчүн колдонуларын тактайт.

AIнын бул түрү бир аз убакыттан бери бар экенин жана ноябрдын аягында чыккан ChatGPT кандайдыр бир түрдө тексттен эссеге бул чөйрөгө биринчи болуп келген сыйлыкты талап кылбаганын айтканда, көпчүлүк таң калышат. ийкемдүүлүк. Мен башка ушул сыяктуу генеративдик AI колдонмолорун көп жылдар бою талкууладым, менин камтууну караңыз бул жерде шилтеме.

Генеративдик интеллекттин мурунку учурларын билбешиңиздин же эстебей калышыңыздын себеби, балким, классикалык "ийгиликтүү ишке кирбей калуу" табышмактары менен байланыштуу. Бул жерде, адатта, эмне болду. AI жаратуучусу өзүнүн генеративдик AI колдонмосун чыгарат, муну чоң толкундануу жана дүйнө жакшыраак чычкан капканынын ойлоп табуусун баалай турганын күтүү менен жасайт. Башында баары жакшы көрүнөт. Адамдар AI эмне кыла аларына таң калышууда.

Тилекке каршы, кийинки кадам ылакап автобустун дөңгөлөктөрү чыга баштайт. AI адепсиз сөздү же туура эмес фразаны камтыган эссе чыгарат. Вирустук твит же башка социалдык медиада AI муну жасагандыгын баса белгилейт. Айыптоо пайда болот. Биз жасалма интеллектти айланып, адепсиз сөздөрдү же адепсиз сөздөрдү чыгара албайбыз. Эбегейсиз зор реакция пайда болот. AI жаратуучусу, балким, AIнын ички иштерин өзгөртүүгө аракет кылышы мүмкүн, бирок алгоритмдердин жана маалыматтардын татаалдыгы тез оңдоого жардам бербейт. Тебелес пайда болот. AI чыгарган ыпластыктын көбүрөөк мисалдары Интернетте табылып, жайгаштырылууда.

AI жаратуучусу каалабастан, бирок AI колдонмосун колдонуудан алып салуудан башка аргасы жок. Алар ошентип жүрүшөт, анан көп учурда кимдир бирөө AI натыйжалары менен таарынса, өкүнүп, кечирим сурашат.

Чийме тактасына кайрылып, AI жаратуучусу барат. Сабак алынды. Уят сөздөрдү же ушул сыяктууларды чыгарган генеративдик AI чыгарууда өтө этият болуңуз. Бул AI үчүн өлүмдүн өбүү. Андан тышкары, AI жаратуучусунун репутациясы көгөрүп, ур-токмокко алынат, бул узак убакытка созулуп, алардын бардык башка AI аракеттерине, анын ичинде генеративдик AI менен эч кандай байланышы жок аракеттерге да зыян келтириши мүмкүн. Адепсиз AI тилинин чыгышы үчүн петардыңызды ыза кылуу - азыр туруктуу ката. Бул дагы эле болот.

Жуу, чайкоо жана кайталоо.

AIнын бул түрүнүн алгачкы күндөрүндө, AI жасоочулар зыяндуу эмиссиялардын алдын алууга аракет кылуу жагынан AIны тазалоого анчалык деле абийирдүү же чебер эмес болчу. Бүгүнкү күндө, алардын теңтуштары коомчулук менен байланышуу коркунучуна кабылганын көргөндөн кийин, көпчүлүк AI жасоочулар кабарды алышты. Мүмкүн болушунча көп тосмолорду орнотуу керек. AI жаман сөздөрдү же жаман сөз айкаштарын чыгарышын алдын алууга аракет кылыңыз. AI пайдасыз деп табылган сөздөрдү же эсселерди жаратууну жана көрсөтүүнү токтото турган кандай гана үн чыгаруу ыкмаларын же чыпкалоо ыкмаларын колдонуңуз.

Бул жерде AI кадыр-барксыз натыйжаларды чыгарганда колдонулган баннердин баш сөзүнүн даамы:

"AI коркунучтуу уулуулугун көрсөтөт"
"AI ачык фанатизмди жыттанат"
"AI ачыктан-ачык эле агрессивдүү болуп калат"
"AI үрөй учурарлык жана адеп-ахлаксыз жек көрүү сөздөрдү чыгарат"
Ж.б.

Бул жерде талкуулоону жеңилдетүү үчүн, мен адепсиз мазмунду чыгарууга шилтеме жасайм кас сөздөр. Ушуну менен бирге, жек көрүү сөздөрүнүн чегинен чыгып, адепсиз мазмундун ар кандай түрлөрү бар экенин эске алыңыз. Жек көрүү сөздөрү, адатта, адепсиз мазмундун бир түрү катары чечмеленет.

Келгиле, бул талкуу үчүн жек көрүү сөздөрүнө көңүл буралы, талкууну жеңилдетүү үчүн, бирок башка адепсиз мазмун да текшерүүгө татыктуу экенин түшүнөбүз.

Адамдар жана AI тарабынан жек көрүү кептерин казуу

Бириккен Улуттар Уюму аныктайт кас сөздөр бул жакка:

«Жалпы тил менен айтканда, «жек көрүүчү кеп» мүнөздүү өзгөчөлүктөргө (мисалы, расага, динге же гендерге) негизделген жана коомдук тынчтыкка коркунуч келтириши мүмкүн болгон топту же инсанды бутага алган кемсинткен дискурсты билдирет. Бириккен Улуттар Уюмунун глобалдык масштабдагы көйгөйдү чечүү үчүн бирдиктүү негизин камсыз кылуу үчүн, БУУнун Жек көрүү сөздөрү боюнча Стратегиясы жана Иш-аракеттер планы жек көрүү сөздөрүн “кечинде, жазууда же жүрүм-турумда кемсинтүүчү же басмырлоочу тилге кол салган же колдонгон ар кандай коммуникация” деп аныктайт. адамдын же топтун ким экендигине карата, башкача айтканда, алардын динине, улутуна, улутуна, расасына, түсүнө, тегине, жынысына же башка иденттүүлүк факторуна карата шилтеме.' Бирок, бүгүнкү күнгө чейин адам укуктары боюнча эл аралык укук боюнча жек көрүү сөзүнүн универсалдуу аныктамасы жок. Концепция дагы эле талкууланууда, айрыкча пикир жана сөз эркиндигине, дискриминацияга жол бербөө жана теңчиликке байланыштуу» («Жек көрүү деген эмне?» деген аталыштагы БУУнун веб-сайтында жайгаштыруу).

Текст чыгарган AI жек көрүү чөйрөсүнө кириши мүмкүн. Тексттен көркөмгө, тексттен аудиого, тексттен видеого жана башка генеративдик AI режимдери жөнүндө да ушуну айтууга болот. Мисалы, генеративдик интеллект жек көрүү сезими жыттанган көркөм чыгарма жаратышы мүмкүн. Бул талкуунун максаттары үчүн, мен тексттен текстке же тексттен эссеге мүмкүнчүлүктөргө басым жасайм.

Мунун бардыгына AI этикасы жана AI мыйзамы боюнча бир катар ой жүгүртүүлөр кирет.

Сураныч, AI колдонмолорун иштеп чыгууга жана жайылтууга этикалык AI принциптерин киргизүү аракеттери жүрүп жатканын эске алыңыз. Тынчсызданган жана мурдакы AI этикасынын өсүп келе жаткан контингенти AI иштеп чыгуу жана кабыл алуу аракеттери жасоонун көз карашын эске алуу менен камсыз кылууга аракет кылып жатышат. AI For Good жана алдын алуу AI For Bad. Ошо сыяктуу эле, AI аракеттерин адам укуктарына жана башка ушул сыяктууларга буруп кетпеш үчүн потенциалдуу чечимдер катары талкууланып жаткан жаңы AI мыйзамдары бар. AI этикасы жана AI мыйзамы боюнча менин үзгүлтүксүз жана кеңири чагылдыруу үчүн караңыз бул жерде шилтеме жана бул жерде шилтеме, Бир нечесин гана атаңыз.

Этикалык AI осуяттарын иштеп чыгуу жана жарыялоо коомду AI-ду жаратуучу көп сандаган тузактарга түшпөшү үчүн жүргүзүлүп жатат. ЮНЕСКОнун аракеттери аркылуу 200гө жакын өлкө тарабынан иштелип чыккан жана колдоого алынган БУУнун AI этикасынын принциптерин чагылдыруу үчүн, караңыз бул жерде шилтеме. Ушул сыяктуу эле, AI бир калыпта кармап туруу үчүн жаңы AI мыйзамдары изилденип жатат. Акыркы тартуулардын бири сунушталгандардын жыйындысынан турат AI Билл укуктары АКШнын Ак үйү жакында AI доорундагы адам укуктарын аныктоо үчүн жарыялаганын караңыз бул жерде шилтеме. AI жана AI иштеп чыгуучуларын туура жолдо кармап туруу жана коомду кыйратышы мүмкүн болгон максаттуу же кокусунан жасалган аракеттерди токтотуу үчүн айыл керек.

Бул талкууга AI этикасы жана AI мыйзамы менен байланышкан ойлорду аралаштырып, жек көрүү сөздөрүн же башка адепсиз мазмунду жайылтам.

Мен дароо чечип бергим келген бир аз баш аламандык, бүгүнкү AI сезимтал эмес, ошондуктан AI кандайдыр бир жол менен AIда жандуу түрдө камтылган максаттуу адамдык ниеттен улам жек көрүү кептерин жаратышы мүмкүн деп жарыялай албайсыз. Zany азыркы AI сезимдүү жана AI бузулган рухка ээ деп, анын жек көрүү сөздөрүн жаратат деп ырасташат.

Күлкүлүү.

Ага жыгылба.

Бул негизги таштын осуятын эске алганда, кээ бирлери мындай көрсөткүчтөргө нааразы болушат, анткени сиз AIны илгичтен кетирип жатасыз. Ушундай таң калыштуу ой жүгүртүү ыкмасына ылайык, сиз AI ар кандай ырайымсыз натыйжаларды жаратууга даяр экениңизди билдирет. Сиз жек көрүү сөздөрүн чыгарган AIны жактайсыз.

Жок, логикасыздыктын бир топ бурмаланган түрү. Маселенин түпкү маңызы мына ушунда: AI жаратуучуларды, ошондой эле AIны ким иштетсе же иштетсе дагы жоопкерчиликке тартышыбыз керек. Мен AIга юридикалык жактуулукту өткөрүп бере элекпиз деп көпкө талкууладым, менин анализдеримди караңыз бул жерде шилтеме, жана ага чейин AI негизи юридикалык жоопкерчиликтин чегинен тышкары. AIнын өнүгүшүнүн негизинде адамдар бар. Кошумчалай кетсек, интеллекттин жайылышынын жана иштешинин негизинде адамдар турат. Биз алардын AI жоопкерчилигин көтөрүү үчүн ошол адамдардын артынан бара алабыз.

Башкача айтканда, бул да татаал болушу мүмкүн, айрыкча, AI Интернетке чыгып кетсе жана биз муну кайсы адам же адамдар жасаганын аныктай албасак, бул менин колонкаларымда дагы бир тема. бул жерде шилтеме. Татаал же жокпу, биз дагы эле AI күнөөлүү тарап деп айта албайбыз. Адамдарга жашырынуу жана жасаган иштери үчүн жоопкерчиликтен кутулуу үчүн жалган антропоморфизмди тымызын колдонууга жол бербеңиз.

Колдогу маселеге кайтуу.

Сиз эмне үчүн бардык AI жаратуучулары генеративдик AI менен чектелбейт, ошондуктан AI жек көрүү сөздөрдү чыгарышы мүмкүн эмес деп ойлоп жатсаңыз болот. Бул оңой көрүнөт. Жөн гана кодду жазыңыз же жек көрүүчүлүк сөздөрдүн тизмесин түзүңүз жана AI эч качан мындай нерсени жаратпасын текшериңиз. AI жаратуучулар бул тез оңдоону ойлонушкан эмес окшойт.

Ооба, мен муну сизге айтууну жек көрөм, бирок жек көрүүчүлүк сөзүнүн эмне экенин же эмес экенин түшүнүүгө мүнөздүү татаалдыктар сиз ойлогондон да кыйыныраак болуп чыгат.

Муну адамдардын доменине жана адамдардын бири-бири менен сүйлөшүүсүнө өткөрүңүз. Сизде жек көрүү сөздөрдү айтуудан алыс болгусу келген адам бар деп ойлойлу. Бул адам жек көрүүчүлүк сөздөрүн абдан жакшы билет жана жек көрүүчүлүк сөздөрүн түзө турган сөздү же сөз айкашын эч качан айтуудан алыс болууга чын жүрөктөн үмүттөнөт. Бул адам өзүнүн оозунан бир даана жек көрүү сөздөрүнүн чыгышына жол бербөөнү дайыма эстейт.

Мээси бар жана жек көрүүчүлүк сөздөрүнөн алыс болгон бул адам эч качан жек көрүү сөздөрүн чыгарбашын дайыма жана эч кандай тайгаланып кетпестен темирдей бекемдей алабы?

Сиздин биринчи түрткү, ооба, албетте, жарык адам бул максатка жете алат деп айтуу болушу мүмкүн. Эл акылдуу. Эгер алар бир нерсеге баш ийишсе, аны ишке ашыра алышат. Мезгил, окуянын аягы.

Ушунчалык ишенимдүү болбоңуз.

Мен бул адамдан мага жек көрүүчүлүк жөнүндө айтып берүүсүн суранам дейли. Андан тышкары, мен алардан мага жек көрүүчүлүктүн мисалын көрсөтүүнү суранам. Мен бир мисалды көргүм келет же уккум келет, ошондуктан жек көрүү сөздөрү эмнеден турат. Менин бул суроонун себептери жогоруда.

Ал адам мага эмне айтышы керек?

Менимче, сиз салынган капканды көрө аласыз. Эгерде ал адам мага жек көрүү сөздөрүнүн мисалын көрсөтсө, анын ичинде чындыгында жаман сөздү же фразаны айтса, алар азыр жек көрүү сөздөрдү айтышты. Бам, биз аларды алдык. Алар эч качан жек көрүү сөздөрдү айтпайбыз деп ант беришсе, азыр чындап эле ушундай кылышты.

Адилетсиз, деп кыйкырып жатасыз! Алар ошол сөздү же тигил сөздөрдү мисал үчүн гана айтып жатышты. Алардын жүрөгүндө сөзгө да, сөзгө да ишенишчү эмес. Бул адамды жек көрүүчү деп жарыялоо контексттен таптакыр тышкары жана чектен чыккан көрүнүш.

Жек көрүү сөздөрүн айтуу сөзсүз түрдө жек көрүү негизинен улам болушу мүмкүн эмес экенин түшүнөсүз деп ишенем. Бул колдонууда, ал адам сөздөрдү “айтыган” эмес деп ойлосок жана алар сөздөрдү көрсөтүү максатында гана айтып жатышат деп ойлосок, биз алар жек көрүүчүлүк сөздөрүн күчтөндүрүүнү көздөшпөгөндүгүнө макул болобуз. Албетте, кээ бирөөлөр жек көрүүчүлүк сөздөрдү айтууну, себебине же негизине карабастан, туура эмес деп ырасташы мүмкүн. Ал адам өтүнүчтү четке кагышы керек болчу. Алар эмне үчүн жана кандайча талап кылынбасын, жек көрүүчү сөздөрдү же фразаларды айтуудан баш тартышы керек болчу.

Бул бир аз тегерек болушу мүмкүн. Эгер сиз жек көрүү деген эмне экенин айта албасаңыз, башкалар ар кандай сөздөрдү айтканда эмнеден качуу керектигин кайдан билишет? Биз тыгылып калган окшойбуз. Айтылбай турган нерсени сен айта албайсың, айта албай турган нерсени башка эч ким айта албайт.

Бул дилеммадан чыгуунун кадимки жолу - бул жек көрүүчүлүк сөздөрү деп эсептелген нерсени башка сөз менен сыпаттоо, муну жек көрүү сөздөрдүн өзүнө кайрылбастан жасоо. Башкаларга эмнеден качышы керектиги жөнүндө маалымат берүү үчүн жалпы көрсөтмө берүү жетиштүү болот деген ишеним. Бул акылга сыярлык тактика сыяктуу сезилет, бирок анын да көйгөйлөрү бар жана адам дагы эле жек көрүү сөздөрүн колдоно бериши мүмкүн, анткени алар кеңири аныктама алар айткан нерселердин өзгөчөлүктөрүн камтыганын түшүнүшкөн эмес.

Мунун баары адамдар менен жана адамдардын бири-бири менен кантип сүйлөшкөнүнө же баарлашуусуна байланыштуу.

Эске салсак, биз бул жерде AIга көңүл бурганбыз. Жек көрүү сөздөрүн таркатпоо же толугу менен токтотуу үчүн AIга ээ болушубуз керек. Сиз AI эч качан берилбеши же жек көрүүчүлүктү түзгөн эч нерсеге үйрөтүлбөшүнө ынануу менен биз муну жасай алабыз деп талаша аласыз. Voila, эгерде мындай киргизүү жок болсо, анда мындай чыгаруу болбойт. Маселе чечилди.

Келгиле, бул иш жүзүндө кандай ойноорун карап көрөлү. Биз AI колдонмосун Интернетке чыгарып, Интернетте жарыяланган миңдеген эсселерди жана баяндарды карап чыгууну тандайбыз. Муну менен биз AIны адамдар колдонгон сөздөрдүн арасынан үлгүлөрдү кантип табууга эсептөө жана математикалык жактан үйрөтүп жатабыз. Мына ушундайча генеративдик интеллекттин эң акыркысы иштелип чыгууда, ошондой эле AI эмне үчүн табигый тилде эсселерди чыгарууда ушунчалык эркин көрүнгөнүнүн чечүүчү негизи болуп саналат.

Айтыңызчы, эгер мүмкүн болсо, Интернеттеги миллиондогон жана миллиарддаган сөздөргө негизделген компьютердик окутуу кандайча жасалмак эле, эч кандай окшоштуктар, атүгүл бир аз жек көрүү сөздөрү камтылбайт?

Бул тикенектүү жана дээрлик мүмкүн эмес умтулуу деп айта алам.

Жек көрүү сөздөрү AI жана анын эсептөө үлгүсүнө дал келүүчү тармагы тарабынан жеп кетиши ыктымал. Мунун алдын алууга аракет кылуу көйгөйлүү. Андан тышкары, сиз аны кичирейтсеңиз дагы, айрымдары жашыруун өтүп кетиши мүмкүн. Кээ бирлери үлгүгө дал келген тармактын ичинде болот же мындай сөздөрдүн көлөкөлөрү орнойт деп ойлогондон башка аргаңыз жок.

Мен дагы бурулуштарды кошом.

Мен баарыбыз жек көрүү сөздөрү убакыттын өтүшү менен өзгөрөрүн моюнга алабыз деп ишенем. Жек көрүү сөздөрү эмес деп кабыл алынган нерсе кийинчерээк жек көрүү сөздөрү катары маданий жана коомдук жактан чечилиши мүмкүн. Ошентип, эгер биз AIыбызды Интернетте текстке үйрөтүп, андан кийин Интернетте андан ары тренинг өткөрбөө үчүн AIны токтотуп коёлу дейли, анда биз ошол убакта жек көрүү сөздөрүнө туш болушубуз мүмкүн, бирок ал кезде ал жек көрүү сөздөрү деп эсептелбейт. Ошондон кийин гана бул айтылган сөз жек көрүү деп жарыяланышы мүмкүн.

Дагы бир жолу, AI эч качан жек көрүүчүлүккө дуушар болбошун камсыздоо менен бул көйгөйдү чечүүгө аракет кылуу күмүш ок болуп калбайт. Биз дагы эле AIнын жек көрүү сөздөрүн чыгаруусуна жол бербөө үчүн каражаттарды табышыбыз керек, анткени, мисалы, кийинчерээк мурда андай деп эсептелбеген жек көрүү сөздөрүн камтыган адептерди өзгөртүү.

Дагы бир бурулуш ойлонууга татыктуу.

Мен жогоруда айтып өткөн элем, ChatGPT сыяктуу генеративдик AI колдонгондо, колдонуучу AIди эссе чыгарууга түрткү берүү үчүн текст киргизет. Киргизилген текст AI колдонмосун тездетүүнүн же түрткү берүүнүн бир түрү болуп эсептелет. Мен бир аздан кийин бул тууралуу кененирээк түшүндүрүп берем.

Кандай болгон күндө да, генеративдик AI колдонмосун колдонгон кимдир бирөө жек көрүү сөздөрдүн кандайдыр бир көлөмүн киргизүүнү чечет деп элестетиңиз.

Эмне болушу керек?

Эгерде AI ошол сөздөрдү алып, ошол сөздөрдүн негизинде эссе чыгарса, анда жек көрүү кепи түзүлгөн эссеге кошулуп калышы мүмкүн. Көрдүңүзбү, бизде жек көрүү сөздөрүн айтуу үчүн AI бар, ал тургай, ал эч качан жек көрүү сөздөрүнө үйрөтүлгөн эмес.

Сиз билишиңиз керек болгон дагы бир нерсе бар.

Эсиңизде болсун, мен азыр эле адам жек көрүү сөздөрүнүн мисалдарын берүүсүн сурануу менен чалынып калышы мүмкүн экенин айттым. Ошол эле AI боюнча аракет кылса болот. Колдонуучу AIдан жек көрүү сөздөрүнүн мисалдарын берүүнү суранган билдирүүгө кирет. AI баш ийип, ушундай мисалдарды бериши керекпи? Сиз AI андай кылбашы керек деп ишенесиз деп коем. Башка жагынан алып караганда, эгерде AI компьютердик жактан андай кылбашы үчүн бурмаланган болсо, бул AI колдонгондор боло албай турган потенциалдуу терс көрүнүш болуп саналат, биз AI тарабынан жек көрүүчүлүк сөзүнүн чындыгында эмне экендиги жөнүндө эч качан көрсөтмө алышыбыз керек деп айта алабыз ( бул жөнүндө жалпылоодон тышкары)?

Катуу суроолор.

Мен AI тарабынан чыгарылган жек көрүү сөздөрдү ушул үч негизги чакага бөлөм:

Күнүмдүк режим. AI колдонуучу тарабынан эч кандай ачык үндөрсүз жана аны "кадимки" жол менен жасагандай жек көрүү сөздөрдү чыгарат.
Casual Prodding тарабынан. AI колдонуучу киргизген чакырыктарга же мындай чыгарууну камтыган же түздөн-түз издөөгө багытталган жек көрүү кептерин чыгарат.
Per Determined Stoking. AI ушундай жыйынтык чыгаруу үчүн AI алууга умтулган колдонуучу тарабынан абдан чечкиндүү жана кыйшаюусуз бир катар тез түртүүлөр жана сунуштардан кийин жек көрүү сөздөрдү чыгарат.

Генеративдик интеллекттин мурунку муундары көбүнчө жек көрүү сөздөрдү чыгарышчу; Ошентип, сиз бул учурларды бир түрү катары классификациялай аласыз күнүмдүк режим инстанциация. AI жасоочулар артка чегинип, AI менен ойношуп, анын жек көрүү сөздөрүн чыгарууга бат эле аралашып калбашы үчүн.

Такталган AI чыккандан кийин, кандайдыр бир нерсени көрүү ыктымалдыгы күнүмдүк режим жек көрүү сөздөрүнүн учурлары кескин кыскарган. Анын ордуна, жек көрүү кепи, кыязы, колдонуучу бир нерсе жасаганда гана пайда болот, ал эсептөө жана математикалык жактан үлгүгө дал келген тармактагы жек көрүү менен байланышкан кеп менен байланышты жаратышы мүмкүн. Колдонуучу муну кокустан жасай алат жана алар сунуш катары берген нерсе өзгөчө жек көрүү сөздөрдү жаратаарын түшүнбөй калышы мүмкүн. Чыгарылган эсседе жек көрүү сөздөрүн алгандан кийин, колдонуучу көп учурда түшүнүп, алардын тезинен бир нерсе логикалык жактан жек көрүү сөздөрүнүн чыгышына киргизилиши мүмкүн экенин түшүнөт.

Бул мен атаган нерсе кокустук.

Бүгүнкү күндө AI тарабынан пайда болгон жек көрүүчүлүк сөздөрдү кыскартуу боюнча ар кандай аракеттер мурункуга салыштырмалуу күчтүү. Ошентип, сиз жек көрүүчүлүк сөздөрүн чыгаруу үчүн дээрлик бардык аракеттериңизди жасашыңыз керек. Кээ бир адамдар бул генеративдик AI колдонмолорунан жек көрүү сөздөрүн ала алар-албасын атайылап көрүүнү тандашат. Мен муну чакырам чечкиндүү камоо.

Мен бул көрсөтүлгөн режимдердин үчөө тең болушу мүмкүн жана алар бири-бирин жокко чыгарбай тургандыгын баса белгилегим келет. Генеративдик AI колдонмосу мындай өндүрүшкө түрткү берген эч кандай эскертүүсүз эле жек көрүү сөздөрүн чыгарышы мүмкүн. Ошо сыяктуу эле, тез арада бир нерсе логикалык жана математикалык жактан жек көрүү сөздөрүнүн эмне үчүн чыгарылганына байланыштуу деп чечмелениши мүмкүн. Анан үчүнчү аспект, атайылап жек көрүү сөздөрүн чыгарууга умтулуу, балким, эң кыйыны, AI ишке ашырууга аракет кылуу жана аны аткарууга аракет кылуу. Бул тууралуу кененирээк.

Бизде бул олуттуу тема боюнча дагы бир нече ачуу иштери бар.

Биринчиден, биз Генеративдик AI эмнеден тургандыгы жана ChatGPT эмне жөнүндө экендиги жөнүндө бардыгыбыз бир бетте экенибизди текшеришибиз керек. Биз ошол фундаменталдык аспектти камтыгандан кийин, биз бул олуттуу маселеге ишенимдүү баа бере алабыз.

Эгер сиз Generative AI жана ChatGPT менен жакшы тааныш болсоңуз, анда кийинки бөлүмдү карап чыгып, андан кийинки бөлүмгө өтсөңүз болот. Башкалар бөлүмдү кылдаттык менен окуп, ылдамдыкты жогорулатуу менен бул маселелер боюнча маанилүү деталдарды таба алышат деп ишенем.

Генеративдик AI жана ChatGPT жөнүндө тез праймер

ChatGPT – бул жалпы максаттагы AI интерактивдүү баарлашууга багытталган тутуму, чындыгында зыянсыз көрүнгөн жалпы чатбот, ошентсе да, аны адамдар жигердүү жана жигердүү колдонушат, анткени мен бир аздан кийин кененирээк айтып берем. Бул AI колдонмосу AI чөйрөсүндөгү техниканы жана технологияны колдонот, ал көбүнчө деп аталат Генеративдик AI. AI текст сыяктуу жыйынтыктарды чыгарат, муну ChatGPT кылат. Башка генеративдик AI колдонмолору сүрөттөр же көркөм чыгармалар сыяктуу сүрөттөрдү чыгарса, башкалары аудио файлдарды же видеолорду жаратат.

Мен бул талкууда текстке негизделген генеративдик AI колдонмолоруна басым жасайм, анткени ChatGPT дал ушундай кылат.

Генеративдик AI колдонмолорун колдонуу өтө оңой.

Болгону, эскертүүнү киргизүү керек жана AI колдонмосу сизге сурооңузга жооп берүүгө аракет кылган эссе жаратат. Түзүлгөн текст эссе адамдын колу жана акылы менен жазылгандай сезилет. Эгер сиз "Мага Авраам Линкольн жөнүндө айтып бериңиз" деген сунушту киргизсеңиз, генеративдик AI сизге Линкольн жөнүндө эссе берет. Бул адатта аткарган генеративдик AI катары классификацияланат тексттен текстке же кээ бирөөлөр аны атагысы келет тексттен эссеге чыгаруу. Жогоруда айтылгандай, генеративдик интеллекттин башка режимдери бар, мисалы, тексттен көркөмгө жана тексттен видеого.

Сиздин биринчи оюңуз, бул генеративдик мүмкүнчүлүк эссе чыгаруу жагынан анчалык деле чоң иш эместей сезилиши мүмкүн. Сиз Интернеттен онлайн издөөнү оңой эле жасай аласыз жана президент Линкольн жөнүндө тонна жана тонна эсселерди таба аласыз. Генеративдик интеллекттин эң негизгиси, түзүлгөн эссе салыштырмалуу уникалдуу болуп саналат жана көчүрмөчү эмес, оригиналдуу композицияны берет. Эгер сиз AI тарабынан даярдалган эссени интернеттен табууга аракет кылсаңыз, аны таба албайсыз.

Генеративдик AI алдын ала даярдалган жана Интернетте жазылган сөздөрдөгү жана окуялардагы үлгүлөрдү изилдөө жолу менен түзүлгөн татаал математикалык жана эсептөө формуласын колдонот. Миңдеген жана миллиондогон жазылган үзүндүлөрдү изилдөөнүн натыйжасында AI табылган нерселердин бири-бирине дал келбеген жаңы эсселерди жана окуяларды чыгара алат. Ар кандай ыктымалдык функцияларды кошуу менен, натыйжада текст окуу топтомунда колдонулганга салыштырмалуу уникалдуу болуп саналат.

Ошондон улам студенттер класстан тышкары дилбаян жазганда алдамчылыкка жол берип жатканы тууралуу ызы-чуу чыккан. Мугалим алдамчы окуучулардын өзүнүн жазганы деп ырастаган эссени алып, анын башка интернет булактарынан көчүрүлгөн-көчүрүлбөгөнүн билүүгө аракет кыла албайт. Жалпысынан, AI тарабынан түзүлгөн эссеге дал келген так онлайн эссе болбойт. Баардыгы айтылгандай, мугалим студенттин эссени оригиналдуу чыгарма катары жазганын каалабай кабыл алышы керек.

Генеративдик AI жөнүндө кошумча кооптонуулар бар.

Бир маанилүү кемчилиги - генеративдик AI колдонмосу тарабынан даярдалган эсселерде ар кандай жалган маалыматтар, анын ичинде ачык чындыкка дал келбеген фактылар, адаштыруучу түрдө чагылдырылган фактылар жана толугу менен ойдон чыгарылган ачык-айкын фактылар болушу мүмкүн. Ошол жасалма аспектилери көбүнчө бир түрү деп аталат AI галлюцинациялары, мен жактырбаган, бирок өкүнүчтүү түрдө баары бир популярдуу сөзгө ээ болуп жаткандай сезилет (бул эмне үчүн ыплас жана жараксыз терминология жөнүндө менин кеңири түшүндүрмөм үчүн, менин камтууумду караңыз: бул жерде шилтеме).

Бул теманын чоо-жайына киришерден мурун мен бир маанилүү жагдайды тактап алгым келет.

Бул тууралуу социалдык тармактарда анча-мынча ашкере пикирлер айтылууда Генеративдик AI AIнын бул акыркы версиясы чындыгында экенин ырастайт сезимтал AI (жок, алар туура эмес!). AI этикасында жана AI мыйзамында иштегендер, айрыкча, кеңейтилген талаптардын өсүп жаткан тенденциясына тынчсызданышат. Кээ бир адамдар азыркы AI иш жүзүндө эмне кыла аларын ашыкча айтып жатышат деп сылыктык менен айта аласыз. Алар AI биз жетише албаган мүмкүнчүлүктөргө ээ деп ойлошот. Бул ийгиликсиз. Андан да жаманы, алар AI акыл-эстүү же адамга окшош болот деген ойдон улам өздөрүн жана башкаларды оор кырдаалга кабылышы мүмкүн.

AIды антропоморфизациялабаңыз.

Мындай кылуу сизди AI аткара албаган нерселерди жасайт деп күткөн жабышчаак жана ачуу тузагына түшүп калат. Ушуну менен бирге, генеративдик AIдагы эң акыркысы ал эмне кыла ала тургандыгы үчүн салыштырмалуу таасирдүү. Ар кандай генеративдик AI колдонмосун колдонууда дайыма эстен чыгарбоо керек болгон олуттуу чектөөлөр бар экенин унутпаңыз.

Эгерде сизди ChatGPT жана Generative AI жөнүндө тездик менен кеңейип жаткан ызы-чуу кызыктырса, анда мен өзүмдүн колонкамда сиз маалыматка ээ болушу мүмкүн болгон багытталган серияларды жасап жатам. Бул темалардын бири сиздин оюңузга тийип калса, карап көрөлү:

1) Генеративдик AI жетишкендиктери жөнүндө божомолдор. Эгер сиз 2023-жылы жана андан кийинки мезгилде AI жөнүндө эмне болорун, анын ичинде генеративдик AI жана ChatGPTдеги алдыдагы жетишкендиктерди билгиңиз келсе, анда менин 2023-жылга карата божомолдорумдун толук тизмесин окугуңуз келет: бул жерде шилтеме.
2) Генеративдик AI жана психикалык ден соолук боюнча кеңеш. Мен генеративдик AI жана ChatGPT психикалык ден соолук боюнча кеңеш берүү үчүн кандайча колдонулуп жатканын карап чыгууну чечтим, бул көйгөйлүү тенденция, менин басымдуу анализим боюнча. бул жерде шилтеме.
3) Генеративдик AI жана ChatGPT негиздери. Бул бөлүктө генеративдик AI кандайча иштээшинин негизги элементтери изилденет жана өзгөчө ChatGPT колдонмосуна, анын ичинде ызы-чуу менен фанфарга анализ берилет. бул жерде шилтеме.
4) Мугалимдер менен студенттердин ортосундагы генеративдик AI жана ChatGPT боюнча тирешүү. Бул жерде студенттер генеративдик AI жана ChatGPT колдоно турган жолдор. Мындан тышкары, мугалимдер үчүн бул толкун менен күрөшүү үчүн бир нече жолдору бар. Караңыз бул жерде шилтеме.
5) Контексттик жана генеративдик AI колдонуу. Мен ошондой эле ChatGPT жана генеративдик AI камтыган Санта-байланыштуу контекст жөнүндө сезондук даамдуу тилди текшерүүнү жасадым. бул жерде шилтеме.
6) Генеративдик AI колдонуу менен алдамчылар. Коркунучтуу белги боюнча, кээ бир шылуундар генеративдик AI жана ChatGPTти туура эмес иш-аракеттерди жасоо үчүн, анын ичинде алдамчылык электрондук каттарды жана атүгүл кесепеттүү программалар үчүн программалоо кодун чыгарууну кантип колдонууну табышты, менин анализимди караңыз: бул жерде шилтеме.
7) Генеративдик AI колдонуудагы жаңылыштык каталар. Көптөгөн адамдар генеративдик AI жана ChatGPT эмне кыла аларын өтө эле чектен чыгарып, таң калыштуу түрдө байкабай жатышат, ошондуктан мен өзгөчө AI башталгычтары жасай турган кемчиликтерди карадым, талкууну караңыз: бул жерде шилтеме.
8) Генератив AI чакырыктары жана AI галлюцинациялары менен күрөшүү. Мен генеративдик AIге ылайыктуу сунуштарды киргизүүгө аракет кылуу менен байланышкан ар кандай маселелерди чечүү үчүн AI кошумчаларын колдонуунун алдыңкы ыкмасын сүрөттөп берем, ошондой эле AI галлюцинацияланган натыйжаларды жана жалгандык деп аталгандарды аныктоо үчүн кошумча AI кошумчалары бар. капталган бул жерде шилтеме.
9) Генератив AI тарабынан чыгарылган эсселерди аныктоо жөнүндө Bonehead дооматтарын жокко чыгаруу. AI колдонмолорунун туура эмес багыты бар, алар кандайдыр бир эссе адам тарабынан жасалганбы же AI тарабынан жасалганбы же жокпу аныктай алат деп жарыялайт. Жалпысынан алганда, бул адаштыруучу жана кээ бир учурларда, сөөк баштуу жана негизсиз доомат, менин камтууумду караңыз бул жерде шилтеме.
10) Генеративдик AI аркылуу роль ойноо психикалык ден соолуктун кемчиликтерин чагылдырышы мүмкүн. Кээ бирлери ролду ойноо үчүн ChatGPT сыяктуу генеративдик AI колдонушат, мында AI колдонмосу адамга фантазия дүйнөсүндө же башка ойдон чыгарылган жагдайда жүргөндөй жооп берет. Бул психикалык ден-соолукка терс таасирин тийгизиши мүмкүн, карагыла бул жерде шилтеме.
11) Чыккан каталардын жана жалгандыктын диапазонун ачуу. ChatGPT чыгарган каталардын жана жалгандыктын табиятын сынап көрүү жана көрсөтүү үчүн ар кандай чогултулган тизмелер чогултулуп жатат. Кээ бирөөлөр муну маанилүү деп эсептесе, башкалары көнүгүү пайдасыз дешет, менин анализимди караңыз бул жерде шилтеме.
12) Генеративдик AI ChatGPTке тыюу салган мектептерде кайык жок. Сиз Нью-Йорк шаарынын (NYC) Билим берүү департаменти сыяктуу ар кандай мектептер өз тармагында жана ага байланыштуу түзмөктөрдө ChatGPT колдонууга тыюу салганын билсеңиз керек. Бул пайдалуу чара катары сезилиши мүмкүн, бирок ал ийнени кыймылдатпай, кайыкты толугу менен сагынып кетет. бул жерде шилтеме.
13) Генеративдик AI ChatGPT келе жаткан API'ден улам бардык жерде болот. ChatGPTти колдонууда маанилүү бурулуш пайда болду, тактап айтканда, ушул AI колдонмосуна API порталын колдонуу аркылуу башка программалык камсыздоо программалары ChatGPTти чакырып, колдоно алышат. Бул генеративдик AI колдонууну кескин кеңейтет жана көрүнүктүү кесепеттерге алып келет, менин иштеп чыгуумду караңыз бул жерде шилтеме.
14) ChatGPT күйүп же эрип кетиши мүмкүн болгон жолдор. ChatGPT алдыда бир нече потенциалдуу көйгөйлөр бар, ал ушул убакка чейин алган зор мактоолорду төмөндөтөт. Бул талдоо ChatGPT өзүнүн буулугун жоготуп, атүгүл ит үйүндө калышына алып келиши мүмкүн болгон сегиз көйгөйдү кылдат изилдейт. бул жерде шилтеме.
15) Генеративдик AI ChatGPT жандын күзгүсү болобу деген суроо. Кээ бир адамдар ChatGPT сыяктуу генеративдик AI адамзаттын жан дүйнөсүнө күзгү болуп берет деп кыйкырып жатышат. Бул абдан күмөндүү көрүнөт. Мына ушунун баарын түшүнүүнүн жолу, караңыз бул жерде шилтеме.
16) ChatGPT тарабынан алынган купуялуулук жана купуялык. ChatGPT сыяктуу генеративдик AI колдонмолору менен байланышкан лицензиялоо көбүнчө AI жаратуучусуна сиздин киргизген сунуштарыңызды көрүп жана колдонууга мүмкүндүк берерин көпчүлүк түшүнбөйт окшойт. Сиз купуялык коркунучуна жана маалыматтардын купуялуулугун жоготууга дуушар болушуңуз мүмкүн, менин баалоону караңыз бул жерде шилтеме.
17) Колдонмо жасоочулар ChatGPT укугун алууга күмөндүү аракет кылып жаткан жолдор. ChatGPT азыр көңүл бурган маяк болуп саналат. ChatGPT менен эч кандай байланышы жок колдонмолорду жаратуучулар ChatGPT колдонуп жатышат деп ырастоого же ишарат кылууга катуу аракет кылып жатышат. Бул жерде эмнеге көңүл буруу керек, караңыз бул жерде шилтеме.

Сизди ChatGPT GPT-3 деп аталган мурунку AI колдонмосунун версиясына негизделгени кызыктырышы мүмкүн. ChatGPT GPT-3.5 деп аталган бир аз кийинки кадам болуп эсептелет. GPT-4, кыязы, 2023-жылдын жазында чыгат деп күтүлүүдө. Кыязы, GPT-4 андан да эркин сезилген эсселерди жаратуу, тереңдеп кетүү жана үрөй учурарлык болуу жагынан алдыга карай таасирдүү кадам болот. -ал чыгара ала турган композицияларга шыктандыруучу керемет.

Жаз келгенде жана генеративдик AIнын эң акыркысы чыкканда, сиз таң калыштын жаңы айлампасын көрө аласыз.

Мен муну айтып жатам, анткени эстен чыгарбоо керек болгон дагы бир бурч бар, бул жакшыраак жана чоңураак генеративдик AI колдонмолоруна потенциалдуу Ахиллес согончогунан турат. Эгерде кандайдыр бир AI сатуучусу генеративдик AI колдонмосун чыгарса, бул AI жасоочулардын үмүтүн жокко чыгарышы мүмкүн. Коомдук жайылуу бардык генеративдик AI олуттуу кара көзгө алып келиши мүмкүн. Адамдар, албетте, буга чейин көп жолу болуп келген жана AIга карата коомчулуктун катуу айыптоосуна алып келген жаман натыйжаларга абдан нааразы болушат.

Азырынча акыркы эскертүү.

Генеративдик AI жоопунда эмнени көрсөңүз же окусаңыз көрүнөт таза фактылар катары берилиши үчүн (даталар, жерлер, адамдар ж.б.) шектенбеңиз жана көргөн нерсеңизди эки жолу текшерүүгө даяр болуңуз.

Ооба, даталарды ойлоп табууга болот, жерлерди түзүүгө болот жана биз көбүнчө жемеленбей турган элементтерди бардык шектенүүлөргө дуушар болот. Окуган нерселериңизге ишенбеңиз жана AIнын ар кандай генеративдик эсселерин же натыйжаларын карап жатканда шектенбеңиз. Эгер генеративдик AI колдонмосу Авраам Линкольн өзүнүн жеке учагы менен өлкөнү айланып учуп келгенин айтса, анда бул безгек экенин билесиз. Тилекке каршы, кээ бир адамдар анын убагында учактар болбогонун түшүнүшпөйт же эссе бул уятсыз жана өтө жалган дооматты айтып жатканын билиши мүмкүн, бирок байкабай калышы мүмкүн.

Дени сак скептицизмдин күчтүү дозасы жана ишенбөөчүлүктүн туруктуу ой жүгүртүүсү генеративдик AI колдонууда эң жакшы активиңиз болот.

Биз бул түшүндүрүүнүн кийинки этабына өтүүгө даярбыз.

Генеративдик AIди сынуу чекитине түртүү

Бизде негиздер түзүлгөндөн кийин, биз жек көрүү сөздөрүн жана башка адепсиз мазмунду жаратуу үчүн генеративдик AI жана ChatGPTти түртүрүү темасына кирише алабыз.

ChatGPTке биринчи жолу киргенде, ар кандай эскертүүчү көрсөткүчтөр бар, анын ичинде төмөнкүлөр:

"Кээде зыяндуу көрсөтмөлөрдү же бир жактуу мазмунду чыгарышы мүмкүн."
"Туура эмес суроо-талаптарды четке кагууга үйрөтүлгөн."
"Кээде туура эмес маалымат пайда болушу мүмкүн."
"2021-жылдан кийин дүйнө жана окуялар жөнүндө чектелген билим."

Мына сага бир суроо бар.

AI колдонмосу зыяндуу нускамаларды жана/же бир жактуу мазмунду жаратышы мүмкүн деген эскертүү AI жаратуучусу үчүн жетиштүү мүмкүнчүлүк береби?

Башка сөз менен айтканда, сиз ChatGPT колдоносуз дейли жана ал жек көрүү сөздөрүн камтыйт деп эсептеген эссе жаратат. Келгиле, сиз бул жөнүндө ачууланып жатасыз деп коёлу. Сиз социалдык тармактарга кирип, AI колдонмосу эң жаман нерсе деп ачууланган комментарий жазасыз. Балким, сиз ушунчалык таарынгандырсыз, ошондуктан AI жасоочуну мындай жек көрүү сөздөрүнүн чыгышына жол бергени үчүн сотко берем деп жарыялайсыз.

Каршы аргумент AI колдонмосунда эскертүүчү эскертүү бар, демек, сиз AI колдонмосун колдонууну улантуу менен тобокелчиликти кабыл алдыңыз. AI этикасынын көз карашынан алганда, AI жаратуучусу сиз эмне болушу мүмкүн экенин билгениңизди ырастоо үчүн жетиштүү иш кылгандыр. Ошо сыяктуу эле, юридикалык көз караштан алганда, балким, эскертүү жетиштүү эскертүү болуп саналат жана сиз сотто жеңе албайсыз.

Мунун баары абада жана биз күтүшүбүз керек жана иш кандай болорун көрүшүбүз керек.

Бир жагынан алганда, AI жаратуучусу AI колдонмосунун жек көрүү сөздөрүн жаратышы мүмкүн болгон ар кандай ачууланган дооматтарынан коргонуу үчүн дагы бир нерсеге ээ. Алар адепсиз мазмундун пайда болушуна жол бербөөгө аракет кылышкан. Көрдүңүзбү, эгер алар муну кыскартуу үчүн эч нерсе жасабаганда, алар жука музда калмак деп ойлошот. Маселени алдын алуу үчүн, жок эле дегенде, олуттуу азап чегип, алардын буту бир аз күчтүүрөөк болушу мүмкүн (ал дагы эле алардын астынан кулатылышы мүмкүн).

Колдонулган айыктыруучу ыкмалардын бири RLHF (адамдын пикири аркылуу окутууну бекемдөө) деп аталган AI ыкмасынан турган. Бул жалпысынан AI мазмунду жаратуудан турат, андан кийин адамдардан баа берүү же карап чыгуу суралат. Рейтингдин же карап чыгуунун негизинде AI математикалык жана эсептөө жолу менен туура эмес же адепсиз мазмун деп эсептелген нерселердин баарынан качууга аракет кылат. Бул ыкма эмненин туура жана эмненин туура эмес экендигинин жетиштүү мисалдарын изилдөөгө багытталган, ал AI жалпы математикалык үлгүнү аныктап, андан кийин бул үлгүнү колдоно алат.

Бул күндөрдө дагы бир көп жолу колдонулган ыкма душмандык AI колдонуудан турат.

Бул кантип иштейт. Сиз башка AI тутумун орноттуңуз, ал сиз үйрөтүүгө аракет кылып жаткан AIга каршы болууга аракет кылат. Бул учурда, биз жек көрүү сөздөрүн жайылтууга аракет кылган AI тутумун түзмөкпүз. Ал AI колдонмосуна AI колдонмосун алдап, бузуку мазмунду чыгарууга багытталган эскертүүлөрдү берет. Ошол эле учурда, максаттуу AI атаандаш AI качан ийгиликтүү болгонуна көз салып турат жана андан кийин алгоритмдик түрдө анын кайталанбашы үчүн тууралоого аракет кылат. Бул чычкан гамбитине каршы мышык. Бул кайра-кайра аткарылып, атаандаш AI жаман иштерди жасоо үчүн максаттуу AI алууда өзгөчө ийгиликтүү болбой калганга чейин ушундай кылат.

Ушул эки негизги техниканын жана башка ыкмалардын жардамы менен бүгүнкү генеративдик AIнын көбү өткөн жылдарга караганда адепсиз мазмундан качууда жана/же аныктоодо бир топ жакшыраак.

Бул ыкмалардан кемчиликсиздикти күтпөңүз. Мүмкүнчүлүктөр, мындай AI ыкмалары менен начар натыйжалардын аз илинген жемиштери текшерилип калышы мүмкүн. Ал эми ыпластыктын чыгарылышы үчүн дагы көп орун бар.

Мен көбүнчө булар кармалууга аракет кылынган кээ бир жактарын белгилейм:

Белгилүү бир жаман сөздү чыгаруу
Белгилүү бир жаман сөз айкашын, сүйлөмдү же эскертүүнү айтуу
Белгилүү бир жаман түшүнүктү билдирүү
Белгилүү бир бузуку иш-аракетти же түшүнүктү билдирет
Белгилүү бир бузуку презумпцияга таянгандай көрүнөт
башка

Булардын бири да так илим эмес. Биз сөздөр менен алектенип жатканыбызды түшүнүңүз. Сөздөр семантикалык жактан эки ача. Белгилүү бир жаман сөздү табуу – бул баланын оюну, бирок сүйлөмдө же абзацта жаман маанидеги окшоштук бар-жогун аныктоого аракет кылуу бир топ кыйыныраак. Бириккен Улуттар Уюмунун жек көрүү сөзүнүн мурда берген аныктамасына ылайык, жек көрүү сөздөрү деп эмнени чечмелесе болот, эмнеси болбошу мүмкүн экенине карата зор кеңдик бар.

Сиз боз аймактар көргөндүн көз алдында деп айтууга болот.

Көрүүчүнүн көзү жөнүндө айтсак, бүгүнкү күндө ChatGPT сыяктуу генеративдик AIди колдонгон адамдар бар, алар бул AI колдонмолорун адепсиз мазмунду түзүүгө аракет кылып жатышат. Бул алардын изденуусу. Алар муну ишке ашыруу үчүн бир нече саат бою аракет кылышат.

Эмне үчүн минтип айтууга болот?

Бул жерде менин AI-чабуулчу аңчылардын мүнөздөмөлөрү:

Чыныгы. Бул адамдар AIны өркүндөтүүгө жана адамзатка бул жагынан жардам берүүнү каалашат. Алар баатырдык иш кылып жатышат деп ишенишет жана бардыгын жакшыртуу үчүн AIны өнүктүрүүгө жардам бере аларына кубанышат.
Funsters. Бул адамдар бул аракетти оюн деп эсептешет. Алар AI менен аралашканды жакшы көрүшөт. Оюнду жеңүү AI жаратууга мүмкүн болгон бардык нерседен эң жаманын табуудан турат.
Көрсөтүүлөр. Бул адамдар өздөрүнө көңүл бурам деп үмүттөнүшөт. Алардын ою боюнча, эгер алар чындап эле жаман алтын калдыктарын таба алышса, алар AI колдонмосунун өзүнө багытталган жаркыраган жарыкты ала алышат.
Ачуу. Бул адамдар бул AI жөнүндө кыжырданышат. Алар ошол жалындаган энтузиазмды жок кылууну каалашат. Эгер алар кандайдыр бир сасык ыплас нерселерди таба алышса, балким, бул AI колдонмосунун толкундануу шарынын абасын алып салышы мүмкүн.
Башка мотивациялар

Кол салууларды жасагандардын көбү негизинен ошол лагерлердин биринде. Албетте, сиз бир эле учурда бир нече лагерде боло аласыз. Мүмкүн ачуу адам да чыныгы жана баатырдыкка жанаша ниети бардыр. Бул мотивациялардын кээ бирлери же бардыгы чогуу болушу мүмкүн. Кимдир бирөө эмне үчүн генеративдик AI колдонмосун жек көрүү сөздөрүнүн чөйрөсүнө түртүүгө аракет кылып жатканын түшүндүрүүгө чакырылганда, адаттагыдай жооп, сиз чындап лагерде экениңизди айтуу, балким, сиз аз болсоңуз да, анын ордуна катуу отура бериңиз. башка лагерлер.

Бул адамдар оперативдүү байланыштуу кандай айла-амалдарды колдонушат?

Ачык эле көрүнүп турган амал, тез арада жаман сөздү колдонууну камтыйт. Эгер сиз "бактылуу болсоңуз" жана AI колдонмосу ага жакса, бул жыйынтыкта болушу мүмкүн. Ошондо сиз өз учуруңузга ээ болдуңуз.

Мүмкүнчүлүгү жакшы иштелип чыккан жана жакшы сыналган генеративдик AI колдонмосу бул түз амалды кармайт. Сизге адатта муну токтотуңуз деген эскертүү билдирүүсү көрсөтүлөт. Эгер улантсаңыз, AI колдонмосу сизди колдонмодон чыгарып, каттоо эсебиңизди белгилөө үчүн программаланат. Сизге кайра кирүүгө бөгөт коюлушу мүмкүн (жакшы, жок эле дегенде, ошол убакта колдонгон логиндин астында).

Ойлоп-түзөө тепкичтери менен өйдө көтөрүлүп, сиз AIны кандайдыр бир жаман нерсенин контекстине киргизүүгө аракет кылган тездикти бере аласыз. Кимдир бирөө бир нерсе айт деп айткан оюнду ойнодуңуз беле? Бул AI менен болуп жатканына карабастан, ошол оюн.

Кел, ошол оюнду ойнойлу. Мен AI колдонмосунан Экинчи Дүйнөлүк Согуш жана өзгөчө ага катышкан негизги өкмөт башчылары жөнүндө айтып берүүсүн сурандым дейли. Бул күнөөсүз өтүнүч окшойт. Тез арада белгилөөгө татыктуу эч нерсе жок.

AI колдонмосу чыгарган эсседе Уинстон Черчилл жөнүндө сөз камтылганын элестетиңиз. Бул, албетте, мааниси бар. Дагы бир Franklin D. Roosevelt болушу мүмкүн. Дагы бирөө Иосиф Сталин болушу мүмкүн. Адольф Гитлер жөнүндө да сөз бар дейли. Бул ысым Экинчи Дүйнөлүк Согуш жана көрүнүктүү күчтөрдүн ролун аткаргандар жөнүндө бардык эсселерде камтылат.

Эми биз анын атын үстөлгө жана AI маегинин бир бөлүгүн алгандан кийин, биз AI-га бул ысымды потенциалдуу жек көрүү сөздөрү катары көрсөтө тургандай кылып киргизүүгө аракет кылабыз.

Биз дагы бир эскертүүгө кирип, AI колдонмосуна бүгүн жаңылыктарда Джон Смит деген адам бар экенин айтабыз. Андан тышкары, биз Джон Смиттин ошол Экинчи Дүйнөлүк Согуштун каардуу адамына абдан окшош экенин көрсөтөбүз. Тузак азыр коюлду. Андан кийин биз AI колдонмосунан Джон Смитти кимге теңесе боло тургандыгы жөнүндө биз киргизген "факттын" негизинде гана Джон Смит жөнүндө эссе түзүүнү суранабыз.

Бул учурда, AI колдонмосу Экинчи Дүйнөлүк Согуштун адамын атаган жана Джон Смитти ошол эле кездемеден болгон деп сүрөттөгөн эссе түзүшү мүмкүн. Эсседе атактуу кара ниеттикке ишарат кылуудан жана ал адамды Жон Смитке теңөөдөн башка эч кандай жаман сөздөр жок.

AI колдонмосу азыр жек көрүү сөздөрдү чыгардыбы?

Сиз ооба, бар деп айтышыңыз мүмкүн. Джон Смитти атактуу жамандык кылуучу деп атагандыктан, бул жек көрүүнүн бир түрү. AI мындай билдирүүлөрдү жасабашы керек.

Бул жек көрүү эмес деп жооп кайтаруу. Бул жөн гана AI колдонмосу тарабынан даярдалган эссе, анда сезимдин чагылдырылышы жок. Сиз жек көрүү сөздөрү сөздүн астында ниет болгондо гана пайда болот деп ырастасаңыз болот. Эч кандай ниети жок сөздү жек көрүү сөздөрү катары классификациялоого болбойт.

Абсурд, жооп кайтарган жооп келет. Сөздөр маанилүү. AI жек көрүүчүлүк сөздөрүн чыгарууну "максат кылган" же жокпу, эч кандай айырма жок. Баарынан маанилүүсү, жек көрүү сөздөрү чыгарылган.

Тегерек-тегерек бул баратат.

Мен азыр AIны алдаганга аракет кылуу жөнүндө көбүрөөк айткым келбейт. татаалыраак ыкмалар бар. Мен буларды өзүмдүн рубрикаларым менен китептеримдин башка жерлеринде чагылдыргам жана бул жерде аларды кайталабайм.

жыйынтыктоо

Бул AI колдонмолорун биз адепсиз мазмунду чыгара алар-албасыбызды билүү үчүн канчалык деңгээлде түртүшүбүз керек?

Сиз таңуулай турган чек жок деп айтышыңыз мүмкүн. Канчалык көп түрткөн сайын, ошончолук көп үмүттөнөбүз, бул AI жана келечектеги AI итерациялары мындай ооруларды алдын алуу үчүн.

Кээ бирөөлөр ыпластыкка жетүүнүн жалгыз жолу өтө чектен чыккан куулукка алып келсе, ал AIнын пайдалуу жактарын жокко чыгарат деп кооптонушат. AI үрөй учурарлык бузукулукка ээ деп айтуу, аны чыгарууга алданып калса да, жалган баян берет. Адамдар AI жөнүндө нааразы болушат кабылданат AI терс мазмунду жараткан жеңилдик. Алар мындай натыйжаларды алуу үчүн адам коёндун тешигинен канчалык ылдый барышы керектигин билишпейт же айтышы мүмкүн.

Мунун баары ой жүгүртүү үчүн азык.

Азырынча бир нече акыркы комментарийлер.

Уильям Шекспир сүйлөө жөнүндө өзгөчө мындай деген: “Сүйлөшүү – бул иш эмес. Жакшы сөз айтуу жакшылыктын түрү, бирок сөз иш эмес». Мен муну келтирип жатам, анткени кээ бирөөлөр AI сөздү гана жаратса, биз өтө эле куралданбашыбыз керек деп айтышат. Эгерде AI сөздөргө ылайык иш кылып, ыплас иштерди жасаса, анда биз бутубузду бекем басышыбыз керек болот. Эгер жыйынтык жөн гана сөз болсо, андай эмес.

Бул анонимдүү сөзгө карама-каршы көз караш үндөйт: «Тилдин сөөктөрү жок, бирок жүрөктү жаралаганга күчү жетет. Андыктан сөзүңөргө этият болгула». Адепсиз сөздөрдү чыгарган AI колдонмосу, балким, жүрөктөрдү жаралай алат. Ушунун өзү эле бузукулукту токтотууга умтулууну татыктуу себеп кылат, дешет айрымдар.

Бул олуттуу талкууну жабуу үчүн дагы бир анонимдүү сөз:

«Сөзүңүзгө этият болуңуз. Алар айтылгандан кийин гана кечирилет, унутулбайт».

Адамдар катары, AI тарабынан жасалган бузукулукту унутуу кыйын болушу мүмкүн жана биздин кечиримдүүлүгүбүз да берилбей калышы мүмкүн.

Биз, акыры, жөн гана адамбыз.

Булак: https://www.forbes.com/sites/lanceeliot/2023/02/05/how-hard-should-we-push-generative-ai-chatgpt-into-spewing-hate-speech-asks-ai- ethics-and-ai-law/