Генератив AI ChatGPT үчүн мыйзамдуу кыямат күнү, эгерде плагиат же укук бузган болсо, AI этикасын жана AI мыйзамын эскертет

ChatGPT сыяктуу генеративдик AI биздин веб-сайттарды жана адам ойлоп тапкан мазмунду бузуп жатабы? Билгин, бол ... [+] капа бол, даяр бол.

Гетти

Кредит керек болгон жерде кредит бериңиз.

Бул, балким, сиз бекем ишенүү үчүн чоңойгон акылмандыктын бир аздыгы. Чынында эле, бул жашоодогу адилеттүү жана акылга сыярлык эреже экенине бардыгыбыз кандайдыр бир деңгээлде макул болушубуз мүмкүн деп болжолдойт же элестетет. Кимдир-бирөө моюнга алууга татыктуу иш кылганда, анын татыктуу таанылышын текшериңиз.

Карама-каршы көз караш бир топ азыраак ынандырарлык көрүнөт.

Эгер кимдир бирөө ошол кредитти талап кылып басып жүрсө жок кредит төлөө мөөнөтү келгенде таанылат, ошондой эле, сен мындай ишеним адепсиздик жана, балким, жашыруун деп ырасташат мүмкүн. Кредитке көрүнүктүү бир нерсе жасаган бирөө алданып калганда, биз көп учурда өзүбүздү катуу тынчсыздандырабыз. Башкалардын эмгеги үчүн башкалар жалган баа бергенде, биз өзгөчө көңүл бурбайбыз деп айта алам. Бул кооптондурбай турган кош кагылышуу. Кредитке ээ болушу керек болгон адам күндөгү учурунан баш тартат. Болгондо да, айлакер көз жоосун алгандан ырахат алууда, бирок алар бизди туура эмес алдап, биздин жагымдуу сезимдерибизди коротуп жатышат.

Эмне үчүн бул эң туура жолдор менен кредит алуу жана туура эмес жана жек көрүндү жолдор менен бөгөт коюу жөнүндө сөз болуп жатат?

Анткени, биз акыркы Жасалма интеллект (AI) жөнүндө сөз болгондо ушундай кыйынчылыкка туш болуп жаткандайбыз.

Ооба, ырастоолорго караганда, бул AI катары белгилүү бир түрү аркылуу болуп жатат Генеративдик AI. Бүгүнкү күндө жаңылыктардагы эң ысык AI болгон Generative AI, буга чейин кредит алууга татыксыз нерсе үчүн насыя алганы көп кол жазмалары бар. Бул генеративдик AI барган сайын кеңейип жана колдонула баштаган сайын начарлашы мүмкүн. Генеративдик интеллектке көбүрөөк кредит берилип жатат, тилекке каршы, чыныгы кредитке татыктуу болгондор чаңда калышууда.

Бул болжолдонгон феноменди так көрсөтүүнүн менин сунуштаган жолу - бул эки жыттуу фразалар:

1) масштабдагы плагиат
2) Автордук укуктун масштабдуу бузулушу

OpenAI тарабынан ноябрда чыгарылган ChatGPT деп аталган кеңири популярдуу AI колдонмосунан улам сиз генеративдик AI жөнүндө кабардар болушуңуз мүмкүн деп ойлойм. Мен бир аздан генеративдик AI жана ChatGPT жөнүндө көбүрөөк айтам. Ошол жерде кал.

Элдин эчкиси эмне болуп жатканына дароо кайрылалы.

Айрымдар генеративдик AI мазмунду жараткан адамдарды бузуп салышы мүмкүн деп катуу нааразы болушууда. Көрдүңүзбү, генеративдик AI колдонмолорунун көбү Интернетте табылган маалыматтарды изилдөө аркылуу үйрөтүлгөн маалыматтар. Бул маалыматтардын негизинде, алгоритмдер AI колдонмосундагы кеңири ички үлгүгө дал келген тармакты өркүндөтө алат, ал кийинчерээк автоматташтыруунун бир бөлүгү эмес, адам колу менен ойлоп табылгандай укмуштай көрүнгөн жаңы мазмунду чыгара алат.

Бул укмуштуудай эрдик Интернетте сканерленген мазмунду колдонуу менен байланыштуу. Маалыматтарды окутуу үчүн булак катары Интернет-контенттин көлөмү жана байлыгы болбосо, генеративдик AI дээрлик бош болмок жана аны колдонууга анча кызыкдар болбойт. AI миллиондогон миллиондогон онлайн документтерди жана тексттерди, ошондой эле байланышкан мазмундун бардык түрлөрүн карап чыгуу менен, акырындык менен үлгүгө дал келүү адам тарабынан даярдалган мазмунду сынап көрүү жана тууроо үчүн алынат.

Канчалык көп мазмун каралса, үлгү дал келүү кыйла такталып, мимикрияда дагы жакшыраак болот, калганы бирдей.

Бул жерде миллиондогон долларлык суроо:

Чоң суроо: Эгер сизде же башка адамдарда Интернетте кандайдыр бир генеративдик AI колдонмосу үйрөтүлгөн мазмун болсо, муну сиздин түздөн-түз уруксатыңызсыз жана балким, сиз такыр билбестен жасап жатсаңыз, анда сизде кандайдыр бир баалуулук пайда болгонуна байланыштуу пирогдун бир бөлүгүнө укугуңуз болушу керек. бул генеративдик AI маалыматтарды окутуу?

Кээ бирөөлөр бир гана туура жооп деп катуу талашып жатышат Ооба, өзгөчө бул адам мазмунун жаратуучулар, чынында эле, алардын кесилишине татыктуу. Эң негизгиси, өз үлүшүн алган адамды табуу кыйынга турат, андан да жаманы, дээрлик эч ким эч кандай үлүш ала элек. Эрксизден жана билбестен салым кошкон интернет-контенттин жаратуучулары алардын мыйзамдуу кредитинен баш тартышууда.

Бул мыкаачылык жана ырайымсыз деп мүнөздөлүшү мүмкүн. Кредит керек болгон жерде кредит берилиши керек деген даанышман акылмандыкты ачуудан өттүк. Генеративдик AI учурда, сыягы, андай эмес. Кредит боюнча көптөн бери келе жаткан жана жакшынакай эреже одоно түрдө бузулуп жаткандай.

Оо, жооп кайтарды, сиз кырдаалды толугу менен ашырып, туура эмес айтып жатасыз. Албетте, генеративдик AI Интернеттеги мазмунду текшерген. Албетте, бул генеративдик AIнын маалыматтарын окутуунун бир бөлүгү катары абдан пайдалуу болду. Ырас, бүгүнкү күндө таасирдүү генеративдик AI колдонмолору бул каралбаган мамилесиз мынчалык таасирдүү болмок эмес. Бирок сиз мазмунду жаратуучуларга кандайдыр бир кредиттин кандайдыр бир түрүн бөлүштүрүү керек деп айтып жатып, өтө эле көп көпүрөдөн өтүп кеттиңиз.

Логикасы төмөнкүдөй. Адамдар Интернетке чыгып, Интернеттен нерселерди үйрөнүшөт, муну кадимкидей жана эч кандай ызы-чуу жок кылышат. Сантехника жөнүндө блогдорду окуп, анан эркин жеткиликтүү сантехниканы оңдоо боюнча видеолорду көргөн адам эртеси күнү сыртка чыгып, сантехник болуп ишке кириши мүмкүн. Алар раковинаны кантип тазалоо керектиги жөнүндө жазган блоггерге сантехникага байланыштуу акча которууларынын бир бөлүгүн бериши керекпи? Алар аккан ваннаны оңдоо кадамдарын көрсөткөн видеону жасаган влоггерге акы төлөшү керекпи?

Албетте, жок.

Генеративдик интеллекттин маалыматтарын үйрөтүү - бул жөн гана үлгүлөрдү иштеп чыгуунун каражаты. Генеративдик интеллекттин натыйжалары текшерилген нерсенин регургитациясы болбосо, сиз алар "үйрөнгөн" деп ишендире аласыз, ошондуктан кандайдыр бир конкреттүү булакка кандайдыр бир кредит берилбейт. Эгерде сиз генеративдик интеллектти так регургитациялоодо кармай албасаңыз, анда AI кандайдыр бир булактан тышкары жалпыланган дегенди билдирет.

Эч кимге кредит жок. Же болбосо, кредит баарына жетет деп айтууга болот. Интернетте табылган жалпы текст жана адамзаттын башка мазмуну кредитти алат. Баарыбыз кредит алабыз. Белгилүү бир булакка кредитти аныктоого аракет кылуу маанисиз. AI өнүккөнүнө жана адамзаттын бардыгына пайда алып келе турганына кубаныңыз. Интернеттеги бул билдирүүлөр AI тармагындагы жетишкендиктердин келечегине салым кошкондугу жана бул адамзатка түбөлүккө кандайча жардам бере тургандыгы үчүн сыймыктанышы керек.

Мен бул эки карама-каршы көз караш жөнүндө дагы айта кетейин.

Ошол эле учурда, сиз интернетте веб-сайттары барлар үчүн кредит төлөнөт жана кечиктирилип калды деген лагерге ыктап жатасызбы же каршы тарап интернет-контент жаратуучуларды чечкиндүү деп эсептейсизби? жок тытылып алуу бир кыйла ишенимдүү позабы?

Табышмак менен табышмак баары биригет.

Муну ачалы.

Бүгүнкү тилкеде мен генеративдик AI негизинен плагиаттык же Интернетте жайгаштырылган мазмундун автордук укуктарын бузушу мүмкүн деген тынчсызданууларга кайрылам (Интеллектуалдык менчик укугу же IP маселеси). Биз бул кемчиликтердин негизин карап чыгабыз. Мен анда-санда бул талкуунун жүрүшүндө ChatGPTге кайрылып турам, анткени бул генеративдик AIнин 600 фунт горилласы, бирок башка көптөгөн генеративдик AI колдонмолору бар экенин жана алар жалпысынан бирдей жалпы принциптерге негизделгенин унутпаңыз.

Ошол эле учурда, сиз чындыгында генеративдик AI деген эмне деп ойлонуп жатсаңыз болот.

Келгиле, адегенде генеративдик AIнин негиздерин карап көрөлү, андан кийин биз учурдагы актуалдуу маселени кылдат карап чыгалы.

Мунун бардыгына AI этикасы жана AI мыйзамы боюнча бир катар ой жүгүртүүлөр кирет.

Сураныч, AI колдонмолорун иштеп чыгууга жана жайылтууга этикалык AI принциптерин киргизүү аракеттери жүрүп жатканын эске алыңыз. Тынчсызданган жана мурдакы AI этикасынын өсүп келе жаткан контингенти AI иштеп чыгуу жана кабыл алуу аракеттери жасоонун көз карашын эске алуу менен камсыз кылууга аракет кылып жатышат. AI For Good жана алдын алуу AI For Bad. Ошо сыяктуу эле, AI аракеттерин адам укуктарына жана башка ушул сыяктууларга буруп кетпеш үчүн потенциалдуу чечимдер катары талкууланып жаткан жаңы AI мыйзамдары бар. AI этикасы жана AI мыйзамы боюнча менин үзгүлтүксүз жана кеңири чагылдыруу үчүн караңыз бул жерде шилтеме жана бул жерде шилтеме, Бир нечесин гана атаңыз.

Этикалык AI осуяттарын иштеп чыгуу жана жарыялоо коомду AI-ду жаратуучу көп сандаган тузактарга түшпөшү үчүн жүргүзүлүп жатат. ЮНЕСКОнун аракеттери аркылуу 200гө жакын өлкө тарабынан иштелип чыккан жана колдоого алынган БУУнун AI этикасынын принциптерин чагылдыруу үчүн, караңыз бул жерде шилтеме. Ушул сыяктуу эле, AI бир калыпта кармап туруу үчүн жаңы AI мыйзамдары изилденип жатат. Акыркы тартуулардын бири сунушталгандардын жыйындысынан турат AI Билл укуктары АКШнын Ак үйү жакында AI доорундагы адам укуктарын аныктоо үчүн жарыялаганын караңыз бул жерде шилтеме. AI жана AI иштеп чыгуучуларын туура жолдо кармап туруу жана коомду кыйратышы мүмкүн болгон максаттуу же кокусунан жасалган аракеттерди токтотуу үчүн айыл керек.

Мен бул талкууга AI этикасы менен AI мыйзамына байланыштуу ойлорду аралаштырам.

Генеративдик AI негиздери

Генеративдик AIдин эң кеңири белгилүү инстанциясы ChatGPT аттуу AI колдонмосу менен берилген. ChatGPT коомдук аң-сезимге ноябрда AI изилдөө фирмасы OpenAI тарабынан чыгарылгандан кийин пайда болгон. Ошондон бери ChatGPT чоң аталыштарды чогултуп, таң калыштуу түрдө өзүнө бөлүнгөн он беш мүнөттүк атактан ашып кетти.

Менимче, сиз ChatGPT жөнүндө уккандырсыз же аны колдонгон адамды билесиз.

ChatGPT генеративдик AI колдонмосу болуп эсептелет, анткени ал колдонуучудан бир нече текстти киргизет жана андан кийин кубаттайт же эсседен турган чы-гармаларды чыгарат. AI тексттен текстке генератор, бирок мен AIди тексттен эссеге генератор катары сүрөттөп берем, анткени ал көбүнчө эмне үчүн колдонуларын тактайт. Узакка созулган композицияларды түзүү үчүн генеративдик AI колдонсоңуз болот же аны кыскача кыска комментарийлерди сунуштай аласыз. Мунун баары сиздин каалооңуз боюнча.

Болгону, эскертүүнү киргизүү керек жана AI колдонмосу сизге сурооңузга жооп берүүгө аракет кылган эссе жаратат. Түзүлгөн текст эссе адамдын колу жана акылы менен жазылгандай сезилет. Эгер сиз "Мага Авраам Линкольн жөнүндө айтып бериңиз" деген сунушту киргизсеңиз, генеративдик AI сизге Линкольн жөнүндө эссе берет. Генеративдик интеллекттин башка режимдери бар, мисалы, тексттен көркөмгө жана тексттен видеого. Мен бул жерде тексттен текстке вариацияга басым жасайм.

Сиздин биринчи оюңуз, бул генеративдик мүмкүнчүлүк эссе чыгаруу жагынан анчалык деле чоң иш эместей сезилиши мүмкүн. Сиз Интернеттен онлайн издөөнү оңой эле жасай аласыз жана президент Линкольн жөнүндө тонна жана тонна эсселерди таба аласыз. Генеративдик интеллекттин эң негизгиси, түзүлгөн эссе салыштырмалуу уникалдуу болуп саналат жана көчүрмөчү эмес, оригиналдуу композицияны берет. Эгер сиз AI тарабынан даярдалган эссени интернеттен табууга аракет кылсаңыз, аны таба албайсыз.

Генеративдик AI алдын ала даярдалган жана Интернетте жазылган сөздөрдөгү жана окуялардагы үлгүлөрдү изилдөө жолу менен түзүлгөн татаал математикалык жана эсептөө формуласын колдонот. Миңдеген жана миллиондогон жазылган үзүндүлөрдү изилдөөнүн натыйжасында AI табылган нерселердин бири-бирине дал келбеген жаңы эсселерди жана окуяларды чыгара алат. Ар кандай ыктымалдык функцияларды кошуу менен, натыйжада текст окуу топтомунда колдонулганга салыштырмалуу уникалдуу болуп саналат.

Генеративдик AI жөнүндө көптөгөн кооптонуулар бар.

Бир маанилүү кемчилиги - генеративдик AI колдонмосу тарабынан даярдалган эсселерде ар кандай жалган маалыматтар, анын ичинде ачык чындыкка дал келбеген фактылар, адаштыруучу сүрөттөлгөн фактылар жана толугу менен ойдон чыгарылган ачык-айкын фактылар болушу мүмкүн. Ошол жасалма аспектилери көбүнчө бир түрү деп аталат AI галлюцинациялары, мен жактырбаган, бирок өкүнүчтүү түрдө баары бир популярдуу сөзгө ээ болуп жаткандай сезилет (бул эмне үчүн ыплас жана жараксыз терминология жөнүндө менин кеңири түшүндүрмөм үчүн, менин камтууумду караңыз: бул жерде шилтеме).

Дагы бир кооптонуу - адамдар эссени өздөрү түзбөгөнүнө карабастан, AI тарабынан жасалган эссе үчүн кредитти оңой эле ала алышат. Мугалимдер жана мектептер генеративдик AI колдонмолорунун пайда болушуна абдан тынчсызданып жатканын уккандырсыз. Студенттер өздөрүнүн дайындалган эсселерин жазуу үчүн генеративдик AI колдоно алышат. Эгерде окуучу эссе өз колу менен жазылган деп ырастаса, мугалим анын ордуна генеративдик интеллект тарабынан жасалмаланганбы же жокпу, аныктоого мүмкүнчүлүгү аз. Бул студентти жана мугалимди чаташтырган тарапты талдоо үчүн менин камтууумду караңыз бул жерде шилтеме жана бул жерде шилтеме.

Бул тууралуу социалдык тармактарда өтө чоң дооматтар пайда болду Генеративдик AI AIнын бул акыркы версиясы чындыгында экенин ырастайт сезимтал AI (жок, алар туура эмес!). AI этикасында жана AI мыйзамында иштегендер, айрыкча, кеңейтилген талаптардын өсүп жаткан тенденциясына тынчсызданышат. Кээ бир адамдар азыркы AI иш жүзүндө эмне кыла аларын ашыкча айтып жатышат деп сылыктык менен айта аласыз. Алар AI биз жетише албаган мүмкүнчүлүктөргө ээ деп ойлошот. Бул ийгиликсиз. Андан да жаманы, алар AI акыл-эстүү же адамга окшош болот деген ойдон улам өздөрүн жана башкаларды оор кырдаалга кабылышы мүмкүн.

AIды антропоморфизациялабаңыз.

Мындай кылуу сизди AI аткара албаган нерселерди жасайт деп күткөн жабышчаак жана ачуу тузагына түшүп калат. Ушуну менен бирге, генеративдик AIдагы эң акыркысы ал эмне кыла ала тургандыгы үчүн салыштырмалуу таасирдүү. Ар кандай генеративдик AI колдонмосун колдонууда дайыма эстен чыгарбоо керек болгон олуттуу чектөөлөр бар экенин унутпаңыз.

Азырынча акыркы эскертүү.

Генеративдик AI жоопунда эмнени көрсөңүз же окусаңыз көрүнөт таза фактылар катары берилиши үчүн (даталар, жерлер, адамдар ж.б.) шектенбеңиз жана көргөн нерсеңизди эки жолу текшерүүгө даяр болуңуз.

Ооба, даталарды ойлоп табууга болот, жерлерди түзүүгө болот жана биз көбүнчө жемеленбей турган элементтерди бардык шектенүүлөргө дуушар болот. Окуган нерселериңизге ишенбеңиз жана AIнын ар кандай генеративдик эсселерин же натыйжаларын карап жатканда шектенбеңиз. Эгерде генеративдик AI колдонмосу Авраам Линкольндун жеке учагы менен өлкөнү айланып өткөнүн айтса, анда бул безгек экенин билесиз. Тилекке каршы, кээ бир адамдар анын убагында учактар болбогонун түшүнүшпөйт же эссе бул уятсыз жана өтө жалган дооматты айтып жатканын билиши мүмкүн, бирок байкабай калышы мүмкүн.

Дени сак скептицизмдин күчтүү дозасы жана ишенбөөчүлүктүн туруктуу ой жүгүртүүсү генеративдик AI колдонууда эң жакшы активиңиз болот.

Биз бул түшүндүрүүнүн кийинки этабына өтүүгө даярбыз.

Интернет жана Генератив AI бул жерде

Эми сизде генеративдик AI деген эмне экенин түшүнгөндөн кийин, биз генеративдик AI адилеттүү же адилетсиз “колдонуп жатабы” же кээ бирөөлөр айтышат деген курч суроону изилдей алабыз. ачыктан-ачык пайдаланып, Интернет мазмуну.

Бул жерде менин бул маселеге тиешелүү төрт маанилүү темалар бар:

1) Double Trouble: Плагиат жана автордук укукту бузуу
2) Плагиаттын же автордук укуктун бузулушун далилдөөгө аракет кылуу
3) Плагиат же автордук укукту бузуу үчүн иш козгоо
4) Мыйзамдуу миналар күтүүдө

Мен бул маанилүү темалардын ар бирине токтолом жана баарыбыз ойлонушубуз керек болгон терең ойлорду сунуштайм. Бул темалардын ар бири чоңураак табышмактын ажырагыс бөлүгү болуп саналат. Бир эле үзүндү карай албайсың. Эч бир бөлүктү башка бөлүктөрдөн бөлүп карай албайсыз.

Бул татаал мозаика жана бүт баш катырма туура гармониялуу каралышы керек.

Double Trouble: Плагиат жана автордук укукту бузуу

Генеративдик AI жасагандар жана аны иштеткендер туш болгон эки кыйынчылык - бул алардын буюмдары эки жаман нерсени жасап жатканында:

1) Плагиат. Генеративдик AI катары чечмеленсе болот плагиат AI маалыматтарды окутуу учурунда орун алган Интернет сканерлөөсүнө ылайык Интернетте бар мазмун.
2) Автордук укукту бузуу. Генеративдик AI милдеттеме катары ырасталышы мүмкүн автордук укукту бузуу маалыматтарды окутуу учурунда сканерленген Интернет мазмуну менен байланышкан.

Тактоо үчүн, Интернетте генеративдик AI маалыматын окутуу үчүн сканерленгенге караганда бир топ көп мазмун бар. Адатта Интернеттин аз гана бөлүгү колдонулат. Ошентип, биз маалыматтарды окутуу учурунда сканерленбеген ар кандай мазмунда генеративдик AI менен өзгөчө уйдун эти жок деп болжолдоого болот.

Бул бир аз талаш-тартыштуу, анткени сиз сканерден өтпөгөн мазмун менен башка мазмунду байланыштырган сызык сызыгыңыз мүмкүн. Ошондой эле, дагы бир маанилүү шарт - эгер сканерленбеген мазмун бар болсо дагы, генеративдик AI натыйжалары бир эле сөзгө туш келсе, ал плагиат жана/же автордук укук бузулган деп ырасталышы мүмкүн. Менин айтайын дегеним, мунун баарында бир топ сыдырым бар.

Жыйынтык: Генеративдик AI плагиат жана автордук укуктун бузулушуна келгенде потенциалдуу AI Этикасы жана AI Мыйзамынын укуктук табышмактары менен коштолот. басымдуу маалыматтарды окутуу практикасын негиздөө.

Буга чейин, AI жасоочулар жана AI изилдөөчүлөрү, алардын үстүндө илинип турган жана коркунучтуу түрдө илинип турган кылычка карабастан, бул дээрлик эч кандай скотсуз өтүштү. Бул көрүнүштөргө каршы бир нече гана сот иштери козголгон. Сиз мындай мыйзамдуу аракеттер тууралуу жаңылыктарды уккан же көргөн чыгарсыз. Алардын бири, мисалы, Midjourney жана Stability AIдин тексттен сүрөткө фирмаларын Интернетте жайгаштырылган көркөм мазмунду бузгандыгы үчүн камтыйт. Дагы бирөө AI колдонмолорун чыгарган Copilot программалык камсыздоосунан улам GitHub, Microsoft жана OpenAIге каршы текстти кодго бузууга алып келет. Getty Images ошондой эле тексттен сүрөткө укук бузуу үчүн Stability AIден кийин барууну көздөп жатат.

Мындай доо арыздар дагы көбөйөт деп күтсөңүз болот.

Азырынча бул доо арыздарды баштоо бир аз шандуу, анткени жыйынтыгы салыштырмалуу белгисиз. Сот AI жасоочуларды жактайбы же алардын мазмуну адилетсиз пайдаланылган деп эсептегендер жеңип чыгабы? Кымбат баалуу соттук күрөш ар дайым олуттуу маселе. Ири масштабдагы юридикалык чыгымдарды утуп же утулуп калуу мүмкүнчүлүгүнө каршы таразага салуу керек.

AI жасоочулардын күрөштөн башка аргасы жоктой сезилет. Эгер алар бир аз болсо да, үңкүргө киришсе, кошумча соттук процесстер келип чыгышы ыктымал (негизинен, башкалардын үстөмдүк кылуу мүмкүнчүлүгүнүн жогорулашына эшик ачылат). Сууда мыйзамдуу кан болгондон кийин, калган мыйзамдуу акулалар каралып жаткан "жеңил эсепке" чуркашат жана сөзсүз түрдө талкаланып, уруп-согуп, акчалай кан төгүү болот.

Айрымдар AI жаратуучуларды коргой турган жаңы AI мыйзамдарын кабыл алышыбыз керек деп эсептешет. Коргоо ал тургай артка карай да болушу мүмкүн. Мунун негизи, эгерде биз генеративдик AI жетишкендиктерин көргүбүз келсе, анда AI жасоочуларга коопсуз аймактын учуу тилкесин беришибиз керек. Соттук териштирүүлөр AI жасоочуларга каршы жеңишке жетише баштагандан кийин, эгер андай боло турган болсо (биз азырынча билбейбиз), генеративдик AI бууланып кетет деген кооптонуу бар, анткени эч ким AI фирмаларына эч кандай колдоо көрсөтүүгө даяр эмес.

Доктор Илья Колоченко жана Гордон Платтын "ChatGPT: IP, киберкоопсуздук жана Генеративдик интеллекттин башка юридикалык тобокелдиктери" деп аталган жакында Bloomberg Мыйзамынын макаласында чеберчилик менен белгиленгендей, Bloomberg Мыйзамы, 2023-жылдын февраль, бул жерде бул көз караштарды кайталаган эки маанилүү үзүндү келтирилген:

«Уруксатсыз кырып алуу жана андан кийин автордук укук менен корголгон маалыматтарды колдонуу автордук укуктун бузулушуна барабарбы деген суроого азыр АКШнын юридикалык окумуштуулары жана интеллектуалдык менчик боюнча укук профессорлорунун ортосунда кызуу талаш-тартыштар жүрүп жатат. Эгерде мындай практикада автордук укук бузууларды көргөн юристтердин пикири үстөмдүк кылса, мындай AI тутумдарынын колдонуучулары да экинчи даражадагы укук бузуулар үчүн жооп бериши мүмкүн жана юридикалык кесепеттерге дуушар болушу мүмкүн.
"Кыйынчылыкты комплекстүү чечүү үчүн мыйзам чыгаруучулар учурдагы автордук укук мыйзамдарын модернизациялоону эле эмес, ошондой эле AI үчүн атайын мыйзамдардын жана ченемдик укуктук актылардын комплексин ишке ашырууну да карашы керек."

Эске салсак, коом катары биз мыйзамдуу коргоону киргизгенбиз кеңейүү Атактуу же атактуу 230-бөлүмдү карап жаткан Жогорку Сот күбө болгондой, Интернеттин XNUMX-бөлүмү. Ошентип, биз генеративдик интеллектти өнүктүрүү үчүн кандайдыр бир коргоо чараларын көрүүгө даяр болушубуз мүмкүн. Мүмкүн, коргоочулар убактылуу орнотулуп, генеративдик AI алдын ала аныкталган чеберчилик деңгээлине жеткенден кийин мөөнөтү бүтүшү мүмкүн. Башка коргоо жоболору иштелип чыгышы мүмкүн.

Мен жакында Жогорку Соттун баалоосу жана 230-бөлүм боюнча акыркы чечими генеративдик интеллекттин пайда болушуна кандай таасир этиши жөнүндө өз анализимди жарыялайм. Алдыда боло турган постту карап туруңуз!

Биз генеративдик AI деп аталган коомду таң калтырган технологиялык инновацияларга эркиндик беришибиз керек деген катуу айтылган пикирге кайтуу. Айрымдар автордук укуктун бузулушу же болуп жатканына карабастан, коом жалпысынан генеративдик AIди өнүктүрүүнүн конкреттүү максаттары үчүн буга уруксат берүүгө даяр болушу керек деп айтышат.

Жаңы AI мыйзамдары кылдаттык менен иштелип чыгып, генеративдик AI үчүн маалыматтарды окутууга байланыштуу деталдарга ылайыкташтырылат деген үмүт бар.

Бул максат үчүн жаңы AI мыйзамдарын иштеп чыгуунун бул түшүнүгүнө көптөгөн каршы аргументтер бар. Кооптондурган нерсе, AI жөнүндө ар кандай жаңы мыйзам автордук укуктун бузулушуна жол ачат. Биз мындай жаңы AI мыйзамдарынын китептерге түшүшүнө жол бергенибизге өкүнөбүз. Муну жөн гана AI маалыматтарын үйрөтүү менен чектегенге канчалык аракет кылбаңыз, башкалар тымызын же акылдуу түрдө автордук укуктун чектелбеген жана кеңири бузулушуна алып келе турган жылчыктарды табышат.

Аргументтер айланып баратат.

Өзгөчө сууну кармабаган бир аргумент AIнын өзүн сотко берүүгө аракет кылуу менен байланыштуу. Мен күнөөлүү кызыкдар тараптар катары AI жаратуучусун же AI изилдөөчүлөрүн айтып жатканыма көңүл буруңуз. Бул адамдар жана компаниялар. Кээ бирөөлөр сотко бериле турган тарап катары AI-ны максаттуу кылышыбыз керектигин айтышат. Мен өзүмдүн колонкамда көпкө чейин талкууладым, биз азырынча AIга юридикалык жактуулукту бере элекпиз, караңыз бул жерде шилтеме мисалы, жана ошентип, AI-га багытталган мындай сот иштери азыр маанисиз болуп эсептелинет.

Кимди же эмнени сотко берүү керек деген суроого кошумча катары бул дагы бир ширелүү теманы козгойт.

Белгилүү бир генеративдик AI колдонмосу AI жаратуучусу тарабынан иштелип чыккан деп ойлойлу, биз аны Виджет компаниясы деп атайбыз. Виджет компаниясынын көлөмү салыштырмалуу кичинекей жана кирешеси да, мүлкү боюнча да көп эмес. Аларды сотко берүү, балким, издеген чоң байлыкка ээ боло албайт. Эң көп дегенде, сиз туура эмес деп эсептеген нерсени оңдогондон канааттанасыз.

Сиз чоң балыктын артынан баргыңыз келет.

Мына ушундайча пайда болот. AI жаратуучусу өзүнүн генеративдик AIсин тонна камыр жана тонналаган активдери бар ири конгломерат болгон Big Time компаниясына жеткиликтүү кылууну чечет. Виджет компаниясынын атын атаган соттук териштирүү эми Big Time компаниясынын аталышы менен жакшыраак максатка ээ болмок. Бул адвокаттар жактыра турган Дөөтү менен Голиаттын күрөшү. Албетте, Big Time компаниясы балык уулоочу кайырмактан арылууга аракет кылат. Алар муну кыла алабы же жокпу, бул дагы бир жолу белгисиз юридикалык суроо болуп саналат жана алар үмүтсүз баткакка батып калышы мүмкүн.

Бул тууралуу кененирээк маалымат берүүдөн мурун, мен маалыматтарды окутуудан улам генеративдик AIнын талаш-тартыштары жөнүндө столдо маанилүү нерсени алгым келет. Плагиат менен автордук укуктун бузулушу бир аз эки башка жырткыч экенин сиз интуитивдик түрдө түшүнөсүз деп ишенем. Алардын жалпы жактары көп, бирок алар бир кыйла айырмаланат.

Бул жерде Дьюк университетинин кыскача сүрөттөмөсү бар, ал экөөнү түшүндүрөт:

«Плагиат башка бирөөнүн эмгегин моюнга албастан пайдалануу катары эң жакшы аныкталат. Бул доогер жаратпаган жумуш үчүн кредиттик дооматты камтыган этикалык маселе. Кимдир бирөө башка бирөөнүн эмгегин ал чыгарманын автордук укук статусуна карабастан плагиат кыла алат. Мисалы, автордук укуктун астында калуу үчүн өтө эски китептен же макаладан көчүрүү плагиат болуп саналат. Маалымат сыяктуу фактылуу материалдар автордук укук менен корголбосо да, таанылбаган булактан алынган маалыматтарды колдонуу да плагиат болуп саналат. Бирок плагиат оңой эле айыгат – материалдын түпнуска булагына туура шилтеме жасоо».
«Ал эми автордук укуктун бузулушу – бул башка бирөөнүн чыгармасын уруксатсыз пайдалануу. Бул биринчи кезекте чыгарма автордук укук менен корголгонбу же корголбогондугуна, ошондой эле канча колдонулгандыгы жана пайдалануунун максаты сыяктуу өзгөчөлүктөргө көз каранды юридикалык маселе. Эгерде кимдир бирөө корголгон чыгарманы өтө көп көчүрүп алса же уруксатсыз максатта көчүрсө, жөн гана баштапкы булакты таануу көйгөйдү чечпейт. Автордук укук ээсинин алдын ала уруксатын алуу менен гана укук бузуу үчүн айыптоо коркунучунан кутулууга болот."

Мен бул эки кооптонуунун маанилүүлүгүн белгилеп жатам, ошондуктан сиз дарылоо ыкмалары ар кандай болушу мүмкүн экенин түшүнөсүз. Ошондой эле, алар экөө тең AI этикасына жана AI мыйзамына кирген ойлорго камтылган, бул аларды изилдөөгө бирдей баалуу кылат.

Келгиле, доомат коюлган каражатты же чечимди изилдеп көрөлү. Сиз бул эки көйгөйлүү маселелердин бирине жардам берерин, бирок экинчисине эмес экенин көрөсүз.

Кээ бирөөлөр AI жаратуучуларга алардын булактарына шилтеме жасоо керек деп ырасташат. Генеративдик AI эссе чыгарганда, эсседе айтылгандардын бардыгына конкреттүү цитаталарды кошуңуз. Интернет мазмуну колдонулган ар кандай URL даректерин жана башка көрсөткүчтөрдү бериңиз. Бул аларды плагиатка байланыштуу тынчсыздануулардан арылтат окшойт. Чыгарылган эссе, кыязы, даярдалып жаткан сөз үчүн кандай булактар колдонулганын так аныктайт.

Бул айтылган чечимде кээ бир мүчүлүштүктөр бар, бирок 30,000 фут деңгээлинде бул плагиат дилеммасы үчүн жарым-жартылай канааттандырарлык даба катары кызмат кылат дейли. Автордук укуктун бузулушун түшүндүрүүдө жогоруда айтылгандай, булак материалына шилтеме берүү сизди сөзсүз түрдө итканадан чыгарбайт. Мазмун автордук укук менен корголгон деп ойлосок жана башка факторлорго жараша, мисалы, материалдын канчасы колдонулганы, күтүлүп жаткан автордук укуктун бузулушунун кылычы кескин түрдө жана акырындык менен төмөндөшү мүмкүн.

Кош кыйынчылык - бул жерде.

Плагиаттын же автордук укуктун бузулушун далилдөөгө аракет кылуу

Далилдеп бер!

Бул баарыбыз жашообуздун ар кайсы мезгилдеринде уккан эскирген рефрень.

Кандай болуп жатканын билесиң. Сиз бир нерсе болуп жатат же болду деп ырасташы мүмкүн. Сиз жүрөгүңүздүн түпкүрүндө мунун болгонун билесиз. Бирок сөз түртүп-түрткүгө келгенде, сизде далил болушу керек.

Бүгүнкү тил менен айтканда, көрсөтүш керек түшүүлөр, алар айткандай.

Менин сизге суроом бул: Генеративдик AI интернет мазмунун туура эмес пайдаланганын кантип далилдейбиз?

Жооп жеңил болушу керек деп ойлойт. Сиз генеративдик AIдан чыгарылган эссе чыгарууну суранасыз же айтасыз. Сиз андан кийин эссени алып, аны Интернеттен тапса болот деп салыштырыңыз. Эгерде сиз эссени тапсаңыз, анда сизде генеративдик AI ылакап дубалына кадалган болот.

Жашоо эч качан мынчалык оңой эместей көрүнөт.

100гө жакын сөздү камтыган эссе чыгаруу үчүн генеративдик AI алабыз деп ойлойлу. Биз айланып, ошол 100 сөздү издеп, интернеттин бардык бурчтарына жетүү үчүн аракет кылабыз. Эгерде биз 100 сөздү тапсак, ошол эле иретте жана бирдей модада көрсөтүлгөндөй, биз өзүбүзгө кызыгып калгандайбыз.

Дейли, биз Интернетте 80 сөздүн 100ине гана дал келген "салыштыра турган" эссени таптык. Бул дагы эле жетиштүү окшойт, балким. Бирок биз дал келген 10 сөздүн 100 гана үлгүсүн табабыз деп элестетиңиз. Бул же плагиат болду же автордук укук бузулду деп кыйкырыш үчүн жетиштүүбү?

Боздук бар.

Текст ушундай күлкүлүү.

Муну тексттен сүрөткө же тексттен искусствого болгон жагдайлар менен салыштырыңыз. Генеративдик AI текстти сүрөткө же текстти көркөм сүрөткө тартуу мүмкүнчүлүгүн камсыз кылганда, сиз текстти киргизесиз жана AI колдонмосу сиз берген сунушка негизделген сүрөттү чыгарат. Сүрөт бул же башка планетада мурда болгон эч кандай сүрөттөлүштөн айырмаланып калышы мүмкүн.

Башка жагынан алганда, сүрөт бар башка сүрөттөрдү эске салышы мүмкүн. Биз AI тарабынан жаратылган генеративдик сүрөттү карай алабыз жана кандайдыр бир деңгээлде ичеги инстинкти менен ал биз буга чейин көргөн башка сүрөткө окшош деп айта алабыз. Жалпысынан алганда, көрүү салыштыруу жана контраст аспектилери бир аз жеңилирээк жүргүзүлөт. Айтылгандай, чоң юридикалык талаш-тартыштар бир сүрөттөлүштүн экинчисинен кайталанышын же кайталанышын камсыз кылат.

Музыкада дагы ушундай жагдай бар. Текстти киргизүүгө мүмкүндүк берген генеративдик AI колдонмолору бар жана AI тарабынан чыгарылган аудио музыка. Бул тексттен аудиого же тексттен музыкага AI мүмкүнчүлүктөрү эми гана пайда боло баштады. Сиздин эң мыкты долларыңызга кое ала турган нерсе - генеративдик AI тарабынан чыгарылган музыка бузуулар үчүн катуу текшерилет. Биз музыкалык укук бузууну укканда билебиз окшойт, бирок бул дагы бир татаал юридикалык маселе, ал жөн гана кабыл алынган кайталанууга кандай сезимде болгонубузга негизделбейт.

Мага дагы бир мисалга уруксат этиңиз.

Тексттен кодго жаратуучу AI сизге текстти киргизүү мүмкүнчүлүгүн берет жана AI сиз үчүн программалоо кодун чыгарат. Сиз андан кийин бул кодду компьютердик программаны даярдоо үчүн колдоно аласыз. Сиз кодду түзүлгөндөй колдоно аласыз же кодду өзүңүздүн муктаждыктарыңызга жараша түзөтүп, тууралоону тандасаңыз болот. Ошондой эле коддун ылайыктуу жана ишке жарамдуу экенине ынануу зарыл, анткени түзүлгөн коддо каталар жана жалган маалыматтар пайда болушу мүмкүн.

Сиздин биринчи божомолуңуз программалоо коду тексттен эч кандай айырмасы жок болушу мүмкүн. Бул жөн гана текст. Албетте, бул белгилүү бир максатты камсыз кылган текст, бирок ал дагы эле текст.

Ооба, так эмес. Көпчүлүк программалоо тилдери ошол тилдин коддоо билдирүүлөрүнүн мүнөзүнө жараша катуу форматка жана структурага ээ. Бул кандайдыр бир мааниде эркин аккан табигый тилден алда канча тар. Сиз коддоо билдирүүлөрү кандайча түзүлөт деп бир аз кутучаңыз. Ошо сыяктуу эле, билдирүүлөрдүн колдонулуш жана тизилишинин ырааттуулугу жана жолу бир аз кутучага салынган.

Жалпысынан алганда, программалоо коду плагиат же бузулганын көрсөтүү мүмкүнчүлүгү табигый тилге караганда дээрлик оңой. Ошентип, генеративдик AI Интернетте программалоо кодун сканерлөө үчүн барганда жана кийинчерээк программалоо кодун генерациялаганда, код ачык түрдө кайталанган деп талашуу мүмкүнчүлүгү салыштырмалуу ынанымдуураак болот. Слэм-данк эмес, андыктан бул боюнча катуу салгылашуулар болот деп күтүңүз.

Менин негизги оюм - бизде генеративдик AIнин бардык режимдерине каршы турган AI этикасы жана AI мыйзамы бирдей болот.

Плагиат жана автордук укуктун бузулушу үчүн көйгөйлүү болот:

Тексттен текстке же тексттен эссеге
Тексттен сүрөткө же тексттен искусствого
Тексттен аудиого же тексттен музыкага
Тексттен видеого
Тексттен кодго
Ж.б.

Алардын бардыгы бирдей тынчсызданууга дуушар болушат. Кээ бирөөлөр башкаларга караганда "далилдөө" бир аз оңой болушу мүмкүн. Алардын бардыгы AI этикасынын жана AI мыйзамынын негизделиши боюнча өздөрүнүн ар түрдүү түндөрүнө ээ болушат.

Плагиат же автордук укукту бузуу үчүн иш козгоо

Талкуулоо максатында, келгиле, тексттен текстке же тексттен эссеге генеративдик AIге көңүл буралы. Мен муну жарым-жартылай генеративдик интеллекттин тексттен текстке түрү болгон ChatGPTтин эбегейсиз популярдуулугунан улам жасайм. Көптөгөн адамдар ChatGPTти жана башка көптөгөн адамдар менен бирге ар кандай окшош тексттен текстке генеративдик AI колдонмолорун колдонушат.

Генеративдик AI колдонмолорун колдонуп жаткан адамдар плагиатка же автордук укуктун бузулушуна таянарын билишеби?

Алардын кылганы күмөндүү көрүнөт.

Эгерде генеративдик AI колдонмосу колдонууга жеткиликтүү болсо, AI жаратуучусу же AIди чыгарган компания алар сунуштап жаткан буюмдарда эч кандай жагымсыз эч нерсе жок экенин билиши же ишениши керек деген божомол басымдуулук кылат деп айткым келет. Эгер сиз аны колдоно алсаңыз, анда ал борттун үстүндө болушу керек.

Келгиле, белгилүү бир генеративдик AI маалыматтарды окутууга карата туура эмес негизде иштеп жатканын кантип далилдей тургандыгыбыз жөнүндө мурунку комментарийимди карап көрөлү.

Мен ошондой эле бир генератив AI кармап алсак, калгандарын басып алуу мүмкүнчүлүгү жогорулайт деп кошумчалай алам. Мен бардык генеративдик AI колдонмолору бир кайыкта болот деп айткан жокмун. Бирок алардын бири дубалга кадалгандан кийин, алар өтө катаал деңизде калышат.

Ошон үчүн дагы болгон соттук процесстерге көз салып туруу абдан пайдалуу болот. Талап кылынган укук бузуу боюнча жеңген биринчиси, эгерде бул орун алса, башка генеративдик AI колдонмолору үчүн кыйроо жана караңгылыкка алып келиши мүмкүн, эгерде кандайдыр бир тарчылыктар кененирээк маселелерден качпаса. Талап кылынган укук бузуу боюнча утулуп калгандар генеративдик AI колдонмолору коңгуроо кагып, майрамдай алат дегенди билдирбейт. Бул жоготуу башка генеративдик AI колдонмолоруна тиешеси жок башка факторлорго байланыштуу болушу мүмкүн жана башкалар.

Эгерде биз 100 сөздүк эссе алып, ошол так сөздөрдү Интернеттен дал ошол ырааттуулукта табууга аракет кылсак, бизде плагиат же автордук укуктун бузулушу үчүн салыштырмалуу катуу иш болушу мүмкүн, калганы бирдей экендигин айттым. Бирок дал келген сөздөрдүн саны аз болсо, биз жука музда калгандай сезилмекпиз.

Мен муну тереңирээк изилдегим келет.

Салыштыруунун айкын аспектиси так ошол эле тизмектеги сөздөрдөн турат. Бул бүт үзүндүлөр үчүн болушу мүмкүн. Бул бизге күмүш табакка салынгандай, байкап көрүү үчүн ыңгайлуу болмок.

Сөздөрдүн үзүндүсү гана дал келсе, биз да шектениши мүмкүн. Идея, алар чечүүчү сөздөрбү же биз оңой эле алып салууга же этибарга албай коюуга мүмкүн болгон толуктоочу сөздөрбү же жокпу, көрүү болмок. Биз ошондой эле сөздөрдүн мурунку же келечектеги чакта колдонулушуна же башка шылуундукка алданып калгыбыз келбейт. Сөздөрдөгү ошол вариацияларды да эске алуу керек.

Салыштыруунун дагы бир деңгээли - бул сөздөр, айрыкча, бир эле сөздөр эмес, бирок ар кандай абалда болгон сөздөр дагы эле бирдей ойлорду жасап жаткандай сезилет. Мисалы, кыскача баяндама көбүнчө түпнуска булак катары окшош сөздөрдү колдонот, бирок биз корутунду баштапкы булакка негизделгендей сезилет.

Салыштыруунун эң оор деңгээли түшүнүккө же идеяларга негизделет. Салыштыруу негизи катары окшош же окшош сөздөрү жок, бирок маңызы же идеялары бирдей болгон эссени көрдүк дейли. Ырас, биз катаал аймакка кирип бара жатабыз. Идеялар тыкыр корголгон деп айта турган болсок, биз билимдин жана билимдин кеңейишине дээрлик бардык түрлөрдү жаап салмакпыз.

Биз дагы бир жолу Дьюк университетинин пайдалуу түшүндүрмөсүнө кайрылсак болот:

«Автордук укук идеяларды коргобойт, идеянын конкреттүү көрүнүшү гана. Мисалы, сот Дэн Браун жазганда мурунку китептин автордук укугун бузган эмес деп чечти Da Vinci Code анткени ал мурунку чыгармадан алган бардык сюжеттин же диалогдун өзгөчөлүгү эмес, негизги идеялары болгон. Автордук укук чыгармачыл өндүрүшкө дем берүүгө багытталгандыктан, жаңы жана оригиналдуу чыгарманы жасоо үчүн башка бирөөнүн идеяларын колдонуу автордук укуктун максатын колдойт, ал аны бузбайт. Бирөө башка бирөөнүн билдирүүсүн уруксатсыз көчүрүп алса гана автордук укук бузулушу мүмкүн."
«Плагиатты болтурбоо үчүн, ал тургай, кимдир бирөөдөн алынган идеялардын булагын, ал идеяларды билдирүү алар менен кабыл алынганына карабастан, моюнга алуу керек. Ошентип, парафраза цитатаны талап кылат, бирок ал сейрек автордук укук маселесин козгойт».

Сураныч, буга чейин эки көйгөйлүү тараптын ортосундагы айырмачылыктар аныкталгандай көңүл буруңуз.

Эми салыштыруу ыкмаларын иш жүзүндө колдонуу көп жылдардан бери болуп келе жаткан нерсе. Муну ойлоп көрүңүз. Мектептеги тапшырмалары үчүн дилбаян жазган студенттер Интернеттен мазмун алып, Пулитцердин А даражасына ээ болгон сөздөрдүн автору деп түр көрсөтүүгө азгырылышы мүмкүн.

Мугалимдер муну менен күрөшүү үчүн көптөн бери плагиатты текшерүү программаларын колдонуп келишкен. Мугалим окуучунун эссесин алып, аны плагиат текшерүүчүсүнө киргизет. Кээ бир учурларда, бүтүндөй бир мектеп плагиатты текшерүү программасын колдонууга лицензия берет. Студенттер эссеге кайрылып жатканда, алгач эссени плагиатты текшерүү программасына жөнөтүшү керек. Мугалимге программа эмнени билдирери тууралуу маалымат берилет.

Тилекке каршы, бул плагиатты текшерүүчү программалар эмне деп айтканына өтө этият болушуңуз керек. Бул билдирилген көрсөткүчтөрдүн жарактуу экендигин эске алуу керек. Жогоруда айтылгандай, чыгарманын көчүрүлгөнүн аныктоо мүмкүнчүлүгү тумандуу болушу мүмкүн. Эгерде сиз текшерүү программасынын жыйынтыгын ойлонбой эле кабыл алсаңыз, анда сиз студентти көчүрүп алган деп жалган жалаа жабышыңыз мүмкүн. Бул адамдын жанын кыйнашы мүмкүн.

Улантуу менен, биз генеративдик AI натыйжаларын сыноо чөйрөсүндө плагиатты текшерүү программаларын колдонууга аракет кылсак болот. Генеративдик AI колдонмосунан чыгарылган эсселерге аны студент жазгандай мамиле кылыңыз. Андан кийин биз плагиат текшерүүчүсү эмне дейт деп эсептейбиз. Бул туз дан менен жасалат.

Жакында жүргүзүлгөн изилдөөлөр бар, бул салыштыруулардын түрлөрүн генеративдик AI контекстинде дал ушул мода менен иштетүүгө аракет кылган. Мен сиз менен кээ бир кызыктуу табылгаларды карап кетким келет.

Биринчиден, кээ бир кошумча фон талап кылынат. Генеративдик AI кээде LLM (чоң тил моделдери) же жөн эле LM (тил моделдери) деп аталат. Экинчиден, ChatGPT GPT-3.5 деп аталган башка OpenAI генеративдик AI пакетинин версиясына негизделген. GPT-3.5ке чейин GPT-3, андан мурда GPT-2 болгон. Бүгүнкү күндө GPT-2 кийинки серияларга салыштырмалуу бир топ примитивдүү деп эсептелет жана биз баарыбыз GPT-4тин жакындап келе жаткан ачылышын чыдамсыздык менен күтүп жатабыз, менин талкуумду караңыз бул жерде шилтеме.

Мен кыскача изилдегим келген изилдөө GPT-2ди изилдөөдөн турат. Муну түшүнүү маанилүү, анткени биз азыр GPT-2 мүмкүнчүлүктөрүнөн ашып кеттик. Бул GPT-2 анализинин натыйжалары боюнча эч кандай чукул жыйынтык чыгарбаңыз. Ошого карабастан, биз GPT-2 баалоодон көп нерсеге үйрөнө алабыз. Изилдөө “Тил моделдери плагиат кылабы?” деп аталат. Джуюнг Ли, Тай Ле, Цзинхуй Чен жана Донгвон Ли тарабынан, ACM WWW '23, 1–5-май, 2023-жыл, Остин, Техас, АКШ.

Бул алардын негизги изилдөө суроосу:

"ЛМдер канчалык деңгээлде (жаттоо менен эле чектелбестен) өздөрүнүн машыгуу үлгүлөрүндөгү фразаларды же сүйлөмдөрдү колдонушат?"

Алар потенциалдуу плагиаттын бул үч деңгээлин же категорияларын колдонушкан:

"Сөзмө-сөз плагиат: сөздөрдүн же сөз айкаштарынын трансформациясыз так көчүрмөлөрү."
"Прафразалык плагиат: синонимдик алмаштыруу, сөздү кайра иреттөө жана/же кайра которуу."
"Идея плагиаты: Негизги мазмунду узартылган формада көрсөтүү."

GPT-2 чындыгында Интернет маалыматтары боюнча үйрөтүлгөн, ошондуктан анализдин бул түрү үчүн ылайыктуу талапкер:

"GPT-2 8 миллион Reddit шилтемесинен алынган 45 миллиондон ашык документтерди камтыган WebText боюнча алдын ала даярдалган. OpenAI WebTextти ачык чыгарбагандыктан, биз OpenWebText колдонобуз, бул WebText корпусунун ачык булактуу рекреациясы. Ал мурунку адабияттар тарабынан ишенимдүү колдонулган».

Изилдөөдөн алынган негизги жыйынтыктар төмөнкүлөрдөн турат:

"Биз алдын ала даярдалган GPT-2 үй-бүлөлөрү OpenWebTextден плагиат жасаарын аныктадык."
"Биздин жыйынтыктар көрсөткөндөй, тактоо OpenWebTextтен сөзмө-сөз плагиат учурларын кыйла азайтат."
«Карлини жана башкалар менен дал келет. жана Карлини ж.б., биз чоңураак GPT-2 моделдери (чоң жана xl) көбүнчө кичинекейлерине караганда плагиаттык ырааттуулуктарды жаратаарын көрөбүз.
"Бирок, ар кандай LMлер плагиаттын ар кандай үлгүлөрүн көрсөтүшү мүмкүн, ошондуктан биздин натыйжалар башка LMлерге, анын ичинде GPT-3 же BLOOM сыяктуу акыркы LMлерге түздөн-түз жалпыланбашы мүмкүн."
"Мындан тышкары, автоматтык плагиат детекторлорунун көптөгөн ката режимдери бар экени белгилүү (жалган негативдерде да, жалган позитивтерде да).
"ЛМдин окутуу маалыматтарынын көпчүлүгү интернеттен мазмун ээлерине билдирбестен алынып салынганын эске алсак, алардын сөздөрдү, фразаларды жана атүгүл негизги идеяларды окуу топтомдорунан түзүлгөн тексттерге кайталоосу этикалык мааниге ээ."

Бизге, албетте, ушул сыяктуу дагы көп изилдөө керек.

Эгер сиз GPT-2нин GPT-3 менен маалыматтарды окутууда кандайча салыштырарын билгиңиз келсе, анда бир кыйла айырмачылык бар.

Кабарланган көрсөткүчтөр боюнча, GPT-3 үчүн маалымат окутуу алда канча кенен болгон:

«Модель интернеттен алынган тексттик базаларды колдонуу менен үйрөтүлгөн. Бул китептерден, веб-тексттерден, Wikipediaдан, макалалардан жана интернеттеги башка жазуулардан алынган 570 ГБ маалымат камтылган. Тагыраак айтканда, системага 300 миллиард сөз кошулган» (BBC Science Focus журналы, "ChatGPT: OpenAIдин GPT-3 куралы жөнүндө билишиңиз керек болгон нерселердин баары" Алекс Хьюз, февраль 2023).

GPT-3 үчүн берилиштерди окутуунун тереңирээк сүрөттөмөсүнө кызыккандарыңыз үчүн, бул жерде GitHub сайтында жайгаштырылган расмий GPT-3 моделдик картасынан үзүндү (акыркы жаңыртылган датасы 2020-жылдын сентябрында көрсөтүлгөн):

“GPT-3 окуу маалымат топтому интернетке жайгаштырылган тексттен же интернетке жүктөлгөн тексттен (мисалы, китептерден) турат. Ал үйрөтүлгөн жана ушул күнгө чейин бааланган интернет маалыматтары төмөнкүлөрдү камтыйт: (1) CommonCrawl маалымат топтомунун версиясы, жогорку сапаттагы маалымдама корпусуна окшоштугунун негизинде чыпкаланган, (2) Webtext маалымат топтомунун кеңейтилген версиясы, (3) ) эки интернетке негизделген китеп корпусу жана (4) англис тилиндеги Wikipedia.”
«Окутуу маалыматтарын эске алганда, GPT-3тин натыйжалары жана көрсөткүчтөрү вербалдык, санариптик эмес маданиятка баткандарга караганда интернетке туташкан калкты көбүрөөк чагылдырат. Интернетке туташкан калк өнүккөн өлкөлөрдүн өкүлү, бай, жаш жана эркек көз карашта жана негизинен АКШга жакын. Өнүккөн өлкөлөрдөгү бай мамлекеттер жана калктар интернеттин көбүрөөк киришин көрсөтүп жатышат. Санариптик гендердик ажырым дүйнө жүзү боюнча интернетте көрсөтүлгөн аялдардын азыраак экенин көрсөтүп турат. Кошумчалай кетсек, дүйнөнүн ар кайсы бөлүктөрүндө интернетке кирүү жана кирүү деңгээли ар кандай болгондуктан, маалымат топтому азыраак байланышкан жамааттарды көрсөтөт.

GPT-3 жөнүндө жогоруда келтирилген көрсөтмөлөрдөн бир нерсе, генеративдик AI жасагандардын эң негизги эрежеси - сиз канчалык көп Интернет маалыматын сканерлесеңиз, генеративдик AIди жакшыртуу же өркүндөтүү ыктымалдыгы жогорулайт.

Сиз муну эки жолдун бири менен карай аласыз.

1) AI жакшыртылды. Бизде мүмкүн болушунча көп Интернетте сойлоп жүргөн генеративдик AI болот. Кызыктуу натыйжа - генеративдик AI мурункуга караганда жакшыраак болот. Бул чыдамсыздык менен күтө турган нерсе.
2) Потенциалдуу копиялоо. Интернетти сканерлөөнүн мындай кеңейиши плагиат жана автордук укуктун бузулушуна байланыштуу көйгөйдү чоңураак жана чоңураак кылууда. Мурда көп мазмун жаратуучулар таасир этпеген болсо, көлөмү гүлдөп баратат. Эгер сиз контентти жаратуучулар тарапта юрист болсоңуз, бул сиздин көзүңүзгө жаш алып келет (балким, коркуу же кубанычтын көз жашы, бул соттук териштирүүдө кандай келечекке алып келет).

Стакан жарымы толдубу же жарымы бошпу?

Сиз чечесиз.

Мыйзамдуу миналар күтүүдө

Сизди ойлондуруп жаткан суроо - бул сиздин жайгаштырылган Интернет мазмунуңуз сканерден өтүү үчүн адилеттүү оюн болуп саналабы? Эгерде сиздин мазмунуңуз төлөм дубалынын артында болсо, анда ал сканерлөө үчүн максаттуу эмес, анткени төлөм дубалынын күчүнө жараша ага оңой жетүүгө болбойт.

Менин оюмча, күнүмдүк адамдардын көбү өз мазмунун төлөм дубалынын артына катып коюшпайт. Алар өздөрүнүн мазмуну жалпыга жеткиликтүү болушун каалашат. Эл аны карап калат деп ойлошот.

Мазмунуңуздун жалпыга ачык болушу аксиоматикалык түрдө сиз аны маалымат үйрөтүлүп жаткан генеративдик AI тарабынан колдонуу үчүн сканерден өтүүгө макул экениңизди билдиреби?

Балким Ооба балким жок.

Бул сиздин көзүңүзгө көрүнгөн юридикалык маселелердин бири.

Мурда айтылгандарга кайтуу Блумберг Мыйзамы макалада, авторлор көптөгөн веб-сайттар менен байланышкан Жоболордун жана Шарттардын (Т&С) маанилүүлүгүн белгилешет:

"Мыйзамдуу мина - маалыматтарды кырып салуу үчүн онлайн ботторду иштеткен AI компаниялары тарабынан байкалбаган - бардык типтеги коомдук веб-сайттарда кеңири жеткиликтүү болгон Жобо жана Шарттарда жашырылган. Учурда чечилбеген интеллектуалдык менчик мыйзамынан жана автордук укук бузуу дилеммасынан айырмаланып, веб-сайттын Жоболору жана шарттары жакшы түзүлгөн келишим мыйзамы менен бекемделет жана адатта жетиштүү сандагы прецеденттерге таянуу менен сотто колдонулушу мүмкүн.

Алар сиздин веб-сайтыңызда лицензияга байланыштуу баракча бар деп эсептесеңиз, анда сиз стандартташтырылган заманбап шаблонду колдонсоңуз, анда ал маанилүү пунктту камтышы мүмкүн:

"Демек, веб-сайттар үчүн көпчүлүк жоболор жана шарттар (акысыз жеткиликтүү) маалыматтарды автоматтык түрдө кырып салууга тыюу салган пунктту камтыйт. Таң калыштуусу, мындай эркин жеткиликтүү калыптар ChatGPT тренинги үчүн колдонулган болушу мүмкүн. Ошондуктан, контент ээлери өздөрүнүн Жоболорун жана шарттарын карап чыгып, веб-сайт ээсинин алдын ала жазуу жүзүндөгү уруксатысыз, кол менен же автоматтык түрдө чогултулган же AI окутуу үчүн веб-сайттардагы мазмунду колдонууга толугу менен тыюу салган өзүнчө пункт киргизиши мүмкүн. .”

Кошумча кикер алардын веб-сайттары боюнча мазмун жаратуучуларынын мүмкүн болуучу аракеттерин талдоодо камтылган:

«Ошондуктан, жараксыз деген берененин ар бир бузулушу үчүн мыйзамдуу түрдө жоюлган зыяндын ордун толтуруу жобосун киргизүү, анын жемиштерин берүүгө ынтызар болбогон чыгармачыл мазмундун авторлору үчүн алгылыктуу чечим болушу мүмкүн. AI окутуу максаттары үчүн интеллектуалдык эмгек, ал үчүн акы төлөнбөстөн же, жок эле дегенде, алардын иши үчүн татыктуу баа берилбестен.

Бул тууралуу адвокатыңыз менен кеңешүүнү кааласаңыз болот.

Айрымдардын айтымында, бул AI жаратуучуларга мазмун жаратуучулар мазмунун коргоого абдан олуттуу карашат деп айтуунун маанилүү жолу. Лицензияңызда туура формулировка бар экенине ынануу, AI жасоочуларга эскертүү бергендей көрүнөт.

Башкалары болсо да, бир аз начар. Алар капаланып, сиз веб-сайтыңызга эң катаал жана эң коркунучтуу юридикалык тилди киргизе аласыз деп айтышат, бирок акырында AI жасоочулар аны сканерлешет. Алардын мындай кылганын билбейсиң. Сенде алардын кылганын далилдеген бир шайтан болот. Алардын натыйжалары сиздин мазмунуңузду чагылдырарын байкай албайсыз. Бул сиз жеңе албай турган чоң күрөш.

Каршы аргумент - сиз согуш баштала электе эле багынып берип жатасыз. Эгерде сизде жок дегенде жетиштүү юридикалык тил жок болсо, жана эгер сиз аларды кармасаңыз, алар ар кандай жоопкерчиликтен кутулуу үчүн тырмышып, шылкыйып кетишет. Мунун баары мыйзамдын туура түрүн жарыялабаганыңыздан улам.

Ошол эле учурда, тартууну көздөп жаткан дагы бир ыкма турат белги сиздин веб-сайтыңыз генеративдик AI тарабынан сканерленбеши керек деген нерсе менен. Идея стандартташтырылган маркер иштелип чыгат. Вебсайттар өз сайтына маркерди кошушу мүмкүн. AI жасоочуларга белгиленген веб-сайттарды өткөрүп жиберүү үчүн маалыматтарды сканерлөөсүн өзгөртүү керек деп айтышат.

Маркердик ыкма ийгиликтүү болушу мүмкүнбү? Кооптонуулар маркерлерди алуу жана жайгаштыруу боюнча чыгымдарды камтыйт. AI жасоочулар маркерлерге баш ийеби жана алар белгиленген сайттарды сканерлөөдөн алыс болушуна кепилдик береби. Дагы бир перспектива, AI жасоочулар белгилер менен келишпесе дагы, бул сотко кайрылуу жана мазмун жаратуучусу AI сканерлөө үчүн акыркы миляны басып өттү деп талашуу үчүн дагы бир далил болот.

Ооба, мунун баары башыңды айлантат.

жыйынтыктоо

Бул курч тема боюнча бир нече акыркы эскертүүлөр.

Сиз плагиат жана автордук укукту бузуучу дилемма катары ушул бүт AI боюнча акыл-эсти ийкемдүү көз карашка даярсызбы?

Плагиат же автордук укукту бузуу актысында генеративдик AI "кармап алуу" жөнүндө божомолдордун көпчүлүгү абдан окшош маалыматтарды окутуу учурунда сканерден өтүшү мүмкүн болгон Интернеттеги мазмун сыяктуу мурунку иштер.

Бул жерде бөлүү жана жеңүү амалы ойноп жатат дейли.

Мына, мен деген эмне.

Эгерде генеративдик AI бул жерден бир аз жана ал жерден кичинекей бит алса, акыры аларды кандайдыр бир конкреттүү продукцияны өндүрүү үчүн аралаштырса, анда алуу учуруна ээ болуу мүмкүнчүлүгү абдан азаят. Кандайдыр бир өндүрүш белгилүү бир булактан алынган деп так айта турган жетиштүү чекке көтөрүлбөйт. Натыйжадагы эссе же чыгаруунун башка режимдери бөлүкчө гана дал келет. Жана адаттагыдай эле плагиат же автордук укук бузулган деп талашууга аракет кылуу менен, сиз адатта ойноп жаткан кичинекей кичинекей биттен көп нерсени көрсөтүшүңүз керек, айрыкча, эгерде бул тиштешүү көрүнүктүү болбосо жана Интернетте кеңири кездешсе. ыйгарып алуу фактысын далилдөөчү ар кандай адекваттуу жүк).

Сиз дагы эле генеративдик AI тарабынан берилиштерди окутуу веб-сайттарды жана мазмун жаратуучуларды кыйратты деп ынандыра аласызбы, атүгүл сунушталган далил олуттуу эмес пропорция болсо да?

Бул тууралуу ойлонуп көрөлү.

Эгерде биз масштабдуу түрдө плагиатка жана автордук укуктун бузулушуна туш болсок, плагиат жана/же автордук укуктун бузулушу деген эмне экенин аныктоого болгон мамилебизди өзгөртүүгө туура келиши мүмкүн. Балким, негизги же чоң түрдө плагиат же автордук укуктун бузулушу үчүн жасалган иш бар. Миңдеген же миллиондогон майда-барат үзүндүлөрдөн турган мозаиканы мындай бузууларды жасоо деп түшүнсө болот. Көрүнүп турган кыйынчылык - бул ар кандай мазмунду күтүлбөгөн жерден бузуулардын чатырына алып келиши мүмкүн. Бул тайгалак болушу мүмкүн.

Оор ойлор.

Легендарлуу жазуучу Лев Толстой чоң ойлорду айтып: «Жашоонун бирден-бир мааниси – адамзатка кызмат кылуу» деп айткан.

Эгер сиздин веб-сайтыңыз жана башкалардын веб-сайттары AIны өркүндөтүү үчүн сканерден өтсө жана сиз ал үчүн бир тыйын албай жатсаңыз, сиз адамзаттын келечегине өз салымыңызды кошуп жатасыз деген жалындуу ишеним менен жубата аласызбы? Бул төлөө үчүн бир аз баа окшойт.

Ооба, эгерде AI бардык адамдарды жок кылуучу коркунучтуу экзистенциалдык коркунуч болуп чыкпаса. Сиз бул үчүн кредит албашыңыз керек. Менин оюмча, сиз бул коркунучтуу натыйжага салым кошпойсуз. Бул каргашалуу божомолду четке кагып, эгер AI жасоочулар өздөрүнүн генеративдик AIларынан акча таап жатышса жана алар пайда табуудан ырахаттанып жатса, сиз да пирогтун бир бөлүгүн алышыңыз керек деп ойлошуңуз мүмкүн. Бөлүшүү жана бирдей бөлүшүү. AI жасоочулар каалаган веб-сайтты сканерлөө үчүн уруксат сурап, андан кийин сканерден өтүүгө уруксат берилгендиги үчүн төлөнүүчү бааны сүйлөшүшү керек.

Кредит керек болгон жерде кредит бериңиз.

Келгиле, сэр Уолтер Скоттко азыр акыркы сөздү айталы: “ Оо, биз кандай чырмалышкан желе токуп жатабыз. Биринчи жолу алдаганга машыгабыз».

Бул, балким, эгер сиз алдамчылык жүрүп жатат деп ишенсеңиз, же баары жакшы, так жана мыйзамдуу деп ойлосоңуз, колдонулбайт. Сураныч, бул жөнүндө ойлонгонуңуз үчүн марттык менен өзүңүздүн ишенимиңизди бериңиз. Сиз татыктуусуз.

Source: https://www.forbes.com/sites/lanceeliot/2023/02/26/legal-doomsday-for-generative-ai-chatgpt-if-caught-plagiarizing-or-infringing-warns-ai-ethics- жана-ai-law/