Бул Ultra Light AI модели телефонуңузга туура келет жана ChatGPTти жеңе алат

Майкрософт бүгүн ал "эң жөндөмдүү жана үнөмдүү чакан тил моделдерин (SLM)" чыгарды деп ырастап, Phi-3 - анын Phi чакан тил моделдеринин (SLMs) үй-бүлөсүнүн үчүнчү итерациясы - салыштырмалуу өлчөмдөгү моделдерден жана бир нече чоңураак.

Чакан тил модели (SLM) - бул тилге байланыштуу конкреттүү тапшырмаларды аткарууда өтө натыйжалуу болууга арналган AI моделинин бир түрү. Кеңири жалпы тапшырмаларга ылайыкталган Чоң тил моделдеринен (LLMs) айырмаланып, SLMлер конкреттүү колдонуу учурлары үчүн аларды натыйжалуураак жана үнөмдүү кылуу үчүн чакан маалымат топтомуна курулган.

Phi-3 ар кандай версияларда келет, деп түшүндүрдү Microsoft, эң кичинеси Phi-3 Mini, 3.8 триллион токенге үйрөтүлгөн 3.3 миллиард параметр модели. Салыштырмалуу түрдө кичинекей болгонуна карабастан — Llama-3 корпусунун салмагы 15 триллиондон ашык маалыматтарды камтыйт — Phi-3 Mini дагы эле контексттин 128 миң токенин иштетүүгө жөндөмдүү. Бул аны GPT-4 менен салыштырууга болот жана токен сыйымдуулугу жагынан Llama-3 жана Mistral Largeди жеңет.

Башкача айтканда, Meta.aiдеги Llama-3 жана Mistral Large сыяктуу AI бегемоттору бул жеңил модель күрөшө баштаганга чейин узак баарлашуудан кийин кыйрап калышы мүмкүн.

Phi-3 Miniнин эң маанилүү артыкчылыктарынын бири - бул кадимки смартфонго туура келүү жана иштетүү. Microsoft моделди iPhone 14те сынап көрдү жана ал эч кандай көйгөйсүз иштеп, секундасына 14 токенди жаратты. Phi-3 Mini иштетүү үчүн 1.8 ГБ VRAM гана талап кылынат, бул аны көбүрөөк багытталган талаптары бар колдонуучулар үчүн жеңил жана натыйжалуу альтернатива кылат.

Phi-3 Mini жогорку деңгээлдеги кодерлерге же кеңири талаптары бар адамдарга ылайыктуу болбосо да, ал өзгөчө муктаждыктары бар колдонуучулар үчүн эффективдүү альтернатива боло алат. Мисалы, чатботко муктаж болгон стартаптар же маалыматтарды талдоо үчүн LLMди колдонгон адамдар Phi-3 Miniди маалыматтарды уюштуруу, маалымат алуу, математикалык ой жүгүртүү жана агенттерди куруу сыяктуу тапшырмалар үчүн колдоно алышат. Моделге интернетке кирүү мүмкүнчүлүгү берилсе, ал реалдуу убакыттагы маалымат менен мүмкүнчүлүктөрдүн жетишсиздигин толуктап, абдан күчтүү болуп калышы мүмкүн.

Phi-3 Mini жогорку тесттик упайларга жетишет, анткени Microsoft өзүнүн берилиштер топтомун мүмкүн болушунча пайдалуу маалымат менен түзүүгө багытталган. Кеңири Phi үй-бүлөсү, чындыгында, фактылык билимди талап кылган тапшырмалар үчүн жакшы эмес, бирок жогорку ой жүгүртүү жөндөмдөрү аларды негизги атаандаштарынан жогору коюшат. Phi-3 Medium (14 миллиарддык параметр модели) ырааттуу түрдө GPT-3.5 сыяктуу күчтүү LLMлерди жеңет - ChatGPT'тин акысыз версиясын иштеткен LLM - жана Мини версиясы синтетикалык көрсөткүчтөрдүн көпчүлүгүндө Mixtral-8x7B сыяктуу күчтүү моделдерди жеңет.

Белгилей кетсек, Phi-3 анын мурунку Phi-2 сыяктуу ачык булак эмес. Анын ордуна, бул а ачык модель, ал жеткиликтүү жана колдонууга жеткиликтүү дегенди билдирет, бирок ал Phi-2 сыяктуу ачык булак лицензиясына ээ эмес, бул кеңири колдонууга жана коммерциялык колдонмолорго мүмкүндүк берет.

Жакынкы жумаларда Microsoft Phi-3 үй-бүлөсүндө, анын ичинде Phi-3 Small (7 миллиард параметр) жана жогоруда айтылган Phi-3 Medium дагы моделдерин чыгара турганын билдирди.

Microsoft Phi-3 Mini Azure AI Studio, Hugging Face жана Ollamaда жеткиликтүү кылды. Модель нускама менен туураланган жана Windows DirectML колдоосу менен ONNX Runtime үчүн оптималдаштырылган, ошондой эле ар кандай GPU, CPU жана ал тургай мобилдик жабдыктарда кайчылаш платформа колдоосу менен.

Крипто жаңылыктарынан кабардар болуңуз, почтаңызга күн сайын жаңыртууларды алыңыз.

Булак: https://decrypt.co/227974/microsoft-phi-3-mini-small-ai-language-model