Alibaba nxjerr modelin e vet të AI-së, thotë se ia kalon DeepSeekut

Kompania kineze e teknologjisë Alibaba ka nxjerrë të mërkurën (më 29.01.2025) një version të ri të modelit të saj të inteligjencës artificiale Qwen 2.5 për të cilin se tejkalonte DeepSeek-V3 tashmë shumë të vlerësuar, ka raportuar agjencia amerikane e lajmeve, Reuters.

Koha e pazakonshme e nxjerrjes në treg të Qwen 2.5-Max, në ditën e parë të Vitit të Ri Hënor, kur shumica e kinezëve janë në pushime dhe me familjet e tyre, tregon presionin që rritja meteorike e startupit kinez të inteligjencës artificiale, DeepSeek në tre javët e fundit është ushtruar jo vetëm ndaj rivalëve jashtë shtetit, por edhe ndaj konkurrencës vendase.

“Qwen 2.5-Max performon më mirë pothuajse në të gjithë bordin GPT-4o, DeepSeek-V3 dhe Llama-3.1-405B”, thuhet në njoftimin e njësisë cloud të Alibabas postuar në llogarinë e zyrtare WeChat, duke iu referuar OpenAI dhe modeleve më të avancuara të inteligjencës artificiale të Meta-s.

Publikimi i 10 janarit i inteligjencës artificiale të DeepSeek, mundësuar nga modeli DeepSeek-V3, si dhe publikimi i modelit të tij R1 më 20 janar, ka tronditur Luginën e Silikonit (në Shtetet e Bashkuara) dhe ka shkaktuar rënien e aksioneve të teknologjisë, me zhvillimin e supozuar të lirë të startupit kinez dhe kostot e përdorimit që i kanë bërë investitorët të vënë në dyshim planet e mëdha të shpenzimeve nga firmat kryesore të AI në Shtetet e Bashkuara.

Por suksesi i DeepSeek ka nxitur gjithashtu përplasje midis konkurrentëve të tij vendas për të përmirësuar modelet e tyre të inteligjencës artificiale.

Dy ditë pas lëshimit të DeepSeek-R1, pronari i TikTok, ByteDance publikoi një përditësim të modelit të tij të inteligjencës artificiale, për të cilin pretendoi se ishte më i mirë se O1 i OpenAI, mbështetur nga Microsoft në AIME, një test standard që mat se sa mirë modelet e AI kuptojnë dhe u përgjigjen udhëzimeve komplekse.

Kjo i dha jehonë pretendimit të DeepSeek se modeli i tij R1 rivalizonte o1 të OpenAI në disa standarde të performancës.

DeepSeek karshi konkurrentëve vendas

Paraardhësi i modelit V3 të DeepSeek, DeepSeek-V2, nxiti luftë çmimesh të modelit të AI në Kinë pas publikimit majin e kaluar.

Fakti që DeepSeek-V2 ishte me burim të hapur dhe jashtëzakonisht të lirë, vetëm 1 juan (0,14 dollarë) për 1 milion argumente – ose njësi të të dhënash të përpunuara nga modeli i AI – bëri që njësia cloud e Alibabas të shpallte ulje çmimi deri në 97% në gamën e modeleve.

Kompanitë e tjera kineze të teknologjisë ndoqën të njëjtin shembull, duke përfshirë Baidu (9888.HK), me nxjerrjen e ekuivalentit të parë të Kinës me ChatGPT në mars 2023 dhe kompanisë më të vlefshme të internetit në vend Tencent.

Liang Wenfeng, themeluesi enigmatik i DeepSeek, ka deklaruar në një intervistë të rrallë mepër mediumin kinez Waves në korrik se startupit “nuk i interesonte” lufta e çmimeve dhe se arritja e AGI (inteligjencës së përgjithshme artificiale) ishte qëllimi i saj kryesor.

OpenAI e përcakton AGI-në si sisteme autonome që i tejkalojnë njerëzit në detyrat më të vlefshme ekonomikisht.

Ndërsa kompanitë e mëdha kineze të teknologjisë si Alibaba kanë qindra mijëra punonjës, DeepSeek funksionon si një laborator kërkimor, i pajisur kryesisht nga të rinj të diplomuar dhe studentë të doktoratës nga universitetet më të mira kineze.

Liang ka theksuar në intervistën e tij të korrikut se beson se kompanitë më të mëdha të teknologjisë në Kinë mund të mos ishin të përshtatshme për të ardhmen e industrisë së AI-së, duke krahasuar kostot e tyre të larta dhe strukturat e komandimit nga lart-poshtë me funksionimin e dobët të DeepSeek dhe stilin më të butë të menaxhimit.

“Modelet e mëdha themelore kërkojnë inovacion të vazhdueshëm, aftësitë e gjigantëve të teknologjisë kanë limitet e tyre”, ka deklaruar ai.

Alibaba nxjerr modelin e vet të AI-së, thotë se ia kalon DeepSeekut

KATEGORITË