
Tas, kas padara DeepSeek īpašu, ir tas, ka tas, acīmredzot, ir daudz lētāks. Lai gan tiek ziņots, ka nozares līderis OpenAI ir iztērējis vairāk nekā 100 miljonus ASV dolāru GPT-4 izstrādei, DeepSeek izstrādāja savu modeli no 6 miljoniem ASV dolāru. Šī izmaksu priekšrocība tika panākta, izmantojot augstas klases Nvidia A100 mikroshēmas kombinācijā ar citiem salīdzinoši lētākiem procesoriem.
Eksperti apgalvo , ka šis skaitlis ir maldinošs, jo tajā nav ņemtas vērā plašākas pētniecības un izstrādes izmaksas, datu iegūšana, personāla izdevumi, infrastruktūras izmaksas un ieguldījumi aparatūrā.
Veiktspēja un funkcijas
Tāpat kā ChatGPT, DeepSeek darbojas, sniedzot atbildes uz jautājumiem, un tas ir salīdzināms ar OpenAI o1 modeli matemātikā un kodēšanā. Tas ir “argumentācijas” modelis, kas domā un reaģē tā, kā to dara cilvēki, padarot to īpaši noderīgu biznesa un klientu apkalpošanas nolūkos.

Performance compared Source: Artificial Analysis Graphic: Jasmine Cui and Joe Murphy / NBC News
Sistēma īpaši labi demonstrē savu argumentācijas procesu problēmas risināšanā, sadalot tās argumentācijas procesu pa posmiem. Tas, tāpat kā cilvēks, kas risina mīklu, var arī izsekot tās loģikai un, ja nepieciešams, labot iepriekšējās darbības.
Šī pārredzamā pieeja ļauj lietotājiem uzzināt, kā tā nāk klajā ar saviem ieteikumiem.
DeepSeek rada ētiskas bažas
DeepSeek pieaugums AI vidē rada svarīgus jautājumus par tā tehnoloģijas sekām, jo īpaši ņemot vērā, ka tas tika apmācīts uz dārgas aparatūras mugurkaula, kas, iespējams, tika izstrādāta, lai izjauktu ASV eksporta kontroli.
Lai gan tā R1 modeļa veiktspēja, kas spēj atkārtot OpenAI o1 funkcionalitāti, bet par nelielu daļu no izmaksām, ir iespaidīga, tas arī atklāj neuzraudzītas vai neētiskas prakses iespējamību AI attīstībā pārējā pasaulē.
Uzņēmuma spēja veiksmīgi iekļaut Nvidia A100 mikroshēmas, kuras iepriekš ierobežoja ASV noteikumi, ir sarkans karogs par uzņēmuma autentiskumu un to, kā šādas tehnoloģijas var izmantot, lai sagrautu starptautisko kārtību.
Turklāt DeepSeek atbildes uz sensitīviem vēsturiskiem notikumiem atbilstība Ķīnas valdības cenzūrai ir satraucoša, jo tā parāda, ka modeli varētu izmantot, lai atbalstītu valsts kontrolētus naratīvus, kas varētu ierobežot modeļa lietderību un uzticamību visā pasaulē.
Tādējādi, tirgiem reaģējot uz šiem šķietamajiem draudiem Amerikas tehnoloģiskajam pārākumam, ir rūpīgi jāanalizē DeepSeek stratēģijas plašākā ietekme – novatoriska, tomēr morāli pamatota.