Bahay Balita Ang development ng Deepseek AI ay nagkakahalaga ng $ 1.6 bilyon, ang pag -debunk ng mitolohiya ng kakayahang magamit

Ang development ng Deepseek AI ay nagkakahalaga ng $ 1.6 bilyon, ang pag -debunk ng mitolohiya ng kakayahang magamit

May-akda : Gabriel Update:Apr 21,2025

Gayunpaman, mas mura pa ito kaysa sa mga katunggali nito.

Ang bagong chatbot mula sa Deepseek ay bumati sa akin ng isang nakakaintriga na pagpapakilala:

Kumusta, nilikha ako upang maaari kang magtanong ng anuman at makakuha ng isang sagot na maaaring sorpresa ka.

Ngayon, ang artipisyal na katalinuhan ng Deepseek ay lumitaw bilang isang kakila -kilabot na manlalaro sa merkado, kahit na nagiging sanhi ng isa sa mga pinaka makabuluhang pagbagsak ng presyo ng stock ng NVIDIA.

Pagsubok sa Deepseek Larawan: ensigame.com

Ano ang nagtatakda ng modelong ito ay ang makabagong mga pamamaraan ng arkitektura at pagsasanay. Ang Deepseek ay gumagamit ng maraming mga teknolohiyang paggupit:

Multi-Token Prediction (MTP): Sa halip na hulaan ang isang salita nang sabay-sabay, ang mga modelo ng pagtataya ng maraming mga salita nang sabay-sabay sa pamamagitan ng pagsusuri ng iba't ibang mga bahagi ng isang pangungusap. Ang pamamaraang ito ay makabuluhang nagpapabuti sa parehong kawastuhan at kahusayan ng modelo.

Paghahalo ng mga eksperto (MOE): Ang arkitektura na ito ay gumagamit ng iba't ibang mga neural network upang maproseso ang data ng pag -input. Ang teknolohiya ay nagpapabilis sa pagsasanay sa AI at nagpapabuti sa pagganap. Sa Deepseek V3, 256 Neural Networks ang ginagamit, na may walong naaktibo para sa bawat gawain sa pagproseso ng token.

Multi-head latent pansin (MLA): Ang mekanismong ito ay tumutulong na tumuon sa pinakamahalagang bahagi ng isang pangungusap. Ang MLA ay kumukuha ng mga pangunahing detalye mula sa mga fragment ng teksto nang paulit -ulit sa halip na isang beses lamang, binabawasan ang posibilidad ng nawawalang mahalagang impormasyon. Pinapayagan nito ang AI na makuha ang mga mahahalagang nuances sa data ng pag -input nang mas epektibo.

Ang kilalang Startup ng Tsino na Deepseek ay nagsasabing nakabuo ng isang mapagkumpitensyang modelo ng AI sa kaunting gastos, na nagsasabi na ginugol lamang nila ang $ 6 milyon sa pagsasanay sa malakas na neural network na Deepseek V3 at ginamit lamang ang 2048 graphics processors.

Deepseek v3 Larawan: ensigame.com

Gayunpaman, ang mga analyst mula sa semianalysis ay walang takip na ang Deepseek ay nagpapatakbo ng isang malaking computational infrastructure na binubuo ng humigit -kumulang 50,000 nvidia hopper GPU. Kasama dito ang 10,000 H800 unit, 10,000 mas advanced H100s, at karagdagang mga batch ng H20 GPU. Ang mga mapagkukunang ito ay ipinamamahagi sa maraming mga sentro ng data at ginagamit para sa pagsasanay sa AI, pananaliksik, at pagmomolde sa pananalapi.

Ang kabuuang pamumuhunan ng kumpanya sa mga server ay nagkakahalaga ng halos $ 1.6 bilyon, na may mga gastos sa pagpapatakbo na tinatayang $ 944 milyon.

Ang Deepseek ay isang subsidiary ng Chinese Hedge Fund High-flyer, na nag-iwas sa pagsisimula bilang isang hiwalay na dibisyon na nakatuon sa mga teknolohiya ng AI noong 2023. Hindi tulad ng karamihan sa mga startup na nagrenta ng kapangyarihan ng computing mula sa mga tagapagbigay ng ulap, ang Deepseek ay nagmamay-ari ng sariling mga sentro ng data, na binibigyan ito ng ganap na kontrol sa pag-optimize ng modelo ng AI at pagpapagana ng mas malaking pagpapatupad ng mga makabagong ideya. Ang kumpanya ay nananatiling pondo sa sarili, na positibong nakakaapekto sa kakayahang umangkop at bilis ng paggawa ng desisyon.

Deepseek Larawan: ensigame.com

Bukod dito, ang ilang mga mananaliksik sa Deepseek ay kumita ng higit sa $ 1.3 milyon taun -taon, na umaakit sa nangungunang talento mula sa nangungunang unibersidad ng Tsino (ang kumpanya ay hindi umarkila ng mga dayuhang espesyalista).

Kahit na sa mga salik na ito, ang kamakailang pag -angkin ng Deepseek sa pagsasanay sa pinakabagong modelo nito sa halagang $ 6 milyon ay tila hindi makatotohanang. Ang figure na ito ay tumutukoy lamang sa gastos ng paggamit ng GPU sa panahon ng pre-pagsasanay at hindi account para sa mga gastos sa pananaliksik, pagpipino ng modelo, pagproseso ng data, o pangkalahatang mga gastos sa imprastraktura.

Mula nang ito ay umpisahan, ang Deepeek ay namuhunan ng higit sa $ 500 milyon sa pag -unlad ng AI. Gayunpaman, hindi tulad ng mga mas malalaking kumpanya na pasanin ng burukrasya, ang compact na istraktura ng Deepseek ay nagbibigay -daan sa aktibo at epektibong ipatupad ang mga makabagong AI.

Deepseek Larawan: ensigame.com

Ang halimbawa ng Deepseek ay nagpapakita na ang isang mahusay na pinondohan na independiyenteng kumpanya ng AI ay maaaring makipagkumpetensya sa mga pinuno ng industriya. Gayunpaman, binibigyang diin ng mga eksperto na ang tagumpay ng kumpanya ay higit sa lahat dahil sa bilyun -bilyong pamumuhunan, mga teknikal na tagumpay, at isang malakas na koponan, habang ang pag -angkin tungkol sa isang "rebolusyonaryong badyet" para sa pagbuo ng mga modelo ng AI ay medyo pinalaki.

Gayunpaman, ang mga gastos sa mga kakumpitensya ay mananatiling mas mataas. Halimbawa, ihambing ang gastos ng pagsasanay sa modelo: Ang Deepseek ay gumugol ng $ 5 milyon sa R1, habang ang Chatgpt4O ay nagkakahalaga ng $ 100 milyon.

Mga Trending na Laro Higit pa +
1.1 / 718.00M
0.01 / 352.80M
0.036 / 431.31M
2.1 / 994.20M
Pinakabagong Laro Higit pa +
Palaisipan | 4.70M
Ang 888 Ladies ay isang nangungunang online bingo at casino platform na naghahatid ng magkakaibang pagpili ng mga laro at nakakaengganyo ng mga promo. Dinisenyo gamit ang isang interface ng user-friendly, pinapayagan ng platform ang mga manlalaro na madaling ma-access ang maraming mga silid ng bingo, slot machine, at iba pang mga kapana-panabik na laro sa casino. Kasama ang ligtas at
Palakasan | 57.60M
Dalhin ang iyong Madden NFL 25 na gameplay sa susunod na antas kasama ang opisyal na EA Sports ™ Madden NFL 25 na kasamang app - isang malakas na tool na idinisenyo upang mapanatili kang konektado at kontrolin ang iyong panghuli na karanasan sa koponan at franchise. Kung namamahala ka ng mga auction, pagsubaybay sa iskedyul ng iyong koponan, o pag -unlock ng exclu
Palaisipan | 19.74M
Sumakay sa isang mahabang tula na digital na Odyssey na may pag -atake ng robot na unicorn, kung saan yayakapin mo ang hindi kapani -paniwala na pagsasanib ng futuristic robotics at alamat na kagandahan. I -channel ang iyong panloob na robot na unicorn habang ikaw ay sumasabay sa mga parang tanawin ng panaginip sa pagtugis ng mga fairies, shimmering dolphins, at ang walang katapusang mga beats ng erasure.
Simulation | 121.36M
Ipahayag ang iyong pagkamalikhain at ipakita ang iyong mga talento sa sining ng kuko na may acrylic kuko mod, isang nakaka -engganyong laro ng simulation na nagbibigay -daan sa iyo na magdisenyo at gumawa ng nakamamanghang virtual na kuko ng kuko gamit ang mga acrylic na kuko. Na may malawak na pagpili ng mga kulay, pattern, disenyo, at mga hugis ng kuko, na sinamahan ng mga makatotohanang tool at accesso
Palakasan | 40.00M
Sumakay sa isang nakapupukaw na pakikipagsapalaran sa Lust Trainer RPG, isang natatanging karanasan sa RPG kung saan nakukuha mo, tren, at makisali sa mga matalik na pagtatagpo na may magkakaibang hanay ng mga nilalang. Sa pamamagitan ng [TTPP] kapana -panabik na mga bagong tampok na kasalukuyang nasa pag -unlad - kabilang ang mga nakaka -engganyong pakikipagsapalaran, pinahusay na pag -upgrade, at kaakit -akit
Card | 38.60M
Hakbang pabalik sa oras at maranasan ang walang katapusang kasiyahan ng laro ng Acey Doozy, na ngayon ay pinahusay na may modernong kaginhawaan - lahat sa loob ng isang solong mobile app. I -relive ang kaguluhan at madiskarteng lalim ng Acey Deucey mula mismo sa iyong smartphone, nasa go ka man o nakakarelaks sa bahay. Ilagay ang iyong intuwisyon sa t