Terwijl de AI-fluencers over elkaar buitelen om te ‘bewijzen’ hoe goed DeepSeek presteert vergeet iedereen de belangrijkste vraag te stellen.
𝗛𝗼𝗲 𝗱𝗮𝗻?
Want terwijl Trump en z’n 𝘧𝘪𝘳𝘴𝘵 𝘭𝘢𝘥𝘺 Musk 500 miljard uittrekken om in AI te investeren heeft DeepSeek volgens de info die tot ons komt nog geen 6 miljoen uitgegeven aan het trainen van het R1 model.
𝗘𝗻 𝗱𝗮𝗮𝗿 𝗴𝗮𝗮𝘁 𝗵𝗲𝘁 𝗮𝗹 𝗳𝗼𝘂𝘁.
Want de trainingsdata hebben ze al veel eerder gebruikt, oa voor V3 van hun model en ook het proces tot het R1 model is niet iets ‘van een paar dagen’. Dus, hoe zit het dan echt?
Sancties maken het onmogelijk om in China op grote schaal modellen te trainen en ontwikkelen en dus moesten de wetenschappers slimmer om gaan met de beschikbare GPU’s. Hiervoor hebben ze de wijze waarop ze om gaan met voorspellingen (die uiteindelijk je antwoord genereren) efficienter moeten maken. Ook ontdekten ze dat garbage-in-is-garbage-out dus gebruiken ze een kwalitatief goede dataset. Het opknippen van de dataset, load balancing, dat soort dingen. (ik deel straks het inhoudelijke verhaal in een video)
Dat het trainen zo goedkoop is, heeft te maken met de experimentele aard, de efficiency en het Temu-AI-effect. Het is nu eenmaal goedkoper om dingen te (laten) doen in China. Veel goedkoper.
𝗛𝗼𝗲 𝗶𝗸 𝗱𝗶𝘁 𝘄𝗲𝗲𝘁?
Nou, ze publiceren hun bevindingen al een poos net als hun model. Dus in tegenstelling tot de Grote Amerikaanse Concurrenten is het model open source (en op basis van andere open source modellen!) en de tot totstandkoming gepubliceerd. Oa een YouTube video die Barry mij toestuurde gaf antwoord op de vraag ‘hoe dan’. Voor mij de vraag die niemand stelt dus.
𝗗𝘂𝘀 𝗢𝗽𝗲𝗻𝗔𝗜 𝗲𝗻 𝗻𝗩𝗶𝗱𝗶𝗮 𝗴𝗮𝗮𝗻 𝗲𝗿 𝗻𝘂 𝗱𝘂𝘀 𝗮𝗮𝗻?
Nog zo’n AI-fluencer onzin kreet: nee, daarom dat Sam Altman ook zo enorm chill reageerde. Die kent dit model al, die snapt hoe open source werkt en zit waarschijnlijk alleen maar te balen dat zijn mensen hier niet zelf op gekomen zijn. Check de nVidia koers maar, die ‘bloedneus’ was al snel gestelpt, qua beurswaarde.
𝗜𝗻𝗻𝗼𝘃𝗮𝘁𝗶𝗲 𝗲𝗻 𝗲𝘃𝗼𝗹𝘂𝘁𝗶𝗲
Kicken dus, dat DeepSeek R1 model. Want het is daadwerkelijk goed en snel. En voor nu gratis. Wel even nadenken aan wie je je data geeft en je vragen stelt, want hoewel de onderzoekers met goede intenties en open source handelen heeft elk Chinees bedrijf te maken met ‘de partij’.
𝗕𝗶𝗮𝘀 𝘃𝘀 𝗖𝗲𝗻𝘀𝘂𝘂𝗿
Het verschil tussen ‘bias’ en ‘censuur’ moet je maar aan je favo AI vragen – mijn tip aan jou is om dus niet meteen al je AI’s te vervangen door DeepSeek (𝘰𝘰𝘬 𝘢𝘭 𝘻𝘰’𝘯 𝘈𝘐-𝘧𝘭𝘶𝘦𝘯𝘤𝘦𝘳 𝘥𝘪𝘯𝘨 𝘰𝘮 𝘵𝘦 𝘳𝘰𝘦𝘱𝘦𝘯), maar meerdere AI’s te gebruiken. Vraag je DeepSeek naar de Amerikaanse verkiezingen en CoPilot naar China en heb je wellicht toch nog antwoord op beide vragen 😉
Erg boeiend artikel! Het idee van DeepSeek en het stellen van de juiste vragen is iets waar veel organisaties nog mee worstelen.