Wat ik mis in de meeste analyses is de censuur kant van dit soort modellen. Die algoritmes lijken me niet waardenvrij. In hoeverre is dat controleerbaar?
Hi Jarno, even voor de volledigheid en fact-check: DeepSeek is NIET volledig open source. Om volledig open source te zijn, zijn de volgende karakteristieken nodig (schrijft de gerespecteerde en kritische AI-wetenschapper Timnit Gebru op Linkedin:
Friends, for something to be open source, we need to see
1. The data it was trained and evaluated on
2. The code
3. The model architecture
4. The model weights.
DeepSeek only gives 3 and 4. And I'll see the day that anyone gives us #1 without being forced to do so, because all of them are stealing data.
Volgens mij is het zelfs MIT open source… Een MIT-gelicentieerd taalmodel kun je vrij gebruiken, aanpassen, finetunen, distribueren en zelfs commercieel inzetten zonder beperkingen. Je mag het integreren in je eigen software en verkopen, zolang je de originele licentie en auteursvermelding behoudt. Er zijn daarbij geen verplichtingen om je eigen wijzigingen open-source te maken, maar het model wordt “as is” geleverd zonder garantie of aansprakelijkheid.
He Jarno, mooi overzicht zo! Nog een vraag: hoe "veilig" is gebruik van DeepSeek? Ik zie ook berichten langskomen dat het model alle gesprekken kan opslaan en gebruiken voor hertrainen, ook als je hem on-premise hebt draaien. Dat er Chinese backdoors in de code zijn gevonden.
Wat ik mis in de meeste analyses is de censuur kant van dit soort modellen. Die algoritmes lijken me niet waardenvrij. In hoeverre is dat controleerbaar?
Hi Jarno, even voor de volledigheid en fact-check: DeepSeek is NIET volledig open source. Om volledig open source te zijn, zijn de volgende karakteristieken nodig (schrijft de gerespecteerde en kritische AI-wetenschapper Timnit Gebru op Linkedin:
Friends, for something to be open source, we need to see
1. The data it was trained and evaluated on
2. The code
3. The model architecture
4. The model weights.
DeepSeek only gives 3 and 4. And I'll see the day that anyone gives us #1 without being forced to do so, because all of them are stealing data.
-
https://www.linkedin.com/posts/timnit-gebru-7b3b407_friends-for-something-to-be-open-source-activity-7290232331468967936-6vea
Lees hier meer over de 'officiele definitie van OSAI:
https://www.technologyreview.com/2024/08/22/1097224/we-finally-have-a-definition-for-open-source-ai/
Volgens mij is het zelfs MIT open source… Een MIT-gelicentieerd taalmodel kun je vrij gebruiken, aanpassen, finetunen, distribueren en zelfs commercieel inzetten zonder beperkingen. Je mag het integreren in je eigen software en verkopen, zolang je de originele licentie en auteursvermelding behoudt. Er zijn daarbij geen verplichtingen om je eigen wijzigingen open-source te maken, maar het model wordt “as is” geleverd zonder garantie of aansprakelijkheid.
Hoe weeg je de beperking in onderwerpen waarop Deepseek bevraagd kan worden? Bij Oeigoetrn of Falun Gong valt-ie stil.
He Jarno, mooi overzicht zo! Nog een vraag: hoe "veilig" is gebruik van DeepSeek? Ik zie ook berichten langskomen dat het model alle gesprekken kan opslaan en gebruiken voor hertrainen, ook als je hem on-premise hebt draaien. Dat er Chinese backdoors in de code zijn gevonden.
Is dit speculatie of zijn het reële angsten?