10/12/2024, 10:56
Note : Un Dataset, c'est l'ensemble des informations qui vont servir à l'entraînement d'un modèle d'IA.
Je suis d'accord avec tout ce que tu dis, sauf pour la politesse.
C'est un vol monstrueux, il n'y a aucun doute là-dessus. Mais je m'inquiète plus du tri qui a été fait, c'est-à-dire de ce qui n'a pas été volé pour des raisons politiques/idéologiques/religieuses etc.
Autrement dit, ce qui m’inquiète le plus ce n'est pas que Mr Dupont se soit fait piller ses oeuvres, mais plutôt que Mr Durand ait été volontairement enlevé du Dataset.
Ce problème de censure touche autant les LLM que les IA génératives d'images.
Et c'est là où je suis d'accord sur " n'est pas un outil neutre politiquement et écologiquement ". Non, il ne l'est pas :
- par nature : Toute l'information disponible n'est jamais que l'information disponible à un temps donné.
- par biais technique : L'information du Dataset a été sélectionnée sur des critères, soit techniques, soit humain.
Pour ce qui est des métiers, là aussi, parfaitement d'accord. J'irais même plus loin en disant que c'est une catastrophe qui monte petit à petit pour beaucoup de métiers (le mien notamment), et c'est déjà là.
Voici un exemple très concret :
Depuis des années (+20 ans), je donne des cours de programmation.
Au dernier TP, les élèves ont un rendu à faire de leur code.
Les élèves attendent toujours le dernier TP pour se rendre compte qu'ils sont à la ramasse et donc, normalement, c'est une forêt de bras pour que je les aide.
Mais pas cette année...
Cette année, j'ai fait "garderie". La raison, vous la devinez : ils utilisent GPT/Claude pour corriger leur code. Pire, ils ont un avis sur lequel est mieux pour le code ou mieux pour l'écriture.
Ils ont donc tous envoyé leur rendu, et la correction sera biaisée. Seul l'oral permettrait de lever les usurpateurs (au-delà des signes évidents).
Donc, c'est le rôle de l'enseignant qui va profondément changer et doit nécessairement évoluer, très rapidement.
Mais ce n'est qu'un exemple.
Par contre, en tant que "codeur", l'autocomplétion par IA locale est un vrai bonheur de productivité (une fois identifié ce en quoi elle est bonne et ce en quoi elle est mauvaise), c'est indéniable et ce n'est que le début.
Et que je pense que ça va (le vol) être de pire en pire avec les possibilités "d'entrainement à la maison".
On va se passer des IA sous le manteau...
Enfin, un petit rappel : Une énorme partie de l'utilisation d'internet tourne autour du ... et devinez si la possibilité de générer des images et vidéos y échappe...
Je suis d'accord avec tout ce que tu dis, sauf pour la politesse.
C'est un vol monstrueux, il n'y a aucun doute là-dessus. Mais je m'inquiète plus du tri qui a été fait, c'est-à-dire de ce qui n'a pas été volé pour des raisons politiques/idéologiques/religieuses etc.
Autrement dit, ce qui m’inquiète le plus ce n'est pas que Mr Dupont se soit fait piller ses oeuvres, mais plutôt que Mr Durand ait été volontairement enlevé du Dataset.
Ce problème de censure touche autant les LLM que les IA génératives d'images.
Et c'est là où je suis d'accord sur " n'est pas un outil neutre politiquement et écologiquement ". Non, il ne l'est pas :
- par nature : Toute l'information disponible n'est jamais que l'information disponible à un temps donné.
- par biais technique : L'information du Dataset a été sélectionnée sur des critères, soit techniques, soit humain.
Pour ce qui est des métiers, là aussi, parfaitement d'accord. J'irais même plus loin en disant que c'est une catastrophe qui monte petit à petit pour beaucoup de métiers (le mien notamment), et c'est déjà là.
Voici un exemple très concret :
Depuis des années (+20 ans), je donne des cours de programmation.
Au dernier TP, les élèves ont un rendu à faire de leur code.
Les élèves attendent toujours le dernier TP pour se rendre compte qu'ils sont à la ramasse et donc, normalement, c'est une forêt de bras pour que je les aide.
Mais pas cette année...
Cette année, j'ai fait "garderie". La raison, vous la devinez : ils utilisent GPT/Claude pour corriger leur code. Pire, ils ont un avis sur lequel est mieux pour le code ou mieux pour l'écriture.
Ils ont donc tous envoyé leur rendu, et la correction sera biaisée. Seul l'oral permettrait de lever les usurpateurs (au-delà des signes évidents).
Donc, c'est le rôle de l'enseignant qui va profondément changer et doit nécessairement évoluer, très rapidement.
Mais ce n'est qu'un exemple.
Par contre, en tant que "codeur", l'autocomplétion par IA locale est un vrai bonheur de productivité (une fois identifié ce en quoi elle est bonne et ce en quoi elle est mauvaise), c'est indéniable et ce n'est que le début.
Et que je pense que ça va (le vol) être de pire en pire avec les possibilités "d'entrainement à la maison".
On va se passer des IA sous le manteau...
Enfin, un petit rappel : Une énorme partie de l'utilisation d'internet tourne autour du ... et devinez si la possibilité de générer des images et vidéos y échappe...
https://www.quefaitesvous.com