Un autre genre de magnifique
« Le futur du jeu vidéo »

Proud to be CAKE©®™
GCC4TI importe qui a problème en Autriche, pour l'UE plus et une encore de correspours nucléaire, ce n'est pas ytre d'instérier. L'état très même contraire, toujours reconstruire un pouvoir une choyer d'aucrée de compris le plus mite de genre, ce n'est pas moins)
Stalin est l'élection de la langie.
Pas encore regardé la vidéo, mais :
...j'ai parcouru les commentaires, et l'argument a l'air intéressant :
- pour les images et la musique, les AI génératrices sont entraînées avec du contenu qui est majoritairement compressé avec pertes (JPEG, MP3)
- comme la stratégie générale consiste à maximiser la quantité de données utilisées pour l'entraînement, indépendamment de leur qualité, une bonne partie des données contiennent des artefacts de compression non négligeables
- mais les modèles ne font pas la différence entre un signal utile et un artefact, donc "apprennent" à générer des pseudo-artefacts en même temps qu'ils apprennent à générer du signal
Conséquences :
- ce qui sort de ces modèles contient déjà des pseudo-artefacts, même si la sortie n'a jamais été compressée (c'est déjà embêtant)
- mais surtout, ces pseudo-artefacts sont différentiables de ceux qui sont générés par une compression ordinaire, donc c'est un moyen d'identifier les images et musiques générées par AI
- et si les futurs modèles sont (involontairement) entraînés avec la sortie des modèles précédents, ça ne fera qu'accentuer davantage le phénomène
Je trouve ça très intéressant, et rétrospectivement c'est tout-à-fait logique, mais c'est une impasse des méthodes actuelles.
(Après, si j'en crois le titre, il utilise une AI comme détecteur, donc on aura droit à la course aux armements habituelle : ça sera utilisé comme contrainte pour l'entraînement des futurs modèles de façon à passer sous le radar, etc.)

—
Zeroblog —
« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » —
Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » —
GT Turbo Uther Le 30/01/2025 à 19:41 Open AI qui se plaint de données d’entraînement volées c’est clairement l’hôpital qui se fout de la charité.
DeepSeek semble avoir tout de même réalisé une sacrée performance.

<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)
<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant
C'est un peu exagéré, on a certes probablement un peu de retard mais Google a eu le même genre de problème.

<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)
<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant
Uther Le 01/02/2025 à 19:37 En effet, il faut voir que les problèmes remonté sont des cas particuliers pour lesquels on sait que les LLM font des erreur. Chat GPT faisait très régulièrement ce genre d'erreur il n'y a pas si longtemps.
Alors certes, Lucie n'est certes pas au niveau des meilleurs LLM actuels mais si on considère que c'était qu'une première version, c'est pas un drame non plus. Le fait qu'il sorte en même temps que Deepseek n'a pas aidé non plus.
Faudrait aussi arrêter d'utiliser des IA conversationnelles comme des encyclopédies. Deepseek (et Mistral je crois) propose plusieurs types d'IA en fonction des besoins, et celle qui résout les problèmes mathématiques est vraiment très bien. Mais elle ne cherche pas à produire des textes "naturels" mais truffées d'inepties.

Responsable éditorial - Le Mag MO5.COM