Blockchain et nouveau modèle d'évaluation AI basé sur les incitations
La large diffusion des applications d'IA rend essentiel l'évaluation précise de la performance des modèles et l'amélioration de la confiance des utilisateurs. Les mécanismes d'évaluation centralisés traditionnels peinent à couvrir des scénarios diversifiés et ne peuvent pas refléter fidèlement les préférences des utilisateurs. Parallèlement, le problème des "illusions" des modèles se produit fréquemment, plongeant souvent les utilisateurs dans une chambre d'écho d'information lors de leurs choix.
Dans ce contexte, une nouvelle plateforme tente de redéfinir la découverte, la comparaison et l'utilisation des modèles d'IA grâce à un mode de crowdsourcing unique et à des mécanismes d'incitation, apportant une transformation paradigmale dans le domaine de l'évaluation de l'IA. Cet article analysera en profondeur les mécanismes clés de cette plateforme, ses points forts technologiques, le contexte de l'équipe et son impact potentiel sur l'écosystème de l'IA.
Créer un marché de feedback AI "sans confiance"
La plateforme s'engage à construire un marché de retour d'expérience AI "sans confiance", permettant aux retours d'expérience diversifiés de circuler librement sous la protection de la Blockchain et des incitations économiques en cryptomonnaie, formant ainsi une couche d'évaluation de modèle évolutive, équitable et transparente. Grâce à la distribution d'incitations pour des données annotées manuellement de haute qualité, la plateforme peut capturer en temps réel les besoins et préférences des utilisateurs réels dans différents scénarios, aidant ainsi les développeurs d'IA à optimiser les performances des modèles de manière itérative.
Le projet a été fondé en juin 2024 par trois cofondateurs ayant une riche expérience dans des géants de la technologie tels que Twitter, Google et Coinbase. L'équipe a conçu et optimisé des systèmes de recommandation et de recherche à grande échelle, avec des idées uniques sur la décentralisation et la transparence de la valeur des données.
Grâce à l'expérience riche de l'équipe dirigeante et à la compréhension précise des besoins des fournisseurs d'IA, ce projet a reçu une reconnaissance élevée de la part de personnalités renommées du secteur technologique et des investisseurs en capital-risque de premier plan. Le récent financement de 33 millions de dollars lors de la levée de fonds pour les semences a été mené par un investisseur en capital-risque de renom, avec la participation de plusieurs dirigeants de géants technologiques, d'autorités académiques et de 45 investisseurs providentiels renommés.
Construire "AI Parlement" pour optimiser l'expérience utilisateur
En tant que plateforme d'évaluation d'IA centralisée, ce projet adhère à la philosophie de "l'IA partagée par tous", permettant aux utilisateurs de découvrir, comparer et utiliser facilement les derniers modèles d'IA. La plateforme renvoie simultanément les réponses de plusieurs modèles pour chaque invite, formant ainsi un "congrès de l'IA". Ce design répond non seulement aux besoins des utilisateurs en matière de choix diversifié, mais permet également d'identifier efficacement les "hallucinations" potentielles des modèles, aidant les utilisateurs à prendre des décisions plus éclairées grâce à la comparaison.
La plateforme prend désormais en charge plus de 500 modèles d'IA, couvrant les domaines de la génération de texte et d'images, y compris de nombreux modèles connus et émergents. Pour optimiser davantage l'expérience, la plateforme a également lancé la fonction "QuickTake", qui permet de condenser des réponses longues en contenus concis. De plus, la plateforme attache une grande importance à la confidentialité des utilisateurs, toutes les conversations sont par défaut privées, et les utilisateurs peuvent contrôler à tout moment le contenu et la portée du partage.
Modèle économique de la valorisation du travail des données
La plateforme utilisera gratuitement les retours des utilisateurs, combinés à un système de points pour évaluer l'utilisation des modèles. Les utilisateurs peuvent gagner des points en notant les réponses des modèles, en choisissant leurs préférences et en expliquant leurs raisons. Plus la qualité des retours est élevée, plus les récompenses sont généreuses, garantissant aux utilisateurs un accès durable et gratuit à divers services d'IA, y compris des modèles haut de gamme.
Les points peuvent être échangés contre plusieurs devises, la plateforme intègre plusieurs réseaux de Blockchain et stablecoins, offrant aux utilisateurs du monde entier des récompenses instantanées et à faible coût. Bien que les revenus mensuels d'un utilisateur individuel puissent ne pas être élevés, ces données d'annotation payantes sont essentielles pour l'itération de l'IA. La plateforme a également mis en place un mécanisme de récompense par parrainage, incitant davantage les utilisateurs à participer.
Nouvelle Paradigme d'Évaluation AI : Système de Notation VIBE
Pour résoudre les problèmes existants dans le classement actuel, la plateforme a lancé une version bêta du classement AI et du système de notation VIBE. Ce système regroupe les données de préférence générées par les utilisateurs du monde entier lors d'interactions naturelles, afin de fournir des résultats d'évaluation robustes et fiables.
Les principes d'évaluation incluent la robustesse (couvrir divers scénarios, refléter les préoccupations des utilisateurs, résister aux comportements malveillants) et la fiabilité (équité, neutralité, transparence, rigueur scientifique). La plateforme ne se contente pas de collecter des préférences binaires, elle encourage également les utilisateurs à indiquer les avantages et les inconvénients des réponses, et effectue une analyse par groupes en fonction du contexte des utilisateurs, afin de montrer les différences de préférences entre les différents groupes.
Sur le plan technique, la plateforme explore l'utilisation de la Blockchain, des primitives cryptographiques et des preuves à divulgation nulle de connaissance pour garantir l'équité, la transparence et la vérifiabilité du processus d'évaluation. Parallèlement, la plateforme a collaboré avec des fournisseurs de données AI professionnels pour assurer l'exactitude des évaluations grâce à un mécanisme de contrôle de qualité multicouche.
 et la fiabilité (équité, neutralité, transparence, rigueur scientifique). La plateforme ne se contente pas de collecter des préférences binaires, elle encourage également les utilisateurs à indiquer les avantages et les inconvénients des réponses, et effectue une analyse par groupes en fonction du contexte des utilisateurs, afin de montrer les différences de préférences entre les différents groupes.
Sur le plan technique, la plateforme explore l'utilisation de la Blockchain, des primitives cryptographiques et des preuves à divulgation nulle de connaissance pour garantir l'équité, la transparence et la vérifiabilité du processus d'évaluation. Parallèlement, la plateforme a collaboré avec des fournisseurs de données AI professionnels pour assurer l'exactitude des évaluations grâce à un mécanisme de contrôle de qualité multicouche.
![a16z a mené un tour de financement de 33 millions de dollars, comment Yupp redéfinit-il le modèle d'évaluation de l'IA basé sur la Blockchain et les incitations ?](https://img-cdn.gateio.im/webp-social/moments-72ec1eb4ea4b0853690939a455fd9194.webp01
Historique et perspectives d'avenir
La plateforme sera officiellement lancée en juin 2025, après six mois de tests internes. Depuis son lancement, le produit a été continuellement itéré, ajoutant des fonctionnalités telles que le support multimodal, l'interaction vocale, la recherche d'informations en temps réel, la mise à niveau des paiements, l'exportation de partage, et continue d'introduire de nouveaux modèles et d'organiser des activités communautaires.
La mission de la plateforme est "d'habiliter l'humanité à façonner l'avenir de l'IA". Le fondateur estime que le développement de l'IA nécessite la participation et la contribution de chacun. Grâce à des réponses IA à multiples perspectives et aux retours des utilisateurs, la plateforme non seulement aide les utilisateurs à mieux décider, mais fournit également une source inépuisable de动力 pour l'évolution de l'IA.
Cependant, en tant que plateforme émergente, comment assurer en continu la qualité des données avec une participation massive des utilisateurs, résister aux comportements frauduleux potentiels, et trouver un équilibre entre la commercialisation et les incitations pour les utilisateurs, restera une direction à explorer et à optimiser continuellement dans son développement futur.
Dans l'ensemble, cette nouvelle plateforme ouvre de nouvelles voies pour l'évaluation par l'IA grâce à un système d'évaluation basé sur le crowdsourcing, des mécanismes d'incitation et des préférences utilisateur réelles. Elle offre non seulement aux utilisateurs une expérience d'interaction IA gratuite et variée, mais transforme également les retours des utilisateurs en données d'entraînement de haute valeur, favorisant l'optimisation continue des modèles. Avec une équipe expérimentée et un soutien de capitaux de premier ordre, la plateforme devrait jouer un rôle clé dans l'écosystème IA futur, réalisant la vision "chacun profite de l'IA, chacun façonne l'IA".