Close Menu
    Facebook X (Twitter) Instagram
    Soozr
    • Accueil
    • Lifestyle
      • Food
      • Musique
      • Santé
      • Sport
    • Fashion
      • Chaussures
    • Voyages
    • Culture
    • Célébrité
    Facebook X (Twitter) Instagram
    Soozr
    Home»Célébrité»Révolution technologique : Comment la dernière étude d’Apple en IA transforme la navigation des malvoyants en mode street view !
    Célébrité

    Révolution technologique : Comment la dernière étude d’Apple en IA transforme la navigation des malvoyants en mode street view !

    SoozrBy Soozr7 juillet 2025Aucun commentaire5 Mins Read
    Facebook Twitter Pinterest LinkedIn Tumblr Email
    Share
    Facebook Twitter LinkedIn Pinterest Email

    Dans une avancée révolutionnaire, l’étude d’Apple sur l’intelligence artificielle ouvre un nouveau monde pour les utilisateurs aveugles en rendant la vue de rue accessible. Cette innovation promet d’améliorer l’orientation urbaine, transformant ainsi la mobilité avec des outils de navigation intelligents. Une étape majeure pour l’inclusivité technologique.

    La Recherche d’Apple sur l’IA : Accès à Street View pour les Utilisateurs Malvoyants

    Apple, en collaboration avec l’Université de Columbia, a développé un prototype de recherche appelé SceneScout, qui vise à rendre les images de Street View accessibles aux personnes aveugles ou malvoyantes. Ce projet met en lumière les défis auxquels ces utilisateurs font face lorsqu’ils naviguent dans des environnements inconnus.

    Contexte et Objectifs de SceneScout

    Les personnes aveugles ou malvoyantes peuvent hésiter à voyager de manière autonome en raison de l’incertitude liée à l’environnement physique. Les outils habituels se concentrent souvent sur la navigation en temps réel et offrent principalement des instructions basées sur des points de repère. Cependant, ils manquent de détails visuels essentiels. Les images de Street View, qui contiennent une riche information visuelle, demeurent inaccessibles pour cette population.

    Pour combler cette lacune, SceneScout combine les API d’Apple Maps avec un modèle de langage multimodal. Cette approche permet de fournir des descriptions interactives et générées par l’IA des images de Street View.

    Modes d’Utilisation de SceneScout

    Le système propose deux modes principaux :

    1. Aperçu de l’Itinéraire

    Ce mode permet aux utilisateurs de se familiariser avec ce qu’ils rencontreront sur un chemin spécifique. Cela inclut des éléments tels que la qualité des trottoirs, les intersections, et l’apparence des arrêts de bus.

    2. Exploration Virtuelle

    Ce mode est plus ouvert, permettant aux utilisateurs de définir leurs critères de recherche, par exemple, s’ils cherchent un quartier résidentiel calme avec accès à des parcs. L’IA les aide à naviguer dans les intersections et à explorer en fonction de cette intention.

    Fonctionnement de SceneScout

    SceneScout utilise un agent basé sur GPT-4o, ancré dans des données cartographiques réelles et des images panoramiques d’Apple Maps. Il simule la vue d’un piéton, interprète les éléments visibles et fournit des descriptions structurées sous forme de textes courts, moyens ou longs. L’interface web est conçue pour être entièrement accessible, facilitant l’utilisation de lecteurs d’écran.

    Résultats des Tests

    Une étude pilote a été menée avec dix utilisateurs aveugles ou malvoyants, la plupart étant familiarisés avec les lecteurs d’écran et travaillant dans le domaine technologique. Les participants ont évalué l’expérience comme étant utile et pertinente. Le mode d’exploration virtuelle a reçu des éloges, car il fournissait des informations que les utilisateurs auraient normalement dû demander à d’autres.

    Cependant, des problèmes ont également été identifiés. Environ 72 % des descriptions générées étaient précises, mais certaines incluaient des hallucinations subtiles, comme l’affirmation erronée qu’un passage piéton avait des signaux sonores. De plus, certaines informations étaient obsolètes, comme des zones de construction ou des véhicules garés.

    Améliorations Suggérées

    Les participants ont souligné que le système faisait parfois des hypothèses sur les capacités physiques de l’utilisateur et l’environnement. Ils ont exprimé le besoin d’un langage plus objectif et d’une meilleure précision spatiale, particulièrement pour la navigation de dernier kilomètre. Certains souhaitaient également que le système puisse s’adapter dynamiquement à leurs préférences au fil du temps, au lieu de s’appuyer sur des mots-clés statiques.

    Perspectives d’Avenir

    Bien que SceneScout ne soit pas encore un produit commercialisé, il explore la collaboration entre un modèle de langage multimodal et l’API d’Apple Maps. Les participants ont exprimé un désir fort d’accès en temps réel aux descriptions de Street View tout en marchant. Ils envisagent des applications pouvant fournir des informations visuelles via des écouteurs à conduction osseuse ou en mode transparence.

    Suggestions des Utilisateurs

    Les utilisateurs ont proposé des descriptions plus courtes lors de la marche, se concentrant uniquement sur des détails critiques tels que les points de repère ou la qualité des trottoirs. Des descriptions plus complètes pourraient être déclenchées à la demande lorsqu’ils s’arrêtent ou atteignent des intersections.

    Conclusion de l’Étude

    Bien que l’étude n’ait pas encore été évaluée par des pairs, elle mérite d’être examinée pour comprendre les directions que prendra l’IA, les dispositifs portables et la vision par ordinateur. Pour en savoir plus sur les avancées dans ce domaine, vous pouvez consulter l’article sur arXiv.

    Références

    • SceneScout: Towards AI Agent-driven Access to Street View Imagery for Blind Users.

    Qu’est-ce que SceneScout ?

    SceneScout est un prototype de recherche développé par Apple et l’Université de Columbia qui utilise des modèles de langage multimodaux pour fournir des descriptions interactives d’images en mode street view, spécifiquement pour les personnes aveugles ou malvoyantes.

    Comment fonctionne le mode d’exploration virtuelle ?

    Le mode d’exploration virtuelle permet aux utilisateurs de décrire ce qu’ils recherchent, comme un quartier résidentiel calme, et l’IA les aide à naviguer dans les intersections et à explorer dans n’importe quelle direction selon cette intention.

    Quels sont les avantages de l’aperçu de parcours ?

    L’aperçu de parcours permet aux utilisateurs d’avoir une idée de ce qu’ils rencontreront le long d’un chemin spécifique, en fournissant des détails sur la qualité des trottoirs, les intersections et les points de repère visuels.

    Quelles lacunes ont été identifiées lors des tests ?

    Bien que 72 % des descriptions générées étaient précises, certaines contenaient des erreurs, comme des affirmations erronées concernant les signaux sonores aux passages piétonniers et des détails obsolètes tels que des zones de construction.

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Soozr
    • Website

    Related Posts

    Découvrez comment l’application Google Home révolutionne l’utilisation de vos anciens thermostats Nest !

    18 août 2025

    Profitez de Remises Incroyables : Économisez 620 $ sur le Tab S10 Ultra, Découvrez le Fold 7 et les Nothing Headphones (1) !

    18 août 2025

    Découvrez le Nouveau Files by Google M3 : Un Design Éblouissant avec Carrousel Animé et Navigation Intuitive !

    18 août 2025
    Leave A Reply Cancel Reply

    Catégories
    • Célébrité (3 598)
    Flux plare. — Tous les articles
    • Fuites de données en 2026 : la France se classe parmi les pays les plus impactés au niveau mondial
    • Cunard et l’épopée des premiers tours du monde en croisière : du Laconia aux majestueux Queens d’aujourd’hui
    • French Days : le Google Pixel 10a immédiatement disponible à seulement 489 € grâce à ce code promo exclusif
    • L’eSIM : Le compagnon de voyage high-tech qui révolutionne vos connexions à l’étranger
    • Découvrez Isla Sir Bani Yas avec MSC Croisières : plage privée, safari et détente au cœur des Émirats
    • Google Messages : un bug critique cause la disparition inattendue de vos conversations
    • Votre iPhone vous surveille-t-il ? Découvrez les 6 réglages essentiels à contrôler
    • Squash : découvrez le sport ultra complet que beaucoup méconnaissent encore
    • Tesla offre une nouvelle mise à jour majeure aux propriétaires de HW3
    • WhatsApp cessera de fonctionner sur certains smartphones dès septembre 2026
    Facebook X (Twitter) Instagram Pinterest
    • Conditions générales d’utilisation
    • Données personnelles
    • Mentions légales
    • Contact
    © 2026 ThemeSphere. Designed by ThemeSphere.

    Type above and press Enter to search. Press Esc to cancel.