John Underkoffler : « Être humain, c’est être créatif ! »
Facebooktwittergoogle_plusredditpinterestlinkedinmail

Rencontré à Austin en mars dernier au SXSW, John Underkoffler s’est illustré par son travail sur Minority Report, dans lequel l’interface présentée aura fait rêver toute une génération. Quatorze ans plus tard, le designer et chercheur au MIT nous présente enfin son produit, et nous explique comment les interfaces hommes-machines peuvent, selon lui, changer le monde.

Vous vous rappelez tous de la scène, désormais culte : muni de ses gants, Tom Cruise déplace des pixels en 3D dans l’espace, sans se soucier de la présence d’un écran. Il agrandit les images, pénètre à l’intérieur des buildings modélisés, et essaie tant bien que mal de trouver un indice qui le conduirait au meurtre qu’il va lui-même commettre quelques heures plus tard. Je n’en dirai pas plus, et me permettrait seulement d’insister auprès de ceux qui n’ont pas encore vu ce chef-d’œuvre de la SF moderne de courir se procurer le film ! Pour les autres qui ont, comme nous, rêvé en regardant cette scène, voici l’homme derrière la technologie que l’on voit à l’écran. John Underkoffier, designer et patron d’Oblong Industries, société avec laquelle il développe actuellement Mezzanine, un outil qui repose exactement sur le même principe. Croisé lors du dernier South by Southwest Interactive, John nous a accordé un long entretien dans lequel nous parcourons de long en large la place de l’interface utilisateur dans nos usages, et la façon dont ces derniers peuvent, et devraient évoluer ces prochaines années.

 
 

 Silex ID : Bonjour John. Comment avez-vous commencé au MIT (Massachusetts Institute of Technology), et comment vous êtes-vous retrouvé à travailler sur ces UI (user interfaces), interfaces utilisateur ?

John Underkoffler : Je suis arrivé au MIT en 1984, pile au moment de l’ouverture du Media Lab. C’était un endroit génial. Pour la première fois, quelqu’un prenait en compte le fait que les ordinateurs n’étaient pas uniquement destinés à servir de bases de données et de tableurs. Évidemment, ils savent faire ce genre de choses, mais ils servent avant tout à communiquer. C’était la philosophie centrale du Lab, et pour mettre en avant ces idées, le mécanisme utilisé était de prendre différentes disciplines et de les mélanger. Il y avait donc des informaticiens, mais aussi des cinéastes, des architectes, des physiciens amateurs ou encore des holographistes, des gens qui n’auraient jamais travaillé ensemble de par le passé, qui n’auraient jamais eu l’opportunité d’échanger des idées. Toutes ces personnes ont été amenées à se rencontrer et à partager des bureaux. Ça a amené pas mal de discussions, de débats animés, enflammés, et de là ont émergé des idées, de nouvelles technologies, et de nouvelles entreprises. Vers 1994, j’ai commencé à être obsédé par l’idée d’interface utilisateur homme-machine. Dix ans s’étaient écoulés depuis la sortie du Macintoch. J’étais naïf, je me disais : « Ok, dix ans avec une seule UI, c’est suffisant !».

macintosh_silexid

Le fait est que, trente-deux ans plus tard, nous utilisons toujours l’interface Macintosh. Ce qui n’est pas forcément une mauvaise chose, mais bon. Dès 1994, j’ai vraiment commencé à me pencher sur ce que je pensais être plus naturel, plus en accord avec l’humain… Finalement, cela a mené à la fin des années 90 au Luminus Room System, qui a été perçu comme un vrai coup de tonnerre ! Alex McDowell, chef décorateur de Spielberg sur Minority Report, a découvert ce système, cet ensemble de démos, de prototypes de codes et d’interfaces utilisateur. Il est venu me dire qu’il avait adoré, et que cela répondait à la demande de Steven Spielberg, qui voulait savoir à quoi ressembleraient les ordinateurs dans 50 ans, et qui ne voulait pas entendre parler d’un clavier et d’une souris ! (Rires). Selon lui, les gens devraient utiliser des mains humaines, ils devraient être spéciaux, il devrait y avoir de l’information partout… Je suis allé à Los Angeles pour travailler sur le film. Voilà comment ça s’est passé. J’étais responsable de toute la technologie montrée dans le film, parce que Steven voulait que tout soit cohérent.

Combien de temps avez-vous travaillé sur le film ?

Environ un an. La pré-production a été inhabituellement longue. C’était génial, on avait tellement de choses différentes à concevoir. J’ai écrit des modes d’emploi, nous avons passé des semaines à répéter avec les acteurs, pour qu’ils sachent comment les utiliser même s’il n’y avait rien sur l’écran, juste un fond pour les effets spéciaux, ils savaient ce qu’ils étaient censés avoir sous les yeux. Grâce à toute cette préparation, et au fait que je pensais bêtement devoir concevoir quelque chose de réel, le résultat a été vraiment bon. Et la réception du public a été extrêmement positive, j’ai commencé à recevoir des appels de grosses entreprises qui me demandaient : « C’est vrai, tout ça ? On peut fabriquer ce système ? » Ça a été le déclencheur, il était temps le construire.

Vous avez construit une partie de ce que l’on voit dans le film…

Tout de suite après le film, j’ai commencé à construire la machine avec les gants et des caméras sensorielles. Le timing était parfait, puisque la technologie du hand tracking s’était mise à niveau juste à temps. Alors oui, ce que nous avons construit en premier était littéralement ce que l’on peut voir dans Minority Report, avec les gants et les grands écrans. Nous avons permis à nos premiers clients de faire des choses qu’ils ne pouvaient pas faire à l’époque. La solution n’était pas un ordinateur plus performant, mais une meilleure interface utilisateur.

Le film est sorti en 2002, vous avez commencé à travailler sur le projet en 2004, mais finalement cela aura mis une dizaine d’années supplémentaires pour fonctionner. Pourquoi autant de temps ?

Ce n’était pas une question de technologie, mais de design. Il a tout d’abord fallu prioriser, comprendre quels seraient les aspects les plus importants du projet Au début, avec le système des gants, nous avons créé un simulateur, une UI pour Saudi Aramco. Ils venaient d’achever le plus gros réservoir de pétrole et d’essence du monde. À ce moment, ils programmaient leurs simulations sur des tableurs, ce qu’il ne faut pas faire !

Nous avons donc construit un fantastique système pour eux, sur lequel on peut utiliser les gants et survoler cet immense champ de pétrole, on pouvait littéralement prendre un puit et le faire bouger. Nous avons aussi fait d’autres choses pour Boeing, General Electric…

C’était des systèmes bien spécifiques à chaque fois, avec des applications très différentes, mais en observant comment ces systèmes étaient utilisés nous avons compris que le fil conducteur était la collaboration. Tous ces systèmes ont permis à des gens avec différents métiers et différentes visions du même travail de se rassembler et de voir la même chose. D’utiliser la même interface en même temps, plutôt que de n’avoir qu’une seule personne qui en ait le contrôle. À ce moment-là, nous avons compris que le monde avait besoin d’un nouvel ordinateur qui permette aux gens de travailler ensemble, plutôt que chacun de leur côté.

Mezzanine n’utilise pas de gants mais une sorte de baguette/ télécommande. Pourquoi ne pas avoir gardé les gants ?

Dans un contexte de pur business, porter des gants peut être considéré comme étrange. Et dans certaines cultures, l’idée que je puisse enlever mon gant et le passer à mon voisin est juste impensable. Alors que la petite baguette, ça fonctionne. Et quand je la prends, cela transmet un signe subtil mais clair pour tout le monde que quelque chose va se passer.

Ce sont des arguments très BtoB, qui correspondent à des besoins professionnels, dans le cadre d’une collaboration en entreprise. Avez-vous prévu une utilisation privée de cette UI ?

Bien sûr. Nous utilisons Mezzanine tous les jours au sein de l’entreprise. Quand on rentre à la maison et que l’on se retrouve avec son gros ordinateur inexpressif tel qu’on le connaît, qui ne fait pas toutes ces choses géniales en même temps, c’est extrêmement frustrant ! Tout le monde nous demande : « quand pourra-t-on avoir ça à la maison ? ». Je pense que ça arrivera tôt ou tard, mais cela nécessitera un peu plus de design. Nous devons comprendre exactement ce à quoi cette interface doit ressembler dans un contexte domestique. Mais les idées sont universelles. Parce que Mezzanine est un système d’exploitation à pixels, la valeur se trouve dans les pixels, dans ce que tout le monde peut voir en même temps, ensemble. Dans un sens c’est un OS, un OS qui pense aux gens, à l’espace architectural et au contrôle simultané.

Pourriez-vous nous expliquer comment cela fonctionne techniquement, sans être trop complexe pour autant ?

L’idée de base, c’est que tout ce que nous faisons avec des ordinateurs, peu importe que ce soit un laptop, une tablette ou un smartphone, se retrouve traduit en pixels. C’est donc visuel, ce sont des pixels que nous pouvons voir. La vraie proposition de valeur de Mezzanine, c’est de collecter ces pixels et de les mettre dans un espace de travail partagé pour que tout le monde puisse les voir au même moment, et même y collaborer. C’est quelque chose d’extrêmement puissant.

Comment le système collecte-t-il ces pixels pour les rassembler sur un plus grand écran ?

Il y a une petite application pour votre téléphone, une sorte d’API (Interface de programmation), qui se connecte à Mezzanine et qui diffuse ces pixels. Normalement, un iPhone et un Android ne peuvent pas communiquer entre eux, mais dans le cas de Mezzanine, tous les systèmes sont pris en compte. Ce système relève d’un langage universel pour tous ces dispositifs, il fait en sorte qu’ils puissent tous fonctionner ensemble. C’est une véritable disruption.

Avez-vous des clients en France ?

Oui. Les plus récents sont PWC (Presswaterhouse Coopers). Ils viennent d’installer une très belle salle Mezzanine à Paris.

Que pensez-vous des autres UI comme la réalité augmentée (les Google Glass), la réalité virtuelle (Oculus Rift…), la voix (Echo, Siri…), ou encore les interfaces cerveau-machine ? Est-ce que ce sont des concurrents ?

Non. Pour plusieurs raisons. La première : aucune de ces interfaces ne fonctionne. Elles pourraient marcher un jour, mais cela reste très primitif pour l’instant. C’est évidemment très excitant, parce que certaines de ces interfaces ont déjà permis à des personnes paralysées de déplacer un curseur sur un écran. C’est un excellent début, mais ce n’est pas une solution d’intérêt général. Si l’on se penche un peu plus sur la question et que l’on creuse un peu niveau science du cerveau, science cognitive, il y a 2 choses principales qui en ressortent : le cerveau humain est basé sur du visuel et sur la gestion de l’espace. On parle de perception, de savoir où se trouve le corps dans l’espace, la relation de son corps avec les autres corps, les autres espaces. C’est pourquoi le fait de pointer est si important. Quand quelqu’un désigne quelque chose avec son doigt, tout le monde sait où regarder, c’est un geste social incroyablement puissant. Voilà pourquoi la baguette est un outil génial.

echo_amazon_silexid

Qu’en est-il de la voix ?

La voix n’est pas un outil assez puissant, parce que le langage humain a du mal à décrire l’espace. Regardez cet écran par exemple, comment le décririez-vous à l’oral ? « Vous avez des mails en haut, des réseaux sociaux à gauche, ici un logiciel de traitement de texte… » Vous deviendriez fou ! La voix décrit mal les relations spatiales, alors que c’est au centre de tout ce que nous faisons avec des ordinateurs. Par contre, ajoutez la voix à une UI comme Mezzanine et vous avez un outil hyper puissant.

Beaucoup de gens pensent que dans quelques années nous aurons nos propres assistants, auxquels nous pourrons parler…

C’est une bonne piste, en effet. Mais l’une des choses qui va changer à coup sûr, c’est qu’il y aura plus d’une UI, plus d’un device dans le futur. C’est une situation artificielle que nous vivons depuis les 30 dernières années, où il n’y en avait qu’une seule.

Mais qu’en est-il du device en lui-même, de l’appareil ?

Je pense que le device en lui-même sera de moins en moins important. Il ne va pas disparaître, mais il se fondra peut-être à nos vêtements, qui sait… Pour l’instant nous sommes hypnotisés par les appareils. C’est probablement commercial, les grandes marques comme Apple ou Samsung veulent que vous pensiez à ces appareils tout le temps, que vous les vouliez et que vous les achetiez ! Et si les éléments vestimentaires que vous portiez étaient tous connectés et intelligents ? La fonctionnalité se retrouverait dans les chemises. À ce moment, la voix deviendrait vraiment utile pour certains types de tâches. Je pense que nous pourrions construire ce monde dans lequel l’appareil n’est pas la chose la plus importante, mais que ce soit l’usage qui prime.

Et en général, selon vous, quelles sont les technologies qui bouleverseront nos vies dans les 5 à 10 prochaines années ? Mark Zuckerberg par exemple parle de l’importance de la VR, et du fait que tout tournera autour de la vidéo…

Le vrai changement, ce serait surtout que ceux qui font les technologies le fassent pour les humains, pas uniquement pour se faire de l’argent. Quand Zuckerberg parle de la vidéo, ce qu’il dit c’est surtout « soyez passifs, consommez ». C’est ce que veut aussi Apple, ils veulent que vous téléchargiez de la musique, des films, et que vous passiez votre temps à regarder du contenu… Shut up and watch! Mais si nous commencions à construire une technologie pour que les gens puissent communiquer entre eux, synthétiser, faire de nouvelles choses, alors nous aurions devant nous un monde fondamentalement différent.

Comment convaincre Facebook ou Google de faire ça ?

Ça ne sera peut-être pas Google ni Facebook.

Ce seront peut-être de nouvelles entreprises. C’est ce que fait Oblong. La bonne chose, c’est que le côté créatif devient addictif, parce que c’est stimulant. Si vous n’avez jamais fait autre chose que de regarder et de consommer, alors vous ne savez pas à quel point c’est génial de faire des choses créatives. Que ce soit de faire du pain, d’écrire une histoire qui n’existe pas encore, de créer quelque chose qui n’existait pas avant…

Si l’on peut commencer à mettre des outils synthétiques, des outils créatifs dans les mains des gens, alors je pense que l’on peut avoir une vraie réaction en chaîne, un cercle vertueux.

Pensez-vous que de nouvelles entreprises pourraient entrer en compétition face à des géants tels Amazon et Google…

Ils n’ont pas toujours été des géants. Je pense qu’il y a une possibilité, mais il faut ouvrir de nouvelles catégories, de nouveaux territoires. Évidemment, ça serait très difficile aujourd’hui pour une petite entreprise de travailler sur un nouveau moteur de recherche et d’essayer de supplanter Google. Mais si une petite boîte commençait à mettre au point un incroyable outil créatif que soudain tout le monde s’arrache, cela pourrait donner naissance à quelque chose de vraiment intéressant.

Mais ne pensez-vous pas que les gens aiment regarder la télévision et se reposer ? C’est fatigant d’être créatif, non ?

Ce monde dont vous parlez, c’est le monde que la télévision et l’Entertainment veulent. C’est comme si nous étions entraînés à penser comme ça. Il est possible d’avoir d’autres attentes, de changer nos habitudes. Pensez-y : un gamin de trois ou quatre ans n’arrête pas de créer, de dessiner, de faire de la musique, de construire des choses… C’est instinctif, être humain, c’est être créatif ! Même sans école, les enfants continueraient à créer toute leur vie, ce qui nous permettrait de créer toute sorte d’outils encore plus rapides et plus efficaces.

Y a-t-il des films ou œuvres que vous nous conseillez ?

Je suis particulièrement intéressé par les livres ou films qui réinventent un peu leur genre, leur discipline, qui prouvent des choses que l’on pensait impossibles. Il y a par exemple ce jeune réalisateur Shane Carruth qui m’a vraiment impressionné, notamment avec son film Primer qui date de 2004, qui est probablement le meilleur film sur le voyage dans le temps. Il l’a fait avec uniquement sept mille dollars, mais il est vraiment excellent !

Comment ça, vous êtes en train de nous dire qu’il y a un film sur le voyage dans le temps meilleur que Retour vers le futur ?

(Rires). Les deux se valent ! Mais Primer est très différent. Et niveau littérature, je recommande particulièrement les œuvres de Harry Mathews. C’est le seul américain qui a été admis dans le mouvement littéraire OuLiPo (Ouvroir de littérature potentielle – dont George Perec faisait partie NDR). Selon Raymond Roussel, l’idée de base de ce mouvement était de tout réinventer, de ne jamais partir du réel. Le résultat est incroyablement inventif, avec des œuvres magnifiques !

Merci John. À bientôt !

Daniel Geiselhart & Matthieu Vetter

 

Facebooktwittergoogle_plusredditpinterestlinkedinmail
AUTHOR

Silex ID

All stories by: Silex ID