Parlons de l’éléphant dans les données

NRZ.Digital
0 0

Parlons de l'éléphant dans les données
Un rendu artistique de la façon dont un ordinateur pourrait identifier un éléphant. Crédit : Ben Wigler/CSHL, 2021

Vous ne seriez pas surpris de voir un éléphant dans la savane ou une assiette dans votre cuisine. Sur la base de vos expériences et connaissances antérieures, vous savez que c’est là que se trouvent souvent les éléphants et les assiettes. Si vous voyiez un objet mystérieux dans votre cuisine, comment découvririez-vous ce que c’était ? Vous vous fieriez à vos attentes ou à vos connaissances préalables. Un ordinateur doit-il aborder le problème de la même manière ? La réponse pourrait te surprendre. Le professeur Partha Mitra du laboratoire de Cold Spring Harbor a décrit comment il envisage de tels problèmes dans une « perspective » en Nature Machine Intelligence. Il espère que ses connaissances aideront les chercheurs à enseigner aux ordinateurs comment analyser plus efficacement des systèmes complexes.

Mitra pense que cela aide à comprendre la nature de la connaissance. Mathématiquement parlant, de nombreux data scientists essaient de créer un modèle pouvant « s’adapter à un éléphant » ou un ensemble de points de données complexes. Mitra demande aux chercheurs de réfléchir au cadre philosophique qui fonctionnerait le mieux pour une tâche d’apprentissage automatique particulière : « En termes philosophiques, l’idée est qu’il y a ces deux extrêmes. L’un, vous pourriez dire « rationaliste » et l’autre, les points « empiristes ». de vue. Et vraiment, il s’agit du rôle des connaissances préalables ou des hypothèses préalables. « 

Rationalistes contre empiristes

Un rationaliste voit le monde à travers le prisme des connaissances antérieures. Ils s’attendent à ce qu’une assiette soit dans une cuisine et un éléphant dans une savane.

Un empiriste analyse les données exactement telles qu’elles sont présentées. Lorsqu’ils visitent la savane, ils ne s’attendent pas plus à voir un éléphant qu’une assiette.

Si un rationaliste rencontrait cet ensemble de points de données dans la cuisine, il pourrait d’abord être enclin à le considérer comme une assiette. Leurs connaissances préalables indiquent qu’une assiette est susceptible d’être trouvée dans une cuisine ; il est très peu probable de trouver un éléphant. Ils n’ont jamais vu cette situation auparavant et n’ont jamais appris qu’une telle situation pourrait se produire. Bien que leur résultat prenne en compte une certaine quantité de données, il laisse de côté d’autres parties. Dans ce cas, leurs méthodes ont produit un résultat incorrect : une plaque.

Parlons de l'éléphant dans les données
Les « données » dans votre cuisine. Crédit : Ben Wigler

Lorsqu’un empiriste voit les mêmes données, il les analyse sans se soucier du fait qu’il se trouve dans la savane ou dans sa cuisine. Ils reconstitueront une image à partir d’autant de points de données que possible. Dans ce cas, leur résultat est une image irrégulière. Cela ne dit pas à l’empiriste s’il regarde un éléphant, une assiette ou quoi que ce soit d’autre.

Ni l’empiriste ni le rationaliste n’ont tort. Les deux approches fonctionnent pour différents types de problèmes. Cependant, dans ce cas, s’il y a un éléphant dans la cuisine, il serait avantageux de le découvrir le plus rapidement possible. Un juste milieu entre les approches purement empiriques et purement rationalistes peut être préférable. Avec une certaine connaissance préalable de l’apparence d’un éléphant, vous remarquerez peut-être la trompe et les pattes. Et bien que les chances qu’un éléphant se trouve dans votre cuisine soient faibles, ce n’est certainement pas impossible. Par conséquent, vous arriveriez à la conclusion qu’il y a effectivement un éléphant dans votre cuisine, et vous devriez probablement partir rapidement.

Prévisible mais faux

Les data scientists sont constamment confrontés à ce genre de problème. Ils entraînent les ordinateurs à reconnaître de nouveaux objets ou modèles. Certains programmes d’apprentissage automatique peuvent être capables de traiter beaucoup d’informations et d’établir de nombreuses règles pour s’adapter aux données présentées, comme l’image irrégulière ci-dessus. L’image irrégulière peut être reproductible lorsque les mêmes règles sont appliquées à un autre ensemble de données similaire. Mais ce n’est pas parce que le motif est reproductible qu’il représente avec précision ce qui se passe (l’éléphant).

Il existe des exemples historiques de ce dilemme. Il y a deux mille ans, Ptolémée a développé un modèle de l’univers qui a donné d’excellentes prédictions pour les mouvements de la lune et des planètes. Son modèle a été utilisé avec succès pendant des siècles. Cependant, Ptolémée a utilisé des informations préalables erronées : il a placé la Terre au centre du système solaire et a donné la priorité aux mouvements circulaires des objets célestes. Johannes Kepler a remis en question ce point de vue au 17ème siècle et a finalement rejeté l’approche de Ptolémée, qui a finalement conduit à la loi de la gravitation universelle de Newton. Bien que le modèle complexe de Ptolémée corresponde exceptionnellement bien à ses propres observations, il ne représente pas avec précision ce qui se passe. Mitra prévient que « si vous voulez être un empiriste extrême, vous avez vraiment besoin de beaucoup de données. Nous comprenons maintenant pourquoi dans certaines circonstances, une telle approche peut, en fait, réussir dans un cadre mathématiquement rigoureux. Les cerveaux biologiques, sur le d’autre part, sont à mi-chemin. Vous apprenez de l’expérience, mais vous n’êtes pas entièrement axé sur les données. « 

Parlons de l'éléphant dans les données
Tronc, pattes : ça doit être un éléphant ! Crédit : Ben Wigler

Mitra espère que les scientifiques des données s’inspireront des circuits cérébraux pour développer des approches d’apprentissage automatique de nouvelle génération. Les cerveaux des vertébrés ont des circuits de différentes tailles, y compris des circuits de taille moyenne (à moyenne échelle). Ces circuits sont codés avec des a priori (informations connues, telles que l’apparence des animaux, où ils se trouvent ou comment s’échapper rapidement d’un éléphant qui charge). Dans le même temps, votre cerveau est très flexible, classant les nouvelles informations et pesant l’importance des différentes priorités en fonction de l’expérience – les éléphants n’appartiennent peut-être pas à une cuisine, mais d’une manière ou d’une autre, vous en avez un de toute façon.

Mitra conclut dans son article : « Cela indique la possibilité d’une nouvelle génération de machines intelligentes basées sur des architectures de circuits distribués qui incorporent des a priori plus forts, s’appuyant peut-être sur l’architecture de circuits à mésoéchelle des cerveaux des vertébrés ».


L’IA apprend à tracer les voies neuronales

Plus d’information: Partha P. Mitra, Ajuster les éléphants dans l’apprentissage automatique moderne par interpolation statistiquement cohérente, Nature Machine Intelligence (2021). DOI : 10.1038/s42256-021-00345-8
Fourni par le laboratoire Cold Spring Harbor

Citation: Parlons de l’éléphant dans les données (2021, 3 juin) récupérées le 3 juin 2021 sur https://techxplore.com/news/2021-06-elephant.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.


Happy
Happy
0
Sad
Sad
0
Excited
Excited
0
Sleppy
Sleppy
0
Angry
Angry
0
Surprise
Surprise
0

Average Rating

5 Star
0%
4 Star
0%
3 Star
0%
2 Star
0%
1 Star
0%

Laisser un commentaire

Next Post

Comment une stratégie de marketing de marque à local a amplifié la croissance de The Grasshopper Company

Résumé de 30 secondes : Grasshopper avait besoin d’un moyen central pour gérer sa stratégie de marque en ligne et de génération de leads avec des centaines de concessionnaires locaux, qui opèrent tous de manière indépendante. Ils ont créé un programme pour les revendeurs utilisant une plate-forme qui alimentait les sites […]

Abonnez-vous maintenant