Un aperçu des outils à utiliser pour développer un projet de ML davantage reproductible
David Beauchemin
9
minutes
Ces dernières années, j’ai travaillé sur divers projets d’apprentissage automatique (principalement des projets de recherche), et j’ai rencontré de nombreux problèmes en cours de route qui ont eu un impact sur la reproductibilité de mes résultats. J’ai dû à plusieurs reprises (non sans me détester) prendre beaucoup de temps pour déterminer quelles expérimentations étaient les meilleures et quels paramètres étaient associés à ces résultats. Pire encore, trouver mes foutus…
Ce n’est une surprise pour personne, 2020 a été une année différente pour .Layer. Elle fut néanmoins une année assez remplie. Voici donc un petit recap pour la communauté. Comme on dit, « mieux vaut tard que jamais »!
On entend souvent dire que le repêchage de la LNH, tout comme c’est le cas
dans d’autres sports professionnels, est une science inexacte. J’imagine que cette
expression fait référence au fait que si l’on doit repêcher un joueur $x$ à un moment
$t$ donné, il n’y a aucune certitude que ce joueur est le bon choix. Mais disons
qu’on prend le temps de regarder plusieurs choix, sur plusieurs années, est-ce toujours le
cas? Est-ce que le repêchage devient en quelque…
Retour sur la première année d'existence d'OpenLayer
David Beauchemin
5
minutes
Cela fait maintenant 1 an que j’ai lancé OpenLayer, mon projet de podcast vidéo sur l’IA. 32 épisodes plus tard, beaucoup de choses se sont dites derrière le micro. Ce texte débute par une présentation de mon voyage dans cette aventure et je termine avec un survol de certains moments forts des diverses discussions que j’ai eu la chance d’avoir avec les invités.
L’hiver dernier, j’ai eu la chance d’aller à Copenhague, au Danemark, dans le cadre de ma recherche de doctorat.
Je suis allé visiter un laboratoire en traitement automatique de la langue naturel, le Coastal Lab, qui oeuvre précisément dans mon domaine, le transfert d’apprentissage.
Je vous fais donc part de mon expérience dans ce billet, qui j’espère pourra en inspirer d’autre à étendre leurs frontières en recherche, lorsque la situation le permettra.
Contribuer au blog n’aura jamais été aussi facile. Tout d’abord, il faut dire que toute soumission, quel que soit son format (Markdown, Microsoft Word, Notepad, name it!), sera considérée, et ultimement transcrite en Markdown. On offre l’option de soumettre un article ici et on pense déjà à une façon de faire pour la révision des documents non-Markdown (possiblement Google Docs). Ceci étant écrit, pour ceux et celles qui voudraient écrire et soumettre un article de la façon…
Cet article a pour but d’exposer les principes clés permettant une implantation haute performance du gradient boosting trees en Julia, un langage réconciliant l’expressivité et la productivité qu’on retrouve en Python et en R et la performance de langages compilés comme le C et C++.
Vendredi le 17 décembre 2019 marquait la fin de 2019 de .Layer avec la deuxième édition du Noël recap, cette fois-ci au Noctem sur Charest/du Parvis à Québec.
Un gros merci à JT Baï d’avoir pris le temps d’organiser l’événement! à Sté et JC Yelle pour la présentation et à tous ceux qui se sont pointés la bean.
Mine de rien, 2019 fut une année chargée pour .Layer.
Voici donc un petit recap pour les intéressé(e)s.
Utiliser le paquetage argparse pour faciliter l'appel de scripts R.
Stéphane Caron
8
minutes
Avez-vous déjà eu à lancer un programme avec différents paramètres? J’imagine que oui … Une manière de faire
serait de se définir des paramètres en début de programme, les changer manuellement, sauvegarder le
programme et relancer de nouveau. Vous imaginez bien que cela n’est pas agréable si on veut tester 20
combinaisons de paramètres différents. Une autre manière pourrait être de se définir un fichier de
configurations, mais encore là on se retrouve face au même problème de devoir…
.Layer (dot-layer) est une communauté ouverte promouvant la collaboration et le partage de connaissances en science des données. Dans les systèmes d'exploitation Unix, les fichiers et répertoires commençant par un point sont invisibles pour l'utilisateur. Plusieurs ignorent leur rôle et même leur existence. En ce monde où les données sont reines, les data scientists forment cette couche cachée, invisible du grand public. Il est maintenant temps que nous disions : Hello, World!