Défi des 100 jours de Ran.Données

Je partage l'événement

Veuillez noter que les séances d’apprentissage et les tutoriels seront bilingues, selon la composition des groupes. La documentation utilisée et créée par les instructeurs sera principalement anglophone. Les instructeurs seront bilingues et pourront répondre à vos questions en français comme en anglais.

Êtes-vous motivé.e?

Quoi de mieux comme résolution pour l’année 2021 que d’intégrer une nouvelle habitude à votre quotidien : programmer et travailler sur un projet une heure par jour… L’AÉBINUM et IVADO vous invitent à rejoindre la communauté du Défi des 100 jours de Ran.Données! C’est l’occasion parfaite pour vous initier à l’analyse de données et à l’apprentissage automatique, tout en complétant un projet de A à Z.

En quoi consiste ce défi exactement?

Le Défi des 100 jours de Ran.Données, c’est allier l’utile à l’agréable! Tout commence par un jeu de données et une idée de projet – ça, c’est vous qui les fournissez. Nous, on s’occupe de vous initier à votre langage de programmation préféré entre R, Python et Julia. Que les 100 jours commencent! De semaine en semaine, nous vous proposerons différents ateliers et tutoriels qui vous aideront à progresser dans votre projet. Nous toucherons à plusieurs sujets, dont la gestion d’un projet d’analyse, l’utilisation d’outils de versionnage, la visualisation de données, les concepts de l’apprentissage machine, et bien d’autres. Le but sera de vous permettre de développer et d’acquérir de nouvelles techniques / habiletés dans un contexte communautaire motivant! Le Défi sera lancé lors d’un après-midi d’ateliers de programmation, qui se conclura par un 5@7 de réseautage. Ce sera le moment parfait pour rencontrer les autres participant.e.s et échanger ensemble! Pour les intéressé.e.s, trouver vos futur.e.s partenaires si vous préférez travailler en équipe. Question de faire changement des séances Zoom habituelles, vous aurez accès à l’espace GatherTown du Défi : libre à vous de vous promener, d’assister aux ateliers, de faire des rencontres, de discuter autour d’un café virtuel, ou même de faire une petite partie de Scattergories! Après ce premier après-midi, ce sera à vous de jouer…

N’hésitez pas à partager vos questions, réussites, et répondre aux autres participant.e. s sur le Slack du Défi, ainsi que sur les différents réseaux sociaux en utilisant les mots-clic #randonnees2021 et/ou #datatrek2021. Vous pourrez aussi tenter de relever différents challenges qui vous permettront d’accumuler des points tout au long du défi. Accumulez un certain nombre de points, et vous recevrez une attestation de participation au Défi des 100 jours de Ran.Données de la part d’IVADO! Tel que mentionné plus haut, vous aurez accès à différents ateliers et tutoriels tout au long des 100 jours, en plus de quelques évènements sociaux pour célébrer des étapes importantes. Enfin, le 100e jour, nous pourrons célébrer vos accomplissements tous ensemble!

Mais au fait, pourquoi 100 jours?

Parce que compléter un projet d’analyse de données tout en développant de nouvelles habiletés, ça demande du temps! Le Défi Ran.Données étant aussi une occasion pour apprendre à programmer ou peaufiner vos habiletés en programmation, il faut un minimum de temps pour mettre vos nouveaux acquis en pratique. Nous sommes conscients que 100 jours peuvent paraître longs… mais nous avons prévu le coup! Plusieurs outils et ressources seront mis en place pour vous accompagner et vous soutenir tout au long du défi.

Prêt.e.s à tenter l’aventure? Alors inscrivez-vous!

Informations clés

Public cible

Étudiant.e.s et professionnel.le.s en science de la vie, intéressé.e.s par l’essor de la science des données, l’intelligence artificielle, et les disciplines connexes.

Objectifs

  • Initier et développer des talents à l’intersection des sciences de la vie/sciences humaines et de l’intelligence numérique;
  • Mettre en place une méthodologie complète pour mener à terme un projet d’analyse de données dans un contexte précis;
  • Développer des habiletés en programmation R, Python ou Julia;
  • Intégrer des outils et notions d’apprentissage automatique à un projet d’analyse de données;
  • Apprendre quelque chose de nouveau quotidiennement;
  • Mettre en place une communauté d’entraide;
  • Avoir du plaisir!

Pré-requis

Afin de pouvoir démarrer le défi dans les meilleures conditions, nous demandons à chaque participant.e d’arriver préparé.e. Dès le premier jour, vous devrez donc avoir:

  • Un jeu de données à analyser (vous pouvez consulter nos suggestions si vous n’en avez pas);
  • Une idée de projet d’analyse : quelle question d’analyse cherchez-vous à réponse? ;
  • Un environnement de travail propice à la programmation R, Python ou Julia (vous choisissez votre langage!).

Recommandations

  • Comptabiliser un minimum de 100 heures de travail sur 100 jours;
  • Travailler sur votre projet un minimum de 5 jours par semaine;
  • Ne pas passer 3 jours sans coder;
  • Travailler comme bon vous semble: seul.e ou en équipe;
  • Lorsque vous programmez, essayez d’appliquer le concept du commit-a-day pour bien faire le suivi de vos progrès et de vos heures de travail;
  • S’engager à relever le défi et partager vos accomplissements dans le Slack ou sur les réseaux sociaux à l’aide des mots-clic #randonnees2021 et/ou #datatrek2021.

Organisatrices

Code de conduite

En vous inscrivant au défi Ran.Données, vous acceptez de vous souscrire au code de conduite (CdC) de l’AÉBINUM.

 

Calendrier provisoire

8 janvier, 13:00-17:00 : Lancement du défi

  • Introduction aux langages de programmation à partir d’un exemple d’analyse complète.

11 janvier 

  • Mise en place votre environnement de travail: ligne de commande, script et notebooks;
  • Compte Github.

13 janvier

  • Initialisation d’un readme sur Github;
  • Déterminer une question/but d’analyse;
  • Réfléchir à ce que vous souhaitez accomplir à la fin du défi.

15 janvier 

  • Lier un compte Github à un répertoire local.

Semaine du 18 janvier : traitement de données

  • Uploader vos données;
  • Dataframe et table;
  • Nettoyer vos données.

Semaine du 1er février : visualisation de données

  • Introduction à des outils de visualisation et aux différents types de graphs.

Semaine du 15 février : analyse statistique

  • Introduction à différentes implémentations de tests statistiques et incorporation des résultats dans une approche de visualisation.

Semaine du 1er mars (relâche Université de Montréal) : Introduction au Machine Learning

  • Analyse ML de base: clustering (k-mean), transformations (PCA, tSNE), régression linéaire et non-linéaire, etc.
  • Concept de ML intermédiaire : réseaux de neurones, random forest, etc.

Semaine du 15 mars : Gather Time!

Semaine du 29 mars : Gather Time!

Semaine du 19 avril : Présentation de vos projets

  • Préparer votre présentation finale.