Celle-ci prend en premier argument un vecteur, puis une série de recodages sous la forme Nouvelle valeur = Ancienne valeur . À noter que toutes ces opérations sont sensibles à la casse (majuscules/minuscules), aux accents, aux espaces, etc. Il faut donc recopier exactement à l'identique les noms des anciennes valeurs.
9.3.2 Modifier les modalités d'une variable qualitative
Il existe plusieurs possibilités pour effectuer ce type de recodage, mais ici on va utiliser la fonction fct_recode de l'extension forcats . Celle-ci prend en argument une liste de recodages sous la forme "Nouvelle valeur" = "Ancienne valeur" .
La représentation graphique de la distribution des probabilités d'une variable qualitative fait appel à 2 types de graphique communément désigné sous les termes : diagramme en bâton et le diagramme circulaire.
5.3.2 Quantitatif à qualitatif
Si une variable numérique contient en réalité un petit nombre de valeurs différentes, il suffit de convertir la classe de l'objet de numeric vers factor ou ordered pour que R comprenne que la variable doit être traitée comme une variable qualitative.
Le test le plus utilisé pour tester la liaison entre une variable quantitative et une variable qualitative à deux (2) modalités est le test de Student (alternative test de Man-Withney).
Il s'agit du test de Kruskal-Wallis, mesure de l'association entre deux variables qualitatives.
Il est possible de regrouper les données relatives à deux variables qualitatives sous la forme d'un tableau d'effectifs ou de fréquences. On parle de tableau de contingence. La réalisation d'un tableau de contingence sur R se fait à l'aide de la commande table() .
Une variable catégorique (aussi appelée variable qualitative) réfère à une caractéristique qui n'est pas quantifiable. Une variable catégorique peut être nominale ou ordinale.
Renommer des variables
Sous R les noms de variables doivent être à la fois courts et explicites. Les noms de variables peuvent contenir des lettres, des chiffres (mais ils ne peuvent pas commencer par un chiffre), les symboles . et _ et doivent commencer par une lettre.
Re: Créer une boucle pour changer le type de variable
S'il n'est pas possible de modifier la base, on peut toujours transformer le data frame sous R avec (par exemple) la fonction reshape (du format "wide" vers le format "long"), puis ensuite reformatter l'unique colonne date.
Pour étudier le relation entre une variable qualitative et une variable quantita- tive, on décompose la variation totale en variation intergroupe et en variation intragroupe. Pour mesurer l'intensité de la relation (toujours d'un point de vue descriptif), on peut calculer un param`etre appelé rapport de corrélation.
On appelle affectation le fait de donner une certaine valeur à une variable. Affecter une valeur à une variable signifie écrire cette valeur dans la case mémoire représentée par la variable. Pour réaliser une affectation en JavaScript ou en Python on utilise le signe = .
Après avoir lancé XLSTAT, cliquez sur l'icône Préparation des données et choisissez la fonction Codage ou dans la barre d'outils Préparation des données sélectionnez l'icone Codage. Une fois le bouton cliqué, la boîte de dialogue apparaît. Vous pouvez alors sélectionner la variable à recoder sur la feuille Excel.
Pour déclarer des variables d'un type non signé, il vous suffit de faire précéder le nom du type entier du mot-clé unsigned .
Exemple : l'âge est théoriquement une variable quantitative continue, mais en pratique l'âge est mesuré dans le meilleur des cas au jours près.
En algèbre, on tente de généraliser les calculs en remplaçant très souvent les nombres par des lettres. Ces lettres se nomment des variables. Une variable peut être représentée par n'importe quelle lettre de l'alphabet. Dans ces expressions algébriques, les lettres a, b, c, y et z sont des variables.
Les variables qualitatives les plus simples sont les variables qualitatives binaires (ou dichotomiques) qui ne comptent que deux modalités ; c'est le cas par exemple pour le sexe, ou pour le codage de la plupart des états pathologiques (présence ou absence de la maladie).
ANOVA permet de déterminer si la différence entre les valeurs moyennes est statistiquement significative. ANOVA révèle aussi indirectement si une variable indépendante influence la variable dépendante.
Deux variables quantitatives sont corrélées si elles tendent à varier l'une en fonction de l'autre. On parle de corrélation positive si elles tendent à varier dans le même sens, de corrélation négative si elles tendent à varier en sens contraire.
En utilisant une variable temporaire
La méthode la plus simple et probablement la plus répandue pour permuter deux variables est d'utiliser une troisième variable temporaire. L'inconvénient de cette méthode est qu'elle nécessite une variable supplémentaire.
Or selon la théorie il faut faire un test de Fisher lorsque la présence de racine unitaire n'est pas rejetée (p. value > 5%). Dans le cas contraire, le test convenable est en principe celui de student pour tester uniquement la significativité de la tendance ou de la constante.
Deux échantillons E1 et E2 sont dit appariés lorsque chaque valeur x1,i de E1 est associée à une valeur x2,i de E2 (appariés = associés par paire : variables dépendantes). Par exemple E1 peut être un groupe de malades avant traitement et E2 le groupe des mêmes malades après traitement.
Lorsque l'un des effectifs théoriques est inférieur à 5 ou lorsque les sommes marginales du jeu de données réel sont très déséquilibrées, il est préférable de se fier au test exact de Fisher.