Généralement, en programmant avec un langage de programmation, vous devez utiliser diverses variables pour stocker diverses informations. Les variables ne sont rien d’autre que des emplacements de mémoire réservés pour stocker des valeurs. Cela signifie que, lorsque vous créez une variable, vous réservez de l’espace en mémoire.
Vous pouvez avoir besoin de stocker des informations de divers types de données comme le caractère, caractère large, entier, virgule flottante, double virgule flottante, booléen, etc .. Basé sur le type de données d’une variable, le système d’exploitation alloue de la mémoire et décide ce qui peut être stocké en mémoire.
Contrairement à d’autres langages de programmation comme C et java dans R, les variables ne sont pas déclarées comme type de données. Les variables sont affectées à R-Objects et le type de données de l’objet R devient le type de données de la variable. Il existe de nombreux types d’objets R. Les plus fréquemment utilisés sont –
Vecteurs
Listes
Matrices
Tableaux
Facteurs
Cadres de données (Data Frame)
Le plus simple de ces objets est l’objet vectoriel et il existe six types de données de ces vecteurs atomiques, également appelés six classes de vecteurs. Les autres objets R sont construits sur les vecteurs atomiques.
| Type de donnée | Exemple | Code R |
|---|---|---|
| Logique | TRUE, FALSE |
v <- TRUE print(class(v)) retourne [1] "logical" |
| Numerique | 12.3, 5, 999 |
v <- 23.5 print(class(v)) retourne [1] "numeric" |
| Entier | 2L, 34L, 0L |
v <- 2L print(class(v)) retourne [1] "integer" |
| Complexe | 3 + 2i |
v <- 2+5i print(class(v)) retourne [1] "complex" |
| Caractère | ‘a’ , ‘ »bien », « TRUE », ‘23.4’ |
v <- "TRUE" print(class(v)) retourne [1] "character" |
| Raw | « Bonjour » est stocké à 48 65 6c 6c 6f |
v <- charToRaw("Bonjour") print(class(v)) retourne [1] "raw" |
Dans la programmation R, les types de données les plus élémentaires sont les objets R appelés vecteurs qui contiennent des éléments de classes différentes comme montré ci-dessus. Noter qu’en R le nombre de classes n’est pas limitée à seulement les six types ci-dessus. Par exemple, nous pouvons utiliser de nombreux vecteurs atomiques et créer un tableau dont la classe deviendra un tableau.
Vecteur
Lorsque vous voulez créer un vecteur avec plus d’un élément, vous devez utiliser la fonction c () qui indique que l’on combine les éléments dans un vecteur.
# Créer un vecteur.
pomme <- c(‘rouge’,’vert’, »jaune »)
print(pomme)
# Quelle est la classe de ce vecteur.
print(class(pomme))
Liste
Une liste est un objet R qui peut contenir plusieurs types d’éléments à l’intérieur, comme des vecteurs, des fonctions et même une autre liste à l’intérieur.
# Créer une liste.
list1 <- list(c(2,5,3),21.3,sin)
# Print the list.
print(list1)
Matrice
Une matrice est un ensemble de données rectangulaires bidimensionnelles. Elle peut être créée en utilisant une entrée vectorielle à la fonction matrice.
# Créer une matrice
M = matrix( c(‘a’,’a’,’b’,’c’,’b’,’a’), nrow = 2, ncol = 3, byrow = TRUE)
print(M)
Tableau
Alors que les matrices sont confinées à deux dimensions, les tableaux peuvent être de n’importe quel nombre de dimensions. La fonction array prend un attribut dim qui crée le nombre requis de dimension. Dans l’exemple ci-dessous nous créons un tableau avec deux éléments qui sont des matrices 3×3 chacune.
# Créer un tableau.
a <- array(c(‘vert’,’jaune’),dim = c(3,3,2))
print(a)
Les facteurs
Les facteurs sont des objets r qui sont créés à l’aide d’un vecteur. Il stocke le vecteur avec les valeurs distinctes des éléments dans le vecteur sous forme d’étiquettes. Les étiquettes sont toujours sous la forme de caractère, qu’il s’agisse d’un caractère numérique ou d’un caractère ou d’un caractère booléen, etc., dans le vecteur d’entrée. Ils sont utiles dans la modélisation statistique.
Les facteurs sont créés à l’aide de la fonction factor (). Les fonctions nlevels donnent le nombre de niveaux.
# Créer un vecteur.
couleur_pomme <- c(‘vert’,’vert’,’jaune’,’rouge’,’rouge’,’rouge’,’vert’)
# Créer un objet facteur.
factor_pomme <- factor(couleur_pomme)
# Affichages de facteur.
print(factor_pomme)
print(nlevels(factor_pomme))
Data Frames
Les data Frames sont des objets de données tabulaires. Contrairement à une matrice dans une trame de données, chaque colonne peut contenir différents modes de données. La première colonne peut être numérique tandis que la deuxième colonne peut être de caractère et la troisième colonne peut être logique. C’est une liste de vecteurs de longueur égale.
Les cadres de données sont créés à l’aide de la fonction data.frame ().
# Créer une data frame.
Typo<- data.frame(
gender = c(« Femme », « Homme », »Femme »),
height = c(152, 171.5, 165),
weight = c(81,93, 78),
Age = c(42,38,26)
)
print(Typo)