Books Home

 

Le livre de R : apprentissage et référence

 

Bernard Desgraupes

464 p. - ISBN : 978-2-311-00477-9.

 Éditions Vuibert, Paris, 2013.

 

 

Chapitre Introduction

Chapitre 1 Notions de base

1.1 Opérations de base    1

    1.1.1 Opérateurs arithmétiques    1

    1.1.2 Variables et affectation    2

    1.1.3 Affichage des variables    3

1.2 Structures de base    4

    1.2.1 Vecteurs    4

        Construction des vecteurs    5

        Séquences numériques    7

        Affichage    8

        Indexation    9

        La fonction which    10

        Vecteurs logiques    11

        Vecteurs nommés    12

        Vecteurs prédéfinis    13

    1.2.2 Listes    13

        Construction de listes    13

        Affichage    14

        Indexation    15

    1.2.3 Matrices et tableaux    16

        Création de matrices    17

        Indexation des matrices    18

        Création de tableaux    20

        Indexation des tableaux    20

    1.2.4 Tables de données    21

        Notion de dataframe    21

        Création d'un dataframe    22

    1.2.5 Tables statistiques    23

    1.2.6 Données catégorielles    24

        Notion de facteur    24

        Création de facteurs    24

        Facteurs ordonnés    26

    1.2.7 Notion d'objet    26

        Attributs et composantes d'un objet    27

        Fonctions génériques    29

        Types et modes    30

        Coercion de types    31

1.3 Calcul numérique    33

    1.3.1 Caractéristiques du calcul numérique    33

    1.3.2 Valeurs spéciales    34

    1.3.3 Fonctions mathématiques    36

    1.3.4 Nombres complexes    38

1.4 Analyse statistique descriptive    40

    1.4.1 Indicateurs statistiques    40

    1.4.2 Quantiles    43

    1.4.3 Résumés    44

    1.4.4 Statistiques bidimensionnelles    44

1.5 Aide et documentation    46

    1.5.1 La fonction help    46

    1.5.2 Structure d'une page d'aide    47

        Syntaxe    47

        Arguments requis ou optionnels    48

        Nommage des arguments    48

        Définition des arguments    49

        Détails    49

        Valeurs de retour    49

        Autres sections    50

    1.5.3 Exemples et demos    50

    1.5.4 Vignettes    51

Chapitre 2 Packages et extensions

2.1 Utilisation de packages existants    53

2.2 Emplacement des packages    54

2.3 Installation d'un package    54

2.4 Information sur les packages    56

2.5 Les packages de base    57

    2.5.1 Chargement au démarrage    57

    2.5.2 La fonction search    57

2.6 Les packages recommandés    59

2.7 Mise à jour des packages    59

Chapitre 3 Manipulation des données

3.1 Jeux de données    61

3.2 Manipulation des vecteurs    62

    3.2.1 Répétition, vectorisation et recyclage    62

    3.2.2 Ajout, suppression, insertion    64

    3.2.3 Formatage d'un vecteur    65

    3.2.4 Variables centrées et réduites    68

3.3 Manipulation des matrices    68

    3.3.1 Ajout de lignes, colonnes, transposition    69

    3.3.2 Coercion    72

3.4 Manipulation des tableaux    73

3.5 Manipulation des listes    74

    3.5.1 Ajout, suppression, insertion    74

    3.5.2 Coercion    75

3.6 Manipulation des dataframes    77

    3.6.1 Attache des données    77

    3.6.2 Ajout de données    78

    3.6.3 Opérations sur les données    78

3.7 Manipulation des chaînes    82

    3.7.1 Formatage et construction de chaînes    83

    3.7.2 Expressions régulières    84

    3.7.3 Recherche de correspondances    86

    3.7.4 Substitution    88

    3.7.5 Scission des chaînes    89

3.8 Traitement des valeurs manquantes    90

3.9 Tri des données    91

3.10 Les fonctions de manipulation    93

    3.10.1 La fonction with    93

    3.10.2 La fonction by    93

    3.10.3 La fonction aggregate    95

    3.10.4 La fonction cut    96

    3.10.5 La fonction split    97

    3.10.6 Les fonctions apply    98

    3.10.7 La fonction outer    100

    3.10.8 La fonction replicate    101

    3.10.9 La fonction sweep    102

    3.10.10 La fonction reshape    103

3.11 Formats de dates    105

3.12 Packages relatifs à la manipulation des données    109

    3.12.1 Le package bitops    110

    3.12.2 Le package reshape    111

        La fonction melt    112

        La fonction cast    112

        Autres fonctions    115

    3.12.3 Le package plyr    117

        Opérations multiples    118

        Traitement de sous-ensembles    118

        Manipulations et transformations    122

        Itérateurs    128

Chapitre 4 Distributions

4.1 Nombres au hasard    131

    4.1.1 Algorithmes RNG    131

    4.1.2 Reproduction du hasard    132

4.2 Tirage au hasard    133

4.3 Distributions classiques    133

4.4 Autres lois de probabilité    137

4.5 Analyse combinatoire    137

Chapitre 5 Graphiques

5.1 Tracés de courbes    141

    5.1.1 La fonction plot    142

    5.1.2 La fonction curve    143

    5.1.3 La fonction lines    144

    5.1.4 Création d'un graphique vide    145

5.2 Périphériques de sortie    145

    5.2.1 Fenêtres graphiques    145

    5.2.2 Fichiers graphiques    146

    5.2.3 Manipulation des périphériques    147

    5.2.4 Impression des graphiques    148

    5.2.5 Systèmes de coordonnées    148

5.3 Paramètres graphiques    150

5.4 Éléments graphiques    153

    5.4.1 Droites    154

    5.4.2 Rectangles    154

    5.4.3 Segments    155

    5.4.4 Flèches    155

    5.4.5 Points    155

    5.4.6 Titre    156

    5.4.7 Polygones    156

    5.4.8 Texte    157

    5.4.9 Grille    158

    5.4.10 Cadre    158

    5.4.11 Marques et graduations    159

    5.4.12 Légende    161

    5.4.13 Splines    162

5.5 Expressions mathématiques    163

5.6 Graphiques statistiques    166

    5.6.1 Diagrammes en bâtons    168

    5.6.2 Diagrammes circulaires    169

    5.6.3 Diagrammes à moustaches    170

    5.6.4 Histogrammes    171

    5.6.5 Diagrammes en mosaïque    172

    5.6.6 Diagrammes d'association    173

    5.6.7 Diagrammes dichotomiques    174

    5.6.8 Diagrammes pointillés    174

    5.6.9 Diagrammes de répartition    176

    5.6.10 Spinogrammes    177

    5.6.11 Diagrammes matriciels    178

    5.6.12 Graphiques de densité conditionnelle    180

    5.6.13 Pétalogrammes    181

    5.6.14 Tiges et feuilles    182

5.7 Graphiques multiples    183

    5.7.1 La fonction matplot    183

    5.7.2 Les paramètres mfrow et mfcol    184

    5.7.3 La fonction layout    185

    5.7.4 Subdivision d'un graphique    186

5.8 Graphiques 3D    187

    5.8.1 Représentation spatiale    187

    5.8.2 Lignes de niveau    188

    5.8.3 Le package scatterplot3d    189

5.9 Le package lattice    191

Chapitre 6 Lecture et écriture

6.1 Formats de fichiers    197

6.2 Désignation des fichiers    198

6.3 Fichiers texte    199

    6.3.1 Fonctions de lecture    200

    6.3.2 Fonctions d'écriture    203

6.4 Fichiers binaires    204

    6.4.1 Écriture de fichiers binaires    205

    6.4.2 Lecture de fichiers binaires    206

6.5 La fonction cat    207

6.6 Flux de données    208

    6.6.1 Lecture    208

    6.6.2 Écriture    209

    6.6.3 Redirection    210

6.7 Le package foreign    210

6.8 Fichiers d'images    212

    6.8.1 Le package pixmap    212

    6.8.2 Le package bmp    214

    6.8.3 Le package png    215

    6.8.4 Le package jpeg    215

    6.8.5 Le package tiff    216

    6.8.6 Le package rtiff    217

6.9 Autres types de fichiers    219

6.10 Fichiers compressés    220

    6.10.1 Archivage et compression    220

    6.10.2 Le package Rcompression    221

6.11 Transfert de fichiers    224

    6.11.1 Le package RCurl    224

6.12 Autres formats de texte    227

    6.12.1 Le package xtable    227

    6.12.2 Le package R2HTML    229

Chapitre 7 Analyse statistique

7.1 Noyaux de densité    231

    7.1.1 Méthodes d'estimation    231

    7.1.2 La fonction density    233

    7.1.3 La fonction kde2d    234

    7.1.4 Le package KernSmooth    236

7.2 Tests statistiques    237

    7.2.1 Les tests classiques    238

    7.2.2 Autres packages relatifs aux tests    240

7.3 Bootstrap    242

7.4 Coefficients de corrélation    244

7.5 Analyse des données    246

    7.5.1 Rappels théoriques    246

    7.5.2 La fonction prcomp    247

    7.5.3 Le package ca    249

    7.5.4 Le package FactoMineR    250

    7.5.5 Autres ressources d'analyse des données    252

Chapitre 8 Programmation élémentaire

8.1 Scripts    255

    8.1.1 Exécution depuis la console R    256

    8.1.2 Exécution depuis un terminal    257

        Script exécutable    257

        Passage d'arguments    258

8.2 Structures de contrôle    258

    8.2.1 Les blocs conditionnels    258

    8.2.2 Les boucles itératives    259

        La commande for    259

        La commande while    260

        La commande repeat    261

        Sortie de boucle    261

        La commande switch    262

    8.2.3 Conditions logiques    263

        Conditions d'égalité    263

        Conditions d'appartenance    265

8.3 Définition de fonctions    265

    8.3.1 Les objets fonctions    265

    8.3.2 Arguments de fonctions    266

    8.3.3 Vérification d'arguments    269

    8.3.4 Valeur de retour    270

    8.3.5 Interruptions    271

    8.3.6 Introspection des fonctions    271

8.4 Le répertoire de travail    272

8.5 Manipulation des fichiers    272

    8.5.1 Opérations sur les chemins    273

    8.5.2 Opérations sur les fichiers    274

    8.5.3 Fichiers temporaires    274

    8.5.4 Informations système    275

    8.5.5 Commandes système    276

    8.5.6 Encodages    276

8.6 Définition d'opérateurs    277

8.7 Débogage et tests    278

    8.7.1 Les fonctions de débogage    278

    8.7.2 Performances de l'interpréteur    279

        La fonction system.time    280

        Le package rbenchmark    280

Chapitre 9 Calcul numérique matriciel

9.1 Calcul matriciel élémentaire    283

    9.1.1 Produit matriciel    283

    9.1.2 Distances    286

9.2 Diagonalisation    287

9.3 Factorisations    288

    9.3.1 Décomposition en valeurs singulières    288

    9.3.2 Décomposition QR    289

    9.3.3 Décomposition de Cholesky    291

    9.3.4 Décomposition LU    292

    9.3.5 Décomposition de Schur    293

9.4 Matrices pleines et creuses    294

    9.4.1 Le package Matrix    294

    9.4.2 Le package SparseM    296

9.5 Exponentielle matricielle    297

Chapitre 10 Modèle linéaire

10.1 Rappels théoriques    299

10.2 La fonction lm    301

10.3 Diagnostics et mesures d'influence    306

10.4 Analyse de variance    309

10.5 Sélection des variables exogènes    311

10.6 La notation de Rogers-Wilkinson    313

Chapitre 11 Classification

11.1 Classification hiérarchique    316

11.2 Partitionnement par k-moyennes    319

11.3 Arbres récursifs    321

    11.3.1 Le package tree    322

    11.3.2 Le package rpart    325

11.4 Le package cluster    327

11.5 Indices de qualité    328

Chapitre 12 Séries temporelles

12.1 Création de séries temporelles    333

12.2 Manipulation des séries temporelles    335

12.3 Représentation des séries temporelles    339

12.4 Lissage des séries temporelles    340

    12.4.1 Le lissage par moyenne mobile    342

    12.4.2 Le lissage par LOESS    344

    12.4.3 Le lissage de Holt-Winter    345

    12.4.4 Le lissage exponentiel    346

    12.4.5 Analyse spectrale    346

12.5 Tests pour les séries temporelles    347

12.6 Packages relatifs aux séries temporelles    348

Chapitre 13 Programmation avancée

13.1 Création de packages    351

    13.1.1 Anatomie d'un package    352

    13.1.2 Le fichier DESCRIPTION    352

    13.1.3 Le fichier NAMESPACE    353

    13.1.4 Les fichiers d'aide    355

    13.1.5 Autres répertoires source    355

    13.1.6 Exemple minimal de package    356

13.2 Programmation orientée objets    359

    13.2.1 Le modèle S3    361

        Notion de classes    361

        Notion de méthodes    362

        Extension du modèle    362

        Nouvelle classe    364

        Surcharge de méthodes    365

        Surcharge d'opérateurs    366

    13.2.2 Le modèle S4    368

        Définitions    368

        Méthodes    370

        Initialisation    372

        Héritage    372

        Opérateurs d'indexation    374

        Coercion de classe    376

        Introspection    379

        Suppression    380

13.3 Capture des erreurs    380

13.4 Programmation en C    382

13.5 Programmation en Fortran    386

Annexes

Annexe A Configuration et options

A.1 Options globales    391

A.2 Environnement et configuration    392

A.3 Espace de travail    392

A.4 Historique des commandes    393

A.5 Informations de session    393

A.6 Variables d'environnement    393

Annexe B La commande R

B.1 La commande shell R    395

B.2 La commande Rscript    396

B.3 Les commandes R CMD    397

        R CMD BATCH    397

        R CMD COMPILE    397

        R CMD SHLIB    398

        R CMD INSTALL    398

        R CMD REMOVE    398

        R CMD build    398

        R CMD check    398

        R CMD Rdconv    399

        R CMD Rd2pdf    399

        R CMD Sweave    399

        R CMD Stangle    399

        R CMD config    399

Annexe C Jeux de données

Annexe D Sweave

Annexe E La norme IEEE

E.1 Définition des nombres en virgule flottante    411

E.2 Format de représentation    412

E.3 Les nombres spéciaux    413

E.4 Précision de R    414

Annexe F Spécification des couleurs

F.1 Désignation des couleurs    415

F.2 Palettes de couleurs    417

F.3 Espaces colorimétriques    419

F.4 Packages relatifs aux couleurs    421

Bibliographie

Index