logo

R – Gegevensframes

R-programmeertaal is een open-source programmeertaal die veel wordt gebruikt als statistische software en data-analysetool. Dataframes in R-taal zijn generieke gegevensobjecten van R die worden gebruikt om tabelgegevens op te slaan.

Dataframes kunnen ook worden geïnterpreteerd als matrices waarbij elke kolom van a Matrix kunnen van verschillende gegevenstypen zijn. R DataFrame bestaat uit drie hoofdcomponenten: de gegevens, rijen en kolommen.



R-dataframestructuur

Zoals u in de onderstaande afbeelding kunt zien, is dit de manier waarop een dataframe is gestructureerd.

De gegevens worden in tabelvorm gepresenteerd, waardoor ze gemakkelijker te bedienen en te begrijpen zijn.

R - DataframesGeeksforgeeks

R – Gegevensframes



Maak een dataframe in programmeertaal R

Gebruik om een ​​R-dataframe te maken data.frame() functie en geef vervolgens elk van de vectoren die u hebt gemaakt als argumenten door aan de functie.

R






# R program to create dataframe> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # print the data frame> print>(friend.data)>

>

>

Uitgang:

 friend_id friend_name 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>

Verkrijg de structuur van het R-dataframe

Men kan de structuur van het R-dataframe verkrijgen met behulp van str() functie in R.

Het kan zelfs de interne structuur van grote geneste lijsten weergeven. Het biedt one-liner uitvoer voor de basis-R-objecten, zodat de gebruiker meer te weten komt over het object en zijn bestanddelen.

R




bellen sorteren in Java

# R program to get the> # structure of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using str()> print>(>str>(friend.data))>

>

>

Uitgang:

'data.frame': 5 obs. of 2 variables:  $ friend_id : int 1 2 3 4 5  $ friend_name: chr 'Sachin' 'Sourav' 'Dravid' 'Sehwag' ... NULL>

Samenvatting van gegevens in het R-dataframe

In het R-gegevensframe kunnen de statistische samenvatting en de aard van de gegevens worden verkregen door toepassing samenvatting() functie.

Het is een generieke functie die wordt gebruikt om resultaatsamenvattingen te produceren van de resultaten van verschillende modelaanpassingsfuncties. De functie roept bepaalde methoden aan die afhankelijk zijn van de klasse van het eerste argument.

R




# R program to get the> # summary of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using summary()> print>(>summary>(friend.data))>

>

>

Uitgang:

 friend_id friend_name   Min. :1 Length:5   1st Qu.:2 Class :character   Median :3 Mode :character   Mean :3   3rd Qu.:4   Max. :5>

Gegevens extraheren uit gegevensframe in R

Het extraheren van gegevens uit een R-dataframe betekent dat u toegang krijgt tot de rijen of kolommen ervan. Men kan een specifieke kolom uit een R-dataframe extraheren met behulp van de kolomnaam.

R




# R program to extract> # data from the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Extracting friend_name column> result <->data.frame>(friend.data$friend_name)> print>(result)>

>

>

Uitgang:

 friend.data.friend_name 1 Sachin 2 Sourav 3 Dravid 4 Sehwag 5 Dhoni>

Vouw Data Frame uit in R-taal

Een dataframe in R kan worden uitgebreid door nieuwe kolommen en rijen toe te voegen aan het reeds bestaande R-dataframe.

R




# R program to expand> # the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Expanding data frame> friend.data$location <->c>(>'Kolkata'>,>'Delhi'>,> >'Bangalore'>,>'Hyderabad'>,> >'Chennai'>)> resultant <- friend.data> # print the modified data frame> print>(resultant)>

>

>

Uitgang:

 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>

In R kan men verschillende soorten bewerkingen uitvoeren op een dataframe, zoals toegang krijgen tot rijen en kolommen, de subset van het dataframe selecteren, dataframes bewerken, rijen en kolommen in een dataframe verwijderen , enz.

Raadpleeg alstublieft DataFrame-bewerkingen in R meer weten over alle soorten bewerkingen die op een dataframe kunnen worden uitgevoerd.

Toegang tot items in R Data Frame

We kunnen elk element uit het dataframe selecteren en openen met behulp van single$>, beugels[ ] or>dubbele beugels[[]]>om toegang te krijgen tot kolommen vanuit een dataframe.

R




# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Access Items using []> friend.data[1]> # Access Items using [[]]> friend.data[[>'friend_name'>]]> # Access Items using $> friend.data$friend_id>

>

>

Java-tutorial voor beginners

Uitgang:

 friend_id 1 1 2 2 3 3 4 4 5 5 Access Items using [[]] [1] 'Sachin' 'Sourav' 'Dravid' 'Sehwag' 'Dhoni'   Access Items using $ [1] 1 2 3 4 5>

Aantal rijen en kolommen

We kunnen erachter komen hoeveel rijen en kolommen in ons dataframe voorkomen door de dim-functie te gebruiken.

R




# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # find out the number of rows and clumns> dim>(friend.data)>

>

>

Uitgang:

[1] 5 2>

Voeg rijen en kolommen toe in R Data Frame

In een R DataFrame kunt u eenvoudig rijen en kolommen toevoegen. Invoeging helpt bij het uitbreiden van het reeds bestaande DataFrame, zonder dat er een nieuw exemplaar nodig is.

Laten we eens kijken hoe we rijen en kolommen in een DataFrame kunnen toevoegen? met een voorbeeld:

Rijen toevoegen in R-gegevensframe

Om rijen aan een dataframe toe te voegen, kunt u een ingebouwde functie gebruiken rbind().

Het volgende voorbeeld demonstreert de werking van rbind() in R Data Frame.

R




# Creating a dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products): '>)> print>(Products)> # Adding a new row for a new product> New_Product <->c>(104,>'Sunglasses'>, 39.99, 40)> Products <->rbind>(Products, New_Product)> # Print the updated dataframe after adding the new product> cat>(>' Updated dataframe after adding a new product: '>)> print>(Products)>

>

>

Uitgang:

Existing dataframe (Products):   Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25  Updated dataframe after adding a new product:   Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 4 104 Sunglasses 39.99 40>

Kolommen toevoegen in R Data Frame

Om kolommen aan een Data Frame toe te voegen, kunt u een ingebouwde functie gebruiken cbind().

Het volgende voorbeeld demonstreert de werking van cbind() in R Data Frame .

R




# Existing dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products): '>)> print>(Products)> # Adding a new column for 'Discount' to the dataframe> Discount <->c>(5, 10, 8)># New column values for discount> Products <->cbind>(Products, Discount)> # Rename the added column> colnames>(Products)[>ncol>(Products)] <->'Discount'> # Renaming the last column> # Print the updated dataframe after adding the new column> cat>(>' Updated dataframe after adding a new column 'Discount': '>)> print>(Products)>

>

>

Uitgang:

Existing dataframe (Products):   Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25  Updated dataframe after adding a new column 'Discount':   Product_ID Product_Name Price Stock Discount 1 101 T-Shirt 15.99 50 5 2 102 Jeans 29.99 30 10 3 103 Shoes 49.99 25 8>

Rijen en kolommen verwijderen

Een dataframe in R verwijdert kolommen en rijen uit het reeds bestaande R-dataframe.

Rij verwijderen in R DataFrame

R


wat is desktop ini



library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove a row with friend_id = 3> data <->subset>(data, friend_id != 3)> data>

>

>

Uitgang:

 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai   # Remove a row with friend_id = 3   friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>

In de bovenstaande code hebben we eerst een dataframe gemaakt met de naam gegevens met drie kolommen: vriend_id , vriend_naam , En plaats . Om een ​​rij te verwijderen met vriend_id gelijk aan 3, gebruikten we de subgroep() functie en specificeerde de voorwaarde vriend_id != 3 . Hiermee is de rij met verwijderd vriend_id gelijk aan 3.

Kolom verwijderen in R DataFrame

R




library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove the 'location' column> data <->select>(data, -location)> data>

>

>

Uitgang:

 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>Verwijder de kolom 'locatie' vriend_id vriend_naam 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>

Om de plaats kolom, we gebruikten de selecteer() functie en gespecificeerd -plaats . De -teken geeft aan dat we de plaats kolom. Het resulterende gegevensframe gegevens heeft slechts twee kolommen: vriend_id En vriend_naam .

Dataframes combineren in R

Er zijn twee manieren om dataframes in R te combineren. U kunt ze verticaal of horizontaal combineren.

Laten we beide gevallen met een voorbeeld bekijken:

Combineer R-dataframe verticaal

Als u 2 dataframes verticaal wilt combineren, kunt u gebruiken rbind() functie. Deze functie werkt voor de combinatie van twee of meer dataframes.

R




# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Name =>c>(>'Charlie'>,>'David'>),> >Age =>c>(28, 35),> >Score =>c>(90, 85)> )> # Print the existing dataframes> cat>(>'Dataframe 1: '>)> print>(df1)> cat>(>' Dataframe 2: '>)> print>(df2)> # Combining the dataframes using rbind()> combined_df <->rbind>(df1, df2)> # Print the combined dataframe> cat>(>' Combined Dataframe: '>)> print>(combined_df)>

>

veelvraat versus das
>

Uitgang:

Dataframe 1:   Name Age Score 1 Alice 25 80 2 Bob 30 75  Dataframe 2:   Name Age Score 1 Charlie 28 90 2 David 35 85  Combined Dataframe:   Name Age Score 1 Alice 25 80 2 Bob 30 75 3 Charlie 28 90 4 David 35 85>

Combineer R-dataframe horizontaal:

Als u 2 dataframes horizontaal wilt combineren, kunt u gebruiken cbind()-functie. Deze functie werkt voor de combinatie van twee of meer dataframes.

R




# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Height =>c>(160, 175),> >Weight =>c>(55, 70)> )> # Print the existing dataframes> cat>(>'Dataframe 1: '>)> print>(df1)> cat>(>' Dataframe 2: '>)> print>(df2)> # Combining the dataframes using cbind()> combined_df <->cbind>(df1, df2)> # Print the combined dataframe> cat>(>' Combined Dataframe: '>)> print>(combined_df)>

>

>

Uitgang:

Dataframe 1:   Name Age Score 1 Alice 25 80 2 Bob 30 75  Dataframe 2:   Height Weight 1 160 55 2 175 70  Combined Dataframe:   Name Age Score Height Weight 1 Alice 25 80 160 55 2 Bob 30 75 175 70>

Lees ook:

  • R – Objecten
  • Datastructuren in R-programmering

In dit artikel hebben we het besproken R-dataframes, en alle basisbewerkingen zoals aanmaken, openen, samenvatten, toevoegen en verwijderen. Dit artikel is bedoeld om u vertrouwd te maken met dataframes in R, zodat u deze in uw projecten kunt gebruiken.

Ik hoop dat dit je helpt bij het begrijpen van het concept van dataframes in R en dat je R-dataframe eenvoudig in je projecten kunt implementeren.